(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202211026482.9
(22)申请日 2022.08.25
(71)申请人 浙江工业大 学
地址 310014 浙江省杭州市拱 墅区潮王路
18号
申请人 浙江大学城乡规划设计 研究院有限
公司
(72)发明人 丁亮 徐志乾 章俊屾
(74)专利代理 机构 杭州天正专利事务所有限公
司 33201
专利代理师 舒良
(51)Int.Cl.
G06F 40/177(2020.01)
G06Q 50/26(2012.01)
(54)发明名称
一种使用区位熵识别跨地区产业集聚的方
法
(57)摘要
一种使用区位熵识别跨地区产业集聚的方
法, 包括如下步骤: (1)通过 企业注册数据计算各
地区各产业的区位熵, 并根据区位熵确定各地区
的主导产业; (2)构建地区间的产业关联矩阵, 并
确定不同地区之间的产业关联强度; (3)识别不
同地区之间产业集聚以及集聚地区的主导产业。
本发明根据区位熵构建不同地区间的产业关联,
且操作简单; 通过各地区的主导产业所构建出的
产业关联表, 能够识别出跨地区产业集聚可能,
以及产业集聚区的主导产业, 且 无需对所分析产
业进行预设。
权利要求书1页 说明书5页 附图1页
CN 115358195 A
2022.11.18
CN 115358195 A
1.一种使用区位熵 识别跨地区产业 集聚的方法, 包括如下步骤:
步骤1: 识别地区主导产业;
步骤11: 筛选正常营业的企业数据; 爬取到的原始企业注册数据包括公司名称、 经营状
态、 注册资本、 行业、 地级市和区县等字段(地级市和区县在后文统称为地区), 从中筛选出
经营状态为存续、 正常、 在业的企业, 即为研究所需的企业数据集;
步骤12: 汇总各地区各产业的注册资本规模; 按照地区和行业对各企业的注册资本进
行加和汇总, 得到各地区内各个产业的注册资本规模数据集, 主要包括地区以及各行业注
册资本规模等字段;
步骤13: 计算区位熵; 使用Excel, 按照区位熵公式对各地区各产业注册资本规模表进
行计算, 得到各地区各产业的区位熵, 区位熵公式如下 所示;
式中: LQij代表j地区i产业的区位熵, qij为j地区的i产业的注册资本规模, qj为j地区所
有产业的注册资本规模; qi指在研究范围内i产业的注册资本规模; q为研究范围内所有产
业的注册资本规模;
步骤14: 识别地区主导产业; 将各地区内, 由步骤13计算得到的不同产业的区位熵从大
到小进行降序排列, 并选取各地区内区位熵值前X1的产业, 将其识别为该地区的主导产业,
从而得到各地区主导产业数据集, 其字段包括地区、 第一大主导产业、 第二大主导产业和 第
三大主导产业 4个字段;
步骤2: 构建产业关联;
步骤21: 构建OD联系; 因为某地区与除其自身外的其他地区都有可能存在产业关联, 同
时减少重复联系, 所以可根据区域内地区的数量N, 构建N*(N ‑1)/2的OD联系数据集, 其字段
包括Origi n和Desti nation两个字段;
步骤22: 构建产 业关联联系对; 将地区主导产 业和OD联系两个产 业分别根据 “Origin=
地区”和“Destination=地 区”进行2次表连接得到带有Origin和Destination地 区各自主
导产业的关联数据集, 其字段包括Origin、 O主导产业1、 O主导产业2、 O主导产业3、
Destination、 D主导产业1、 D主导产业2、 D主导产业3共8个字段;
步骤22: 赋值产业关联强度; 若两地区间无相同的主导产业则赋值为0, 若有一个主导
产业相同则赋值为 1, 有两个相同则赋值为2, 以此类推.并去除值为0的产业联系, 得赋值后
地区产业关联 数据集, 其字段包括Origi n、 Destination和产业关联度3个字段;
步骤3: 识别跨 地区产业 集聚;
步骤31: 识别集聚区域; 通过凝聚子群算法对产业关联表进行分析(该操作可借助
Gephi中的模块度分析实现), 被分为同一个子群的地区将会被赋值同样的数字, 不同子群
数字不同, 根据分析 结果确定哪些地区之间联系紧密、 实现了跨 地区产业 集聚;
步骤32: 识别集聚区域的主导产业; 将集聚区域内部的产业关联进行汇总, 统计不同产
业的关联对数, 并根据数量从多到少进行降序排列, 取前X2的产业作为该集聚区域的主导
产业。权 利 要 求 书 1/1 页
2
CN 115358195 A
2一种使用区位熵识别跨地区产业 集聚的方 法
技术领域
[0001]本发明涉及数据处理技术领域, 涉及一种使用区位熵识别跨地区产业集聚的方
法。
背景技术
[0002]产业集聚是指同一产业在某个特定地理区域内高度集中, 产业资本要素在空间范
围内不断汇 聚的一个过程。 产业集聚能够形成外部规模经济和内部规模经济, 促进集聚区
域的经济发展。 同时, 外部规模 经济有可能产生正向的空间溢出效应, 带动周边地区产业的
发展。 此外产业 集聚还可以促进创新。
[0003]关于产业集聚的识别的方法, 多见于经济学管理学领域, 并且种类较多, 涉及的对
象和范围也不尽相同。 如以企业为研 究对象的、 基于Ripley的K函数的D函数和 M函数, 但该
类方法多用于城市内部; 以城市或区域整体为研究对 象的区域基尼系 数、 以因子分析法为
核心的多元统计方法等, 但无空间纬度, 只能表征产业的总体集聚程度; 也有以企业为对
象, 但受限于数据获取不得已从产业整体角度出发以反映区域内产业集中程度的赫芬达尔
指数、 产业集中度、 产业绝对集中地理指数等。 现有 方法多反映研究范围内部产业的总体集
聚程度, 并且需提前预设所分析 的产业, 对于不同地区之间产业是否有可能存在集聚现象
无法进行准确识别。
[0004]产业集聚的识别可应用于区域领域的研究分析, 包括区域产业集群发展、 跨城市
群都市区产业合作、 区域产业一体化等。 通过识别跨地区产业集聚, 能够为区域产业规划提
供决策支持和数据支撑 。 但目前还没有 使用区位熵构识别跨 地区产业 集聚的方法。
发明内容
[0005]本发明要克服现有技术的上述缺点, 提供一种使用区位熵识别跨地区产业集聚的
方法。
[0006]为了识别跨地区产业集聚, 本发明的一种使用区位熵识别跨地区产业集聚的方
法, 包括如下步骤:
[0007]步骤1: 通过企业注册数据计算各地区各产业的区位熵, 并根据区位熵确定各地区
的主导产业。
[0008]步骤11: 筛选正常营业的企业数据。 爬取到的原始企业注册数据包括公司名称、 经
营状态、 注册资本、 行业、 地级市和区县等字段(地级市和区县在后文统称为地区), 从中筛
选出经营状态为存续、 正常、 在业的企业, 即为研究所需的企业数据集。
[0009]步骤12: 汇总各地区各产业的注册资本规模。 按照地区和行业对各企业的注册资
本进行加和汇总, 得到各地区内各个产业的注册资本规模数据集, 主要包括地区以及各行
业注册资本规模等字段。
[0010]步骤13: 计算区位熵。 使用Excel, 按照区位熵公式对各地区各产业注册资本规模
表进行计算, 得到各地区各产业的区位熵, 区位熵公式如下 所示。说 明 书 1/5 页
3
CN 115358195 A
3
专利 一种使用区位熵识别跨地区产业集聚的方法
文档预览
中文文档
8 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共8页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 03:55:57上传分享