APP下载

基于知识图谱的国内数字经济演化路径、热点及展望

2022-12-22王鹏飞

科学与管理 2022年6期
关键词:聚类领域文献

王鹏飞, 程 华

(1. 浙江理工大学 经济管理学院, 浙江 杭州 310018;2. 浙江理工大学浙江省生态文明研究院, 浙江 杭州 310018)

0 引言

数字经济在推动经济增长和转变人们生活方式方面发挥了重要作用, 已成为推动我国经济高质量发展的 “新动能”[1-2]。 目前国内外学术界对其定义是: 作为关键生产要素的数字化知识和信息, 借助数字技术核心驱动力, 以现代信息网络为重要载体, 深度融合数字技术与实体经济, 不断提高经济社会的数字化、网络化和智能化水平, 加速重构经济发展与治理模式的新型经济形态[3-4]。 20 世纪末, 美国利用数字革命的机遇取得了世人瞩目的经济成就, 欧洲和日本等地区通过积极推进数字技术, 也获得巨大成效[5-7]。 如今, 在新的国际格局和时代背景下, 对我国而言, 需要抓住数字技术的发展机遇, 通过利用自身在数字经济领域所积聚的优势, 促使经济发展再上一个新台阶[8]。

目前, 国内学术界对该领域的研究逐渐深入, 近年来通过知识图谱和文献计量等方法分析数字经济的文献也受到关注。 在数字经济研究的中外比较方面,王海花等[9]和逄健等[10]从国际视角出发, 分析数字创新国际研究热点和演化趋势, 提出数字经济国家发展战略。 董晓松等[11]借助可视化分析工具, 对 1992—2018 年的Web of Science 和CNKI 的数字经济相关文献进行计量分析和比较。 在数字经济发展上, 李治国等[12]采用 2011—2018 年我国城市面板数据, 实证考察数字经济发展的产业结构转型升级效应及其作用机制。 陈亮等[13]对 2012 年和 2017 年的数字经济规模进行测算, 深入分析中国数字经济的经济效应。 可见,现有文献主要针对数字经济某一领域或阶段展开研究,并没有对21 世纪以来该领域的演化路径、 过程和学科体系进行追踪分析和全面梳理, 因此基于CSSCI 最新文献数据, 科学客观地展示该领域的演化过程、 热点、前沿和研究趋势, 具有比较重要的意义。

综上所述, 本文以21 世纪以来国内数字经济研究文献为样本, 借助可视化图谱软件CiteSpace, 对该领域的研究文献进行关键词分析、 高频词时区划分、热点词聚类和突现词辨析等操作, 对国内数字经济研究的演进路径及其理论体系、 前沿动向探索, 并完善国内学术界关于此领域研究的结论, 以期为后续研究提供借鉴与参考, 助力国内数字化经济持续高质量发展。

1 研究设计

1.1 数据来源与处理

以 “数字经济” 为主题在CNKI 数据库中进行检索, 时间范围从 2000 年至 2021 年。 CNKI 的检索范围设置为CSSCI 数据。 通过以上操作检索, 并对文献的标题、 摘要和研究内容进行筛选、 查重等处理, 最终筛选得到与本主题相符的2 079 篇文献为样本 (检索时间为 2021 年 11 月 15 日)。

1.2 研究方法与工具

本研究以 “数字经济” 主题文献为研究对象。 首先, 对收集的文献进行简单的统计分析, 以获得上述文献的基础数据, 再借助科学知识图谱工具和文献引文数据分析软件等, 展示该领域的核心作者、 文献互引、 学科分布等信息, 并重点对文献共被引网络以及关键词共现网络进行可视化分析。 然后, 结合文献内容对可视化结果进行研究, 通过分析样本数据, 并以可视化图形的方式呈献, 可以帮助得出该领域的研究热点与发展脉络, 进而探讨未来的研究方向及发展趋势。 选择CiteSpace 网络节点关联强度 Cosine, 生成关键词等知识图谱, 整理出国内数字经济研究领域的核心力量, 通过关键词统计及聚类图谱分析该领域的研究热点, 并探究该领域研究前沿。

2 国内数字经济研究基本特征分析

2.1 文献的总体发展阶段

21 世纪以来, 从总体趋势看国内数字经济领域文献发表量总体呈上升趋势。 如图1 所示, 在时间跨度上, 大致可以分为三个阶段, 第一阶段是2000—2008年, 这也是我国数字经济发展的萌芽期, 国内该领域的研究也刚起步, 部分学者对此有初步的探索。 研究重点以分析数字经济对社会经济发展和行业领域的影响为主, 尤其是研究国外发达经济体的创新活动对国内的启示。 第二阶段是2009—2017 年, 国内数字经济迎来了快速发展期, 每年都有两位数的发表数量, 新业态不断涌现。 这段时期出现一次研究高峰, 其中2017 年发表文献 65 篇。 第三阶段是 2018—2021 年,国内该领域的研究进入爆发期, 大量研究人员投身到这一领域, 文献的发表数量比前两阶段有爆发式的增长。 在 2021 年, 文献数量达到另一个高峰, 为 856篇, 是2000 年发文量的 122.3 倍, 年均增长量达到31.58%。 这一阶段的研究内容更加广泛和深入, 包括数据要素、 数据垄断、 平台经济、 数据产权、 数字治理、 企业数字化创新和转型等[14-16], 几乎涉及社会、经济、 安全和民生的各个方面。

图1 21 世纪数字经济研究文献发文量

1998 年, 中文社会科学引文索引 (CSSCI) 数据库中首次出现介绍数字经济相关著作, 自此以后该领域逐渐获得国内外学者关注。 其后G20 杭州峰会发布的 《二十国集团数字经济发展与合作倡议》, 以及“2018 国际数字经济博览会” 等活动, 将国内的研究推向新高峰, 这与前文第三阶段文献发展阐述保持一致。

2.2 数字经济研究核心力量分析

2.2.1 作者及研究团队共现关系图谱

通过对文献作者及研究团队分布统计, 借助NoteExpress 可视化分析软件生成作者词共现关系图谱,分析字段设置为 “作者”, 频次倒序数量选择前260,可以快速分析该研究领域的主要研究人员和团队合作关系 (如图2 所示)。 上述样本数据中, 文献作者有2 984 位。 图中, 组成外环的各个小圆圈代表不同的文献作者, 从右侧的圆圈 “戚聿东” 显示为#1, #1 表示作者关键词频率最高, 顺时针方向依次显示为#2, #3等; 各个圆圈之间连接的曲线代表作者之间的合作关系, 曲线越粗越深表示合作频率越高。

图2 国内数字经济领域研究作者合作共现关系

21 世纪以来, 国内数字经济领域研究发表文献数量最多的是戚聿东团队, 从2019 年开始共发表21 篇论文。 时间跨度从2019 年至2021 年, 与他合作最多的作者是肖旭和蔡呈伟等。 以平均每年7 篇的文献发表量, 说明其研究团队在该领域的影响力和核心作用。图中用标记#1 显示, 团队成员之间多条连线也说明该团队人数众多, 相互之间合作比较频繁。 通过梳理该团队合作文献, 发现研究范围主要包括数字化企业的性质、 数字期权理论、 产业数字化转型、 数字货币和数字经济发展等内容。 其次排第二位的是陈兵, 2019年至2021 年发表该领域文献18 篇, 他是表1 中唯一没有稳定合作成员的科研人员, 其主要关注内容是法治视阈下数字经济发展、 监管、 消费者权益保护与公平竞争等规制系统创新。 另外, 图上标记#2 的是发表15 篇文献的杨东团队和标记#3 的11 篇文献的任保平团队。

表1 为国内数字经济领域研究文献核心作者团队分布数据, 是对图2 中信息的补充和完善, 还有发文量9 篇的谢康、 夏杰长、 许宪春和唐要家等团队。 从发文年份上, 可以发现这些团队都是近年来随着国内数字经济领域兴起而应运而生, 特点是成果数量多,影响力比较大且仍然继续活跃在该研究领域。 由此可知, 该领域研究存在成果显著和稳定的团队, 是此领域比较明显的核心研究力量。

表1 国内数字经济领域研究文献核心作者团队分布

2.2.2 发文期刊分布

根据对样本数据中期刊统计分析, 2 079 篇文献共涉及到443 种期刊。 按CNKI 中对期刊所属类别的划分统计, 主要涉及社会科学、 经济与管理科学和交叉学科等。 依据刊载数量, 发文量大于等于30 的排名前8的期刊如表2 所示。 21 世纪以来, 发表在 《税务研究》 上的数字经济主题相关的文献高居第一位, 数量达到73 篇, 占样本总数的3.51%, 该期刊 (2020) 复合影响因子是3.206。

表2 数字经济领域研究期刊分布 (发文量≥30)

表2 中复合影响因子最高的是 《改革》 和 《经济学家》, 分别达到 5.202 和 5.13, 发文量分别为 47 篇和39 篇。 表中8 种期刊的发文总数为375 篇, 占样本总数的18.04%, 接近五分之一, 可见上述期刊在该领域的影响力和重要性, 已得到国内科研人员较高的关注。

3 演化路径、 热点与前沿分析

3.1 演化路径分析

3.1.1 关键词共现分析

通过CiteSpace 数据分析软件梳理上述样本文献的关键词形成词共现网络, 对出现频率较高的关键词进行视觉上的呈现。 在文献计量学中, 这种共词方法常用来确定数据样本中各主题之间的关系。 利用词共现分析, 以此来确定该领域的研究方向和主要热点。 本研究操作主要步骤总结为: 首先分别导入中英文文献数据并进行格式化转换; 其次时间切片Years Per Slice设置为1, Node Types 选择关键词 Keyword; 然后借助Pathfinder 和Pruning sliced networks 剪枝算法简化网络并突出其重要的结构特征; 最后运行CiteSpace, 通过算法实现关键词共现来确定文献主题研究相互之间的关系, 以此来确定该领域的研究方向和主要热点。 对样本数据2 523 个关键词进行词共现分析, 得到结果如图3 所示。

图3 中数据经济、 数据要素、 经济高质量发展、共享经济、 数字化转型和数字鸿沟等节点突现更明显,说明该领域国内研究与当前国家在数字经济领域出台的一系列政策密切相关。 政府 “十四五” 规划及2035年远景目标提出加快数字化发展的要求, 强调数字经济和实体经济深度融合, 激活数据要素潜能, 因此国内经济开始转为创新型全要素驱动模式, 涌现出各种新经济、 新业态和新模式。

图3 国内数字经济领域高频关键词图谱

为了让最终呈现的结果更加严谨客观, 在关注关键词频次和节点大小的基础上, 结合中心度对数字经济研究领域进行分析。 为了客观呈现该领域的主要研究热点, 接下来借助中心度和共现频次等参数信息,对样本数据结果进行统计分析。 上述两个参数可以更加直观地表示文献中的关键词之间的关联性, 其中关键词中心度大于0.1 的节点在一定程度上也反映该领域研究热点, 表3 为中心度和出现次数排名前15 的数字经济主题研究关键词。

表3 数字经济研究高频词以及出现频率

3.1.2 关键词词频分析

高频关键词依次有数字经济1 452 次, 然后是高质量发展、 数据要素和大数据等, 反映数字创新在价值管理、 信息技术和知识经济等领域的关注度。 另外,相关的核心词有数字化转型、 共享经济和数字鸿沟等,这些都是与企业数字创新与信息技术等密不可分的关键词。 在综合关键词共现图谱、 出现频次、 中心度分析后, 可以得出 21 世纪以来, 数字经济、 数字化转型、 大数据、 高质量发展、 数字贸易和平台经济等关键词最为突出, 反映了当前数字经济领域的研究热点。

3.2 研究热点及前沿分析

通过借助CiteSpace 软件构建文献关键词突现图谱, 来实现国内数字经济领域前沿分析。 其中, 突现值Burst 是指在特定时段范围内, 某关键词被引频次大幅上升或在短时间内显著增加, 突发性节点强度代表该节点的突发增长率的高低, 强度大的突发性节点从一定程度上反映该领域的研究前沿。 分析与操作的主要过程总结如下: Term Type 选 Burst Terms、 Node Types 选关键词 Keyword。 在弹出的新窗口里, 不必等迭代结束, 点击 Burstness 的 View 视图, 就可以得到Citation Burst 文献关键词突现图谱。 图谱上的每一个关键词所处的时区, 即这个关键词首次出现的时间,彼此之间的相连线条体现了关键词间相互联系, 由此反映出数字经济领域研究热点的演化过程。

图4 中主要呈现6 列前18 个突现词排序图谱数据信息, 字段涉及 Keywords、 Year、 Strength、 Begin 和End 等。 其中Year 字段表示样本数据的选择起始年份,Strength 表示文献关键词突现强度, Begin 为该内容迅速成为热点的起始研究年份, End 字段是该研究不再成为热点的结束年份, 最后一列时间跨度为当前样本数据的取值年份范围。 其中深色加粗的部分为研究热点时间区域, 浅色较窄的内容为该关键词的研究年份。

图4 国内数字经济领域文献关键词时区图谱

通过分析关键词突现强度可知, 21 世纪以来, 强度最大的是数据要素, 达到15.9, 该词反映出 “人才、 资本、 信息、 技术” 等创新要素融合而实现深度合作。 同时, 中介效应、 数字化创新、 扎根理论和大数据合作资产等词突变强度较大, 分别为 15.3、14.35、 10.94 和 9.52, 说明在国内数字经济研究领域, 以使用数字化的知识和信息作为关键生产要素、以现代信息网络作为重要载体、 以信息通信技术的有效使用作为效率提升和经济结构优化的重要推动力,转变经济增长方式、 助推企业转型升级、 提升国家竞争力、 促进经济发展和社会进步[17]。

从突现时间上分析, 该领域持续时间最久的关键词比较多, 包括数据要素、 数字化创新和公共数据等,从2000 年到2017 年的研究过程体现其覆盖商业创新、生产制造、 公共治理、 居民就业和教育医疗等各领域,重点体现在电商、 移动支付、 互联网金融和在线文化娱乐等行业。 2018 年以后就不再是突现热点, 虽然仍有学者关注此领域的研究。 该领域人工智能和大数据等主题词出现时间比较晚, 但是近两年迅速发展, 成为突现的热点研究内容, 也是该领域的研究前沿。

学术研究通常与经济、 科技和社会发展密切相关,相关研究高频词突现、 热点关联与持续和国家政策文件或规划以及改革措施密不可分, 既相互影响, 又相互促进。 表4 列出国内数字经济领域主要关键词突现时间发生的重要关联事件, 可以发现与上述文献发表阶段和趋势基本一致, 同时与该领域核心研究团队的研究成果也存在关联现象。

表4 数字经济领域高频词突现主要相关事件汇总

3.3 研究趋势与展望

借助CiteSpace 的聚类分析功能, 将样本数据中关系紧密的主题关键词进行聚类, 通过对同一聚类中的最大值加上标签, 作为该类别的代表进行解析。 操作步骤主要包括: 首先设置前50 位关键词进行独立统计, 并合并汇总得到关键词列表; 然后根据Cosine 余弦相似性, 计算关键词节点之间的连接强度; 最后利用剪枝算法Pathfinder, 按时间片对关键词进行聚类分析, 进一步确定主题研究的有效性。

根据关键词网络中的Modularity Q 值和Silhouette S值两个指标揭示其基本特点。 通过以上操作, 并对结果进行分类筛选和去重操作等, 汇总得到如图5 所示的关键词聚类可视化图谱。 利用上述算法依据数量大小进行排序, 得到#0 聚类数字经济、 #1 聚类产业数字化、 #2 聚类数字化创新、 #4 聚类企业创新、 #5 聚类数字贸易、 #6 聚类高质量发展、 #9 聚类反垄断、 #10聚类 “一带一路”、 #11 聚类数字技术和#14 聚类共享经济等10 个主要聚类汇总信息。

图5 国内数字经济领域关键词共现聚类知识图谱

从图5 参数分析可知, 聚类模块值Q 值为0.681 2,大于 0.5, 聚类平均轮廓值 S 为 0.865, 高于 0.7, 结果显示聚类结构显著且是令人信服的。 对上述聚类信息汇总分析和归纳, 得到该领域主要研究趋势与发展,分别是数字经济发展创新基础理论 (#0 聚类、 #2 聚类、 #5 聚类和#11 聚类)、 数字经济治理与监管 (#6聚类和#9 聚类) 和数字产业创新商业模式 (#1 聚类、#4 聚类、 #10 聚类和#14 聚类) 等。

3.3.1 数字经济发展创新基础理论

#0 聚类、 #2 聚类、 #5 聚类和#11 聚类等组成了数字经济发展创新的主要基础理论。 以数据资源为关键生产要素, 以知识创新为主要驱动力, 代表了围绕数据这种关键的生产要素所进行的一系列生产、 流通和消费的经济活动过程[18-19]。 实现产品、 生产资料、 劳动力和资金更低成本、 更大范围的流通和更高水平的匹配, 实现更高质量、 更有效率、 更加公平和更可持续的高质量发展[20]。 数字化和人工智能技术相结合,是符合新经济时代特征的一种科技创新范式, 运用商业化规则让更多的商家和客户有机会参与到技术产业化过程中, 通过市场竞争加速科技与实体经济相融合[21]。

综上所述, 国内数字经济研究已形成一个以数字创新为核心,以数字市场、数字组织和数字治理为基本支撑, 以数字路径为宏观手段的基础理论体系。

3.3.2 数字经济治理与监管

#6 聚类和#9 聚类主要关注数字经济治理与监管。数字经济给社会带来巨大福利, 但是, 得益于网络效应、 规模经济、 零边际成本, 而且通过相互补贴可以在多个领域开展经营活动, 结果可能导致平台不正当竞争、 垄断、 泄露个人隐私、 损害消费者权益和风险隐患积累等不合理现象[22-23]。 因此有学者提出, 有必要加强在行业内反垄断、 跨行业无序扩张、 数据使用公开开放、 监管过程市场化等方面的监管规范, 坚持市场化取向, 将监管重点转向对数字企业反竞争行为本身, 打造更加公平规范有序的市场竞争环境[24-25]。国家目前的政策和规划是推动数字经济高质量发展,因此需要构建与其相适应的监管机制和多元共治的协同治理机制, 实现 “产业数字化” 和 “数字产业化”双轮驱动[2,26-27]。

同时也需要政府通过直接投资或补贴来改善或解决数字鸿沟现象, 减小个体之间收入和发展水平的差距。 建立新的投融资环境, 培育壮大新的服务与消费模式, 打造新的产业增长支柱。 更多从需求出发, 主动投资在与需求相关的短板领域, 以实现经济效益和社会效益的并举[28-29]。

综上所述, 我国数字经济领域的治理与监管, 目的是确保用户在网上可以获得安全和公平交易的产品和服务, 同时确保企业能够在线上开展公平和自由的竞争活动。

3.3.3 数字产业创新商业模式

#1 聚类、 #4 聚类、 #10 聚类和#14 聚类构成当前国内数字产业创新商业的主要模式。 数字经济时代兴起的创新商业模式, 不仅是面向真实的市场需求, 而且通过运用商业化机制, 以企业为主体, 组织各类创新资源, 实现技术突破和商业爆发[30]。 在国家宏观政策指导下, 利用国内数字基础设施不断完善、 数字产业基础雄厚和数字经济市场潜力巨大等优势, 增强数字技术与产业、 贸易的融合能力, 推动数字贸易新业态、 新模式发展和服务贸易企业数字化转型[31-32]。 已有研究表明, 数字经济对高质量发展和技术创新均产生促进作用, 直接效应的促进效能大于间接效应, 即部分效能通过技术创新得以实现[33-35]。

综上所述, 利用数字技术, 生产企业可以实现生产过程的重构, 从大规模批量化生产过渡到柔性生产和定制生产, 不仅能够适应国内消费升级的趋势, 从长远看还能够造就全新的生产组织形式, 即一个新商业模式、 新经济模式和 “互联网+” 等数字产业创新商业模式实现的过程。

4 结论和建议

本研究运用CiteSpace 和NoteExpress 文献计量软件, 对CSSCI 数据中2 079 篇数字经济领域文献进行发展阶段、 核心作者团队、 研究热点和前沿等分析,得出以下3 个主要结论: ①21 世纪以来这一领域文献发表量总体呈上升趋势, 在时间跨度上, 大致可以分为萌芽期、 快速发展期和爆发期。 但国内研究比较晚,受国家政策规划等影响比较明显。 ②国内数字经济领域存在以戚聿东、 陈兵和杨东等为代表的成果显著和稳定的团队, 构成了此领域比较明显的核心研究力量。但研究主体主要为高校, 且相互之间合作不紧密, 存在跨团队合作比较少的现象。 ③数字经济领域国内研究热点聚焦在数字化转型、 大数据、 高质量发展、 数字贸易和平台经济等方面, 重点体现在数字经济发展创新基础理论、 数字经济治理与监管和数字产业创新商业模式等内容。

数字经济是一种社会化水平更高的基础性和创新性的经济模式, 对未来国家间经济竞争有着重要的影响。 在全球经济放缓的大背景下, 数字经济将会成为引领未来一段时间发展的重要动力。 未来, 探究和完善国内数字技术应用, 强化服务贸易政策促进体系, 体现数字经济共享发展, 实现信息服务全覆盖和加强数字服务贸易国际合作机制等领域是值得探讨的研究方向。

猜你喜欢

聚类领域文献
Hostile takeovers in China and Japan
2020 IT领域大事记
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
基于K-means聚类的车-地无线通信场强研究
领域·对峙
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
基于高斯混合聚类的阵列干涉SAR三维成像
The Role and Significant of Professional Ethics in Accounting and Auditing
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法