基于文本挖掘的煤炭工业政策变迁与反思
2017-09-03谭章禄宋庆正
谭章禄 宋庆正
(1. 中国矿业大学(北京)管理学院,北京市海淀区,100083;2. 煤炭资源与安全开采国家重点实验室,北京市海淀区,100083)
★ 经济管理 ★
基于文本挖掘的煤炭工业政策变迁与反思
谭章禄1,2宋庆正1,2
(1. 中国矿业大学(北京)管理学院,北京市海淀区,100083;2. 煤炭资源与安全开采国家重点实验室,北京市海淀区,100083)
为分析煤炭工业政策变化特征和趋势,采用社会网络分析和对应分析等文本挖掘、统计分析方法对“五年规划”文本进行分析。通过对1996-2016年煤炭工业“五年规划”文本内容进行词频统计、关联网络分析、语义网络分析、对应分析,揭示出不同“五年规划”文本高频词使用的差异性和相似性,政策关注的方向和重点,煤炭工业政策的变迁和发展趋势。研究结果表明,煤炭工业从最初的单纯追求产量、增长的粗放式发展向高效、清洁、绿色的集约式发展转变。
五年规划 政策变迁 语义网络分析 对应分析
煤炭行业的发展对我国经济发展具有决定性的作用,煤炭行业的健康发展关系着国计民生,而煤炭政策的变迁对于煤炭行业的影响十分巨大。产业政策是政府调控宏观经济的重要手段,这是国家规划、干预和引导产业形成和发展的一种政策。自20世纪90年代以来,煤炭行业以开放煤价为标志正式步入市场化改革阶段,为此国家发改委共发布5个关于煤炭工业五年规划,为煤炭行业改革作出指导和规范。伴随着煤炭行业的不断发展,煤炭政策关注的侧重点也在不断变化。通过对1996-2016年煤炭工业“五年规划”进行文本挖掘,揭示煤炭工业政策的变迁和发展趋势,不仅是对煤炭工业“五年规划”的总结和梳理,也有利于准确把握煤炭工业的发展方向。
1 研究方法
社会网络分析方法(social network analysis,SNA)源于人类学、社会学等学科的发展,以行动者及其相互间的关系作为研究内容,对行动者的关系模型进行描述,分析模型中蕴含的结构和相互影响关系。目前常见的社会网络分析工具包括:Ucinet、Gephi、NetDraw、NetMiner、Pajek等,这些工具各有优势,功能与操作有相似互通之处但也不尽相同。本研究采用社会网络分析软件Gephi和NetDraw,Gephi是一个集图与网络分析的开源软件,能方便广阔地获取网络数据并对其互动性进行探索和解释。
对应分析的基本思想是将列联表中变量及类别之间的关系同时反映在一张二维散点图上,通过图中类别点之间的空间距离反映类别关系的大小。可以利用二维散点图可视化的方式直观地揭示同一变量各个类别之间的差异和不同变量各个类别之间的对应关系。
2 词频统计与网络图分析
词频统计分析可以确定从“九五”到“十三五”规划的若干文本特征。借助ROST CM6内容分析软件对取得的文本进行分词、词频统计、过滤无意义词语后,可以得到5个“五年规划”文本和总文本的前50个高频词及词频数,见表1。从表1可以看出,“九五”规划中比较有代表性的词语如国有、乡镇等高频词的排序较高,在20世纪90年代,政府对于不同性质煤炭企业的发展具有不同的规划。随着煤炭行业改革,乡镇煤矿企业作为煤炭生产的重要力量被逐步整合和兼并,产业集中度上升,大型国有企业发挥核心作用。“十三五”规划中比较有代表性的词语如生态、高效、产量、退出等排序居于前列。随着“十一五”、“十二五”时期煤炭产能的不断释放以及经济增长的逐步放缓,煤炭供给量上升、需求量相对下降导致煤炭行业产能过剩,过去粗放式发展对环境的危害日趋明显,在新形势下退出产能、安全、绿色、高效开发等理念被广泛接受。
为清晰地展示不同“五年规划”文本特征词的关联和区别,以表1为基础,选取“九五”规划至“十三五”规划排名前50位的高频词建立“五年规划”与高频词关联矩阵,然后将其导入Gephi软件,得到如图1的关联网络图。
表1 “五年规划”前50个高频词及词频
注:第16至第49个高频特征词数据省略,数据为ROST CM6软件分析结果
人的注意力通常会体现在其所编写的文本资料中,而注意力的配置又与人的决策紧密相关。同样,此种注意力与组织文本之间的关联在政府组织的运作中依然存在。通过高频词与“五年规划”文本之间的关联网络图,可以从宏观层面看出每个规划关注侧重点的相似与不同。由图1可以看出,由5个规划文本围成的中间区域为所有文本共同存在的高频词,说明5个文本对于这些方面都有所关注,而这些高频词都比较笼统具有较高的概念性,如煤炭、煤矿、企业、工业、政策等。而边缘区域为某些规划相对独有的信息,也说明了不同规划文本关注的不同侧重点。“九五”规划涉及到计划、地方、乡镇、职工、工资等,这是由于“九五”期间,为适应社会主义市场经济体制要求,煤炭工业进行产业结构调整,减人提效,提高职工工资和生活水平,重点加大国有企业改革,转变经营机制,促进地方国有企业和乡镇企业等不同类型煤矿健康发展。“十五”规划涉及到集团、洁净、增长、需求等,这是由于“十五”期间继续进行结构调整,深化国企改革,实施大集团、洁净煤、综合经营等战略,推进洁净煤技术产业化,满足经济增长对于煤炭资源的需求。“十一五”规划涉及到整合、示范、工程、规划区等,这期间以煤炭整合、有序开发为重点对中小型煤炭企业进行整治改造,加大勘查力度,根据存储规模和地质情况建设不同类矿井,建立各项示范工程,加快科技创新。“十二五”规划涉及到开展、沉陷等,这说明对于沉陷区域的治理和复垦等地表沉陷问题首次得到重视。“十三五”规划涉及到绿色、高效、清洁、产能等,这说明随着经济发展新常态的提出,创新、协调、绿色、开放、共享的发展理念深入人心。煤炭产能过剩,结构性矛盾、科技创新能力不强、机制体制不完善等问题逐步凸显出来,为此将深化改革和科技创新相结合、绿色开发与清洁利用相结合、健全煤矿退出机制,优化产业结构,将煤炭由单一燃料向原料和燃料转变,实现煤炭工业由大到强的转变。
图1 高频词与“五年规划”关联网络图
其他一些区域的词语为两个或多个“五年规划”文本所共有的词语,可以看出文本用语以及关注点之间的若干相似性。如“九五”规划和“十五”规划共有的国有、结构、调整等,这期间持续进行国有企业改革与产业结构调整,转变经营机制,按照现代企业制度建立起大型国有企业集团,进行集约化生产,提高经营效率、规模经济效益、行业集中度。“十一五”、“十二五”、“十三五”规划共有的煤矸石、煤层气、瓦斯、基地、生态等,这期间随着科技发展和环保意识的提升,对于生态环境问题的认识也逐步提高,尤其是对煤矸石、煤层气等资源综合开发利用取得新进展;对于瓦斯这一煤矿灾害重点问题的治理工作得到重视,安全形势得以改善;国家继续鼓励科技创新,建立健全保障体系,推动生态环境的不断改善。
3 语义网络分析
语义网络分析可以描述“计划文本”的知识特征,形象地展示各个特种词之间的联系。为有效地区分“五年规划”的发展特征,重点比较“九五”和“十三五”规划文本的语义网络图,如图2、图3所示。
从图2可以看出,规划文本主要从煤矿的所属性质、产量等进行阐述,图中可以看出煤炭的相关性词语大都是改革、贯彻、转变、政策、经济等宏观概括词语。改革、经济、转变、市场、市场经济等形成聚簇,企业、经营、建立形成另一聚簇,而对“九五”规划文本进行研读发现都是反映在社会主义市场经济初期煤炭行业面临的转变经济发展方式、体制改革创新、经营改革,实现多种方式经营,建立健全现代企业制度,贯彻国务院有关规定,增加煤炭产量,提高职工素质和生活水平等宏观指导方针和办法;围绕煤矿的相关词语主要有乡镇、国有、转产、综合等,强调国有煤矿应当发挥的作用以及对乡镇煤矿的扶持、改造与整顿,实现适度规模经营。
从图3可以明显看到以煤炭和煤矿关键词构成的聚簇。在煤矿与煤炭的聚簇又形成几个小的聚簇,如退出、控制、关闭、产能构成结构优化升级关键词,在煤炭行业产能过剩的情况下严格控制新增产能,有序退出过剩产能,关闭整个小矿井等措施控制产能;规模、地区、基地、大型、产量、亿吨构成生产开发布局关键词,主要以大型煤炭基地为核心,基地外煤矿关闭退出机制,不同地区的大型煤炭基地区分不同的产能控制措施;清洁、高效、生态、绿色等构成煤炭清洁高效利用关键词,在绿色开采的基础之上,加强商品煤质量管理,推进重点耗煤行业的节能减排;治理、灾害、瓦斯、矿井等构成煤矿灾害防治关键词,主要是利用物联网、大数据技术对煤矿矿井内的灾害进行预防和综合治理工作;机制、企业、市场、建立等构成煤炭企业市场化改革关键词,顺应市场化趋势,进行机制体制建设以更好地适应市场;发挥、科技、深加工、质量、科技等构成加强煤炭科技创新关键词,推广先进适用技术加大科技示范工程建设,提高煤炭深加工,使先进技术和生产实际相结合。
通过对关键词形成的聚簇进行研究可以发现,相对于“九五”规划,“十三五”规划关注点更加具体、关注重心更加细化,而规划的重心也从单纯的增加产量到以科技创新为突破口深化煤炭行业改革、转变经济发展方式调整产业结构,从增加产能转变到控制退出落后产能,从粗放式开采到绿色开采实现煤炭资源的安全、可持续开发,从单一采煤到合理开发煤矸石、煤层气、矿井水等资源高效、集约、综合利用。
图2 “九五”规划文本语义网络
图3 “十三五”规划文本语义网络
4 对应分析
将“九五”规划至“十三五”规划的5个规划文本合并,选取频率前50位的关键词,计算50个关键词在不同规划文本中的使用频率,即利用词频数除文本总词频数,结果见表2。将关键词作为列变量,“五年规划”作为行变量,频率变量设置为加权变量,利用SPSS statistic21统计分析软件进行对应分析,结果散点图如图4所示。
表2 50关键词在“五年规划”文本频率分布
注:第16至第49个高频特征词数据省略
图4中各散点不同的空间位置关系反映出5个“五年规划”文本和50个关键词之间的不同关联程度,由图4可以看出不同的文本在两个维度上具有较高的区分度,“五年规划”文本与50个关键词在4个象限进行不同的聚集。其中“十一五”和“十二五”规划分布在第一象限且相邻较近,相近邻的关键词主要有产量、治理、瓦斯、煤矸石等词语,也反映出这期间对于相关方面的重视。“九五”规划在第二象限,相近邻的关键词主要有国有、职工、改革等,这也反映出了“九五”期间随着国家进行市场化改革,煤炭行业也面临着改革的压力,国有企业改革以及职工安置等问题都是关注的重点。“十五”规划在第三象限,这期间主要是进行规模化生产改造,进一步深化市场“这只看不见的手”,减少政府干预。“十三五”规划在第四象限,关注的重点在高效、生态、产能,更加突出了煤炭安全绿色开发和清洁高效利用。
图4 “五年规划”文本对应分析结果
5 结论
通过对煤炭工业“五年规划”文本进行社会网络分析和对应分析,得出以下结论。
(1)通过词频和关联网络分析可知,不同的“五年规划”的高频关键词既具有相似性但也有差异,通过对高频特征词和规划文本的关联分析可以揭示出不同的“五年规划”关注的侧重点的差异。
(2)语义网络分析揭示出“九五”规划文本主要关注转变经济发展方式、体制改革与经营改革等;“十三五”规划文本在去产能、绿色、清洁、高效、生态、深加工等方面关注度较高,更加注重煤炭工业的安全绿色开发、清洁高效利用。
(3)通过对应分析定性可知,“十一五”和“十二五”规划文本关键词较为相似,政策关注点比较一致;“九五”、“十五”、“十三五”规划文本的政策关注点各有不同,区别较为明显,比较清晰地揭示了煤炭工业发展的阶段性特征和发展趋势。
[1] 张勇.充分发挥《煤炭产业政策》的指导性作用[J].中国煤炭,2008(1)
[2] 张维冲,李文绚,杨冠灿.基于社会网络分析的高校分类研究——以“211”高校为例[J].情报杂志,2016(8)
[3] 邓君,马晓君,毕强.社会网络分析工具Ucinet和Gephi的比较研究[J].情报理论与实践,2014(8)
[4] 张长鲁.基于数据挖掘的煤矿安全可视化管理研究[D].北京:中国矿业大学(北京),2015
[5] 文宏.中国政府推进基本公共服务的注意力测量——基于中央政府工作报告(1954-2013)的文本分析[J].吉林大学社会科学学报,2014(2)
[6] 鞠建华, 强海洋.中国矿业绿色发展的趋势和方向[J].中国矿业,2017(2)
[7] 杨杨, 张继平.我国五年计划(规划)文本的演变特征分析:基于内容分析和对应分析方法[J].行政论坛,2013(5)
[8] 刘冰,马宇.产业政策演变、政策效力与产业发展——基于我国煤炭产业的实证分析[J].产业经济研究,2008(5)
(责任编辑 宋潇潇)
神华集团“煤电/煤化工废物协同处置
与循环利用”课题通过验收
近日,国家科技部组织召开神华集团承担的国家863计划“煤电/煤化工废物协同处置与循环利用技术及示范”课题验收会议。会上,专家组对该课题的完成情况和技术创新给予了高度肯定,一致同意通过验收。
“煤电/煤化工废物协同处置与循环利用技术及示范”课题是国家“十二五”规划大宗固废处理与资源化技术的重要研究内容。2012年开始实施,经过5年的努力,课题组取得的主要研究成果包括粉煤灰提取氧化铝联产超白玻璃及分子筛、固态胺二氧化碳吸附剂、粉煤灰基煤化工废水处理催化剂等技术,开发了氧化铝、超白玻璃、系列分子筛等20多种产品,建成万吨级粉煤灰提取氧化铝示范装置、千吨级粉煤灰基MTO废水净化装置和固态胺二氧化碳吸附工业侧线3套装置。其中,粉煤灰提取氧化铝示范装置连续稳定运行超过100天,氧化铝提取率达到90%以上,氧化铝产品的纯度达到国家冶金级一级品要求。
Thechangeandreflectionofcoalindustrypolicybasedontextmining
Tan Zhanglu1,2, Song Qingzheng1,2
(1. School of Management, China University of Mining and Technology, Beijing, Haidian, Beijing 100083, China;2. State Key Laboratory of Coal Resources and Safety Mining, Haidian, Beijing 100083, China)
In order to analyze the characteristics and trends of coal industry policy change, this paper analyzed the five-year planning text by using text mining and statistical analysis methods such as social network analysis and corresponding analysis. Through the analysis of word frequency statistics, correlation network, semantic network and corresponding analysis in the contents of the five-year plan of coal industry in 1996-2016, differences, similarities of different high-frequency words in five-year plan, policy direction and focus, coal industry policy changes and development trends were revealed. The results showed that the coal industry had changed from the initial pursuit of pure production, growth of extensive development to efficient, clean, green intensive development.
five-year plan, policy change, semantic network analysis, correspondence analysis
国家自然科学基金资助(61471362)
谭章禄,宋庆正. 基于文本挖掘的煤炭工业政策变迁与反思[J].中国煤炭,2017,43(8):33-38. Tan Zhanglu, Song Qingzheng. The change and reflection of coal industry policy based on text mining [J].China Coal,2017,43(8):33-38.
TD-9
A
谭章禄(1962-),男,教授,博士生导师,主要从事煤矿企业信息化、可视化管理方面的研究工作。