“东数西算”布局下的西部大数据产业的建设探究
2023-10-12李刚刚
摘要:数据要素作为国家经济发展的新动力,将成为新时代的核心基础资源。为构建全国一体化算力资源的布局,国家启动“东数西算”工程。尽管西部地区在大数据集群建设方面取得了一些成就,但在数据质量、数据更新、耗能、资源共享、开放性和数据产业化等方面仍存在不足。基于西部地区数据要素和数据产业建设现状和问题,本文从西部地区在“东数西算”数据布局中所承担的节点任务、基础设施建设、制度设计等方面提出了一些参考思路,以促进西部地区大数据产业的发展。
关键词:西部地区;东数西算;大数据
21世纪,全球处于数字时代,算力逐渐成为生产力核心。为推进全国大数据中心建设的一体化进程,国家于2021年启动了“东数西算”工程,该工程以数力和算力为战略支点来规划和布局数据建设。国家发展改革委、中央网信办、工业和信息化部和国家能源局共同颁布了《全国一体化大数据中心协同创新体系算力枢纽实施方案》文件,指出将在东部和西部八个地区,包括:京津冀、长三角、粤港澳大湾区、成渝、贵州、甘肃、内蒙古、宁夏启动国家级算力枢纽站点建设,并以此为算力的核心种子点,同时构建十个国家数据中心集群[1]。西部地区虽然在算力资源建设方面处于弱势,但作为“东数西算”工程算力数据产业枢纽节点建设的重点承载者,应识别和整合政策、地理、市场等多方当地优势,推动本地区数字化资源和产业的建设和发展。本文以助力数网协同的国家全局算力网为目标,基于西部地区大数据产业建设现状,拟从其在“东数西算”数据布局中的所承担的节点任务,探讨西部地区数据算力网络的构建思路。
一、西部地区大数据产业建设的现状和局限性
西部地区数据中心的产业建设虽然起步较晚,但因再生能源充裕,具备建设大数据中心枢纽节点的潜能。
(一)建设现状
西部地区大数据建设起步较晚,2001年国家自然科学基金委员会启动了“中国西部环境与生态科学研究计划”,其中西部数据中心建设是该计划中的一项重要内容。该数据中心整理并集成了西部环境与生态数据,以及相关的科研数据与成果,并以数字图书馆的形式建立了科学数据共享平台[2]。其特色内容包括将数据与文档、文献关联集成到统一的平台,提供知识挖掘、数据集检索和专家用户知识论坛等服务。此外,西部数据中心联合其他地方数据中心,构建了科学互通共享的数据网,为西部数据化产业相关项目和团体提供了有效的数据服务[3]。
大数据产业的发展和布局与各地区数据公司的成立量呈正相关,且数据公司的年成立量与各地区的年GDP指标变化趋势一致。根据2010年至2019年数据公司成立量的数据显示,数据公司年成立量高的地区主要集中在东南部地区;与2010年相比,截至2019年,西部地区成立的数据公司数量呈逐年上升趋势,但远低于东部沿海地区[4]。就算力水平而言,地区数据中心的算力能效与数据中心的在用上架率有一定相关性。根据《2020全球计算力指数评估报告》,每提高1个百分点的计算力指数,数字经济和GDP将分别增长3.3‰和1.8‰。2019年和2021年国内数据中心的平均在用上架率分别为50%和53.2%。中西部地區的上架率约为30%~40%,远低于全国平均水平[5-6]。
(二)存在问题
西部数据中心在建设过程中取得了一定规模,并对全国数据集成和共享做出了贡献。但仍存在一定的局限性。首先,数据中心尚未形成统一规范的数据发表流程,这导致数据的质量无法得到有效的保证。其次,西部地区存在人才短缺问题,缺乏专业技术人员对数据进行把控和管理。此外,当地科研人员对于个人科研数据成果的上传意识不足,这也限制了数据中心的发展和数据质量的提升。由于数据质量不一致,数据中心所包含的元数据和数据文档更新速度较慢,这影响了数据规范化和提供有效服务的成效。因此,西部数据中心需要加强规范化管理,提升人才培养和引进,加强科研人员的数据上传意识,改善数据更新速度,以提高数据中心的质量和服务水平。
此外,虽然西部地区近年来在产业发展方面逐步取得了一定成就,但地区产业结构仍主要由“高耗能”的加工制造业占主导地位。与此同时,当地数字化产业,如数据公司的发展水平较低,对数据中心的需求不大;同时由于数据中心对外宣传不足,数据共享平台的开放性不够,导致数据中心供大于求,数据与需求用户的关联度不够。数据中心作为经济发展的“新基建”,应用不充分,反向抑制了数据集成中心的构建与进一步发展。
数据中心产业发展相关专业人才较少、财力有限和投资收益低,也是限制西部地区数据化产业发展的重要因素。2020年全国研发费用中,西部地区占比13.1%,远低于东部地区占比67.1%[7]。人才和科技创新研究是促进数据产业建设的驱动力。当前西部地区各级政府对科技研究和人力资本的投资存在不同区域之间的不均衡现象,陕西、重庆和四川等地的科研经费投入占其他地区的68.9%[7]。此外,地方政府投资主要集中在能源开发和固定资产上,挤占了科技创新驱动力的投入。
二、西部地区在“东数西算”数据布局中的地位
“东数西算”工程的主要目的是发展西部数据中心产业,将东部大量的数据传输至西部,在西部建设算力枢纽和数据中心集群,承接东部数据储备,引导和促进数字中心的集约化和绿色化发展,推动东西部数字经济的协调平衡发展[8]。
(一)资源及技术优势
数据中心的建设规模和算力水平与所选建设地的资源数量及技术发展水平密切相关[9]。东部地区的数据产业市场需求巨大,但有限的资源供给无法满足算力业务的需求。根据中国电子技术标准化研究院发布的《绿色数据中心白皮书》,2018年全国的数据中心耗电量达到1608.89亿千瓦时,2020年我国数据中心耗电量达2000亿千瓦时,预计到2024年,数据中心耗电量将超过全社会电力需求的5%以上。西部地区拥有广阔的土地资源、丰富的气候条件、低人力成本以及丰富且价格相对较低的水、电、光、热等资源[10],这为调整东西部算力资源不平衡状况提供了有效的解决方案,同时也为东部地区数据中心产业发展的瓶颈提供了解决途径。
数据按照访问频率可分为冷数据、热数据和温数据。不常使用的离线类数据多为冷数据。相对于热数据,冷数据访问频率较低,对查询时效性要求不高,但需要长时间甚至永久储存。冷数据的性能要求较低,但需要大容量存储介质。温数据的访问频率和对存储性能的要求介于热数据和冷数据之间[11]。
东部地区数据中心产业市场使得该地区更偏向于热数据和温数据的处理,而西部地区则具有地理和资源优势,更适于处理冷数据或温数据以及离线备份和归档数据[12]。具体而言,西部地区可通过高效利用当地丰富的土地、电力和人力资源,融合能源、数据业务和信息传输等多个数据产业环节,建设大型数据中心,构建云计算一体化的算力网络平台,为东部地区受限于能源和土地的情况,调度算力平台,提供大数据处理能力和数据存储系统。
(二)产业布局
“东数西算”工程的首要任务是在不同数据中心集群间之间,以及数据中心集群所覆盖的不同城市之间建立网络传输线路,尤其是东西部骨干数据网络之间的信息传输通道[12]。
虽然西部地区数字科技起步晚,发展较为缓慢,数字产业化水平也相对较低,但近年来西部地区的城市中心发展迅速。除国家中心城市西安、成都、重庆外,兰州、昆明和贵阳等城市的城市动力也在不断增强[4]。城市建设的推进促进了大数据产业链的升级。除了依托当地水、风、电等资源进行数据中心基础建设外,当前西部地区也涉及人工智能企业、互联网数据等尖端大数据产业。这扩大了数据中心的市场需求,为东部大数据产业要素的跨域互通、转移以及构建东西部骨干算力网络奠定了基础。如2016年,华为云与贵州省政府签署合作协议,启动贵安华为云数据中心,主要承载数据备份、储存以及数据离线分析等业务,并且辐射至重庆、云南等多个周边城市[13]。
三、西部地区“东数西算”数据大数据产业建设的思路
(一)大数据产业的建设方向
算力网络的构建根据“十四五”数据产业发展规划,结合西部地区资源和数字技术处理特征,进行当地大数据产业的优化升级。可针对性引进点对点的龙头企业的投资建设,以龙头企业数据中心建设为带动点,构建可持续发展的大数据产业链。
可主要集中于:①国家部署或大型国有企业的能源、医疗、文化等行业数据源:优先发展国家部署或大型国有企业的数据中心建设,特别是在能源、医疗、文化等行业。这些行业的数据源丰富,建立与之相关的大数据中心将推动产业链的发展。
②大型商企的云计算、云储存等数据调度服务:引入大型商企的云计算、云储存等数据调度服务,提供灵活、高效的数据存储和计算能力,满足各行业企业的需求。
③低技术门槛的数据基础服务:建设低技术门槛的数据基础服务,如数据标记、清洗、分发等。这些服务对于中小企业来说较为重要,可以促进其利用数据资源进行创新和发展。可以以龙头企业的投资建设为主导,培育扶持本地创新大数据服务和数字企业的发展,并建立标杆企业。通过建立标杆企业,可以带动更多数据中心产业的建设,形成协作共生的发展模式。此外,在政策的带动下,需要拉动更多投资,同时建立健全的高层次人才的引进机制和培训新模式。加强对数据中心运行、维护和研发人员的培养,提高其理论知识、技术能力和创新能力。这将增强投资效益,并吸引更多资金流和人才流入,为当地大数据产业链的建设提供更多的动力。
(二)大数据产业构建的途径
“东数西算”工程是针对东西部地区数据中心产业发展的不平衡而提出的解决策略。西部地区的算力资源为数据中心产业的发展提供了较大的空间和潜力。具体大数据产业构建途径如下:
1.加强和推进西部数据基础设施建设
优化资源配置,建立新兴技术设施,搭建与“东数”相适配的“西算”网络体系。以数据传输网络通路为例,有序推进千兆光纤网络和5G网络基础设施建设,通过设备的更新和技术的改造,提高生产效益,激发大数据产业新动能,孵育更多数据新产业和产业运行新模式,维持大数据产业的可持续健康发展。另外,制定关于大数据人才和科学研究政策和规范,增加对信息化生产要素的投入,包括专业型、创新型和复合型大数据人才培养和科学研究,为铸建大数据产业高格局持续发展提供坚实基础。
2.从数据产业化需求的角度出发
推进当地文化经济产业的建设和发展,增加对数据中心的上下游产业链的需求,加速数字经济向全产业的融合发展。文化经济与大数据应用是相互促进、相互影响的。大数据应用通过改变文化产业的呈现形态和运行模式,进而影响人们的生活方式和文化经济结构。数据中心作为数据交换的通道和枢纽,与文化经济产业的建设密切相关。通过扩大文化经济产业市场需求,可推进数据中心的内需体系,两者相辅相成,促进数字经济循环的稳定构建。
3.通过借助东部地区先进的科技和重点数字经济企业等优秀资源
设立互利互惠的大数据产业项目企划,邀请支援方在西部地区建立数据合作项目,推动数据化产业项目的落地和实施。同时,可以邀约国家重点高校在西部地区建立科研项目,利用他们卓越的数据计算力、数据库能力、存储能力和人工智能等方面的优势,将其在西部地区的科研数据和科研成果转化为数字化产业的推动力。通过这种合作方式,可以实现东西部地区的资源互补,推动数字经济的均衡发展。
4.加强西部地区内区区之间和东西部其他数据中心的合作
推动数据共享,提高数字信息挖掘水平和动态统筹算力,探索建立智能调度算力网络系统。如建立西部区域内区与区之间的能耗指标共享机制,动态进行数据中心耗能监测,根据区差异,进行能耗指标阶梯扶持。通过东西部地区大数据信息的共享流通,为不同数据中心或企业间数据交易提供共性服务,最大程度实现数据价值,有益于数据中心集群生态交换体系的可持续发展。
四、結束语
全国区域大数据产业目前处于初始发展阶段,数据中心在全国布局基本确定,但地区局部大数据产业的规划和布局仍在摸索调整中。在国家政策的扶持下,西部地区需树立追赶意识,把握发展机遇,根据地区优势,统筹能源建设、人才吸纳、数据共享、网络通道优化等体系,在大好形势下乘势而上,构建西部绿色数据中心和算力网,全面实现数据汇集和跨域流通,进而顺利推动地区数据产业的平衡集聚,为实现全国东西部数据经济的协调发展提供强大动力。本文基于西部大数据建设的现状和其在“东数西算”数据布局中的地位分析,从大数据产业构建的方向和实现途径两个层面,探索性地分析和探讨了“东数西算”布局下的西部数据算力网络构建思路,具体从基础设施和人才储备建设、数据产业化市场要求、制度设计等层面提出路径建议,希望对西部地区“东数西算”工程的顺利实施提供参考。
参 考 文 献
[1] 温涛.四部门发布《全国一体化大数据中心协同创新体系算力枢纽实施方案》 大数据中心助力数字经济蓬勃发展[J].中国经济周刊,2021(10):90-91.
[2] 王亮绪,南卓铜,吴立宗等. 西部数据中心数据集成和共享的回顾与展望[J].中国科技资源导刊,2010,42(05):30-36.
[3] 南卓铜,王亮绪,吴立宗等.科学数据中心数据与知识集成[J].中国科技资源导刊, 2010,42(05):15-21+36.
[4] 骆铜林,郑文森,谢京洋等.中国数据中心产业布局的影响因素研究——基于2010-2019年省级面板数据的实证分析[C].2021年(第七届)全国大学生统计建模大赛,2021: 875-907.
[5] 数据观综合.“东数西算”工程带动各方面投资超1900亿元[EB/OL].贵州省大数据发展管理局,2022-04-18[2022-04-10].https://dsj.guizhou.gov.cn/xwzx/gnyw/202204/t20220418_73488940.html.
[6] 高技术司.“东数西算”工程助力我国全面推进算力基础设施化[EB/OL].中华人民共和国国家发展和改革委员会官网,2022-03-07[2022-04-10].https://www.ndrc.gov.cn/xxgk/jd/jd/202203/t20220317_1319467.html?code=&state=123.
[7] 国家统计局 科学技术部 财政部.2020年全国科技经费投入统计公报[EB/OL].中华人民共和国国家中央人民政府,2021-09-22[2022-04-10].http://www.zgyq.china.com.cn/2021-09/29/content_41688890.html.
[8] 刘富荣.加快实施“东数西算”工程对构建全国一体化大数据中心体系新格局的重要意义[J].财经界,2021(17):1-2.
[9] 郭亮,吴美希,王峰等.数据中心算力评估:现状与机遇[J].信息通信技术与政策,2021(02):79-86.
[10] 董平.西部地区生态环境与经济增长的协调发展研究[D].成都理工大学,2017.
[11] 姜晓青,王钦若.大数据环境下冷数据存储技术概述[J].工业控制计算机,2016,29(06):58-60.
[12]邢接力.构建国家级分布式架构“东数西算”為数字经济再添新动力——访上海市计算机学会存储专委副主任陈雪菲[J].广播电视信息,2022,29(04):105-106.
[13]谌思宇.加快建设世界最大数据中心聚集区[J].当代贵州,2020(24):33.
李刚刚(1988.10-),男,汉族,甘肃庄浪,本科,助理工程师,研究方向:数据采集。