摆渡大数据
2018-05-30王世虎
王世虎
10月26日,中国华录集团控股的上市公司——北京易华录信息技术股份有限公司发布2018年第3季度财务报告,国联证券点评认为易华录数据湖建设推进顺利,使得公司现金流有所改善。
在“以数据湖为主体,协同发展大交通、大安全、大健康”的战略指引下,基于公司徐州淮海数据湖和泰州华东数据湖项目的良好示范效应,易华录陆续在重庆、开封、北戴河、延吉等城市落地了数据湖项目,同时发布微型数据湖产品D-BOX,在全国200多个城市进行推广。
数据湖吸睛
2018年4月,徐州政府与京东集团签订合作协议,在淮海数据湖基础设施建设的基础上,推动徐州市与京东集团的全面合作,加快京东云在数据湖上的部署,提供云计算服务。通过京东物流、京东金融、京东大数据等优质要素配置赋能徐州市铜山特色产业发展。2018年6月,华录集团和徐州市政府签署战略合作协议,北方华录与铜山区政府簽署战略合作协议,蓝安公司与10家独角兽企业签署战略合作协议。
淮海数据湖项目总投资约39.8亿元,建筑面积8.07万平方米,开展园区、数据湖、城市大数据应用的建设和运营。项目建设周期3年,现已完成数据湖一期工程(可实现100PB存储规模)建设,并由高新区政府牵头,发布相关政府条例将政府数据迁入数据湖中,现已有10余家委办局或事业单位的数据存入数据湖中。
目前蓝安公司(SPV公司)已经注册完成正在开展整体项目建设,已将铜山区36个委办局的数据及应用系统迁移到示范湖中,一期示范湖开通了云主机资源50多台(财政局、教育局、环保局、交通局、农委、发改委、图书馆、水利局、安监局、新闻中心)并满载,现在根据政府需求正在进行二期扩容,设备正在安装调试中。现与20多家委办局进行对接将其存量数据全部迁移完成,目前数据总量达到30PB。初步形成了大数据示范效应,吸引了100多个地方政府参观团前来考察学习。
2018年5月16日,世界智能大会在天津举行,北京易华录作为大会的唯一战略合作伙伴,通过津南数据湖打造数据开放大赛,深度参与智能大会,与来自全球的合作伙伴、客户、媒体和意见领袖建立数据湖生态合作圈,推动世界智能化进程。大赛为津南数据湖项目的数据生态发展奠定基础,大赛设立100万奖金以及5000万产业孵化基金,截止6月29日吸引来自全球的1740支创新创业团队,比赛提交次数达到2467次,挖掘开放数据潜能,破解大数据应用难点,寻找大数据产业“新风口”,推动津南数据湖与地区产业深度融合,助力经济加速发展。
天津津南数据湖总投资达42亿元,其中园区建设投资20亿,建设35万平方米,含数据中心机房、孵化器、加速器、办公区、公寓、生活配套设施等(直接投资);数据湖+智慧津南投资23亿元(PPP模式)。津南数据湖目前已将津南区安监局100T安监视频数据专线传输到津南示范湖中。天津西青区交管局大数据一网通平台中的交管视频数据陆续引入津南数据湖中。津南数据湖2号机房已有35台机柜出租给天津广电,提供海量数据存储等一系列服务。
津南数据湖以未来科技园(华录未来科技园占地8300平米,目前已有10余家技术团队和高新企业入驻)为重要依托,将建设成为具有国际先进水平的,集智慧城市、智能交通领域产、学、研、展、销为一体的高科技产业集群,园区的建成将促进地区产业优化,为增加就业率、推动地方经济发展做出更大的贡献。
天上到地上
“如果把一张光盘存储的数据比作一滴水,那么一个能够承载城市海量数据的大数据中心,就可以被称作是这个城市的数据湖”。城市数据湖是中国华录集团于2016年基于时代发展需要和政府管理服务需求提出的政府新一代数字经济基础设施,其依托蓝光存储与光磁融合一体化技术可实现海量大数据的长期存储,利用其低能耗的特点可满足绿色数据中心建设要求,实现节能减排,同时还具有防篡改、抗电磁攻击等安全特性,具备“海量、绿色、生态、安全”的特点。
“天上有云,地上有湖”是城市数据湖自提出之后,始终坚持贯彻的基础理念,其生态体系架构设计围绕着“湖存储+云计算”展开,数据湖采用蓝光存储和光磁融合的新技术,实现对于大数据时代的海量数据存储;云计算是数据湖生态体系中另一个重要的部件,传统IDC数据中心用磁盘阵列来存储与运算数据,成为实现云计算的载体。而传统磁盘阵列存储成本高,搭载数据“水资源”容量非常有限,例如:历史视频数据只能存放一个月,超过时间只能删掉,造成数据“水资源”的大量流失。在数据湖生态体系中,云上承载不了的数据“水资源”,遇冷形成降水,形成地表水和地下水,地表水代表那些有价值待存储的数据,地下水代表有价值但尚未实现存储的数据,均可导入数据湖中进行存储。
和传统的磁盘存储相比,光磁融合数据存储机制以更低的成本提供更优质的数据服务,有效保存经济社会运行过程中各行业各方面的原生态数据,为大数据分析和人工智能应用提供数据资源支撑,同时基于其开放共享的平台机制为整个城市的大数据生态发展奠定了基础。
建湖三部曲
城市数据湖通过“建湖”“引水”“水资源利用”三部曲,构建了融合数据感知、存储、处理和应用为一体的智能化综合信息基础设施,具有汇聚海量数据势能、分析转化数据动能、形成数据应用生态、拉动区域经济等优势。
第一步是建湖,以光磁融合的方式合理分配存储资源,同时在软硬件方面结合人工智能、大数据、云计算等尖端技术搭建数据储存载体,为海量数据存储及利用提供安全、绿色的存储空间和分析平台。为更好地服务城市信息基础设施建设,推动城市网格化管理,现阶段华录集团提出了“一湖多点”的建湖新思路。“一湖”即以区域内大规模数据湖为主湖,“多点”即在本区域内其他各县(市)区子湖,根据实际业务需求,为每个各县(市)区新建数据湖子湖。由政府出台数据汇聚、存储、开放、共享政策,规范全区域政府数据资源管理工作,推进政府数据资源“聚、通、用”,将各县(市)区先行导入到子湖中,后将海量数据通过子湖汇聚到主湖,由主湖对汇聚数据进行分析加工,为管理、生产、经营等多领域,提供一流的大数据服务,助推区域数字经济发展。通过“一湖多点”,实现数据的融合、共享,为未来的数据产业发展,人工智能产业集聚,打下坚定的基础。
第二步是引水,即在基础设施建成后,利用政府数据先行打入、产业融合等手段多方引水,通过设立标准的数据类型和数据接口,为不同数据源个性化定制相应数据导入方案,保证数据安全、完整、高效的导入数据湖,形成城市数据海量资源池。同时考虑政府各个委办局及行业因为业务系统的复杂性,都会产生大量的结构化或非结构化的数据,并且由于各个不同行业数据的属性、特征、价值的不同,国家部委或行业监管部门对其数据存储的政策、存储的介质、存储的周期都有不同,采取“多处引水”或“集中蓄水”等不同的建设策略和存储方式,推动各行业数据资源的整合与采集。
第三步是水资源利用,当大量数据集聚完成后,以数据作为重要的招商资源,通过数据确权和制定相应开放规则,对数据进行预处理、脱敏等操作,然后有序开放给大数据、人工智能和互联网等领域的企业,通过问题众治、产业众包的方式,融合开发新的运用,并将随之产生的新数据循环利用,服务于各式各样的智慧城市应用。
现华录集团通过城市数据湖这一大数据时代城市数字经济基础设施与多地政府、企业展开合作,已在天津、徐州、泰州、株洲、重庆、德州、开封等10余个地市开展城市数据湖建设,力争在2年内在每一个省布设一个“大湖”(规模在1000PB以上),用5-10年让每一个地市拥有自己的城市数据湖(“子湖”)。
在大数据时代,“开放共享、合作共赢”的理念将是大数据企业乃至大数据产业发展的关键,因此华录集团在开展城市数据湖建设的同时更重视大数据生态的建设,现已组建成包含170余大数据、人工智能企业的数据湖生态圈,涵盖20余个行业,各家企业以数据湖为基础,数据为生产要素,携手并进、共同发展。
蓝光耀全球
中国华录是唯一专业从事数字音视频研发、生产和服务的中央企业,拥有“中国高清第一品牌”等称号,在蓝光领域是我国唯一一家拥有“国际蓝光光盘联盟有贡献级会员”称号的企业,其用于数据中心级存储的蓝光存储技术世界上仅有中国华录和索尼两家掌握,已为Facebook、国家信息中心等众多国内外用户提供蓝光存储服务,同时华录蓝光存储技术已被列为工信部发布的第一批《绿色数据中心先进适用技术目录》。
具体来说蓝光存储技术相比传统磁盘存储技术具有容量大、低能耗、低成本、寿命长、安全可靠等四方面技术优势:基于现有单张光盘300GB的存储技术,可实现蓝光存储机柜(47U标准机柜)1.64PB的存储能力;蓝光存储机柜,满负荷工作功率130W,待机功率仅为7W,蓝光存储的耗电量是磁盘阵列存储的3‰;经德国TüV公司检测认证,蓝光盘具有50年以上的使用寿命,无需频繁的存儲设备更新和数据迁移,数据存储整体成本仅是磁盘阵列存储的6.5%;蓝光存储技术采用单向刻录技术,可避免数据篡改,因其存储介质采用无机物可具有防电磁攻击的能力,同时蓝光光盘在面对高温、高湿、光照、水浸、强力弯曲、划伤等外界影响后依然能够保证数据读取。
推动信息化
城市数据湖的建设将有效提升区域信息基础设施水平和信息化服务能力,并在政务服务、产业提升、产业导入、民生服务等方面提供有效支持。
政务服务:通过数据湖的建设有效汇集各委办局的数据,形成城市数据资源池,通过数据共享、分析、挖掘有效提升政府现有各类政务服务应用的决策能力和业务能力,形成以数据分析为决策依据的城市大数据应用;帮助政府数据招商引资,数据湖汇聚一个区域的海量数据,成为区别于传统土地、补贴以外的招商利器。
产业提升:通过数据湖的建设为区域提供数据存储、计算、分析的资源,为其产品研发、定制化生产提供可能,有效将数字经济和实体经济结合,快速实现原有产业提升;建设城市数据湖能够促进区域和城市创新发展,通过在全国各地建设数据湖这一信息基础设施,形成城市产业链效能,最终形成业态良好发展的局面;建设城市数据湖是区域数据汇聚、开放、利用的需要,构建智慧城市云基础架构,提供综合的共享的应用支撑和管理能力;建设城市数据湖能够促进区域传统产业转型升级,引导传统产业更好地应对市场变化,推动互联网金融、互联网教育、互联网医疗等新型产业与传统产业快速融合。
产业导入:通过双创中心的培育、孵化,大数据生态圈的构建,为区域培养或引入大数据和人工智能类型的企业,为区域产业结构提供新的成分,从而实现产业结构转型;建设城市数据湖能够打造区域大数据产业生态,引导技术源、物资流、人才流、信息流等新资源、新要素的投资进入与落地实践。
民生服务:建设城市数据湖有助于改善政府公共服务和社会治理,建设城市数据湖,精耕数据,能够提升民生服务质量。通过大数据的分析,协助政府和企业发现市民在政府服务、生活服务上迫切存在的需求,对城市数据湖这个庞大资源池中的各种数据精耕细作,寻找服务应用的创新点和突破点,有效提升民生服务的服务质量,真正做到以人为本的服务理念。