APP下载

块数据4.0
——人工智能时代的激活数据学

2018-10-08

领导决策信息 2018年21期
关键词:海量关联群体

2018年5月28日,由贵阳大数据战略重点实验室研究编著的最新理论成果《块数据4.0:人工智能时代的激活数据学》正式发布。未来人类将进入超数据时代,超数据时代将是一个更加开放、更加复杂的巨系统,对数据科学研究的思路与方法也应当发生相应的转变。《块数据4.0》围绕块数据的理论架构开展深入研究,创新性地提出激活数据学,构建了基于复杂理论的应用模型,为大数据领域和人工智能领域的探索研究提供了一个崭新的视角。

绪 论

大数据时代的解决方案

我们没有把大数据仅仅看作所谓的“大”的数据,而是把大数据看作一种“活”的数据,因为只有激活,大数据才有生命,才有社会属性,才能成为未来世界人们赖以生存与发展的土壤和空气。激活数据学的核心正是将人类认知能力与计算机快速运算和海量存储的能力结合起来。一方面,提高智能系统的置信度,避免人工智能技术的局限性所造成的风险甚至危害;另一方面,建立人类参与的混合增强智能,将海量数据通过人机混合增强智能实现最佳释放。这种形态是人工智能可行的、重要的成长模式。

超数据时代

超数据时代的数据拥堵

超数据时代,由数据短缺变为数据过剩。信息爆炸与数据爆炸带来海量信息、垃圾数据泛滥,使得人类被无边界的数据层层包裹,最终形成认知障碍。我们把这种问题和困境称为“数据拥堵”。在超数据时代,复杂性的、动态的思维方式将被树立,人们的思维方式也将呈现复杂性的变化趋势。人机物三元融合将使得数字科技沉浸式地渗透到实体经济和社会服务活动中,通过人机物闭环协作交互过程提升生产生活的智能化水平。

数据搜索

数据搜索:智能感知

数据搜索是激活数据学中的准备阶段,是块数据系统依据某种信号组织相关数据的一种行为。激活数据学中的数据搜索,实现了在关联数据体系的基础上从孤立的“数据”到全局数据的“汇聚”过程。基于激活数据学的数据搜索结合新一代人工智能技术,摆脱了传统搜索引擎的局限性,更加智能化,更具主动性,提供多元化的搜索方式,为用户提供个性化定制服务,更好地满足用户的个性需求。

关联融合

关联融合:智能聚合

在智能搜索获得的数据集中,需要处理的数据可能来自不同数据域、不同数据源,同时还具有不同的数据形式。从人脑整合不同感官之间的信息模式出发,激活数据学提出一种新的方法体系——数据跨界关联融合。它通过对搜索出来的模糊结果数据集进行降维去噪、关联识别、跨界重构,深度挖掘数据的显性价值与隐性价值,形成相对精确的结果数据集。

激活数字据学

激活数据学是一种新的数据科学理论与方法,其目的在于解决超大规模数据的获取、筛选、融合、计算和分析问题。激活数据学是块数据理论的升级版,它以块数据为基础数据资源层,以“数据共享、互联互通、业务协同”为原则,汇聚海量跨行业、跨领域的数据并进行融合重构,构建自由流动、立体化的数据存储体系,并以深度神经网络和人机交互接口为决策分析层,模仿人脑思考方式和群体智能,进行数据挖掘、预测分析与智能决策,提升决策与分析的智能化和准确率。

群体智能

群体智能:智能碰撞

激活数据学中的智能碰撞是把传统强调的专家智能模拟转移到群体智能,智能体的构造从逻辑和单调走向开放和涌现。在人和智能体组成新型的智慧群体的过程中,智能碰撞能够让人类和人工智能相互学习,充分发挥各自优势,使得人机之间劣势互补、优势增强,借助互联网平台,能够高效重组群体,形成更广泛、更精准的群体智能。

云脑时代

云脑时代:开启数字文明新纪元

云脑时代是运用激活数据学这个新方法论推动人、智能机器和云计算等融合发展的新时代,也是新技术、新模式被激活应用的时代。未来的互联网,将不再只是部分领域的互联网,而是全人类共同享有的互联网,也是在实现了人的全面自由发展环境下的自由互联,推动全人类进入数字命运的共同体时代。

应用场景

激活数据学的应用场景

人工智能时代是一个更加开放、更加复杂的巨大系统,可以对不确定性和不可预知性实现更加精准的预测。激活数据学以发现块数据内海量复杂数据的潜在关联和预测未来为目标,以复杂理论的系统思想为主要范式,探索其理论基础和运行规律,并且尝试用量化手段进行模型构建。对于城市而言,城市大脑可以将散落在各个角落的数据汇聚到一起,使用云计算大数据和人工智能技术,让城市的各个“器官”协同工作,变成一个能够自我调节、与人类良性互动的有机体。

热点减量化

热点减量化:智能筛选

热点减量化是超数据时代如何对海量数据进行有效取舍的一个重要途径。热点减量化通过自激活步骤,对数据单元活跃状态进行清晰的层次划分,并以此为依据,挑选出更具价值的数据单元进行分析。通过模仿人脑筛选信息的遗忘机制,借鉴大数据信息取舍的方式方法,结合人工智能时代当下的需求,将遗忘因子作为热点减量化的一个结构性要素纳入分析系统,从而寻求在数据分析中实现以自然遗忘为要件的信息取舍。

自激活

自激活:智能决策

自激活是激活数据学研究的核心环节,是数据价值释放的临界点。在前期数据搜索和关联融合的数据输入下,数据仍然是一个潜在价值的状态,如何发挥其价值,将其变成相应的数据知识进行自主决策输出是自激活自主决策过程中,甚至整个激活数据学系统中最关键之处。在当今数据膨胀的环境中,自激活将对数据运用进行更优化、更有效的提升。科技在发展,技术在进步,自激活阶段的运行过程会不断更新,而随着人们对人脑的了解越来越深,自激活的输出将会实现更大的价值,使人工智能更“增智”。

猜你喜欢

海量关联群体
哪些群体容易“返贫”——受灾户、遇困户、边缘户
认清亏欠问题——对参与近期香港暴乱的青年群体之我见
“一带一路”递进,关联民生更紧
海量快递垃圾正在“围城”——“绿色快递”势在必行
“群体失语”需要警惕——“为官不言”也是腐败
中间群体
奇趣搭配
智趣
一个图形所蕴含的“海量”巧题
从教材中突围,走课内海量阅读之路