智慧图谱:洞悉每一次“蝴蝶振翅”
2018-10-27张贝贝
文/张贝贝
互联网时代,海量数据汹涌而来,该如何有效利用数据挖掘高价值信息,敏锐发现客户诉求,把握商业机会?知识图谱助力企业实现每一次市场洞察和科学决策。
在一篇名为《一只蝴蝶拍一下翅膀会不会在德克萨斯州引起龙卷风?》的论文中,美国气象学家洛伦芝(Lorenz)提出,亚马逊流域的一只蝴蝶扇动翅膀,会掀起密西西比河流域的一场风暴。洛伦芝把这种现象戏称做“蝴蝶效应”,简单理解即一件表面上看来毫无关系、非常微小的事情,可能带来巨大的改变。
当前,大数据、人工智能等技术的不断演进和快速发展开启了信息化发展的新阶段,数据已成为关键生产要素,“软件定义、数据驱动”对于推动行业转型升级发挥着重要支撑作用。国家相关部门已推出了一系列推动大数据产业发展的举措,并正在扎实推进大数据战略的实施,大力推动大数据和实体经济融合,打造数字经济时代下的国际竞争新优势。
面对纷繁复杂的海量数据,面对消费者实时交互数据的多样性,谁能够洞察市场和客户诉求,实时发现商业机会,优化服务体验,谁就能运筹帷幄,决胜千里。当然,在精准地进行市场洞察后又该如何进行科学的决策,还面临着很大的挑战。
据了解,目前超过70%的大数据属于文本数据,传统分析决策产品无法对海量的文本数据进行处理,无法按照商业知识对文本数据的颗粒度分类与关联,构造行业知识图谱。而业界流行的简单的舆情监测只能看到统计结果,无法探索到事实背后的原因。但现实情况是,从问题出发,实时获得答案是业务决策人员的迫切需求,但往往大数据分析需要长时间处理,无法实现“所思即所得”。
此外,IT分析人员与决策者之间的知识鸿沟会造成“信息漏斗”,各方人员需要付出大量的时间成本来沟通,而与此相对应的分析模型却不能随需求而变化、调整。这些挑战让不少行业决策者举步维艰,无论是金融、家电、服装、旅游,还是政府、科研都面临类似的决策困境和挑战。
知识图谱科学决策之利器
面对挑战,迎头而上才能把握机会,凸显行业竞争实力。北京智慧图谱科技有限公司(简称智慧图谱)便是这样的一家人工智能科技服务公司。其背靠全球领先的文本大数据服务商北京智慧星光信息技术有限公司(简称智慧星光),基于首创的新一代智能知识发现平台和“知识即服务”模式,帮助客户关联分散的数据,高效地进行市场洞察、产品洞察、服务洞察和投资洞察。目前,已在零售品牌商、金融机构、通信企业、咨询机构、公关广告公司等行业客户中形成了很好的口碑。
北京智慧星光信息技术有限公司董事长李青龙
据北京智慧图谱科技有限公司CEO王绪刚介绍,人工智能最近这几年可谓风头十足,然而很多人一提到人工智能技术马上想到的是人脸识别、图像识别、语音识别等技术,其实这些只是人工智能技术中的一类重要应用,即模式识别,它模拟了人类的“感知”功能—这是高级生物都具有的功能。
人类智能还有一个重要的能力,即决策推理能力,这一能力更具商业价值,而“知识图谱”就属于这一类“认知”技术,除了对非结构化数据的识别以外,它更强调对商业语义的理解、推理和预测。而智慧图谱所采取的技术就是基于“知识图谱”来为政府、行业用户、企业和研究机构提供更优质、高效的决策支持。
据介绍,知识图谱作为人工智能的研究分支,被广泛应用于社交网络分析、语义分析、反欺诈等应用场景中。从语义网到Linked Data再到知识图谱,在学术界已小有名气的这些技术,在工业界的应用才刚刚开始。
对此,王绪刚强调:“对我们来说,大数据的核心价值是更高效地发现未知,甚至预测未来。而产品化的目的是让大数据的价值更易被发现和利用,甚至不懂技术的人也可以驾驭。因此,这就需要知识图谱等一系列的技术组合来完成。与其他人工智能分支技术相比,知识图谱强调用数据进行业务语义的表达,这就为‘人可以理解’的人工智能奠定了基础,人机更容易协同工作。机器不断被纠正、不断强化,最终利用机器学习闭环实现准确率更高的自动化决策,实现自我学习和自我增长。”
技术攻关迈向人机协同
对于知识图谱的本质理解,北京智慧星光信息技术有限公司董事长李青龙从根本上进行了阐释:“从根源上来看,知识图谱就是探索式地解决客户不知道的问题,让用户能够洞察表象背后看不到的本质,并且能够看到不一样的结果。过去,我们更多是去解决信息不对称的问题,或者进行数据分析,随着这种分析手段不断发展和推进,我们就需要更深入地切入客户的实际业务过程中,为他建立行业应用的知识图谱,最后能够为决策者提供智慧、科学的决策参考。但是这个过程是很困难的,很多人更多的是做一些外围的理论性工作。”
李青龙提到,知识图谱的技术攻关非常难,那么究竟难在哪里?
对此,王绪刚介绍了团队在研发“知识图谱”相关技术上的一些瓶颈和难点。“最早我们是做结构化数据的自动推理。例如,如果我认识你,我可能还认识谁;我喜欢这个产品,还喜欢另外一个什么样的产品;我看了这个影片,还会喜欢看什么影片等此类的自动分析和推理。目前这些类型的应用黏性非常高,能够主动给你推送你最喜欢的东西。它实际上是替代了千万个人工做的筛选工作。但是后来我们发现,在处理非结构化数据的时候,一部分的自动推理能起到作用,还有一部分需要大量的人工协同工作。当我们要产生一个商业上的判断和决策的时候,比如是否需要调整产品的价格,设计上需要哪些改观和优化等,这些需要加入人的一些商业经验再做判断,这时候就要求高效的人机协同了。”
目前,对于智慧图谱来说,关键是进行第二步—人机协同方面的攻关。王绪刚强调,最难的就是把人类大脑的知识、经验、常识赋予计算机。但这个阶段是必须跨越实现的。“未来,我们将继续研发大规模知识图谱可视化构建、图谱数据挖掘算法,让数据的价值应用能以最快的速度在每个行业落地。比如,在旅游行业,我们已经积累了丰富的互联网行业数据,并利用知识图谱技术做到让机器自动推理,大大提升市场分析人员数据驱动决策的效率。经客户实践,分析效率较使用前提升30倍,同时满足决策者实时洞察每个运营单位的现状与趋势的需求。”
据了解,智慧图谱背靠的智慧星光已经积累了丰富的互联网文本大数据资源及客户使用反馈数据,加之智慧图谱的行业知识图谱技术,大幅提升了智能决策的准确度和知识图谱的构建速度。
IGraph平台捕捉“蝴蝶振翅”
基于知识图谱的技术应用,智慧星光推出了IGraph,一款为研究人员提供的集数据获取、治理、语义识别与分类、关联分析、可视化于一体的在线决策平台。它通过整合协作式爬虫、自然语言处理和知识图谱技术,将散乱的互联网上相关的产品、价格、评论以及营销活动信息用语义化的方式关联起来,让业务人员自己可以以问题驱动的方式进行推理与预测,实时洞悉行业每一次“蝴蝶振翅”。
目前,公司已为旅游、家电等多个行业提供了IGraph智能知识发现平台,实现电商、垂直论坛、社交网站评论等数据的汇总,实时分析,助力企业决策智能化,高效调研市场需求、监控竞品动向、了解消费者需求及产品服务的优化痛点。
从创新性上,王绪刚介绍,IGraph主要具备以下几点特性:
1.实时探索分析。利用图计算(专利)技术,基于大规模知识图谱数据进行实时计算,自由关联分析,支持超过亿级数据量和毫秒级计算响应,让用户可以做到即时决策。
2.像人类思考一样去做分析。基于知识图谱的交互探索式分析,可以模拟人的思考过程去发现、求证、推理,业务人员自己就可以完成全部过程,不需要专业人员的协助。
3.Knowledge As A Service(KAAS)。内嵌产品,营销知识图谱规范,自动化形成语义标签。不仅提供数据和分析能力,同时提供3C、汽车、服装等30多个行业知识图谱。内置购买阻力模型、流行趋势模型等50多个智能模型。
4.知识沉淀。利用交互式机器学习技术,支持根据推理、纠错、标注等交互动作的学习功能,不断沉淀知识逻辑和模型,提高系统智能性,将知识沉淀在企业内部,降低对经验的依赖。
5.协作效率。包括分析模板、分析仪表盘、知识配置三大功能,支持分析师—业务决策—知识工程师在线协作,防止沟通漏斗。
据介绍,数据决策过程需要多种背景,对企业管理者而言,能够实时了解自己与竞争对手的实际运营状况,从产品、服务、客源等角度实施比对分析与决策支持是急需的技术。通过采集评论分析与同业竞调等维度,实时调取数据,及时对自身产品和运营做出调整,为客户提供满意服务与强体验产品。
同时,在分析决策的探索过程中进行业务知识的传递与沉淀,保证企业不会因为某个人的变动而造成业务的停滞,业务知识才是企业真正的商业壁垒。
访谈实录
Q:中国大数据产业生态联盟、《软件和集成电路》杂志社
A: 北京智慧星光信息技术有限公司董事长李青龙
北京智慧图谱科技有限公司CEO王绪刚
Q:如何理解蝴蝶效应和市场洞察?
李青龙:我理解的是窥一斑而知全豹,实际上就是从一个细微之处开始分析,能够看到整个态势的变化。其实这也是所有的信息、数据服务的一个过程。不管怎样,我们要先解决洞察的问题,然后再分析洞察背后的关系,挖掘业务的相关度。第一步我们已经实现,第二步要将知识图谱的这套技术与用户的业务做更深入的关联,最终达到“所思即所得”的决策支持。
北京智慧图谱科技有限公司CEO王绪刚
王绪刚:市场上一个细微的变化有可能会给行业带来颠覆,比如一些互联网公司的出现就改变了旧有的产业格局,产生了新的业态。那么对于企业家来说,他困惑的是不知道这个细微的变化,不知道这只蝴蝶在哪里振翅。然而,世间万物都是有关联性的,由A导致B,由B导致C,由C导致D、F,正是这种关联性才会产生蝴蝶效应。知识图谱实际上就是把关联性关系构建好,当一个事件发生以后,你会实时地知道它对你现在的业务产生了哪些影响,这也是知识图谱推理的过程。
Q:目前知识图谱技术如何与业务相结合,并落地到用户应用中?又给用户带来了哪些价值和作用?
图 智慧星光知识图谱架构
王绪刚:基于知识图谱,我们开发了一款智能在线口碑分析产品,它突破了传统舆情的思路,不以关键词为输入,而是整合了互联网消费者的口碑数据,比如电商评价、OTA游记、社交评论等,事先勾勒好行业的知识图谱,从而可以做到更接近业务的洞察和“随需分析”。市场人员可以采取“所思即所得”的方式,从问题出发,实时发现运营中的客户需求、痛点、竞争对手的变化等,达到分析决策的高效与有效双重保证。
知识图谱通过概念节点,可以把来自不同数据源、不同格式的数据通过一套语义表达体系融合起来,因此,未来我们将继续推动知识图谱技术在数据融合方面的落地。只有内外部数据打通,才能发现更多的价值。
Q:从技术角度看,我国企业该如何与国外缩短距离,作为国内企业又该如何修炼内功,发力大数据技术?
王绪刚:我国企业,尤其是民营企业,管理流程与理论相对于国外企业没有那么完备,而任何技术在企业内部的落地都是管理方法的IT实践。我国互联网技术的应用在世界范围内形成了一种新的企业管理方法。如何利用互联网资源,从数据、消费者管理、用户体验和企业内部决策等方面,通过大数据技术落地,这是我国企业的机会。
行业应用案例
案例名称:旅游行业客户口碑分析
核心特点:
·全平台收集游客意见反馈:整合生活服务类网站、OTA垂直网站等多个数据源,采集用户在游记、评论等中的游园反馈。
·建立了从游客入园到离园的全流程标签体系,能快速洞察游客对餐饮、游乐设施、演出、交通、排队体验等各个环节的满意情况,更快速、更有针对性地优化园区整体运营。
应用解读:
旅游行业中,游客对旅游产品/服务的体验满意度决定了客户的重游意愿。但园区发现通过园内拦截的方式进行满意度问卷发放,存在采样规模少、游客配合度低等问题,并不能了解到游客对园区游玩过程的意见和反馈。
应用价值:
客户满意度增加了25%。游客在线评论的整体满意度大幅提升,有效建立了主题公园的良好口碑。