APP下载

面向大社交数据的深度分析与挖掘

2019-12-03魏利梅

电子技术与软件工程 2019年21期
关键词:社交分析信息

文/魏利梅

互联网在当今社会各个领域都实现了广泛普及,而且其发展速度非常迅速,网络资源数据容量在快速扩张,大数据所带来的时代变革引起了各国政府的高度重视。在信息技术快速进步的前提下,互联网、物联网以及云计算的技术发展非常迅速,以文本、图像、视音频为主的各类网络大数据增长速度非常惊人,这也标示着我国已经正式进入了以大数据为主的三次工业革命时代,大数据已经成为了当今世界技术创新、核心竞争力以及生产力提升的前沿科技。

1 大数据带来的机遇

(1)对于当前国家的信息产业以及科学技术发展来说,大数据的研究已经成为了其重要的支撑点。网络媒体在当今社会的快速普及,拥有庞大群体的公众在参与网络活动的过程中产生了大量网络数据,这就使得在金融服务、医疗卫生、社会生活的各个层面有大量数据需要进行表达。因此政府部门只有在针对上述各种数据进行及时准确的获取,并进行精确处理之后最终得到正确的信息,才能够及时的发现存在的各种民生问题,在此基础上才能够制定出更加符合时代发展、人民生活需求的决策。

(2)随着互联网经济时代的来临,大数据技术的掌握程度也决定了其经济发展的水平。海量的网络数据中往往都含有非常丰富的个人信息以及个人实际需求等相关的信息,只有在建立起智能化的服务系统之后,才能将各项网络数据的具体内容转化为可利用的有效信息,在此基础上,政府部门就能够进一步提升经济战略部署以及公共服务水平。

2 大数据研究面临的科学挑战

2.1 网络大数据语义理解和分析

网络大数据目前主要是以文本、图像、视音频等作为主要载体形式。用户充分利用谷歌以及百度等常规的搜索引擎就完全能够快速的查找到自己所需要的个人信息,而优酷网等一些平台能够为客户提供大量的视频数据。另外,Facebook、新浪微博以及微信等一些社交网络平台能够为广大用户提供丰富的图像、视频数据。随着数据量的不断增加,有时也带来了数据存储、检索、管理等多个方面的问题。谷歌、百度等一些具有商业性质的搜索引擎主要是建立在网络数据模式下的文本检索;但是在网络大数据快速发展的形势下,大部分的数据都严重缺乏文本描述,因此就必须要充分利用合理的算法来实现对各种数据的分析,并实现对可视化以及音频内容的理解,但是在现在完全文本化的技术水平下很难实现良好应用,必须要充分利用网络大数据的语义来对此进行全面的分析。

2.2 社交网络大数据的群体行为分析与挖掘

随着社交网络的快速发展,使得人们的生态生活逐步形成了网络化、数字化、虚拟化的环境,在此基础上也让人们拥有了从未有过的高度信息知识产权,也进一步促使社会的信息化水平达到了一个全新的高度。在社交网络快速发展的同时,不仅让人们的信息交流需求得到进一步释放,也使得网络信息产生了社会化、内容碎片化的问题,而信息的传播也体现出了更加强烈的网络化特征,在这种形势下,网络信息环境要想实现科学化管理和合理化的应用就具有了一定难度。目前来说,人们并没有对社交网络模式下的群体行为方式进行充分掌握和深刻的理解,从而使得当前社交网络中信息出现了可靠性的问题,信息的传播也存在不可预测的现象,而群体行为本身具有不可控的性质,导致社会数据大量出现的同时,人们对于社会数据缺乏基本的了解。在针对社交网络结构的具体演化过程以及产生群体行为的原动力及其本质进行深入研究分析,能够全面促进社交网络管理实现科学化,而且也能够对网络环境的文明理性发展起到积极的促进作用。

2.3 网络大数据的多维分析与可视化

当今时代网络媒体发展非常迅速,各种新闻、微博、论坛等新媒体平台的发展呈现出了不可阻挡的势头,由此也产生了海量的媒体内容。但是在当今的媒体形势下,往往采用的是简单的罗列来实现对媒体信息的展示,例如,当前一些主流的搜索引擎往往是将各种搜索的结果按照一定的数据来进行简单排列,而大多数新媒体网站也主要是通过人工方式将新闻主页按照不同的区块来进行编辑,而不同的媒体信息之间基本处于单一和孤立的状态,因此在实际浏览的过程中,整体效率非常低下,并不能满足当今时代下网络大数据实际的呈现需求。由于上述几种问题的存在,使得人们并不能够实现对网络热点信息的快速感知,因而也不能够对当前的网络热点信息进行全面、准确的了解。鉴于此,必须要针对当前的网络大数据聚合以及呈现等相关技术进行深入研究,这样才能从根本上进一步改善网络大数据的分析与理解,也能够让网络大数据的使用效率以及实际的使用效果得到进一步提升。

3 国内外研究现状和发展趋势分析

3.1 网络大数据的语义理解与分析技术

大数据语义分析技术的出现能够为网络大数据的理解提供更加充足的支持,也能够为各种大数据的实际应用奠定坚实基础。但是需要注意的是,随着当前网络中异构化数据产生的速度不断提升,导致数据本身的媒体形式更加复杂,如何能够实现对海量异构媒体信息的有效识别就成为了当前需要重点研究的话题之一。领域自适应算法主要是针对某一个目标领域视频数量相对比较有限的条件下,充分利用该领域已经形成的模型来最终构建起该目标领域的模型;但是,在这种模式下还必须要面对如何能够实现对信用模型的合理应用并顺利的建立起目标领域的模型。

在针对当前国内外主要发展现状进行分析之后可以发现,社交网络在具体研究过程中还存在着下面一些问题:

(1)目前人们主要是从宏观的层面来针对网络结构进行分析,而网络结构的微观变化则很少有人进行关注;

(2)对于社交网络来说,其主要是通过传染病模型来建立起信息传播模型,但是并没有在信息传播过程中将用户的个人角色、心理因素以及不确定性等相关因素进行充分考虑;

(3)在实际针对涉及到网络影响力进行分析的过程中,通常情况下都是针对网络节点的全局影响力进行分析,而对这种影响力的多样性则往往选择忽略。

3.2 网络信息聚合与呈现技术

多层次多维度的信息聚合与呈现技术主要是针对多源异构数据的统一性表示进行研究,其关注的重点在于多元动态信息聚合以及管理,并针对当前的网络热点事件进行深度挖掘,并将其呈现给用户,针对这两个方面目前已经开展的多项的研究内容,要想实现对网络热点事件的全面掌握,人们就必须要从多个角度对整个事件进行全面分析,在这种情形下就必须要将整个时间完整的呈现给用户。 现有的方法大多基于数据可视化的策略进行信息呈现。

虽然目前人们已经针对上述内容展开了大量的研究,但是在整个领域的发展过程中还有一些关键性的技术必须进行深入探讨,而这些技术主要包括以下几个方面:

(1)异构媒体信息的语义关联。其主要内容关联整体方式相对比较单一,因此很难适应当前在网络事件深度挖掘实际需求,目前大量应用的数据挖掘都是建立在物理链接的基础上,而这种挖掘方式在很大程度上对各种潜在因素的关联并没有给予高度重视,这样就会导致针对网络事件的挖掘缺乏全面性。

(2)网络事件挖掘。网络事件的挖掘目前主要是建立在搜索的方式之上,其主要利用的是网络数据在某种形式上存在着相似度,通过对数据相似度进行匹配并实现排序来进行搜索,但是在这个过程中并没有对网络事件背后潜在的语义结构进行充分考虑。

(3)媒体内容呈现。媒体内容也往往是以单一的平台网络数据形式来展开对数据的分析,在不同的平台之间或者是异质媒体之间并没有实现对网络事件的协同呈现。

4 结束语

近几年来,我国社交网络媒体的发展非常迅速,从而使得用户数据量在不断攀升,为了能够实现这个社交媒体网络大数据的深度挖掘,并在此基础上为社会网络的发展带来机遇。在未来涉及网络数据的深度分析与发展过程中进一步强化研究,这样才能让网络信息的管理以及实际的应用水平得到有效提升。

猜你喜欢

社交分析信息
社交之城
社交牛人症该怎么治
隐蔽失效适航要求符合性验证分析
社交距离
电力系统不平衡分析
你回避社交,真不是因为内向
订阅信息
电力系统及其自动化发展趋势分析
展会信息
健康信息