APP下载

论网络信息溯源系统建设

2009-05-27吴彬彬

新闻前哨 2009年5期
关键词:搜索引擎用户信息

杨 晶 吴彬彬

[摘要]网络传播信息大多是非线性传播,其规律并元简单的模式可以遵循。对于研究来说,许多信息传播背后深层次的驱动因素无法表征显现,从而导致研究中因素环节缺失,但对信息源头的分析,却是其研究中不可或缺的重要环节。

[关键词]论网络信息溯源系统建设

伴随互联网高速发展带来的信息化水平不断提高。网络正发挥日益重要的作用。网络的功能众多,但传播信息是最重要的功能之一。通过网络的信息传播目前已成为公众传播中一条重要途径。

网络传播信息大多是非线性传播,其规律并无简单的模式可以遵循。对于研究来说,许多信息传播背后深层次的驱动因素无法表征显现,从而导致研究中因素环节缺失,但对信息源头的分析。却是其研究中不可或缺的重要环节。信息在各网站转载过程中、在各种语言相互翻译过程中、在被引用和论证过程中,判断有无失真、局部抽取和剽窃等情况时,更需要利用到信息的溯源性。而在网络传播的信息中如何快捷追溯信息源头以及快速厘清传播路径,正是诸多缺失环节中最为关键的一环。

一、网络信息溯源和溯源系统

网络信息溯源是通过对互联网公开信息的采集,使用自动或者人工的方式,对特定信息加以追踪,从而找出其公开环境下的首发站点或者用户,并且厘清传播脉络的一种技术手段。溯源系统,就是完成整个溯源过程的一套相对完善的体系构架。

网络信息溯源不同于网络溯源。一般来说,网络溯源是指当攻击、仿冒等网络事件发生以后,能根据与此相关的例如日志记录、时间等信息,找到引发事件的实体。这是一种事后威慑方式的安全防范技术。而网络信息溯源,是针对数据外部表现形式的追踪。并且这种数据的外部表现形式对受众是有理解意义的,它是一种相对滞后的查询技术,也是一套实证系统。

二、网络传播中的问题和溯源系统建设的意义

在新闻信息的传播中,各网站编辑更改标题、遗漏或者去掉电头,使得在几轮传播后,读者根本不知道其原始发稿单位。这不仅不利于版权保护,对原发稿新闻网站也极不公平。个别断章取义的或者别有用心的转发者,可能肢解或者局部抽取信息,使得原本正确的信息在传播中可能发生失真。溯源系统的建设。可以让读者和研究者了解新闻的全貌和整个传播的过程。

在非新闻信息的传播中,个人隐私被恶意传播、“人肉搜索”逐步增添新信息、非法信息从私密到公开渠道的流传等传播现象,要解析其规律也必须从源头加以分析。而对于虚假商业信息流传、不实信息的扩散、特殊目信息的散播,这些原本就失真的信息在传播中可能会被无限地放大。溯源系统的建设。可以达到对热点信息或部分敏感信息的监控或屏蔽的目的。

网络为公众获取信息、传播信息提供了一个相对自由的开放式平台,但同时也为虚假信息、有害信息的传播打开了方便之门。如何在最大程度地发挥信息网络传播便利的同时,又能最大限度地保护国家、社会、集体和个人的合法权益不受侵害,这是网络传播环境下各国都面临的一个巨大挑战。因此,建设一套可以追溯信息源头的系统是一个重要的任务。

三、信息溯源系统功能需求和结构层次

网络信息溯源系统是建立在现行网络构架基础之上,能够自动并辅以手动快速查询并形成分析结果。它针对新闻网站、商业网站、各大论坛、博客和各类专业网站设置信息采集点,以各信息采集点为中心,对关键信息建立溯源索引表,再根据每张溯源索引表建立信息流转数据和传播节点报告。

1信息溯源系统的功能需求。

针对其功能和当前网络技术特点,信息溯源系统应当满足以下需求:

第一,系统不会对当前网络性能和功能有太大的影响:

第二,能利用现有技术,保护现有设备投资和技术投入:

第三,系统扩展性较强,能够分步骤研发和部署实施:

第四,满足多种业务需求以及多操作系统、多种类设备的异构性需求:

第五,不过多改变用户现有业务使用习惯:

第六,可快速有效地操作实施,必须有保护个人或商业隐私的措施:

第七,能够分级授权使用,并至少有一个级别针对公众用户。

2信息溯源系统的结构层次。

根据网络溯源系统的需求,要求其必须分解层次,并且按照用户角色不同和数据处理的不同,可进一步分别对其层进行分类。

一是按照用户角色分。可以分为用户层、分析层、操作层。

用户层是系统使用者统一的角色级别,根据其授权等级不同,还可以进一步细分用户组,但必须包括一个全体用户均可使用的一般用户组。

分析层是针对专业、半专业或者授权用户的角色级别,允许其行使浏览详细溯源索引表、更改溯源信息优先等级等功能。

操作层除了可以完成分析层的相关工作以外,还可以行驶管理员角色,不仅可以对所有数据归档或更改,还可以调整和分配其他用户角色。

二是按照数据业务处理流程分,可以分为搜索层、索引层、数据分析层。

搜索层根据网络链接完成信息搜索工作,其功能职责类似网络搜索引擎。采用网络“爬行器”对链接或者链接的链接进行搜索,并把相关链接收录进入溯源索引表中。

索引层主要是对溯源索引表进行检索操作,根据用户的指令抽取索引表中完整记录的索引节点的位置、时间等信息。

数据分析层则是运用数学模型和算法,对搜索层搜索过程、索引层索引结果、索引节点记录容错性等涉及数据优化和数据挖掘的环节,进行逻辑处理。

四、信息溯源系统搭建的初步构想

由于本文不涉及具体的数学模型和技术细节,因此。不对技术和模型做过多阐述,而只对系统搭建的宏观步骤进行初步讨论。

信息溯源系统是一个庞大的网络应用系统,涉及计算机技术众多,需要考虑的环节纷杂,工程量巨大,但其首要的技术是网络搜索引擎技术。

目前搜索引擎技术已基本成熟,以Coogle为代表的国外搜索引擎和以百度为代表的国内搜索引擎,几乎瓜分了整个中国互联网搜索引擎市场,但是,另外众多的国内搜索引擎的迅速崛起,也是一股不可忽视的技术力量。由于受到搜索引擎技术研发费用较高、用户粘合度较大等现实因素所制约。结合现有的成熟技术建设信息溯源系统是必然的方向。因此,选择一家成熟的搜索引擎并与之合作,是建立溯源系统的第一步。

随着互联网越来越高速的发展,对其网络传播秩序也有更进一步的要求。我国2006年发布的《信息网络传播权保护条例》,是以法定的形式强调了有序传播的构想。因此,网络信息溯源系统建设的第二步,则是要进一步完善配套功能开发,特别是针对数字版权保护、网络证据保全和有害信息过滤等重点环节。

溯源系统建设的第三步,是要逐步建立统一的信息溯源格式,为进一步扩充溯源系统做好技术支持。统一的溯源信息格式。将会在敏捷传播、信息快速引用、数字举证和网络传播研究中发挥积极作用。

除此之外,溯源系统还要求各地新闻网站、各大商业网站和国内搜索引擎公司共同参与系统的搭建,共同参与溯源标注格式的制定,并共同维护网络信息传播的有序性。

信息网络溯源系统是一个极为庞大的计算机网络系统,在目前显而易见的层面中,主要是针对信息溯源这一项功能所提出,但是,作为一套成熟的体系,在未来的研究和发展方向中,要求它从完成简单操作的功能系统向完成复杂需求的业务系统转变。

随着人们对网络的依赖,对互联网的使用范围越来越广,将会有越来越多、越来越重要的信息在互联网上发布。除了新闻信息的传播外,商业信息的溯源也是系统一个重要运用方向。

从商业需求上看。世界上各大新闻机构的站点,对企业来说也是宝贵的信息库。一些关键的贸易数据、关税或人均的消费量在某些新闻稿中也可以查询得到,这对企业来说常常是很重要的。从商业应用上看,关于企业的谣言从何而起、品牌传播是如何进行的、竞争对手的发展动向如何、外界对本企业的商业活动有怎样的反应,这些问题其实都可以对信息的监控和溯源来解释和分析。因此,可以预见的是,用户对网络溯源的渴望将会有更多的需求。

作为21世纪的互联网,必须提供必要的网络信息溯源能力,否则蓬勃发展的网络将会受到一定影响,用户也可能会因此丧失信心。

猜你喜欢

搜索引擎用户信息
关注用户
关注用户
关注用户
网络搜索引擎亟待规范
Nutch搜索引擎在网络舆情管控中的应用
如何获取一亿海外用户
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析