网络健康信息聚合模式比较分析*
2019-05-25廖花林文庭孝李成熙罗爱静林德南
廖花林 文庭孝, 李成熙 罗爱静 林德南 谢 山
(1.中南大学生命科学学院医药信息系 长沙 410083;2.湖南省医学信息研究重点实验室 长沙 410083;3.深圳市医学信息中心 深圳 518000)
1 引言
2016年10月,国务院发布《“健康中国2030”规划纲要》,首次将“健康中国”上升为国家战略。随着物质文化生活水平的提高和社会生活环境的变化,人们的健康意识日益增强,极为关注健康信息。虽然人们获取健康信息的途径多种多样,但互联网,特别是移动互联网已成为获取健康信息的主要渠道[1]。由于互联网健康信息庞杂,人们在获取网络健康信息的同时,也面临着信息爆炸、信息孤岛、信息迷航[2]等一系列问题。信息聚合作为信息组织与信息检索的新模式和新手段,在一定程度上缓解了健康信息需求增长与健康信息服务提供不够便捷、简洁和智能的矛盾。
随着社会的发展,信息聚合的内涵在不断变化。信息聚合是指将多来源的信息进行聚类、融合、重组,通过同一平台提供给用户的过程。信息聚合是网络信息组织、存储、管理、检索和服务的基础。网络信息资源分为政府信息类、文化信息类、学术资源类和健康信息类等类型[3]。美国医学图书馆联盟指出:健康信息泛指与大众、病患及其家属有关的健康和医学信息,包括医疗、预防、保健、康复、生殖健康、健康教育等[4]。国内外学者对网络健康信息这一领域较为关注,在网络健康信息服务、网络健康信息需求、用户网络健康信息行为及其影响因素、网络健康信息服务评价、网站健康信息质量评价[5]等方面进行了一定程度的研究,但对网络健康信息聚合关注较少。
2 网络健康信息聚合模式
网络健康信息聚合模式多种多样,根据其对象和特点,可将其归为两大类,即面向资源的网络健康信息聚合模式和面向用户的健康信息聚合模式。面向资源的网络健康信息聚合模式主要是以信息资源组织为中心,而面向用户的健康信息聚合模式则以用户需求和用户服务为中心。
2.1 面向资源的网络健康信息聚合模式
2.1.1 基于目录式导航的网络健康信息聚合模式
网络信息资源呈爆炸式增长,为了方便用户快速找到所需信息,网络健康信息一般采用目录式导航方式组织信息资源。用户除了使用搜索引擎外,一般偏向于通过目录式导航浏览获取信息。目录式导航是按照一定的分类标准将网络信息资源分成不同类别,然后将同一类别的信息聚合整理到一起。目前,网络信息资源的分类组织方式主要有主题分类、学科分类、分面组配分类法、体系分类法和公众分类[6]。这些分类组织方式构成了目录式导航和网络健康信息聚合的基础。
基于目录式导航的网络健康信息聚合模式是指根据一定的分类标准,将网络健康信息按主题聚合到某一平台,以目录式导航的方式提供给用户。网络健康信息服务平台目前主要采用主题分类的方式聚合各类健康信息,主题分类法是主题法与分类法融合的产物,一个主题词代表一个类目是主题分类法的显著特征。如39健康网按照不同科室和不同疾病聚合相关信息,用户点击浏览就可以获取与某一疾病相关的内容,包括疾病首页、疾病知识、专家咨询、医院医生、常用药品和文章解读等健康信息。
基于目录式导航的网络健康信息聚合模式的优点在于:①可以综合整理有关健康的各类信息,以主题为分类标准,把与健康信息主题相关的信息聚集在一起;②分类浏览方式直观,当检索目的不明确、检索词不确定时,目录式导航浏览方式更有效率;③可以使用户快速全面地了解某一主题健康信息全貌,有利于用户有效选择和利用健康信息。其缺点在于:①用户健康信息需求呈现出个性化、多元化发展趋势,但基于目录式导航的健康信息聚合模式提供方式单一、结构固定、灵活性不足;②信息聚合层次较浅,适合健康信息素养较低的新手用户。
2.1.2 基于搜索引擎的网络健康信息聚合模式
通过搜索引擎获取网络健康信息已成为人们利用健康信息的主要方式。基于搜索引擎的网络健康信息聚合模式是指基于搜索引擎平台,对健康信息搜索结果进行自动、非监督聚类,使用户能在更高的主题层次上查看搜索结果[7]。它可以细分为静态聚合和动态聚合两种类型,静态聚合以Yahoo!为典型代表,通过分类目录的方式对网络资源进行聚合;动态聚合以39健康网自带的搜索引擎为代表,在用户检索输出结果的基础上再依据一定的规则进行聚合和二次组织[8]。
基于搜索引擎的网络健康信息聚合模式作为最受用户欢迎的信息搜索和获取方式,其优势极为明显:①基于用户提供的关键词一站式搜索相关信息,初步聚合整理提供给用户,帮助用户节省时间和精力,提高信息获取效率;②使用简单,用户易于操作,查询方便快捷,体验效果好。基于搜索引擎的知识发现系统将会成为未来网络健康信息聚合发展的基本趋势。
该模式的缺点也比较突出,搜索引擎属于浅层次、粗粒度的信息聚合模式:①搜索引擎采用以简单的关键词匹配为主的搜索模式,对所有用户需求进行相同的分析,不同用户使用同一关键词得到的检索结果雷同,没有考虑内容与用户之间的关系,不能有效获取和理解用户的真实信息需求,无法为用户提供个性化和智能化检索结果;②搜索引擎难以及时反映用户信息需求的变化,用户希望在尽可能短的时间内找到最感兴趣、最切合自身需求的信息资源,但搜索引擎提供的只是按相关性排序的结果界面,没有对多来源的信息进行聚类、融合、重组以及提供多维显示方式,用户仍需花费大量时间和精力才能获取所需信息,增加了用户的身体和心理负担[9]。因此,基于搜索引擎的健康信息聚合模式属于初级层次的信息聚合,方便用户对各种信息进行快速浏览,但不能达到帮助用户快速准确定位信息的目的。2.1.3 基于知识元的网络健康信息聚合模式
随着用户对网络的依赖度加大以及信息素养的逐步提升,其信息需求层次也日益提高,要求信息聚合由原来的“广、快、精、准”向“深、动、精、细”转变[10]。以往的网络资源揭示和利用大都集中在信息资源的宏观结构,未深入信息资源的微观内容部分,造成信息聚合层次较浅,难以向用户展示多维度知识关联,导致用户需求满意度不高。
基于知识元的网络健康信息聚合模式是指将粗粒度的健康信息碎化为细粒度的知识元,通过关联关系实现健康信息深度聚合。知识元是指语义上相对完整的表达特定知识的最小的内容单元,从知识生产和创造的视角分为常识知识元、引证知识元和创新知识元[11]。网络健康信息来源广泛,质量参差不齐,部分内容的理解需要有较高的健康信息素养。去粗去精,去繁从简,深度聚合细粒度的健康信息有助于用户花费更少成本获取信息。针对网络健康信息资源构建细粒度聚合单元元数据框架,从多维度、多层级深入揭示和关联分散在各类型网络信息资源中的细粒度聚合单元[12],抽取和聚合知识元是将来网络信息聚合发展的必然趋势。
基于知识元的网络信息聚合模式可以深入揭示内容信息,挖掘知识关联,深度聚合各类健康信息,提高信息供给质量。该模式能够根据用户的信息需求多维度聚合健康信息,优化信息服务方式,降低用户的信息获取难度。它还有利于促进知识发现,提升知识服务效率,并提高将信息转化为用户所需情报知识的速度。但目前国内外对基于知识元的网络信息聚合模式的研究还处于探索阶段,没有现成的模式可以借鉴。这一信息聚合模式与现有的资源环境和网络环境差距较大,与此同时,还需要结合用户的信息需求、用户情境等要素来优化聚合效果。
2.2 面向用户的网络健康信息聚合模式
2.2.1 基于RSS的网络健康信息聚合模式
RSS(Really Simple Syndication),即简易信息聚合,是一种描述和同步网站内容的信息聚合模式,通过RSS可以在互联网上订阅感兴趣的内容[13],适合网络新闻、博客等不定时更新,但又比较受关注的网络健康信息源。Web2.0的显著特征就是基于RSS的信息聚合[14]。
基于RSS的网络健康信息聚合模式是指用户根据自己的兴趣以及关注重点订阅不同来源的网络健康信息并将其聚合到同一平台,然后通过电脑客户端或网页在线的方式获取健康信息。这是基于用户选择的聚合系统,向用户提供一站式网络健康信息获取服务,起着过滤无效信息的作用。Google与鲜果等第一代RSS服务提供商已经相继退出网络信息市场,这表明纯粹的信息聚合模式因为无法与目前的技术、环境、用户需求有机结合,已经不能满足用户的多元需求。
基于RSS的网络健康信息聚合模式的优点在于:①可以体现用户的个性化信息需求,RSS聚合服务提供的信息都是用户自己选择和订阅的,完全屏蔽用户未订阅的内容和垃圾信息;②用户通过客户端或在线阅读的方式可以在同一界面获取所需的健康信息资源,不需要在多个不同的网站页面进行跳转;③系统按照订阅网站的更新主动将最新的信息推送给用户[15],用户可以及时有效地获取最新信息,兼顾时效性和准确性。
该模式的缺点也日益突出:①依赖用户主动订阅相关信息,而用户的健康信息素养水平参差不齐,容易造成重要健康信息的遗漏和缺失;②只是简单地解决了订阅和一站式获取信息的问题,未对内容进行智能处理[16];③随着健康信息来源以及内容的增多,RSS平台的信息呈快速增长趋势,对用户获取信息造成了一定困难,无法满足用户对信息更高的要求;④移动互联网时代的潜移默化,人们已经习惯于通过手机获取信息服务,而基于RSS的网络健康信息聚合更适合在电脑端提供服务;⑤用户的社会化需求无法得到满足,没有考虑内容与用户关联,不能帮助用户接触所关注领域更优质的信息源[17];⑥目前基于用户兴趣的健康信息推送服务已经十分成熟,很少有人愿意主动去订阅相关信息。2.2.2 基于内容推荐的网络健康信息聚合模式
基于内容推荐的健康信息聚合模式是指基于对用户的使用习惯、社交关系、搜索关键词等内容的分析,结合搜索引擎、大数据挖掘、机器学习等技术,通过特定算法计算出用户最关注的健康信息内容进行精准推送,用户通过手机或平板就可以接收到自己感兴趣的健康信息。基于内容推荐的健康信息聚合模式属于服务提供者主导的以用户需求为中心的信息聚合模式,服务提供者指定了聚合来源,用户被动接受信息[18]。基于内容推荐的健康信息聚合模式以用户为中心进行个性化推荐,为每一个用户提供感兴趣的健康信息,实现了千人千面和精准推荐内容,用户可以将关注的资讯进行评论、转发以及分享到社交平台。
这一信息聚合模式的优点在于:①通过手机就能接收所关注的网络健康信息,简单方便快捷,符合用户诉求;②在机器学习的基础上,结合推荐算法,进行智能精准推送,更容易理解用户的信息要求,帮助用户减少使用成本;③提高了信息推荐的准确度,成为大数据时代挖掘有价值信息的有效方式。
该模式的缺点在于:①“渠道”服务提供商与“内容”提供商的边界模糊,损害了著作权人和内容提供商的权益,容易造成版权纠纷[19];②服务提供商搜集了大量的个人数据信息,如果保管不慎,将会导致个人隐私泄露;③提供商推荐的都是用户感兴趣的信息,容易造成用户阅读视野狭窄,最终可能让用户陷入信息茧房的尴尬境地;④机器编辑将用户的兴趣需求排在第一,信息的价值受到冲击,不利于高价值和高质量信息的传播。
2.2.3 基于社会化媒体的网络健康信息聚合模式
随着互联网和社交软件的发展,纯粹的文本聚类已经无法满足用户的需求,需要从聚合信息向聚合收发信息的用户转变,将社会化媒体的信息源与用户聚合起来,充分发挥群体影响力的作用[20]。社会化媒体,也叫社交媒体,是支持用户撰写、分享、评论、讨论、交流的平台,主要形式有社交网站、微博、博客、论坛、即时通讯等,如新浪微博、知乎、丁香园、科学网等影响十分广泛。这些社交平台根据社会学和信息科学的规律,针对用户的社会化信息行为完成信息聚合,并且将分门别类的主题传递到相对应的用户手中[21]。社交媒体是公众表达自我的平台,内容包括众多用户宝贵的看病心得、患病历程分享、治疗经验等健康信息。目前的社会化媒体聚合是依据物以类聚、人以群分的原理,将相关的用户聚合在一起。基于社会化媒体的健康信息聚合模式是指在聚合用户的基础上,聚合整理社交媒体中的健康信息,再根据用户的需求予以提供。微博是当前社交媒体的重要代表,有学者针对微博信息资源的短文本、主题发散等相关特征,提出了一种面向语义关联的细粒度社交媒体信息资源的多维度主题聚合方法,但只能对某一时间段某一类型的微博信息进行主题挖掘和多维度主题聚合[22]。
基于社会化媒体的健康信息聚合模式的优点在于:①通过社交媒体传播的信息大多来源于用户亲身经历或身边人分享,公众对这类信息具有天然好感,乐于获取此类信息;②经验分享型信息对于健康信息需求者来说,与自身情境、信息诉求等更为契合,属于高价值信息;③基于社交媒体的社会化挖掘及推荐功能,能迅速发现大家关注的热门信息,让用户及时获取更多有价值的信息。
该模式的缺点为:①健康信息海量分散,且无序零乱,规范化程度低,含有大量口语化表达,不利于组织和挖掘利用;②用户生成内容不可控,无法从源头进行质量把关;③健康信息具有高价值特征,但该模式目前还处于理论研究阶段,缺乏成功的应用模式。
3 结语
本文结合网络健康信息的特点,提炼出六种网络健康信息聚合模式,并根据其侧重点和差异,分为面向资源和面向用户的网络健康信息聚合模式两大类,如表1所示。总体来看,基于目录式导航和基于搜索引擎的健康信息聚合模式在现实中已有实际应用,但其聚合层次不深,属于针对网络健康信息资源宏观结构的信息聚合模式,并且信息服务提供方式单一;而基于知识元的健康信息聚合模式可以深入信息内部实现深度聚合,并可根据用户需求进行多维度聚合,但目前还处于探索阶段;基于RSS的健康信息聚合模式由于用户的信息获取习惯以及它本身的局限性,已经失去了用户群;基于内容推荐的健康信息聚合模式对于用户来说,使用成本低,信息获取精准方便快捷,存在各类隐患,但是用户接受度高;基于社会化媒体的健康信息聚合模式目前还局限于单一的社交媒体内部,如果要实现跨平台健康信息聚合,整理各类社会化媒体中的健康信息,还有诸多技术问题和现实难题需要解决。六种网络健康信息聚合模式各有其优缺点,可以取长补短,相互融合,将面向资源和面向用户的信息聚合模式有机结合起来。构建更好的网络健康信息聚合模式,是未来信息组织、信息聚合和信息服务发展的方向。
表1 网络健康信息聚合模式比较
综上所述,有效的网络健康信息聚合模式应符合以下标准:聚合粒度更细,深入健康信息内容内部,不限于信息宏观外部特征;深度揭示信息特征,根据用户的信息需求和动机,多维度、多层次聚合健康信息,用户可以自己组合信息;根据每个用户的特点提供不同的聚合结果界面,体现个性化需求,精准推荐信息;社会化媒体中的健康信息具有高价值特征,尽可能挖掘聚合到同一平台;既考虑资源又考虑用户,将资源和用户结合起来,实现网络健康信息的高效聚合。未来的网络健康信息综合聚合模式必须具备上述特征,才是具有生命力、满足社会需求和用户健康信息需求的信息聚合模式。