在线学术社交网络知识组织研究述评
2021-06-07赵雪芹蔡铨王青青
赵雪芹 蔡铨 王青青
关键词:学术社交网络;知识组织:知识服务;研究现状
学术社交网络能够打破科研工作者的传统知识交流壁垒,致力于满足其科研信息需求,维护其个人学术社交关系,促进科研工作者的知识交流与知识创新。学术社交网络最初起源于在线学术社区,学术社区设立的初衷在于为学者提供前沿知识、存储优质学术资源,依托于该理念而设立的典型社区有Scilinks、Linkedin等。此后随着社交网络的发展与普及,以Twitter、Facebook为代表的社交媒体针对用户科研需求开始拓展服务范围,在社交网络中架构学术平台.帮助研究者建立维护和管理自己的学术社会网络。但由于大众社交网络中用户群体差异较大且其中信息专业性不强.无法充分满足学者科研信息需求,因而催生了针对不同科研用户特征的垂直科研领域的学术社交网络。自学术社交网络发展至今,国内外学者和机构为优化其知识组织模式,提升知识服务质量开展了各式各样的实践探索.如我国唐杰教授率领团队应用语义技术将科研人員、科技文献和学术活动三者相互关联,从多个资源中集成学者数据构建学术社交网络AMiner;中科院计算机研究所在为学者提供资源支撑基础上添加学者个人微博、科研群组以及实时更新关注的论文与话题功能模块,搭建了一个既保留了社交平台属性又结合了文献资源管理的学术社交网络Sos.cholar:美国麻省理工的Wickramasekara率领团队通过开发云端设计个人知识管理工具Benchling,在生命科学领域有效地帮助学者收集、储存、加工、利用和传播各类信息资源;西班牙哈恩大学通过不同语言标签集管理文献信息,集成信任、协作和内容3种知识组织方法的混合推荐系统,设计并实现了学术社交网络SharingNotes。尽管国内外学术社交网络种类繁多.但根据运营理念和核心功能不同,主要分为4种不同类型的学术社交网络:以ResearchGate为代表的用户互动平台、以Men.deley为代表的文献信息管理平台、以小木虫为代表的UGC(用户生成内容)社区和以经管之家为代表的学科前沿资讯平台。然而,无论是哪种类型的学术社交网络.知识组织都是提升用户体验的基础,但随着网络中数字化的科研信息不断扩充,学术社交网络中海量的科研信息和用户交互内容逐渐呈现无序化、异构化,极大地增强了用户搜寻信息的难度,使得学术社交网络发展出现瓶颈。基于这一现状,如何将现存良莠不齐、离散异构的学术信息筛选组织成一个结构化的知识体系,满足用户科研信息获取与知识交流需求,是优化在线学术社交网络的当务之急。立足于这一现实,国内外学者从理论和方法两方面,对学术社交网络知识组织展开了深入研究。
1在线学术社交网络知识组织理论研究
在线学术社交网络知识组织理论研究主要分为两个研究领域,即不同知识单元之间的广度关联研究和知识组织体系的深度聚合研究。不同知识单元之间的广度关联研究不仅包括文本和词汇之间的关联研究,还包括厘清用户知识需求与知识单元之间映射模式研究。知识组织体系的深度聚合研究则包括构建不同类型的知识组织结构体系,进而探析在线学术社交网络知识组织的未来发展趋势。
1.1知识组织单元由单一粗粒度向多元细粒度发展
文本和词汇是在线学术社交网络最基本的知识单元,在早期学术社交网络中,大多以文本知识单元为基础,基于科研本体和主题本体构建知识组织。如宋文等基于概念理论提出采用语义技术链接不同主题的知识体系,并通过计算文本相似度拓展学术社交网络的知识发现服务。这种仅基于文本粒度的简单知识组织理论粗略地帮助人们链接学术社交网络中的知识.但随着知识资源形态的丰富,单一文本层次的语义技术远远无法满足学术社交网络知识组织。在分众分类法兴起的背景下,学术社交网络知识组织衍生出了词汇为量级的知识单元.通过挖掘词汇之间的语义关系抽取新的文本特征,在一定程度上弥补了语义缺失的不足。因此,学术社交网络知识组织转向以文本一词汇的跨粒度知识单元聚合研究,如傅城州等以分众分类为基础依托于语句关系收集标签词汇增强语义关系,并通过计算文本相似度和聚类构建架构学术社交网络。而学术社交网络的社交属性要求知识组织需要围绕用户开展,为用户交互服务,仅基于文本、词汇的知识组织无法满足用户知识交流需求。因而,曾建勋提出了应用本体语义技术,从用户生成内容和用户关系构建科研关系网络,以用户一文本新视角探索学术社交网络知识关联服务新模式。如今,学者们正尝试利用深度学习从大量简单数据中寻找规律处理新知识构建多粒度知识组织,如Pradhan T等结合深度学习和随机游走模型从文本、词汇和用户多层次细粒度地为学者推荐潜在科研伙伴,并通过采集数据集验证模型在精度、召回率和F1得分等指标上相较于其他方法具有更强的有效性。
1.2知识组织体系从链式知识层向多维知识网络演变
在最初的学术社交网络知识组织体系中,将不同学科的文献信息分成不同的知识层,通过元数据链接不同知识层,以便于用户获取知识。如Verd.ugo N等搭建了Ogmios系统利用元数据集成科研成果信息,并基于上下文的匹配方法将学术社交网络中的研究者个人资料与知识需求结合,根据学者知识需求情景实时协同知识组织。然而随着学术社交网络中知识交流频率的增加,产生了大量的新知识.最初的单链式关联不足以整合源源不断产生的新的交互内容,只有通过增添新的知识和语义关系,才能不断强化不同知识层之间的关联,保持学术社交网络中资源组织可持续发展。陈果等在构建的领域知识库中利用知识元将学术社区中用户生成的碎片化知识与原有知识体系链接,为学术社交网络中知识组织引入新的知识单元,形成多链式知识组织结构。而如今,在用户知识需求转变迅速背景下,尽管现有知识组织结构能勉强整合科研信息,但无法动态地随用户知识需求变化而变化,为厘清知识空间至知识需求的映射规律,只有通过更加密切的网状关联,融合用户需求聚合知识层,才能精准满足多层次的用户知识需求。如张连峰等应用关联数据分析用户个体间、个体与群体间、交互群体间的关系归纳用户知识需求,提出了一种深度融合主题和SECI模型的知识组织框架,以加速学术社交网络中的知识的流转和创新。
学术社交网络知识组织单元由单一粗粒度的文本、词汇转向多元细粒度的知识超网络,知识组织体系亦从链式知识层演化至多维知识网络,这些变化既是知识组织理论变革的具象表征,也是学术社交网络知识组织理论顺应时代潮流的发展趋势。从学术社交网络知识组织理论研究历程来看,无论是从概念理论、分众分类到社会网络理论,还是从元数据、领域本体到关联数据学术社交网络知识组织理论研究都无一例外地朝着用户聚拢。同时,用户在学术社交网络中除了是知识利用者,更是知识的生产者和管理者,这使得学术社交网络知识组织愈发注重用户交互的作用.通过揭示用户交互关系进行知识组织将成为革新学术社交网络知识组织理论的要点。
2在线学术社交网络知识组织方法研究
学术社交网络的知识组织理论研究逐步深入的同时,知识组织方法也不断迭代更新,已有的研究实践中,已经从学者关系、标签聚类、主题聚合和推荐机制等方面进行了方法探讨,以揭示学术社交网络知识结构,明晰知识交流演化規律和趋势.促进学者有效利用学术社交网络开展科研交互与合作。
2.1利用学者关系拓展社交网络
学者关系中的引证、合作、信任关系既是现实学术社交的基础,也是网络学术社交的脉络,面向学者关系开展知识组织利于学者交流合作实现知识的共享和创新。2014年,邱均平等在国家社科基金重大课题成果中利用共现和耦合的方法挖掘潜在科研关系.为学术社交网络专家发现和知识服务提供了新思路;2018年,Hoang D T等利用学者之间已有研究合作网络,建立了一个加权向量图来帮助学者发现学术社交网络中新的合作者;胥伟岚引入社会网络分析方法进一步解析学术社交网络中用户科研关系,提出了一种基于人际网络优化学术社交网络知识交流模式的方法。
2.2结合用户标签聚类信息资源
VanderWal于2005年创造了社会标签(Folk.sonomy)一词,它是由用户生产的,用于描述实体的词表或分类事物的机制。在学术社交网络中社会标签的应用多融合于知识组织体系中,2013年,Uddin M N等认为应建立社会标签和知识之间的联系.并基于Folksonomy提出了一种根据学者评分检索和排序学术社区资源的方法。2015年,毕强等以豆瓣网为研究对象,挖掘图书情报学科的图书标签之间的潜在关联关系,融合社会分析法拓展了用户标签聚类方法。2018年,郭顺利在博士学位论文中通过提取知乎中用户原创内容关键词,利用DPAC算法聚合社会化问答社区用户生成答案发现知识主题,为用户生成知识融人社区知识体系提供了广阔的前景。
2.3融入关联数据聚合主题内容
2006年.万维网之父Tim.Bemera-Lee提出以关联数据简化实现语义Web,其中关联数据主要通过发布和链接结构化数据使得分散异构的数据孤岛实现语义关联,从而促进传统文件网络向数据网络的演进。在学术社交网络中面向主题关联的知识组织则是指依据本地资源主题内容补充新数据.以完善学术社交网络知识脉络的一种关联数据应用方法。2014年,Kava M等构建了一种新的基于数据立方体的模型.链接学术社交网络中某一主题的所有异构资源,丰富了学术社交网络的知识结构。2018年,王日芬等使用LDA主题模型在科研文献共现关系重构了社区学科知识网络,同时提出主题影响力概念并规范了其测度方法。2018年,关鹏等在该研究基础上,通过复杂网络与多agent系统仿真.实现了整合主题的学科知识网络演化,为主题关联的知识组织提供了新的方法与工具。
2.4应用推荐系统重构知识组织
推荐系统是目前信息过滤系统中最有效解决用户信息过载问题,提升信息服务质量的工具之一。在学术社交网络中.主流推荐系统机制分为以下3种:协同过滤、基于内容和混合推荐。协同过滤是推荐系统中应用最广泛的算法,它无需注解领域术语,对各个研究领域具有普适性。2016年,吴燎原等提出了联合概率矩阵分解科研信息的新算法,协同群组信息和用户标注更精准地为学者过滤了冗余信息,提升了科研社交网站知识推荐服务的精度。协同过滤具有普适性,但其存在稀疏矩阵和冷启动的问题。为解决这一问题,2018年,ZhaoP等通过提取高层次学者的研究内容,计算提取研究主题与潜在读者的阅读兴趣之间的相似度后进行匹配,跨越了用户相似度稀疏产生的服务障碍,解决了冷启动问题。但基于内容的推荐算法仍存在缺陷,其推荐结果易重复,无法满足用户多样化的信息需求。混合推荐算法弥补了前两种传统推荐方法的缺点,能大幅度地提升推荐效果。2019年,Sarwar S等利用机器学习技术(案例推理和神经网络的混合)提出了一种个性化、可调整的用户分类模型,并结合情境感知优化知识服务系统,实时地向学者推荐所需科研信息。
综上所述,学术社交网络知识组织方法主要有:利用学者关系拓展社交网络、结合用户标签聚类信息资源、融人关联数据进行主题聚合和应用推荐系统重构知识组织这4类,其中学者关系依托于用户交互关系、用户标签由用户与内容交互产生、关联数据依赖知识交互关联、推荐系统立足于用户交互行为需求,并且用户交互贯穿于用户使用学术社交网络的全过程,亦是学术社交网络建设的主题。因此,依托于用户交互行为满足用户知识需求的学术社交网络知识组织方法研究将成为学界未来的重要方向。
3研究评述及未来研究建议
综上所述,国内外相关研究围绕学术社交网络知识组织问题,展开了知识组织理论探索,提出了许多改进社交网络知识组织的方法并应用于技术实践中,取得了较多研究成果,为本研究的开展提供了理论支持与技术模型借鉴,但仍存在一些问题:①现有的对学术社交网络知识组织的理论研究.多从用户知识需求分析与资源关联角度展开,尽管其中掺杂了一些用户交互行为的分析,却未将用户交互行为与学术社交网络的知识资源组织结合起来进行深入研究。②现有的学术社交网络知识组织的方法与实践研究集中在学者与论文推荐服务方面,未能充分挖掘学术社交网络的社交属性和碎片化的交互内容开展更深层次的知识服务。针对这些问题,未来研究可从以下几个方面展开。
3.1学术社交网络用户交互特征与需求分析
用户对于知识的需求呈现出多样化与个性化特征.用户交互行为特征是用户需求偏好的有效反映,用户知识发现与获取需求从分散、孤立的显性需求,转变为基于知识关联关系的聚合需求,用户需求的满足仍存在精准性不高、延展性不强等缺陷。因此,针对学术社交网络中用户交互特征与需求进行分析是未来学术社交网络知识组织拓展的第一步.为了更好地满足用户的知识需求,理应对学术社交网络用户进行群体差异分析与精准刻画,在此基础上进行用户交互需求建模.为知识组织的开展提供依据。
3.2学术社交网络用户交互内容与关系关联揭示
用户的知识交流与利用形态处在新的变革之中.用户通过知识交流和利用行为形成用户交互关系、用户一知识资源间的关联关系和知识资源间的关联关系。这些关联关系与用户的知识需求内容紧密相连。通过对交互内容进行深度语义挖掘,将其与用户的需求偏好和用户的社会化交互关系进行语义关联,能够更好地揭示用户关系与知识需求之间的关联关系。学术社交网络用户间所开展的广泛科研交互及所形成的交互关系.是实现学术社交网络中合作关系转化和科研合作开展的重要支撑,以用户交互关系为视角动态关联用户知识需求,有助于构建跨系统的知识关联组织.与时俱进地满足科研用户不断变化的信息诉求。在其关联揭示中,应对用户交互内容进行实体识别与抽取.并界定语义特征,挖掘实体之间的概念语义关系;根据实体特征与语义关系进行交互内容与关系标注。同时,为便于知识关联组织阶段对交互内容的利用.亦需要针对资源标注结果优化语义描述,以实现机器可理解。
3.3基于用户交互关系的多维知识关联组织
由于学术社交网络中学术资源来源广泛、类型多样,致使知识分布呈现无序化、碎片化,无法建立紧密有效的知识关联,但优质的知识关联是实现知识资源的细粒度组织的关键,如果知识资源关联组织无法完整链接在一起.将无法为用户提供精准、个性化的知识服务。因而,将异构的学术资源和UGC内容通过何种方法链接成一个新的动态整体,将成为未来学术社交网络知识组织研究的新方向。目前,已有学者提出通过语义分析细粒化知识单元,结合科研關系关联异构学术资源,但其仍未能充分挖掘学术社交网络的社交属性和碎片化的交互内容,其中许多问题仍亟待解决,如:如何抽取学术社交网络中多元知识单元之间的关系、多维关系与知识网络之间的映射模式以及知识交互关联构建等问题。因此,在未来研究中为了更深层次揭示学术社交网络中知识资源关联关系,构建多维关联关系网络,需要融合用户之间的交互关系、用户与知识交互关系、知识之间的关系进行多维度、多层次的立体化关联。
3.4面向用户交互需求的知识服务拓展
知识组织的目的是为了提供更好的知识服务,因而提升学术社交网络知识的利用效率,发挥社交属性和碎片化交互知识的价值,需要围绕用户的交互需求进行知识服务拓展,构建面向用户交互关系的知识来源关联、结构关联和知识进化关联服务体系。未来研究推进中,应在前述知识关联多维组织的基础上.探索基于用户交互关系的潜在科研关系匹配与推荐服务、碎片化知识的聚合服务、隐l生知识的获取与推送服务等。除此之外,学术资源组织应在知识元链接系统、学科分面导航系统和知识关联检索系统中选择何种形式呈现给用户也将成为学术社交网络研究重点。学术社交网络知识组织研究不应当局限于理论与方法研究,应携手信息服务机构将研究理论与方法运用在实践中,增强理论与方法的普适性。实证研究需要在不同类型、专业的学术社交网站中,揭示不同知识单元之间的知识关联.面向用户开展多维知识组织.集成碎片化的显性知识,发现理论机制中存在的问题,完善平台建设,推动知识的组织、传递和应用。
4结语
本研究系统回顾了国内外学术社交网络知识组织的理论和方法研究,结果表明:学术社交网络知识组织正在逐渐由传统学科类属体系转向依托于用户交互关系的新模式,促进知识的关联发现与链接,形成内容相互关联、多维度、多层次的知识网络。本研究结合国内外研究现状,提出未来的研究可以围绕用户交互行为与内容特征、揭示用户交互关系、多维知识关联组织等内容展开。