特定领域科技前沿跟踪信息源挖掘与获取策略研究
2017-08-30李荣李辉赵芳
李荣+李辉+赵芳
〔摘 要〕 [目的/意义]特定领域科技前沿情报跟踪工作需要构建信息源体系,而目前针对科技前沿跟踪信息源挖掘与获取策略研究还比较欠缺。[方法/过程]本文结合情报实践工作,对科技前沿信息源相关概念给予界定,对科技前沿信息特征及信息源挖掘方法加以归纳分析,并以5G领域为具体研究案例,从信息源主体间关联性、信息源挖掘与甄别方法、信息源直接获取三方面,探索科技前沿跟踪信息源获取策略。[结果/结论]研究提出了中心扩散、人机结合、权威发布获取三大科技前沿跟踪信息源挖掘与获取策略,以期对战略情报研究与实践工作有所借鉴。
〔关键词〕 科技前沿 ;信息源 ;前沿跟踪; 信息源挖掘;信息源获取;移动通信技术
DOI:10.3969/j.issn.1008-0821.2017.08.018
〔中图分类号〕 G255.76 〔文献标识码〕A 〔文章编号〕1008-0821(2017)08-0122-07
〔Abstract〕[Purpose/Significance]Specific field of Frontier Science and technology information tracking work need to construct the information source system,but it exists a lack of research on the mining and acquisition strategy of frontier science and technology information source. [Method/Process] Combining with relative experience,a base of defining related concepts of frontier science and technology information source,concluding the characteristics and methods of mining of frontier science and technology information source,this article researched acquisition strategy from the connection of information subjects,mining and discrimination method and direct acquisition. [Result/Conclusion] This thesis explored to put forward the three major information source mining and the acquisition strategies of tracking frontier science and technology: diffusion from the central source,human-computer cooperation,authority issued,and hereby provided valuable references for the future strategic intelligence research and practices.
〔Key words〕 frontier science and technology;information source;frontier tracking;information source mining;information source acquisition;mobile communication technology
當前,全球正在迎来新一轮的科技与产业革命,颠覆性技术不断创造出新产品、新需求、新业态。如何具有前瞻性地把握科技发展趋势与演变路径,成为当前科技情报工作所面临的巨大挑战。在此背景下,传统科技情报工作模式在很多方面都必须做出调整。以信息的来源与类型为例,传统科技情报研究多以一次文献及多次加工文献信息作为主要研究对象,而要感知和把握科学与技术发展前沿,就必须将信息搜集工作前置延伸至知识创造的源头,无论是支撑宏观决策的战略情报研究或是微观层面的战术情报研究,都必须首先构建支撑科技前沿跟踪情报工作的信息源体系。情报信息源体系的构建大致涉及信息源获取、信息源筛选与信息源优化三个环节[1]。目前,相关研究多是针对某一特定类型信息或某一特定领域信息源的获取,或从网络动态跟踪视角展开,而有关特定技术领域科技前沿跟踪信息源体系构建及获取策略研究却较为鲜见。笔者结合科技前沿跟踪工作实践,在系统总结科技前沿信息特征、信息源目标体系及挖掘方法的基础上,以第五代通信技术为研究案例,探索性地提出了科技前沿信息源挖掘与获取的三种策略。
1 科技前沿信息源的界定
随着科学技术的不断演进与发展,催生了超材料、智能机器人、量子信息等可能引发新一轮产业技术革命的新兴技术领域,它们也越来越受到人们的关注。想要具有前瞻性地把握这些技术领域的发展趋势与演变路径,必须通过跟踪其相关科学与技术的发展前沿来实现。相对于普莱斯(Price)、加菲尔德(Garfield)、佩尔松(Persson)等知名信息科学家从科学计量学角度对研究(学科)前沿给出的定义,科技前沿还是一个较为模糊的概念[2]。两者之间的关系可从以下两个方面理解:一方面,研究(学科)前沿通常反映的是学术上的热点问题,而科技前沿涉及基础科学、技术与产业及科技发展战略等不同层面;另一方面,科技前沿针对某一特定技术领域而言,其前瞻性、先导性、探索性等特征明显,而研究前沿所反映的热点问题不一定具有上述特性[3]。基于此,本文理解下的科技前沿概念的内涵,是指能够对某一特定科学或技术领域未来发展产生重大影响与引领的新思想、新方向、新热点、新布局。以此理解延展到科技前沿信息,特指能够承载、表达与传递这些新思想、新方向、新热点或新布局的信息。从外延来看,科技前沿信息是指特定领域世界科技强国正在部署或正在执行中的科技战略规划、技术路线、资助机构资助的各类计划或项目信息及其已经完成或尚未完成的成果信息,以及领先机构或个人发布的权威观点信息。
信息源从字面的意思理解,就是信息的来源。由于信息在不同学科和行业有着不同的理解,对信息源的解释也不尽相同。情报学界习惯将承载信息的某种载体称为信息源,也就是说产生、持有和传递信息的一切人、物体和机构,都是信息源[4]。按照信息的加工程度、载体形式、传播途径等,信息源存在多种类别划分方式。在信息存储、传播与交流的方式数字化、网络化程度越来越高的背景下,网络信息已经成为科技发展前沿监测的信息来源。本文以网络信息源作为主要研究对象,并将科技前沿跟踪信息源特指为能够生产、发布、传播、存储特定领域新思想、新方向、新热点或新布局信息的机构门户、专业媒体或个人社会化媒体网站。
2 科技前沿信息的特征分析
由于网络信息种类多样、来源广泛,要构建服务于特定领域科技发展前沿动态跟踪的信息源体系,首先必须准确把握科技前沿信息所具有“前沿”特性。结合信息生态链的相关理论,本文认为科技前沿信息应该具有以下四大特征:
2.1 生产者的尖端性
前文提过,先导性与探索性是科技前沿的重要基本特征。因此,从信息生态链的角度,前沿科技信息产生者,必须是参与特定领域科技创新活动及信息活动的领先主体。这些主体是零次信息和带有创新性一次、二次信息的生产者,可以是个人、群体或组织,他们通常能创造出该领域的重大突破或拓展出新的研究方向,是引领所在领域发展的尖端性群体。因此,锁定这一群体,就等于把握住了领域发展的脉络。
2.2 传播的权威性
信息组织与传播是信息生态系统的重要环节。信息的组织者是指通过一定方法使信息有序化,便于用户查询和使用的专业人员; 而信息传播者是指通过一定信息通道实现信息传播的各种媒体或领域技术人员[5]。无论是信息组织者或传播者,专业性要强,情报机构一定要将他们的权威性作为信息源考量的重要依据。
2.3 内容的先导性
科技发展前沿是一个动态过程,随着时间的变化领域的前沿热点或问题也将发生变化,同一领域不同时间节点的前沿是不完全相同的,因此,科技前沿信息所反映的内容应该是面向未来且包含时间维度,既应该包括体现当前科技发展前沿信息,如各类计划、项目最新资助的战略投资重点领域,也应有反映未来科技前沿的信息,如政府的科技规划、战略路线图及刚刚部署启动或即将部署规划的信息[3]。
2.4 来源渠道多样性
科技前沿是非常复杂的问题系统,涉及重点领域领先主体、前沿技术、学科前沿及重大战略需求等多方面,任何情报机构无法通过单一来源信息来全面把握某一具体领域的前沿发展问题。从现有的相关情报实践活动来看,科技前沿跟踪与分析通常需要采用文献与网络交互的信息查询方法来实现,既需要查询专业文献数据库,也需要关注科技强国资助的重大计划或项目信息、具有较高影响力科学奖项信息及重要国际会议信息等一次信息,同时还需要一些知识服务机构或智库型机构发布的研究报告、战略文件或某一科技主题发展预测报告等二次或多次加工信息。这些多源、异构信息的有效获取,是科技前沿跟踪的关键之匙。
3 科技前沿跟踪信息源目标体系
科技前沿跟踪的实质是通过检测特定领域重点国家的重要科技政策、重大研究计划、重要项目研究布局及最新技术进展,能够准确掌握或预测该领域当前及未来科技前沿所在。由于不同领域科学与技术演进路径存在差异,因此,某一特定领域前沿跟踪信息源目标的确定,应建立在对其关键技术或产业成熟度大致把握的基础之上。笔者结合科技情报动态跟踪领域的工作实践,初步将科技前沿跟踪信息源目标分为领先创新主体、国家战略规划与管理机构、权威科技媒体与知识服务机构及重要国际组织与科研团体四大类(见图1)。领先创新主体包括本领域国内外处于领先地位的研究机构、团队及首席科学家;国家战略规划与管理机构包括科技创新管理部门、科研资助机构;权威科技媒体与知识服务机构是指领域内权威会议发布平台、顶级期刊、科技主流媒体及全球具有较高影响力智库机构;国际组织与科研团体主要涉及国际科技组织、学协会与基金会等非政府组织[6]。根据技术或产业发展现状差异,特定领域在确定其前沿跟踪信息源目标时可有所侧重。
4 科技前沿跟踪信息源挖掘与分析方法
在把握科技前沿信息特征并建立科技前沿跟踪信息源目标体系的基础上,要进一步挖掘具体的信息源需采取不同的途径和方法,做到相互补充和验证,从而使挖掘结果全面且准确。通过梳理现有信息源挖掘的途径和方法,特别是网络信息源,可将其划分为定量挖掘与定性挖掘两大类。如图2所示,定量挖掘又可分为文献分析与内容分析。前者主要利用网络数据库进行论文和专利统计分析来实现,通过对论文与专利文献的统计分析来找到目标领域包括研究机构、团队、著名科学家在内的领先创新主体。后者则以网络事实型数据为挖掘对象,其中,通过科研项目、奖励、会议等相关信息,可锁定重要的科研机构、会议及科学奖项;另外,借助计算机辅助技术,对网页文本信息进行聚类分析,可实现对异构文本信息中机构、人员关键实体的识别与抽取,辅助实现对互联信息源快速发现。定性分析可分为调查与归纳分析与知识与经验判断两种分析方法。一方面,可以通过对特定领域全球发展态势及相关国家的科技创新体系进行调研,从而找到关键的科技管理机构与科研资助机构;同样也可以对重要国际组织、学会或基金会进行定性调研。另一方面,还应借助智库机构及专家的智慧與经验,如通过跟踪一些著名智库机构发布的研究报告,或者是领域专家的言论,获得一些重要研究机构、企业、主流媒体等相关信息源[6]。总之,科技前沿信息源挖掘与分析应建立一种开放、融合、灵活、智能的方法体系。
5 5G领域科技前沿跟踪信息源体系构建
5.1 5G技术演进路径
移动通信技术起始于20世纪70年代,经过40多年的飞速发展,目前已进入4G网络的大范围应用及5G网络技术测试阶段。本文通过对各代通信系统的技术特征及典型标准的梳理(见表1),发现未来第五代移动通信网络表现出明显的技术趋同性,体现在频谱效率提升、多制式网络融合及技术标准一体化等方面[7]。无线技术及新型网络成为5G技术热点研究方向;全球统一的频谱、统一的标准,是5G获得成功的关键;美国、欧洲与亚洲(中、日、韩为代表)间全球竞争格局已形成。
基于上述分析,本文认为,5G领域前沿跟踪目标主体,应重点锁定上述国家领先研发机构、重要推进组织及重点关注活动。其中,重大研发计划、重要会议及一些权威机构的发布活动,应是重点监测对象。
5.2 科研机构信息源挖掘
国际电信联盟(ITU)作为全球第五代移动通信网络(5G)标准的重要推动组织,汇集全球各地区领先研发机构,从2013年开始开展有关5G标准前期研究。为此,ITU专门成立“IMT-2020”焦点组,与标准部13研究小组(下一代网络组)联合开展5G标准前期研究。本文采用网络调查法,从ITU全球近700个联盟成员中,抽取出美国、亚洲、欧洲相关国家中同时参与到上述两个工作组研究活动的机构,并借助领域专家经验,确定其中30家机构(见表2),作为本文5G领域重点科技前沿跟踪信息源中的领先机构。
5.3 重要推进组织信息源挖掘
为能与国际电信联盟(ITU)5G标准化部署同步,主要技术领先国家都专门成立了各自的推进组织。这些推进组织对内承担了本国5G现阶段及未来工作计划的组织、实施与协调,对外开展协同实验研发,各国有关5G研发及标准化工作的重要信息都来自于这些推进组织。为此,将这些推进组织纳入信息源体系十分必要。本研究主要采用网络主题词搜索结合专家咨询的定性调查方法,确定了包括我国IMT-2020(5G)推进组在内的五大重要5G领域推进组织(见表3)。
5.4 重要会议信息源挖掘
全球构建5G技术生态背景下,关注移动通信领域重大会议信息显得至关重要。互联网新闻报道是会议活动的重要信息来源。本研究利用情报专用网页信息采集工具,通过“移动通信”、“标准”“会议”等关键词,对近三年中文主流网络媒体发布法人相关信息进行抓取。软件能够实现对所抓取网页文本信息中包括会议名称在内命名实体的自动识别与出现频次统计,结合定性判断,最终选定世界移动通信大会(MWC)、世界电信标准化全会(WTSA)、全球5G大会、世界电信发展大会(WTDC)、世界电信展等五大会议活动作为5G领域重要会议信息的跟踪信息源。本文认为,进入信息源跟踪体系的重要会议应具备以下三大特征:在移动通信技术领域全球影响力大;权威发布或披露5G全球标准化进程前沿动态;建有专门的信息发布平台。
5.5 重大战略计划信息源挖掘
根据ITU制定的全球5G标准时间表,主要参与国家都根据自己的战略目标出台了本国的推动计划。本文通过对5G技术领域重要国家关键发展战略的快速扫描,确定了本研究信息源体系构建中应重点关注的一些重大战略计划(见表4)。通过跟踪这些计划,可以掌握各国在5G领域最新的实验进展、研发投入、阶段性成果等前沿动态。
5.6 权威发布信息源挖掘
各个国家在5G领域最新的实验方案、测试进展、网络技术架构等重要前沿信息,会以公告、白皮书或专题报告等形式,并通过本国权威机构组织定期发布。本研究通过中心源扩散的策略,以国际电信联盟(ITU)作为中心信息源,通过挖掘中心信息源与外部相关信息源间关联关系,建立不同的链接路径,进而最终锁定了5G领域若干权威机构发布信息源。以表5中中国信息通信研究院权威发布为例,如图3所示,在确定国际电信联盟为这一中心后,对网络信息源进行深度挖掘,找到了其IMT-2020計划,进而追逐到了我国5G推进组,而后又链接到了重要牵头机构中国信息通信研究院,最终获取了其权威发布信息信息源。
综合上述对第五代移动通信技术(5G)领域科技前沿跟踪信息源的挖掘结果,绘制出信息源体系图。如图4所示,该信息源体系明确了5G领域领先国家、研究机构、推进组织及重要活动,并具体到了具体名称。上述信息源大多还不是要通过人工或自动化手段直接跟踪获取信息的具体信息源,还有待根据具体情报实践主题进行进一步深入挖掘。
6 特定领域科技前沿信息源获取策略
前文对科技前沿信息特征及其来源目标体系及挖掘方法进行了探究。从中可以看出,鉴于对“前沿”的限定,科技前沿信息与传统意义上的科技信息在很多方面都不尽相同。从信息来源获取的角度,一方面,后者已有较为成熟、规范的分类方法及来源体系,通常可以直接获得,而前者则无法直接获取,必须借助不同方法、途径及策略加以实现。另一方面,前者对信息发布主体先导性与权威性有一定限定,要求追溯到前沿的代表性人物或机构[8]。基于对5G领域具体案例研究,本文提出能够快速识别并获取特定领域科技前沿信息源的三种方法策略。
6.1 中心扩散策略
中心扩散策略是根据特定领域科技前沿跟踪信息源目标的个体特征及重要性,通过信息源间的某种关系,找到该领域前沿跟踪信息源间的链接路径,实现信息源的拓展。中心扩散策略的核心思想是确定某一具有“枢纽”特征的中心信息源,逐级追踪到末端直接获取的信息源[9]。
该策略存在两个适用前提:第一,适用于技术演进阶段较为明确,且研发活动趋同性较为明显的领域。如全球行业公认已处于技术测试与评估阶段的第五代移动通信技术。第二,中心信息源必须在该领域具有很高的权威性与强大的“联系能力”。国际电信联盟作为联合国主管信息通信技术的权威机构,在全球5G标准实现进程中扮演引领者与枢纽的重要作用,有着强大的信息集聚能力。该策略应用有两个要点:一是中心信息源的确定,可采用定性分析与定量分析相结合的方法,来确保信息源选取的准确度与可信度;二是信息源联系路径的建立。通过对中心信息源的挖掘,找到其与外部潜在信息源间的关联关系,逐级扩展。
6.2 人机结合策略
在海量网络信息环境下,科技发展前沿信息来源与传递通道不断拓展,而科学技术本身的发展,也使得动态跟踪对象不停更迭。因此,科技前沿跟踪信息源的发现与获取,既需要借助信息化工具的辅助,更依赖于人脑的分析判断。人机结合策略主要针对信息源的挖掘与甄别,提出智能化情报辅助工具与领域专家在信息源体系构建不同环节的介入。该策略的应用要求信息源挖掘的对象要十分明确,且工具与专家的选取要科学有效。针对不同类型、不同特点信息源主体及其关系的抽取,选取不同类型的工具。本研究5G重要会议信息挖掘中所使用的网页文本信息采集分析工具,能够实现对人物、会议名称等命名实体的识别与抽取。在专家智力干预方面,应把握不同专家在不同环节介入的时间节点。信息源挖掘对象与工具的选取,由情报领域专家主导;工具挖掘初步获取的信息源经情报人员初步判断筛选,引入所属领域权威专家,由他们完成信息源的最终甄别与选取。人机结合策略的本质是智能采集、辅助分析与人脑判断的相互协同,该策略的应用应根据特定领域技术发展趋势与信息源构建具体需求的变化不断完善与调整。
6.3 权威发布获取策略
一个领域的前沿是随着时间推移不断发生进化、转化与演变,因此,基于对论文、专利等文献数据定量分析下的信息源挖掘,具有一定的局限性。由于前沿科技具有很强的前瞻性,通常会成为权威智库机构关注与研究的重点。这些权威机构凭借其独有的信息获取渠道,能够面向重点领域的前沿发展,研究发布重大战略咨询报告、趋势分析报告、论文或专利统计报告等满足不同决策需求的情报产品。而这些情报产品通常会涵盖重点领域全球顶级研究机构、热点方向、学术带头人、学科与研发布局等科技前沿信息[10],并可通过公开渠道获得。这些情报信息具有较高权威性与可信度,可直接作为跟踪信息源获取对象。此外,一些国际知名研究或出版机构发布的排名也可作为信息源的直接获取渠道,如自然指数集团每年发布全球自然指数(nature index)排名;路透社于2015年首次发布“TOP100全球最具创新力大学” ;美国宾夕法尼亚大学智库研究项目(TTCSP)连续多年研究并持续编写与发布《全球智库报告》等。这些报告对具体技术领域的创新活动及领先机构进行评价。但需要注意的是,任何一个排名都是某一机构基于一套特定研究方法而得出的结论,不可直接作为科技前沿跟踪信息源主体,还应根据特定领域科学与技术发展现状,参考其他策略获取结果综合加以分析甄别。
7 小结
在科学与技术学科不断交叉与融合发展的背景下,如何从海里网络信息中挖掘与获取科技前沿信息源,并构建信息源体系,是当代情报机构开展特定领域科技发展前沿跟踪情报工作的基础。本文在对科技前沿信息特征、信息源目标主体及信息源挖掘方法分析研究的基础上,以第五代移动通信技术为具体领域,尝试构建科技前沿跟踪信息源体系,并从信息源主体间关联性、信息源挖掘与甄别方式、信息源直接获取三方面,提出特定领域科技前沿跟踪信息源的挖掘与获取的三大策略。
科技前沿动态跟踪信息源的挖掘与构建是一项复杂、系统且需要积累的工作,不可能在短时间内一蹴而就,跟踪目标主体随着前沿热点主题的变化自身也在发展变化,因此,需要在实践中不断发掘、积累、调整和完善。此外,不同领域所涉及的学科范畴、技术演进方式及知识产生与存在形式都是有所不同,而与之相关的前沿信息产生的源头的也就存在很大差异,因此,从信息源获取策略的角度,不存在一套普适性的方法体系,既需要对现有方法的融合与改进,也需要不断引入新的思路、技术或工具。
最后,笔者认为,准确把握目标领域发展脉络,是特定领域科技前沿跟踪信息源获取与体系构建的重要前提;恰当使用现代化情报辅助工具,并结合专家智慧,是最佳实践方法;而以具体任务为导向,则是信息源体系建设的最佳推进方式。
参 考 文 献
[ 1 ] 牛振恒,李玲,苏郁洁,等.关于情报快报编制流程与质量控制的探索与实践——以生物能源科技与产业动态监测快报为例[J].现代情报,2011,(08):11-14.
[ 2 ] 盛立. 生物医学领域研究前沿识别与趋势预测[D].北京:军事医学科学院卫生勤务与医学情报研究所,2013.
[ 3 ] 刘小平,冷伏海,李泽霞. 国际科技前沿分析的方法和途径[J].图书情报工作,2012,(6):60-64.
[ 4 ] 沈固朝,施国良.信息源和信息采集[M].北京:清华大学出版社,2012.
[ 5 ] 马捷,靖继鹏,张向先.信息生态系统的信息组织模式研究[J].图书情报工作,2015,(5):15-19.
[ 6 ] 袁建霞,董瑜,邢穎,等.学科情报动态监测信息源的挖掘及体系构建[J]图书情报工作,2013,(11):80-85.
[ 7 ] 高 芳,赵志耘,张旭,等.全球 5G 发展现状概览[J]全球科技经济瞭望,2014,(07):59-66.
[ 8 ] 宋忠惠,郑军卫. 支撑智库研究的信息源建设策略[J].智库管理与实践,2016,(03):65-71.
[ 9 ] 孙碧娇,王新.基于信息源研究的国防科技信息资源发掘与获取策略探讨[J].情报理论与实践,2011,(11):91-95.
[ 10 ] 刘小平,冷伏海,李泽霞. 学科战略情报研究产品及其实现过程[J]图书情报工作,2011,(11):47-51.
(本文责任编辑:孙国雷)