图灵奖的基础信息统计与预测
2016-12-06刘彦君
赵 芳 吴 琼 刘彦君
(北京市科学技术情报研究所,北京 100120)
图灵奖的基础信息统计与预测
赵 芳 吴 琼 刘彦君
(北京市科学技术情报研究所,北京 100120)
借鉴以往的研究成果,以图灵奖获奖者为中心,从图灵奖官网、维基百科、百度百科、万方数据库等采集信息,对基础数据统计后,从历年获奖人数、获奖人年龄工作机构年龄研究领域、图灵奖分布的领域等角度对概况进行描述,在此基础上,对数据作进一步分析,对图灵奖未来若干年的获奖趋势作出预测。
图灵奖;基础数据;趋势
1 研究综述
图灵奖创立于1966年,是计算机界最负盛名的奖项,有“计算机诺贝尔奖”之称,只有国际计算机学领域最具权威资格和卓著成就的科学家才能够获得由美国计算机学会(ACM)颁发的这一奖项。
在万方数据库里,不设定限制,搜索“图灵奖”,共计1119条记录①虽然图灵奖也被称为杜林奖,但是在万方里用“杜林奖”检索,有18条记录,逐一排查后,发现无与之相关的信息。,用标题检索“图灵奖”,得到22条记录;同法检索“诺贝尔奖”,分别是5402条、1240条。通过万方的知识脉络图也可看出,2010年之后,图灵奖相关文章仅1~2篇。这说明同为国际科技大奖,国内对图灵奖的关注度比较小。原因有(1)图灵奖比诺贝尔奖晚设立65年。(2)图灵奖是计算机科学专门领域的奖项,而诺贝尔奖是包含诸多科学领域的综合大奖,前者被关注的群体范围远小于后者。(3)与我国计算机科学起步晚、发展水平有限也有一定关系。
通过对知识脉络图给出的经典文献和前沿文献,总结出对图灵奖的研究角度主要有:(1)对获奖者介绍。如南开大学教授刘瑞挺和中国教育网对新近获奖者信息进行了即时跟踪和完善。贲可荣和熊伟对历年获奖者的获奖工作做了概述[1]。(2)对获奖者所在机构在计算机科学方面的发展概况介绍。刘瑞挺教授对计算机科学重要研究机构进行了详细介绍②以上主要参考《计算机教育》期刊上刘瑞挺教授的文章。《计算机教育》是由教育部主管,清华大学主办,权威的、中高端计算机教育类的学术杂志,该期刊将谭浩强、吴文虎、刘瑞挺称为我国计算机基础教育的“三驾马车”。。(3)对图灵奖的获奖者信息进行统计分析。柳婵娟等人对获奖者有关信息和图灵奖分布的专业领域等数据进行了统计和分析[2]。(4)研究图灵奖获得者的论文。唐川等人利用文献计量指标对图灵奖得主进行识别(较好识别)和预测(预测能力一般)[3],和晋飞以图灵奖获得者的论文为例研究引文的速度和宽度来探索引文分布特征[4]。
2 研究角度和信息来源说明
本文借鉴以往的研究成果,以图灵奖获奖者为中心,对围绕获奖者的信息进行采集和统计,以期对图灵奖众多获奖者有一个全面的、综合的认识,在此基础上作出几点预测。
所用信息来自图灵奖官网、维基百科、百度百科、万方数据库,对其中不一致的信息以图灵奖官网信息为准。
3 基础数据的统计和分析
3.1 概况
3.1.1 历届图灵奖获奖者更新至2015年
历届获奖者已有专家统计过,如刘瑞挺统计到2006年[5],吴鹤龄与崔林统计到2011年[6],本文将这些信息更新至2015年,参见表1。
3.1.2 单人和组合获奖的年份分布
图灵奖从1966年开始颁发,至2015年共颁奖50次。其中12次以组合获奖,两人一起获奖10次,三人获奖2次;单人获奖38次,占76%,是主要的获奖形式。如果按照人数,在所有的64名获奖人员中,单人获奖是38人,组合包含26人。
图1是组合获奖的年份。
表1 历届图灵奖获奖者
图1 单人和组合获奖的年份分布
3.1.3 获奖人国籍
在64名获奖人中,其中17人是非美国国籍,占26.6%;其余47人均为美国人(包括入籍和双重国籍③之所以双重国籍算入美国,是因为获奖者的获奖工作主要是在美国完成的。),占73,4%。为了解非美国籍获奖总人数的变化趋势,将1966年——2015年划分为5个时间段,分别统计了获奖总数、非美国籍获奖人数以及二者的比例(参见表2),发现以往和未来相当长一段时间内,美籍人获奖的绝对优势一如既往,也说明美国依旧是计算机科学的中心。
表2 获奖人国籍
还有两点值得注意,亚裔获奖人来自发展中国家中国和印度,而非属于发达国家的日韩;除了欧美人,获奖人比较多的是来自犹太血统的人。
3.1.4 获奖人的工作机构
获奖人之所以做出成绩,与工作机构的科研实力和水平分不开。他们经历的工作机构在计算机科学上的科研基础条件、文化体制环境等值得学习和借鉴。柳婵娟等人对这些机构做了统计,但是不全面。本文在此基础上补充完善如下④在统计过程中,发现大多数获奖人的工作机构都有变动,为了统计数据的一致性,本文统计的机构指的是获奖人获奖时所在机构。:
表3 获奖人工作机构
3.1.5 获奖人的年龄
柳婵娟等人对获奖人做出突出贡献时的年龄做了统计。但是在采集获奖人信息的时候,发现获奖人要在计算机科学领域做出成绩需要数年,可能需要跨越柳婵娟等人划分的年龄段(比如从30多岁至40多岁之间),这样给统计带来困扰。所以本文以获奖人获奖当年的年龄进行统计,具体数据参见下表:
表4 当年获奖人的年龄
3.1.6 获奖人的研究领域
对专业领域的统计,柳婵娟等从学历所属领域的角度进行统计,以期对目前高校现行的计算机科学与技术专业的办学方向、培养目标及课程体系、教育教学方式进行反思和探究[7]。从柳婵娟等人⑤柳婵娟等人研究采用的图灵奖信息截至2009年。统计的学历专业领域看:数学才是获图灵奖的主要领域,其次是物理学和电气工程,计算机科学领域显然对获图灵奖的作用不大。
图灵奖是计算机科学领域的国际大奖,如果该领域的研究人员反而没有优势获得这一项奖,既不符合该奖设立的初衷,也难以符合逻辑。此外柳婵娟等人统计的是本科专业领域,根据他们对获奖人最终学历的统计,获奖人是博士的占到约77%(参见表5),在本科专业领域与工作领域的关系未明朗的情况下,贸然以获奖人本科专业领域指导计算机教育未必恰当。
表5 学历统计情况
柳婵娟等人是寻找图灵奖获奖人的教育经历对计算机科学教育可资借鉴的经验。但是这种经验只是改进计算机
科学教育,不能够看出之所以能达到“图灵奖”水平需要从事的专业领域。
在采集图灵奖获奖人相关信息的过程中,发现获奖人毕业之后工作的领域而非学历领域是决定其获奖的直接、重要的因素。了解获奖人工作的领域既可以确定努力的方向,也可以看出计算机科学与其他专业领域之间在实践和理论上的融合和影响。
获奖人工作中的研究领域主要有计算机科学、数学、心理学、经济学、哲学、分子生物学、临床医学、统计学、电气工程。其中4名获奖人是完全以数学领域的研究成果获奖,11人是将其他领域与计算机科学结合起来的研究获奖,49人完全以计算机科学领域的研究获奖,这说明①计算机科学领域的研究人员是图灵奖获奖人的主要人员。②只有数学和计算机科学能够以独立领域的研究获得图灵奖,其他领域只有与计算机科学结合才可以。
3.1.7 图灵奖分布专业领域
柳婵娟等人统计了截至2009年图灵奖分布的专业领域,本文在此基础上,将数据更新至2015年,统计的数据如下⑥由于笔者不是计算机领域的专业人士,所以数据的统计是请计算机专业人员做的,与柳婵娟等人的结果差别比较大。:
表6 图灵奖分布专业领域(至2015年)
3.2 未来颁奖趋势
3.2.1 21世纪第二个十年中未来四年组合获奖的几率大
以十年为一期划分,20世纪70年代至90年代,每十年就有两次是组合获奖;进入21世纪,第一个十年期,组合获奖一跃达到4次,第二个十年期过去的六年里,已有2次是组合获奖。获奖总人数和组合获奖人数在稳定了30年之后,在21世纪的第一个十年出现了增长,并且后者增长幅度大于前者。按照这种趋势,21世纪的第二个十年即使与第一个十年持平(获奖16人),在未来的2016年—2019年四次颁奖中,还需要颁发给8个人(参见图2)。结合上面的获奖次数,可以推断第二个十年剩下的四年组合获奖的几率很大。
图2 获奖人数变化趋势
3.2.2 未来获奖人大约是1935年——1966年之间出生的人获奖人总的年龄趋势见下图:
图3 获奖人员年龄变化趋势
以十年为一期,每一期都有一个出生年份最高点和最低点,其他人的出生年份在这个区间内。分别将每一期最低点和最高点接连起来,发现出生年份最高点和最低点都是趋向年轻化。表7是出生年份最低点之间和最高点之间的差值:
表7 出生年份最低点之间和最高点之间的差值
由2015年倒退至十年期即2006年,这期间的出生年份最高点和最低点分别是1958年和1933年,加上年轻化的趋向和差值,未来获奖人的出生年份应该在1933年至1966年之间。
3.2.3 未来十年非美国籍获奖人比例上升
图灵奖截至2015年颁发了50年,每十年为一期,分为五期,分别统计了每一期的获奖人总数、非美国籍获奖人数以及二者比例,参见表8:
表8 50年来的获奖人数比例
用曲线表示五期的变化趋势,参见下图:
图4 非美国籍获奖人所占比例
由上图可知,波峰和波谷是呈现规律性的变化的,由此可以推断,未来十年里,非美国籍获奖人相对美国籍获奖人的比例会出现一个高峰。
3.2.4 未来获奖人平均年龄会越来越大
如果图灵奖以每十年为一期,分为五期,将5期中的获奖人获奖时的年龄平均,参见下表:
表9 平均年龄分布(50年来)
获奖人获奖时的平均年龄的变化趋势如下图:
图5 获奖时平均年龄
根据年龄变化的趋势图,可以推测未来获奖人的平均年龄会越来越大。
[1]贲可荣,熊伟.图灵奖得主主要成就综述[J].计算机科学,2000,27(9):18-20.
[2]柳婵娟,张小峰,唐文静,等.图灵奖:历史与启示[J].计算机教育,2011(7):30-42.
[3]唐川,唐卷,房俊民,等.图灵奖得主识别与预测研究——基于多文献计量指标和支持向量机[J].情报杂志,2015(2):69-72,78.
[4]和晋飞.“引文速度”和“跨学科性”指标研究[D].中国科学院大学,2014.
[5]刘瑞挺.图灵奖新得主:弗朗西丝•艾伦[J].计算机教育,2007(9):6-8.
[6]吴鹤龄,崔林.图灵和ACM图灵奖(第四版)[M].北京:高等教育出版社,2012.
[7]柳婵娟,张小峰,唐文静,等.图灵奖:历史与启示[J].计算机教育,2011(7):30-42.
Prediction Based on Statistical Fundamental Information of TuringAward
Zhao Fang Wu Qiong Liu Yanjun
(Beijing Institute of Science and Technology Information,Beijing 100120)
After collecting data from Turing Award official website,Wikipedia,Baidu encyclopedia,Wanfang Database,this paper carries out statistics on fundamental information of Turing Award winners by drawing on the academic results of previous studies.Then it describes the general situation of the total number of prize winners,organizations,research fields and so on.It also further analyzes the data and makes prediction for the future TuringAward winners.
TuringAward;fundamental information;trends
C81
A
1008-6609(2016)08-0037-05
赵芳,女,河北廊坊人,博士,助理研究员,研究方向:科技情报,信息采集。
自立课题“网络环境下信息采集方法研究”,项目编号:13605。