大数据时代下的外语社会化考试*

2016-09-16蔡基刚

中国电化教育 2016年6期

关键词：社会化外语考试

蔡基刚，林芸

(复旦大学外文学院，上海 200433)

大数据时代下的外语社会化考试*

蔡基刚，林芸①

(复旦大学外文学院，上海 200433)

外语社会化考试建立在大数据时代，必须有大数据的意识。该文介绍了大数据的功能和价值，分析了外语社会化考试的四个特征。在此基础上，以刚诞生的英语工作能力考试为个案，就如何利用大数据的相关性达到预测目的，为社会用人单位找到合适的人力资源，提高大学英语教学的质量和效率，提出了外语社会化考试数据的层次性、考试设计的模块化、考试项目选择的个性化、工作能力的定量化和数据信息的共享性等原则。

大数据；外语社会化考试；高考；国家英语考试

一、引言

最近一两年我国见证了外语社会化考试的热潮。2014年颁布的《中共中央关于全面深化改革若干重大问题的决定》(以下简称《决定》)提出：“探索全国统考减少科目、不分文理科、外语等科目社会化考试一年多考”。同时，各地都相继公布了高考改革方案，提出从2016年起，高考英语实行社会化考试，一年两次考试，学生可多次参加，按最好成绩计入高考总分。社会化考试有什么特征和要求？大数据时代，社会化考试将如何发挥其作用？本文将讨论和回答这些问题。

二、大数据及其功能和价值

在信息化时代，每个人都要使用手机电脑发送或查询信息，都要在商店的结算机器上付钱，都会在公共场所的监控探头下走路，只要使用计算机或联网，就会产生和留下信息，这些信息通过储存和处理就形成数据。当这些数据到达一定的量，并转化为具有价值信息就是大数据。美国互联网数据中心对大数据的定义是：通过高速捕捉、发现和分析数据，并从海量数据中获取价值的一种新的技术架构。可以说，我们生活在大数据时代。根据Mayer Schonberger和 Cukier[1]观点，大数据有以下功能和价值。

1.大数据的核心就是预测。例如，纽约马路上每年有很多沙井盖发生爆炸，爆炸时井盖冲上几层楼高，给生命财产带来极大威胁。统计学家Rudin通过整理19世纪电缆修理工留下的维修记录，成功地预测未来哪些地段的沙进盖可能发生爆炸的时间。谷歌工程师根据当地网民的对“流感”相关关键词搜索的统计成功预测了哪些地方的甲型流感会大规模爆发。Farecast 利用航空机票的数据预测了未来机票的价格。

2.大数据是建立在不同数据之间的相关性上。例如，沃尔玛这个世界上最大的零售商在他们的销售信息中发现，手电筒销售量和蛋挞(一种美式早餐)的销售量是按正比增加的，而且根据记录，这两种商品销售量的大幅度增加正是季节性飓风来临的时候。这样，通过季节性飓风和蛋挞销售量的相关性，预测了蛋挞什么时间应大量上架。

3.大数据价值具有可以不断挖掘的潜在价值。大数据包括基本用途、二次用途、三次用途，具有双重价值。例如，商店的监控摄像头，原来只是收集商店扒手的信息，但根据数据进一步整理，又发现顾客停留最多的铺面和柜台，客流量统计就此转化为了商业利润。谷歌街景车原本是想通过对房屋和街道的拍照来绘制和完善谷歌地图，结果利用这些数据又生产出全自动驾驶汽车。

4.大数据可带来巨大商业利润。通过顾客停留的商铺柜台，商家可预测商品供应量。美国一家快递公司就是根据员工每天传上来的行车线路、送货业绩和交通事故情况，绘制出一张各地区送货的最佳线路图，从而减少了左转线路(容易车祸)、堵塞时间等，结果一年中送货员的车子少跑了4828万公里，节省了300万加仑的汽油，减少了3万公吨的二氧化碳排放量。

5.大数据产生的信息可以共享和转让，使第三方或更多方得益。亚马逊的电子阅读器具有让读者标注和强调内容的功能，记录了读者在每一页停留的时间和阅读速度。结果亚马逊通过这些数据知道哪些书、哪些段落、哪些内容是读者最喜欢的。他们把这些信息卖给出版商和作者，他们很容易出版畅销书。

可见，大数据研究就是通过海量的数据信息来发现某种行为规律，揭示未来发展趋势。大数据具有海量性(Volume)、速度性(Velocity)、多样性(Variety)[2]、真实性(Veracity)、可核查性(Verification)和价值性(Value)等特点，大数据的价值是通过数据采集、数据分析和数据运用三个必要步骤来实现的。近几年来，大数据已广泛用在教学上。如从学生选修系统、退课系统、图书借阅等得到的数据可以预测学生的需求。在外语教学上，通过分析学生在教学平台上听说读写模块和内容的选择，可以预测学生的学习困难、学习需求和社会用人需求等。

三、外语社会化考试的特点

社会化考试的提法并不新鲜。外语社会化考试的关键不是多次，而是考试从教学象牙塔走向社会使用的定位转移。如果我们把国际上的托福和雅思或SAT等外语考试作为社会化考试的原型，我们就会发现一个典型的社会化考试有以下特点。

1.社会化考试是以社会需求为驱动的

语言测试领域历来有两种观点：技术考虑(Technical Discourse)和社会考试(Sociological Discourse)。前者关注测试本身的质量，如信度、效度、区分度等技术指标；后者更关注测试在社会中的使用和所产生的影响[3]。效度是指“一项测试是否测量了它所要测量的东西”[4]。效度有各种各样，如内容效度(内容应紧扣教学目标和教学大纲)、预测效度(考试结果能准确预测考生未来能力)等。但一个社会化考试还要有一定的价值意义(Value Implications)和所产生的积极的社会后果(Social Consequences)。为此，美国著名教育学家Messick把这两个指标放入了效度的范畴[5]。如托福和雅思的推出就是从争夺国际留学生的战略角度出发，而托业的推出是日本企业家最初为适应经济全球化趋势考虑的。因此，社会化考试是根据社会需求来设计的。根据语言学家研究，外语学习者如想用英语进行学习和工作，8000到10000词汇是最低的要求，阅读速度在150词以上[6]。因此，即使拿了高分的大学生也只能说明达到了大学英语四级课程要求，并不一定能胜任企业工作或高校学习。

2.社会化考试一般是由非政府行政部门组织实施的

考试机构独立化是社会化考试的重要标志，如托福和雅思等考试都是由独立的私人机构或社会专业机构组织的。由行政部门组织的考试之所以不是社会化考试，原因之一就是它们不是通过竞争，而是通过一些行政文件来获得其全国统考的地位。考试内容和形式较少根据市场和语言考试内在规律。

3.社会化考试是尺度参照性考试，而不完全是常模型参照性考试

尺度参照性测试是将考生的成绩与预先设计的能力、目标或技能标准做比较，以此来衡量该考生的语言行为是否达到该标准。因此这种考试用来进行资格考试，看其考生是否达标。而常模参照性测试是对个体考生的考试结果与某一个特定群体(所有参加该次考试的考生)的考试结果进行比较，从而确定这一考生在群体中的位置。简单地说，在尺度参照性考试(如托福或托业，尽管这些考试也采用常模参照记分体制)中，某个考生只要达到标准，就具备到北美和英国等高校进行学习，或可以到国际跨国企业工作的资格；而在常模型参照性考试中，即使某个考生达到预设标准，是否及格还要看这个群体的平均成绩。

4.数据能否公开，为谁服务是区别社会化考试另一特征

最近新诞生的英语工作能力考试完全符合外语社会化考试的特征。首先，它是需求驱动的，有明确的社会功能，是为配合我国“走出去”国际化战略专门设计的，只要通过考试，就能在企业里从事用英语开展的外贸(或金融、法律、软件、石油、电力、航空、旅游等)工作；第二，这个考试是由高校外语教师和企业考试公司共同组织的独立考试机构，没有任何官方背景；第三，考试产生的数据信息将充分利用，为企业找到合适的人力资源，为我国外语教学质量的提高，为考生个人分析自己的语言能力服务。

四、大数据意识的外语社会化考试

考试，无论是网考、机考还是纸考，只要通过计算机输入信息就产生了数据。以托福为例，从20世纪八九十年代起，每年我国有许多考生通过这个考试赴欧美国家留学，如果追踪他们现在的专业和成就，关联所储存的考试数据就会发现许多有用的信息。可见，托福考试已不是一项单纯的语言测试。通过考试信息数据的开发，美国考试中心使托福成为一个每年为美国从全球上千万考生中延揽人才的竞争手段。如何挖掘数据的潜在价值，对大数据时代的外语社会化考试是一个重大挑战。

1.考试数据的层级性

“让数据说话”就是要发现数据的相关性。大数据可以通过海量数据来呈现事物之间的相关关系，并利用数据之间的相关关系解释过去、预测未来。任何一个外语考试，根据其数据的处理程度和数据单向与交叉关系，可以得到三个层次的数据。

原始数据：即不需要处理的数据，如通过考生填写的信息，可以得到每次有多少男生和女生参加考试以及他们的年龄、专业、地区、学校和考试次数；通过考生的成绩分数可以了解全部考生的听说读写项目的单项分数和总分。这些原始数据可以提供给我们各地区、各学校、各专业、各年龄段等考生成绩情况。

一次处理数据：通过考生背景信息和考试数据处理，我们可以发现年龄、性别、专业、地区等因素与听、说、读写各项能力之间的相关关系，为外语教学和外语培训提供有用的科研数据。

二次处理数据：通过追踪学生的家庭背景、学习英语时间长短、本科专业学习成绩、外语学习环境(如全英语教学)、毕业后的工作岗位以及薪水水平等，可以发现英语考试成绩以及各项语言能力的强弱与他们专业成功的相关关系，从而建立预测人才模型，提供给猎头公司或有关部门。

所以，大数据时代的外语社会考试应有意识地挖掘一次和二次数据，让数据之间的相关关系帮助我们达到为社会企业单位和外语教学服务的目的。

2.考试设置的模块化

以往设计的考试所得到的信息数据往往是保证基本用途。对数据采集方来说是被动的，考试产生什么样的信息，就接受什么样的信息。而大数据视野下的外语社会化考试就可以通过有目的设计，得到设计者想得到的相关性数据。如何做到这一点？考试毕竟是考试，除了姓名、性别、学校和专业等信息，不可能要求考生输入不相关的信息，这是大数据时代必须遵循的隐私原则。但是我们可以通过模块化设计，采集到我们所需要的信息。如听、说、读和写模块独立给分，就如同雅思考试，这样我们就可以分析出考生的强项和弱项以及相关关系。

在大数据时代，按语言模块划分还不够，我们还可以根据认知能力和工作能力划分。Bachman[7]的研究表明，所测量和测试的语言交际能力由三个部分组成：语言能力、策略能力和心理生理机制。语言能力包括组织能力(具有把话语或句子连接成语篇的能力，其中包括掌握各种衔接手段和新旧信息辨别等)和语用能力(如语境下辨别言外之意的言外能力和社会文化交流的语言能力)；策略能力包括评价能力(辨别达到一定交际目的所使用的语言变体以及评估交际目的等)、计划能力(选择有关语言知识制定一个达到交际目的的计划)和实施能力(如何实施这个计划)；心理生理机制(包括如何接受和生成口头和书面的信息能力)。根据这一理论，语言测试家正在考虑如何量化这些能力，能够按模块分别测试。

如英语工作能力考试把整个考试分成了通用职场英语和专门行业英语两大模块。前者是测试企业员工用英语从事跨行业的一般工作能力，测试内容可细分为以下工作任务，如下表所示。

考核涉及任务表

仅以 “工作会议”为例，我们可以从听说读写各个方面来测试考生如何准备会议计划、起草会议通知(邀请函)、电话邀请与会人员、写会议行程、进行会议注册与接待、和发言人沟通、在会议中提问、发表个人观点、提出一个新的议题、发表主题演说、对发言进行总结、反驳别人观点、组织头脑风暴、组织一个电话(视频)会议、组织对一个提议表决、处置会议意外情况、礼貌打断别人讲话、开始(结束)一个会议、对会议议程做出变更、编写会议总结(纪要)等，这些内容正是工作环境所需要的。可见通过不同模块的设置，可以考察考生的各个方面的英语工作能力。

3.考试的个性化选择

在考试设计中，尽量给予考生根据他们的需求进行模块或内容的选择机会，这是获得有相关信息的另一方法。其公式是：个性+选择=数据。如在英国，有一家保险公司既有根据车主的年龄、性别、驾龄等来购买的统一保险，但又同时推出一款保险，车主可以根据驾驶的地段和驾驶的时段来购买汽车保险，这种保险的费用是很低，甚至几乎是免费的。那么保险公司靠什么赚钱呢？数据。他们就是通过车主所保的地段和时间，成功地预测了车祸发生最频繁的地段和时间，可以把这个相关信息转让或售出。因此，要让考试产生尽量多的相关数据的或让数据说更多的话，其原则必须是：个性化和选择性。

英语工作能力考试分成两个模块，考生可以选择只考通用职场模块，或选择和专门行业英语模块一起考。行业英语模块是按照专业和行业划分的，如有金融、外贸、法律、石油、软件、电力、航空、海事、旅游、医学、工程等模块，考生可以根据需要选择其中一个。在行业英语模块中，考生还有选择权。在这个模块中考试内容分成语言能力和行业知识两大板块，前者是测试这个领域中的交际能力包括口头和书面，如听懂飞行员与指挥塔的交流，写出运动员上台领奖的感言；后者是测试这个领域的一般常识，包括这个领域最典型的术语和高频词汇。考生可以选择其中一个板块，也可以选择两个都考，甚至可以在听说读写译五大模块中根据考生需要和用人单位需求，自行选择其中一项或几项考试。这种个性化选择，可以让考试组织方成功地预测了行业需求情况，以及大学毕业生需求和跨专业选择工作的倾向等信息，起到更大的社会功能。

4.工作能力的定量化

考试卷面结构是按传统的听说读写模块来安排，还是按工作能力来测试？或是把两者融合起来，通过不同的赋值来测算，这是大数据时代外语社会化考试要解决的。英语工作能力考试提出考核用英语完成任务的六大工作能力：理解能力、思维能力、沟通能力、计划能力、执行能力和管理能力。能否将这些能力在听说读写项目中体现、细分和量化，通过赋值，分别给出这些能力的得分。信息技术化时代完全可以把分散在听说读写各个项目里的这几种工作能力挑出分类，从而得出它们在这方面的能力的数据。我们也可以在语言题的基础上，依据听力和阅读材料设计一些延伸题，专门测试其工作能力。尤其是在口语题和写作题中，更可以设计一些测试考生的思辨能力、创新能力、沟通能力和团队合作能力的问题，模拟正式求职面试场景。当然这些关系非常复杂，如考试反映出来的分数的高低究竟是语言能力因素还是认知能力和工作能力因素，这需要做很多研究工作，建立一个可分析的模型。如果能解决的话，我们所给考生的成绩报告单不再是传统的听说读写四个成绩，其中还有理解能力、思维能力、沟通能力、计划能力、执行能力和管理能力等分数。换句话说，以后的公司招聘不需要海选性的面试，通过这些数据就能找到他们所需要的候选人。

5.考试数据的共享性

大数据带来的是数据信息开放和共享的价值理念。大数据时代的外语社会化考试要求打破传统外语考试的数据保密、数据封闭、数据隔离和数据孤岛的现象，实现考试信息最大程度的开放和共享。对于社会化考试而言，凡不涉及某个个体考生的数据，都可以转让给研究单位、社会用人单位和高校教学单位去处理分析。数据一旦产生，就有无限的潜在价值，不同人用不同方法，根据不同目的去处理，便会产生不同的价值，如推动企业选才，改进外语教学。当然，信息是共享的，作为回报，用人单位可以根据自己行业的需求提出建议，如优先考哪些工作场景，哪些工作能力等等。同样，由于这个考试对考生来说可以是免费的，因此他们愿意提供更多的信息，在个人需求、学习策略、教学环境等方面的咨询中给与更多的配合。

6.考试的互联网

大数据和互联网是孪生兄弟。大数据时代的外语社会化考试必须在借助互联网运转。今后的考试不再是在一个封闭的考场，而是在任何时候任何地方只要可以上网，考生都可借助自己的电脑或iPad参加考试，甚至在家里。上网后在云端下载试题，计算机就自然关闭其他程序，直到考试结束。此时iPad的摄像头就是监考官，不停地跟踪考生答题的全过程，包括他们是否查阅自己带的资料，是否替考等等。因此，成本大大降低，效率也大为提高。当然这种考试是基于海量的题库。考试结束后，考试委员会的官网上会公布每个考生的二维码，考生只要扫一下就可以了解自己全部考试信息，其中包括考生的作文、考生的口试录音等。二维码的密码由考生自己掌握，在求职和升学使用，考生可决定给哪些用人单位或其他人“扫一下”。由于考试成本的大大降低，和考试数据为各方所利用，社会化外语考试就能做到低报名费甚至像英语工作能力考试一样实行免费报名。

五、结语

大数据时代的外语社会化考试如何设计、运转、采集信息、共享信息是一个重大的课题。大数据时代的外语社会化考试首先要发挥其社会功能，如为我国“走出去”的国际战略化服务，也就是说为企业为高校找到能够直接运用英语进行工作和专业学习的人。本文提出社会化外语考试的四个特征和考试数据的层次化，考试项目的模块化、考生项目选择的个性化、工作能力的定量化和考试数据信息的共享性等5项原则都是新的探索。这些探索将对我国开始真正意义上的外语社会化考试，尤其是在大数据背景下的外语社会化考试将产生积极的影响。

[1] Mayer-Schonberger, V. & K,Cukier. A Revolution that Will Transform How We Live, Work, and Think[M]. New York: Houghton Mifflin Harcourt, 2013.

[2] Douglas, L.. 3D data management: controlling data volume, velocity and variety[DB/OL].http://blogs.gartner.com/doug-laney/files/2012/01/ad949-3D Data-Management-Controlling-Data-Volume-Velocityand-Variety.pdf,2012-01-01.

[3] Filer, A. Assessment: Social Practice and Social Product[M]. London:Routledge Falmer UK,2000.

[4] Lado.R. Linguistics across Cultures [M].Ann Arbor:The University of Michigan Press,1957.

[5] Messick. Validity[A]. R.L.Linn.Educational Measurement(3rd)[C].New York: Macmillan,1989.13-104.

[6] Diller,K. The Language Teaching Controversy[M].Rowley,Mass:Newbury House Publishers,1978.

[7] Bachman. Fundamental Consideration in Language Testing[M]. Oxford:Oxford University Press,1990.

责任编辑：赵兴龙

Big Data Approach: Socialized Tests of Foreign Languages

Cai Jigang, Lin Yun
(Foreign Languages and Literature Department, Fudan University, Shanghai 200433)

The designers of any socialized tests of foreign languages must have big-data awareness. On the basis of the introduction of the functions and values of big data, and the main features of a socialized examination of foreign languages, the paper uses the case of the newly-established Competence Tests for Workplace English to illustrate such principles as the classi fi cation of tests’ data, the modularity of the design of test items, the individuality of candidates’ choices, the quanti fi cation of competence and the sharing of examination information, the principles that socialized tests of foreign languages in the Big Data era should follow.

Big data; Socialized Tests of Foreign Languages; GaoKao; National College English Tests

G434

：A

1006—9860(2016)06—0127—05

蔡基刚：教授，博士生导师，研究方向为对比语言学和应用语言学(caijigang@fudan.edu.cn)。

林芸：在读博士，讲师，研究方向为对比语言学和应用语言学(linnn2204@163.com)。

2016年3月4日

* 本文系国家语委重点科研项目“汉英学术语篇阅读效率及信息加工对比研究”(项目编号：ZDI125-57)、上海市教委重点科研项目“上海高校实施从通用英语向学术英语转型的大学英语教学改革行动研究”(项目编号：A1301)研究成果。

① 林芸为本文通讯作者。