外语心理语言学“规模潜伏数据采集软件”开发与应用研究
2011-11-08邵杰明闻炳海张少林潘赛仙
邵杰明 闻炳海 张少林 潘赛仙
(1.桂林市财政局,广西 桂林 541002;2.3.4.广西师范大学,广西 桂林 541004)
外语心理语言学“规模潜伏数据采集软件”开发与应用研究
邵杰明1闻炳海2张少林3潘赛仙4
(1.桂林市财政局,广西 桂林 541002;2.3.4.广西师范大学,广西 桂林 541004)
规模性潜伏数据采集软件是研究我国庞大外语学习群体之外语认知心理的客观数据采集工具,缺少这类软件已经严重制约了我国外语认知心理的科学研究。本研究采用跨学科人员合作模式,研制开发可同时采集50人外语认知心理过程的潜伏数据软件。通过多次检验、修改、应用,此软件已具备实用性和稳定性,可采集外语产出与理解过程的多种认知潜伏数据,为外语学习、理解、产出等心理加工过程的分析提供了科学依据。
潜伏数据;软件;开发;应用;外语心理语言学
1 前 言
心理语言学研究领域的潜伏数据(latency data)指语言感官刺激呈现和人们话语反应行为出现之间的时间延迟,又称反应时(response time)。它是语言加工速度或语言加工效率的指数,通常用来测量语言心理操作过程的持续时间和效果,并据此分析语言认知加工过程。在计算机科学领域,潜伏数据指计算机启动一项要求和获得应答之间的时间。国外的心理语言学研究通常应用计算机潜伏数据采集软件获得语言加工的客观数据,探索母语或二语习得、理解与产出的心理过程,内容涉及语言加工机制在处理语言各样态、各层面、各维度时的作用与局限,以及学习者处理各种不同广度、深度、强度、难度、复杂度语言材料的认知过程,等等。
我国的外语教学研究领域目前缺少探索外语学习认知心理的测量工具。尽管外语实证研究方法近年来受到重视,应用日益增多,但采集数据主要还是通过调查问卷和测试,这种研究虽然比过去经验型、评论型、直觉型、总结型的研究(Stern,1983:57-58)有进步,但仍不能了解外语学习、理解、产出的客观心理过程,不能为优化教学过程提供足够有效的科学依据。
本研究由计算机和英语教学领域的研究者组成的攻关团队合作进行,共同研发规模性潜伏数据采集软件,并检验其在英语认知心理过程测量的应用效果,力图填补我国外语研究这一方面的不足。
2 开发软件基本功能原型系统
该软件开发的第一步是项目组成员根据外语心理语言学研究对软件功能的要求,构建开发环境和实验环境,组织人员设计开发基本功能的原型系统,确定以使用B/S模式设计开发英语潜伏性数据采集系统作为研究方向。然后在AJAX(Garrett,2005)+ASP、FLASH+ASP、ActiveX+ASP三个技术解决方案中挑选出AJAX+ASP、FLASH+ASP两种技术解决方案。随后项目组成员对 AJAX+ASP方案和FLASH+ASP方案分别进行了验证。
验证结果表明,使用ASP+AJAX时,客户端表现层、描述层、行为层能做到完全分离,各个层次之间相互耦合不大,方便多人协作开发。而且在这种模式下,修改屏幕上显示的数据也不需要像传统WEB开发方式那样跳转或刷新整个页面,对时间数据的记录和采集可以在客户端完成,避免网络延时和服务器延时带来的采集精度延时。另外,这种模式中各个功能模块都是独立运行的,只要按功能划分模块,再分别对这些模块设计编码,组合后就可以进行最终部署。因此,团队决定以AJAX+ASP构架开发系统。
3 开发软件系统中的各个模块
图1 、图2展示了此软件的框架结构和各个模块。
图1 .规模性潜伏数据采集软件框架模块
图2.规模性潜伏数软件模型模块设计编码类别
此软件框架包括:数据库类、Ajax类、用户类、JS xml类。软件各个模型模块都分为三部分:ASP行为部分、XML结构、JS行为部分。设计编码的步骤按照先设计XML(1986 ISO8879)结构、再设计ASP行为、再设计JS行为进行。完成框架开发后将其引入系统,只需要根据模型模块的实际需求,写少量的数据库查询、输出代码就可以完成模型模块ASP部分开发。而将用户验证、XML初始化、XML接收、XML解析、XML输出、数据库连接等操作交给框架模块执行。客户端只需要调用JS XML类解析XML并动态加载到HTML中,封装XML请求发送到各个ASP入口点,就可以完成Java Script部分的开发,将客户端的用户认证、XML解析、用户界面交互交给框架完成。引入框架将大大提高软件模块化,并将各个模块之间的耦合度降到最低,使得各个模块之间只有在数据库中存在耦合。大大降低软件开发复杂度,软件模块的添加、修改、编码都将会按流水作业一般完成。引入框架,研究者只需要把精力集中在数据处理部分。例如,Teacher Add Examination To Class.asp模块代码中,代码第1到第11行是框架代码,所有其他同类模块中都有一份这样的代码。该模块的第11至第22短短几行就实现了该模块的主要功能,即将一道试题添加到一个班级的测试列表中。而实际运行中的用户认证、登陆认证、参数传递等都交由框架自动处理。
4 软件应用检验
检验的第一步在计算机实验室的6台电脑上联机进行。由于测试结果良好,完全达到要求,随后将此软件挂在广西师范大学独秀网,进行规模性潜伏数据采集试用。独秀网的服务器是联想一台高性能刀片机服务器(2005年托管网络中心,100M校园网带宽)。服务器上没有安装任何大程序,只打开了IIS、FTP和防火墙,没有实时杀毒软件。2007年使用PHP+MYSQL DISCUZ!论坛曾有1300人同时在线,速度还非常快。
检验的第二步,采用根据心理语言学理论与实验原理设计并编写的英语实验材料,组织100名大学生,分别检验本软件系统对视觉理解和语音产出两个方面规模性潜伏性数据采集与测试功能的效果。检验程序如图3、图4所示。
图3 .视觉刺激-话语产出实验程序
图4 .视觉刺激-理解判断实验程序
“英语视觉感官刺激→英语话语判断理解”功能测试有32组,每组4句英语理解判断材料,50人同时使用该软件测试。测试时,题目一次性发送,用户不刷新页面就不需要请求服务器。每组题按照设计只向服务器端发送一个答案保存请求。只调用一次数据库插入,对服务器达到最大优化。测试结果良好,但存在两个小问题:(1)数据库设计时,一个字段的默认值为NOW,但是测试记录的时间不准确。几个测试是不同时间进行的,但是时间记录却一致;(2)有数据丢失现象,如50人参加32组视觉材料理解测试,应该有50×32=1600条记录,可是数据库中只有1524条记录,约有5%的数据丢失。丢失的原因分别为用户没有完成测试和系统丢失数据。
“英语话语感官刺激→英语话语产出”语音潜伏数据功能测试使用48组英语语言与图片刺激,观察对英语口头语言产出的启动效应,50人同时使用该软件测试的问题比较大。在测试过程中,有接近1/3的计算机出现了测试一半时弹出“对话框错误”的提示,浏览器自动退出,因而测试记录混乱,无法实施统计。检查原因发现:(1)多媒体教室的麦克风有些直接接到多媒体面板上,不是直接接到电脑上,因而电脑不能完全记录语音产出的时间与结果。(2)在使用 ActiveX上传录音过程中,服务器压力太大,返回404错误页面,造成ActiveX异常退出,进而引发IE崩溃。
5 软件的完善与应用
由于话语产出录音问题比较大,经过分析,项目组决定放弃 FMS录音模块,转而使用 C++(Stanley 2006)开发MFC框架的ActiveX录音控件。在ActiveX控件中调用C++开源mpg 123 MP3编码解码库(张益贞、刘滔,2003)完成录音。录音上传部分使用MFC类库中的Chttp Connection、ChttpFile、Cinternet Session,类以模拟WEB中POST提交表单的方式将封装了 MP3录音文件的 XML文档提交到ASP服务器端。ASP服务器端解析XML还原出MP3文件(Hunter, Rafter, Fawcett,2009),并将MP3文件存储在服务器上(如图5所示)。
图5 .改进后的录音模块
另外,对数据丢失问题进行了系统升级解决方案论证,创建新的ActiveX组件,在ActiveX中启动测试应用程序,测试应用程序内嵌IE组件,在该IE组件中调用原来的程序进行测试。在修改过程中,项目组进行了反复测试,解决各种问题,软件功能有了较大改善。
对软件进行改进后,利用广西师范大学雁山新校区的新设备再次进行软件测试,每组50人,成功获取外国语学院教师与研究生做心理语言学研究所需的 6项规模性潜伏数据与测试结果。它们涉及如下研究领域:英语句法启动效应研究,英语主/宾型与先行词生命度对关系从句加工难度影响的研究,合成词加工过程中的部分整合关系结构研究,英语工作记忆广度与语言水平对英语学习者隐喻理解影响的研究,长时记忆中的英语词长效应实验研究,数吸引效应对英语主谓一致影响的实验研究。采集的数据有较好的客观性,对六项研究提供了科学的数据依据。
6 结 语
外语心理语言学是基于实验的认知科学分支,主要研究外语信息在大脑中如何表征、如何转换、如何储存、如何提取等心理过程,与外语教学密切相关。由于外语研究面向的是不同外语使用者和学习者群体,只有采集大样本数据才能利用推断统计学进行研究结果的外部效度检验。从这个意义上说,开发规模性潜伏数据采集软件对促进外语心理语言学研究有积极促进作用。目前,完善后的此软件挂在广西师范大学独秀网上(http://www.dxw.gxnu.edu.cn/newphp2/,管理员帐号和密码:admin),欢迎外语教学研究领域的研究人员登陆注册使用。
[1]Garrett,J.J.2005.Ajax:A New Approach to Web Applications[EB/OL].http://www.adaptivepath.com/ideas/essays/archives/000385.php.
[2]Hunter D,J.Rafter,J.Fawcett(吴文国译).XML入门经典(第四版)[M].北京:清华大学出版社,2009.
[3]Stanley B.Lippman,Barbara E. & Moo Josée LaJoie(李师贤等译).C++Primer(第四版)[M].北京:人民邮电出版社,2006.
[4]Stern H.H.Fundamental Concepts of Language Teaching[M].上海:上海教育出版社,1983.
[5]张益贞,刘滔.Visual C++实现MPEG/JPEG编解码技术[M].北京:人民邮电出版社,2003.
TP39
A
1673-2219(2011)09-0142-03
2011-05-26
本研究为新世纪广西高等教育教学改革工程立项项目(桂教高教[2008]151号)成果之一。
邵杰明(1979-),男,山西运城人,计算机工程师,在职硕士研究生,研究方向为计算机应用与网络。闻炳海(1976-),男,河北石家庄人,计算机科学与信息工程学院讲师,计算机专业在读博士研究生,研究方向为计算机软件开发与应用。张少林(1953-),女,山东成武人,硕士,外国语学院教授,研究方向为心理语言学、应用语言学。潘赛仙(1978-),女,湖南益阳人,硕士,外国语学院讲师,研究方向为英语教学。
(责任编校:京华)