APP下载

基于大数据的英语与布依语的数字化转型对比研究

2016-03-18陈毅萍

贵州师范学院学报 2016年11期
关键词:布依族词典语料库

黄 琼,陈毅萍

(1.贵州师范学院外国语学院,贵州 贵阳 550018;2.重庆大学外国语学院,重庆 400000)

基于大数据的英语与布依语的数字化转型对比研究

黄 琼1,陈毅萍2

(1.贵州师范学院外国语学院,贵州 贵阳 550018;2.重庆大学外国语学院,重庆 400000)

本文阐述了在信息技术迅速发展和贵州大数据建立的背景下,结合发展前人应用信息技术保护布依语及其他少数民族语言的相关研究,对比了英语的数字化转型研究,探索了布依语的数字化转型形式:语料库建立,在线词典的开发,网络三维技术的应用,希望能为信息技术应用于布依语保护实践提供参考。

大数据;布依语;信息技术;数字化

一、大数据时代带来的发展契机

2014年3月1日,贵州省委、省政府在北京成功举办贵州·北京大数据产业发展推介会,正式拉开发展大数据的序幕,贵州领先全国,“抢跑”进入大数据时代。

大数据时代是建立在通过互联网、物联网等现代网络渠道广泛大量数据资源收集基础上的数据储存、智能处理和展示的信息时代。在这个时代,人们几乎能够从任何数据中获得可转换为推动人们生活方式变化的有价值的知识。这意味着,数字化决定生存。

数字化就是将许多复杂多变的信息转变为可以度量的数字、数据,再以这些数字、数据建立起适当的数字化模型,把它们转变为一系列二进制代码,引入计算机内部,进行统一处理,这就是数字化的基本过程。

数字化是数字计算机的基础,若没有数字化技术,就没有当今的计算机,因为数字计算机的一切运算和功能都是用数字来完成的。

数字化是多媒体技术的基础。数字、文字、图像、语音,包括虚拟现实以及可视世界的各种信息等,实际上通过采样定理都可以用0和1来表示,这样数字化以后的0和1就是各种信息最基本、最简单的表示。因此计算机不仅可以计算,还可以发出声音、打电话、发传真、放录象、看电影,这就是因为0和1可以表示这种多媒体的形象。用0和1还可以产生虚拟的房子,因此用数字媒体就可以代表各种媒体,就可以描述千差万别的现实世界。

数字化是软件技术的基础,是智能技术的基础。软件中的系统软件、工具软件、应用软件等,信号处理技术中的数字滤波、编码、加密、解压缩等等都是基于数字化实现的。例如图像的数据量很大,数字化后可以将数据压缩至10到几百倍;图像受到干扰变得模糊,可以用滤波技术使它变得清晰。这些都是经过数字化处理后所得到的结果。

数字化是信息社会的技术基础。数字化技术还正在引发一场范围广泛的产品革命,各种家用电器设备,信息处理设备都将向数字化方向变化。如数字电视、数字广播、数字电影、DVD等等,现在通信网络也向数字化方向发展。

数字化是信息社会的技术基础。有人把信息社会的经济说成是数字经济,这足以证明数字化对社会的影响有多么重大。

因此,在大数据时代,如果不能将布依语与信息技术结合发展,将面临着被历史淘汰的命运,大数据时代的到来给布依语的保护和发展提供了发展的契机。推进布依语的数字化转型的相关工作已经迫在眉睫。

二、英语数字化转型相关研究

英语数字化转型就是将英语转变为计算机能够存储,管理,传播和处理加工的可以度量的数字数据。具体形式有网络英语音频、视频和文档等。

信息与语言天生具有本质的同一性。信息技术与英语教学本质的关联性为信息技术与英语教学的交融、整合提供了逻辑可能。语言是信息的载体,也是信息的组成部分,信息的交流和转换,就是语言材料的交流和转换,而语言教学就是语言材料信息的交换和生成的实践活动,因此,语言在这一过程中先被数字化——如文字和声音的数字化、艺术化、技术化加工,再被交互传达。

英语教育技术是信息技术和语言教学学科互涉所产生的学科间交叉研究的典范。英语教育技术将英语进行数字化处理,并取得有效成果的有很多。现在比较流行的有英语MOOC研究。如孟亚玲、魏继宗的研究指出MOOC是信息技术促进教育变革的成功案例,MOOC加速了知识民主化进程,MOOC促进了学习国际化,MOOC实现了远程教育与传统教育的融合,MOOC是自主学习成就精英的舞台,同时MOOC呼唤教师职责的回归。早期的有网络学习社区的建立,学习软件的开发,在线词典和语料库的构建等。张秋秋就指出,“在线词典具有种类繁多,资源丰富,检索简单方便等优势,为语言学习也为语言研究等工作提供了相当大的便利”。马英博指出,“基于语料库的教学模式可以有效地消除传统词汇教学的各种弊端。语料库具有大量的真实语料,其语料的真实性和实际性的特点有利于学生掌握和运用真实语境的英语词汇。语料库辅助英语词汇教学的新模式增加自主学习和合作活动,使学生增加了的学习内驱力”。初期的还有基于web的英语写作教学和阅读教学以及博客和播客应用于英语教学等。皮忠玲研究表明,视频播客已广泛应用于网络学习中。由于视频播客可以通过呈现生动的视觉信息来传授知识,研究者认为它更容易吸引学习者的注意力,激发学习兴趣,加深对知识的理解。

这些研究都表明了英语数字化转型后,取得了英语传统教学所无法媲美的教学优势和教学效果。首先,英语数字化转型后,实现了英语的移动学习,即随时随地的,碎片式,零散的移动学习,这种移动学习已经证明是现在最有效的学习方式之一。其次,英语数字化转型后,英语的教学实现了由教师为中心到以学习者为中心的自主学习,实现了学习者个性化的学习并满足了不同学习者的学习需要,从而达到有效学习。最后,英语数字化转型后,英语学习变成了协商与合作的,可以即时交流的。学习也不再是对知识的记忆,而是对知识和间接经验的再创造,从而使新知识纳入已有的知识结构中,学习结果也变得更加富有成效和意义;丰富的学习工具和资源,让终身学习变为现实。

由此我们可以得知,英语教育技术促进了传统英语教学的成功转型,英语在英语教育技术的处理下数字化,这种数字化转型适应了时代的发展,也提高了英语教学的效果。如果英语数字化转型的相关成果合理应用到布依语与信息技术的结合研究上,既可以满足布依语在本族人之间的教学需要,还可以使布依语的发展适应大数据时代的发展和需要,最终达到保护布依语的目的。[3]

因此,在贵州建立大数据的背景下,合理借鉴英语教育技术使得布依语实现数字化转型,不仅是布依语保护的有效手段,而且是布依语在大数据时代生存发展的必需。布依语数字化不仅能保护传承布依语及其珍贵的文化,而且也为其他濒危少数民族语言的保护和传承能提供宝贵的借鉴经验。

三、布依语的现状调查

根据贵州省统计局2010年第六次人口普查数据显示,布依族总人口2870034人,占比0.2153%,现位居全国56个民族人口排名第12位。其中以贵州的布依族人口最多,占全国布依族人口的97%。贵州布依族主要聚居在黔南和黔西南两个布依族苗族自治州,以及贵州的都匀、荔波、独山、平塘、镇宁等10个县(市)。

布依语属汉藏语系壮傣语族,各地区布依语的词汇相差不大,语法一致,语音略差别。所以,布依语无方言差异,只有土语区别,各地布依族人都可以用本民族语言交流。布依语,特别是其语汇(语词及谷语、谚语等)部分,保存了本民族的社会历史、思想意识和风俗习惯等方面的文化内涵,反映出布依族的悠久的历史与文化。

龙海燕对位于贵阳市郊的花溪区养牛坡、开阳县石头坡、乌当区偏坡村、修文县独山村、白云区兴家田村、清镇市杨家庄等民族村寨的布依语使用现状做了实地调查。调查结果表明,由于城镇化进程不断加快,影响了布依语使用的社会文化环境及氛围,改变了布依语母语使用者的观念,加之受汉语文化的冲击,母语使用者老龄化等原因。从贵阳市郊布依族语言的使用现状来看,如果不加以保护,不做社会干预,在30至50年以后贵阳市郊将不会有布依语存在。贵州布依语濒危,采取有效的保护措施已经刻不容缓。[1]

而少数民族语言保护是国家非常重视的一个课题。中国语言资源保护工程(简称语保工程)是由教育部和国家语委领导实施的一项国家重大语言文化工程。工程在2015年5月正式启动。语保工程覆盖全国十大方言区和全国130多种少数民族语言。国家语委发布“十三五”科研规划,未来几年,我国将重点实施中国语言资源保护工程,收集记录汉语方言、少数民族语言等。在此背景下,本文的研究针对具体地区、具体语言的保护形式思考,具有很好的实际价值。

四、数字化转型对布依语的保护及传承的途径思考

笔者检索了有关布依语的相关研究,发现截止目前,这个领域的相关论文仅有13篇,而使用英语教育技术保护布依语的论文仅有1篇。笔者又检索了英语教育技术、少数民族语言的保护、大数据等相关论文,探索出以下3种可应用于布依语数字化的转型形式。

(一)语料库的建立

语料库是应用计算机技术对海量的自然语言材料进行处理、存储以供检索、索引以及统计分析的大型资料库,它是按照明确的设计标准为某一具体目标而建立的语言资料库(Granger 1998;李文中 1999)。而计算机语料库以其语料的充分性、客观性、可验证性、使用的便捷性,正在使语言学的研究与应用产生量与质的飞跃(Chafe 1992;Johansson 1982)。由于对布依语的保护需要加强对布依语的相关研究,而基于语料库的研究方法已经成为当代语言学和应用语言学研究中的一种主流方法。任何语料库研究均开始于语料库体的建立(Sinclair 1991:13),所以建立布依语语料库是非常有历史价值和现实意义的。[4]

国内关于语料库的研究比较丰富,比较有代表性的有王成平的彝、汉、英三语平行语料库的建设研究,并指出如果其语料库建设成功,将是我国也是世界上,第一个基于彝语和汉语、英语的平行语料库。由此可见,三语语料库一方面已有突破性的的调查研究和建设性实践,另一方面,这种三语平行语料库建设还是处于初创阶段,还有很大的利用价值和空间。[5]而占升平也对建立布依语语音数据库进行了初步探索,对建立布依语音数据库的必要性和重要性进行了阐述,也对在建设过程中遇到的问题也提出了建设性的解决方案。这是基于外语教育技术对布依语进行保护的一项突破性研究,而且这还是应用型研究。这个语音库的建成,将为布依语语音的研究提供大量的资源。[6]

但迄今为止,还没有有关布依语语料库的相关研究。而建立语料库,必须采用布依语文字和语音同时进行存储,布依族本来有自己的古文字,古布依字或方块布依字是古代布依族人民为了借用汉字的字型或结构创造的用来书写布依语的文字,类似古壮字。1956年11在贵阳市召开的布依族语言文字问题科学讨论会上,决定采取布依文和壮文联盟(布壮文字联盟)的方针,并通过了《布依文方案(草案)》,创制了以拉丁字母为基础的文字,以贵阳附近的龙里县羊场镇话(属布依语第二土语区)为标准语。该方案经原中央民委批准,自1957年开始在布依族地区试验推行。由于政治原因,推行工作于60年代中断。20世纪50年代又创制了拉丁布依文。20世纪50年代创制了布依文,但未能普遍推广,现在通用汉文的较多。如果建立布依语语料库,就面临着布依语文字的采用问题。是使用民族古文字,还是使用创制的布依文,或者拉丁布依文。如果使用汉文来作为布依文的标注很显然是不合理的。比如布依语“我喜欢你”发音为“股卖萌”。(本文采纳的是贵州省黔西南布依族苗族自治州望谟县布依语发音。)如果把其文字写成汉语“我喜欢你”会导致布依族人学习汉语和布依语时出现双向负迁移的影响。而如果就按其发音写成“股卖萌”,也会失去布依语言所承载的厚重文化历史价值,所以建立布依语语料库是促进布依语文字采用的重要推力,也是保护布依语语言文字的重要资源库。

笔者认为,建立语料库来保护一种语言是非常有意义也非常实用的。因为以往的传统的著作或者电子书籍对布依语的语音和词汇的保存容量有限,发行又受地域限制,而网络上的语料库不仅能基本囊括布依语基本所有的语音和词汇,而且能及时更新数据,而且能够让全世界的在线用户能不受时空限制,了解学习研究这门语言,而这对于保护布依语而言是至关重要的。

(二)在线词典的开发

词典曾被称为无声的老师,而网络在线词典的发展无疑彻底改变了这一观念。现在的在线词典不仅能够提供准确的单词发音,甚至能够把例句等内容也较流利地读出来,这样对学生学习语音提供了方便。

保护布依语,在建立语音语料库的同时,应该开发有效的辅助的布依语查询及学习工具,即在线词典。以满足在线用户布依语网络自主学习研究的需要。词典是学习一门语言的不可或缺的工具,而现在词典已经发展到纸质词典,电子词典和在线词典三者并存互补的阶段,能够满足不同语言学习者的需求。[7]

在线词典是指建立在网络之上,可为用户提供实时共享查询服务的重要参考工具。任何一门语言的学习和保护都离不开词典这种工具,而在线词典有着传统纸质词典和电子词典都无法媲美的优势:(一)动态性。所谓动态性,就是指词典随着语言或科学技术的发展以及人们对语言现象和各种社会科学、自然现象研究的深入,不断对词典进行修订和完善。纸质词典需要经过作者写稿,编辑校对,出版流程,通常要三到五年才能更新一次。而电子词典的信息也是存储于芯片里,无法自动更新,需要新一款的电子词典面世,又需要不低的成本进行购买,所以电子词典基本被淘汰了。而在线词典是在网络上进行信息发布,知识一更新可以随时更新词典信息,发布及时,成本低廉,在线用户也能免费使用,还能和编辑在网上进行互动。(二)检索便捷多样。在线词典的检索十分方便,只要输入相应的词,就可以获取相应的词条。用户还可以从十多项检索方式里选择自己最习惯的检索入口,进行查询。(三)内容丰富。在线词典不但能检索得出相应词条的发音,同义词,反义词,例句,甚至词源文化信息等。而且这些信息还可以不断添加完善。[8]

因为汉语是世界上使用人数最多的语言,英语则是全球使用最广泛的语言,编制一个英—汉—布依三语的布依语在线词典,基本能保证与其他语言的互译。笔者认为,这种三语在线词典对于濒危布依语的保护非常有现实意义。而在词条的解释中,也可以加入图片,注释甚至视频,来让在线用户对布依语及其文化有更深的体验和认识。有了在线词典和语音语料库,布依语已经实现了数字化转变,剩下的只是需要在网络上加大布依语的影响力,吸引在线用户的关注和使用了。

(三)基于网络三维技术的布依语使用情景创设

网络三维技术的出现最早可追溯到20世纪90年代的虚拟现实建模语言。虚拟现实建模语言支持纹理映射、全景背景、雾、视频、音频、对象运动、和碰撞检测——一切用于建立虚拟世界的所具有的东西。

西方国家在虚拟现实研究上处于领先地位,我国的研究起步较晚。目前网络三维技术在教育科研、仿真校园、虚拟教学与实验等方面应用较广泛,可实现知识传授、培训体验、实践练习于一体的教学,最终实现“寓教于乐”。

布依语的数字化转型,为网络三维技术展现着巨大的发展潜力。我们可以应用网络三维技术提供的软件,设计制作出布依语使用的各种三维虚拟场景,能够使网络用户沉浸在其中,并与场景中的人物进行交互,使得布依语的展示过程更具互动性、趣味性,从而提高布依语的传播效果。比如,我们可以把用户设定为一个去望谟县布依族自治区旅游的游客,然后他/她要在整个过程中需要使用布依语和虚拟的布依族人进行交流,在这个地区完成一系列任务获得相应的晋级,晋级后,会进入到其他场景,继续使用布依语完成各种任务。而这些场景都是虚拟真实的布依族原生态的母语环境和社会文化氛围。这样就弥补了由于城镇化进程而受到破坏的布依语所使用的原生态的社会文化环境。

网络三维技术既可以模拟真实的布依语使用场景,还可以美化再创造各种布依语使用的社会文化环境,使在线用户能实现沉浸式,交互性强,寓教于乐的布依语网络在线自主学习。还能制作一些相关的语言文化在线游戏,使用户在玩在线游戏的过程中进行布依语的隐性学习,体验独特的布依文化。

网络三维技术可以有效促进和实现布依语的网络自主在线学习,网络自主在线学习是信息时代一种重要的学习形式,是网络用户实现继续教育和终身教育的有效途径。布依语的数字化应该首先要推进布依语网络自主在线学习的实现。这样能使布依语产生持续的生命力,只要有网络的存在,就能实现随时随地的自主学习,学习资源不断更新和扩充,布依语就以数字化的形式得到了长久的保存。

因为网络三维技术可以模拟真实情境,还可以创设虚拟人物,比如老师、学习同伴等。让学习者真正体验和课堂学习无限接近的学习情境,又可以选择和课堂学习情境截然不同的学习情境,让学习者根据自己的学习习惯和喜好来决定学习场景,达到有效学习布依语的目的。

而且据以往的研究发现,网络自主在线学习有一个严重的缺陷,就是缺乏师生情感交流和人机双向互动,这大大降低了学习者的学习热情和效果。而最新的网络三维技术能够有效的解决这个问题。所以使用网络三维技术来实现布依语网络自主在线学习才是我们现在要探索的方向。[9]

五、结论

在信息技术兴起以及大数据的时代背景下,布依语之所以仍然面临濒危的困境,除了以前造成布依语濒危的因素继续存在以外,还有一个更为重要的原因是布依语及其所承载的文化,没有以适应大数据时代发展的技术形式进行保护和传承。笔者相信,以上3种布依语的数字化形式的思考,如果能够得到进一步的深入调查和研究,展开实践,应用于现实,一定能有效地阻止和逆转布依语消亡的过程。而这需要相关学科领域的研究人员能共同合作研究,才能取得良好的效果。

[1]龙海燕.贵阳市郊布依族语言使用情况及保护对策——兼论濒危语言保护问题[J].贵州民族研究,2013(3):224-226.

[2]朱建平,章贵军,刘晓葳.大数据时代下数据分析理念的辨析[J].统计研究,2014(2):10-19.

[3]胡加圣,陈坚林.外语教育技术学论纲[J].外语电化教学,2013(3):3-9.

[4]陈 桦,李爱军.创建中国英语学习者英语语音库的必要性及构想[J].外语研究,2008(5):50-55.

[5]王成平.信息处理用彝、汉、英三语平行语料库的建设与语料对齐技术研究[J].科技通报,2012(2):131-133.

[6]占升平.布依语语音数据库初探[J].数字兰台,2013(1):33-35.

[7]周毛先,头旦才让,才让加.基于WAMP的藏汉英互译在线词典的设计与实现[J].中文信息学报,2011(4):63-65.

[8]司敬新.在线词典的特点分析[J].中国电化教育,2005(2):84-85.

[9]李勇帆,李里程.论情感计算和Web3D技术支持的网络自主在线学习模式的设计与构建虚拟学习社区中学习者交互因素研究[J].中国电化教育,2011(8):129-133.

[10]王娟,吴永和,段晔,季隽.3D技术教育应用创新透视[J].现代远程教育研究,2015(1):62-71.

[11]周丹妮,贺真真.教师在一对一数字化学习环境中的教学能力发展的案例研究[D].上海:上海师范大学,2015(4):1.

[责任编辑:袁向芬]

A Contrastive Study of English and Buyi Language Informatization Based on Big Data

HUANG Qiong1, CHEN Yi-ping2

(1.School of Foreign Languages, Guizhou Education University, Guiyang, Guizhou, 550018; 2.School of Foreign Languages, Chongqing University, Chongqing, 400000)

Under the background of the establishment of big data in Guizhou and the fast development of information technology, combined with previous researches which used to protect Buyi language and other national languages and compared with English digitalization,this study probes the available digitalization forms of Buyi language based on information technology:the build-up of copra, the development of online dictionary, the utilization of Web3D, the author hopes that this study can be a reference to the utilization of information technology in Buyi language protection.

Big Data; Buyi Language; Information Technology; Digitalization

2016-09-23

1.黄 琼(1986-),女,湖南冷水江人,贵州师范学院外国语学院教师,研究方向:现代教育技术。2.陈毅萍(1967-),女,重庆人,重庆大学外国语学院副教授,研究方向:现代教育技术。

H268

A

1674-7798(2016)11-0086-05

猜你喜欢

布依族词典语料库
关于布依族舞蹈的传承与发展论述
贵州布依族民歌中女性意识的觉醒——以黔西南布依族《十二部古歌》为例
《语料库翻译文体学》评介
米兰·昆德拉的A-Z词典(节选)
米沃什词典
词典引发的政治辩论由来已久 精读
布依族古村落平寨
基于COCA语料库的近义词辨析 ——以choose和select为例
基于JAVAEE的维吾尔中介语语料库开发与实现
基于GIS的黔西南布依族自治州生态旅游规划