APP下载

如何认识和理解语言大数据及其应用

2019-12-10张滋暄

中国科技纵横 2019年20期
关键词:应用发展

张滋暄

摘 要:在信息飞速发展的今天,我们引入了大数据这个广义的概念,那么对于我的专业,语言大数据,可谓更是全新的一个名词。在大数据的影响下,语言这门学问的学习和传播方式已经在潜移默化的发生改变。语言学习者对于语言的认知会影响学习者的学习的效果,大数据的飞速发展给语言学习者提供了更加快捷与系统的方式,丰富了语言信息获得的方式,提高了语言学习者的学习效率和自我学习能力。

关键词:语言大数据;发展;应用

中图分类号:H08 文献标识码:A 文章编号:1671-2064(2019)20-0194-02

0 引言

本文试图通过论述回答两个问题:一是何为语言大数据,即语言大数据应该如何理解;二是如何运用语言大数据,即对语言大数据的研究和发展有何重要意义。这两个问题同时是本专业未来发展中进一步探索的两个关键问题。在此,我通过两年学习中得到的一些见解分享,还望予以雅正。

大数据正在以前所未有的广度和深度影响着这个时代,诸多大数据分析的系统使我们的生活变得更加便利。语言是人类最为重要的交流思想、传递信息的工具,是人类生活中不可缺少的重要组成部分。大数据思维和实践在语言研究及学习领域的应用,有利于人类更进一步地打开语言宝库,从而帮助人类更好地生活。

1 语言大数据概念的理解

本部分阐述何为语言大数据,如何理解这个概念。后文中通过麻省理工学院的一项研究的研究方式引入本文对于语言大数据的前身的理解,随后说明语言学在大数据时代之下的新型的观念,进一步阐释语言大数据的定义。

自工业革命以来,人类逐渐由传统的工业时代朝着信息化时代转变。信息变得越来越广泛,几乎所有的事情都涉及各方面的信息,这使得人们迫切的需要利用工具来减轻负担。而计算机的出现和使用大大的减轻了人们的负担,其可以帮助人类处理一些基本信息,例如翻译、数据统计、抽取信息等,使得人们可以集中注意力来做一件事情,在此背景下自然语言和计算语言学应运而生,并发展的十分迅速。2016年初,麻省理工學院(MIT)的大脑与认知科学系在国际顶尖期刊《美国科学院院报》上的一项语言学交叉研究利用已经公开发表的依存树库,对37种语言进行了统计分析指出人类语言存在依存距离最小化这一倾向。此研究虽然存在一定缺陷,但却依旧受到媒体的广泛关注,而这一研究也充分体现了大数据研究方法在语言认知研究中的重要作用。即在语言系统的运作规律的过程中,运用大量的数据来挖掘多种语言中存在的规律。

2 探究语言学研究与大数据思维的关系

本部分通过阐述大数据对语言学研究产生的重要影响,来进一步分析语言大数据这一新兴学科存在和发展的必要意义。信息时代在给当今的语言研究带来挑战的同时,也为实现新的语言研究转变提供了新的契机。首先我们通过一组大数据与语言学相结合的实例说起。

美国Mark Davies教授2013年建立的GloWbE语料库规模19亿词,“Google Books:British English”语言数据高达340亿词,“Google Books:American English”语言数据高达1500亿词。

大数据思维方式与众不同之处在于,其要求探索所得出的是“是什么”,从而能够更好的帮助人们去理解。在信息蓬勃发展的时代,语言研究同样需要转变,转变到寻找语言事实的“是什么”而不是“为什么”,通过了解语言之间的相互关系,能够更好的理解和认知语言研究,不断的开阔我们的眼界,为我们带来新的思路,从而对语言学习产生积极影响。通过数据方法的运用,促使我们产生了一种感知维度,为我们提供了更加清晰、具体的研究方向,从而能够更好的理解和认识。根据所得的各种语言材料,能够使我们展开更加深入的研究,探讨语言的本质特征,数据手段有助于更好地反映语言的真实状态和本质特点。

3 分析语言大数据在语言学以及日常生活中的应用

本部分分为三个层次,通过理论与实例相结合来语言大数据在语言教学中非常广泛的应用,甚至推广到日常的生活中,我们可以发现语言大数据已经进深入到我们的生活为我们提供了很多便利和新的思维生活方式,打破了传统的局限性,获得了更广阔的视野,从而进一步促进语言大数据这一新兴学科的发展[1]-[2]。

3.1 语言大数据在语言学研究中的应用

语言学习者的认知策略会影响学习者的学习效果,大数据技术的发展给英语学习者提供了更加快捷便利准确的方式,丰富了知识的获得方式,提高了语言学习的个性化和自主性。传统的学习语言的过程是学习者坐在教室里通过教师的板书讲课来实现的,这种教学方式下的学习者是被动的。但随着大数据时代的到来和当代教学理念的优化进步,学习者应该主动的接受语言知识,互联网环境下,学习者有相对的自主权,通过大数据提供的海量语言学文库,可以主动的按照各自喜好或者是各自的长处短处进行有针对性的语言学习,这能提高语言学习者的自主学习的能力,并能更好地适应飞速发展的社会。

在语言大数据出现以前,语言学研究存在一个难以解决的困境。大量学者将研究目的定位探寻一定范围内语言事实的原因,但这种研究只能在一定范围内、一定是其解释和说明小部分语言事实,以至于学者们陷入了建立成千上百种语言学理论和模型,也无法综合全部语言建立一套完整的语言学研究体系,甚至无法将所有语言事实解释清楚的困境。这种困境在语言大数据产生后得到了一定的解决。语言大数据深化了语言的研究,加强了对语言的客观化、精细化的描述,使语言研究由随机取样或例子列举转变到尽量分析更多的语言数据。因此,语言大数据背景下的语言学研究能够大范围观察语言事实的相关程度和演化过程,扩展了研究的事业和应用服务范围,避免研究者的认知偏见和语言感知误差,甚至能够预测语言现象或事实发展的趋势,这是传统语言学做不到的。

3.2 语言大数据在语言教学上的应用

在语言教学中,语言大数据从宏观和微观两方面都发挥着重要作用。宏观上,语言大数据能够更好的利用语言,特别是在英语写作的过程中,一般的研究只能够从理论和技术层面出发,而数据的利用则是从更深层次的角度出发,探讨语言数据的背后价值,不断的发展和突破,推动中华文化宣传和发展,促使中华文化在世界范围内广泛流传。在微观上,语言大数据有利于增强教师和学生的信息化融洽意识,更好地促进英语核心素养的提升,使英语学科朝着更加科學化、现代化的方向迈进。在实际应用中,语言大数据背景下的语言教学,可以迅速及时地批改学生的作文,并对学生的英语综合能力进行跟踪指导和改进,有利于学生的自主学习,更能使师生交流更加顺畅。与此同时,大数据分析下的语言教学对尖子生和英语“学困生”这两个群体的特殊学生提供了现实可操作性,使得分类培养和关注会更加方便。

在当今计算机技术高速发展下,大数据预测的准确性越来越高,教师对学生的评价也变得越来越具体,不在局限于主观客,而是从大数据预算的角度出发。例如,在以往的计算中,由于数据量不够具体,同时时间较短、所涉及的范围也比较小,导致所得结论的准确性不高。这使得教师难以作出精准的评价,因而他们只会客观的参考结论,而不能将其作为最后的评价。

3.3 语言大数据在日常生活中的应用

大数据化实际上是一种机器化,因为大数据的力量必须借助于机器才能发挥实现,而日常生活中最接近机器的语言研究,就是机器翻译系统的开发和应用相信大家都用过百度或者有道翻译,也相信会有大部分人对这些翻译机器的翻译能力并不是十分满意。不过,伴随着大数据时代的来临,语言大数据在促进语言发展的同时,也能更好地帮助机器翻译系统产生更大的进步。而抛开机器这一载体的支持,单纯看语言大数据这一基于数据的语言分析对日常生活的影响的话,最为显著的便是语言大数据对出版行业发展的影响。在数字出版的时代,利用大数据技术,借助于多语种情感分析、知识图谱等先进技术捕捉全球热点话题,分析全球出版业IP动态,检测全球图书、作者、出版社的信息,并能预测销售趋势,对于出版行业的选题策划以及营销评价分析等有着重要作用。此外大数据技术的应用,将成为出版业转型升级的重要工具,对出版管理、编务和营销产生深远影响。

4 有关语言大数据的余论

本部分包括有关语言大数据在当今社会所产生的效应和一些相关的余论,它所具备的一些特点和带来的语言研究新观。语言学是一门学科,但是同时也是一门科学。大数据的出现和广泛应用使我们体会到:语言学研究可以实现科学化数据化海量精准化,但前提是采用科学的方法。显然,科学的方法,需要我们付出更多的努力去学习与掌握。从长远来看,对于语言的学科我们所要掌握了解的还有很多,那么仅凭我们的人脑和书本知识是完全不够的,海量的信息需要我们去概括总结,最全面系统的方式就是借助大数据的平台。当然,离着我们预期的所能达到的“语言大数据高度成熟化”还有着很大的一段距离,这需要我们新时代每一个人的努力,共同用大数据与语言学相结合的思维去探索提升。语言的历时研究对探究语言及其结构的演变趋势和机制有着重要的价值;语言的历时研究对各个阶段语料的分布、数量及其分析处理手段有着特定的要求。在计算机技术高速发展下,促使大数据蓬勃发展。语言数据的搜索、获得、储存变得越来越简单、方便。基于大数据基础,促使语言研究探索更加清晰、具体,朝着语言的结构、形态、语音乃至文化等方面发展,为语言研究打下来坚持的基础,从而能够朝着更层次的方向发展[3]。

5 结语

通过本文之前的分析,对于如何认识和理解语言大数据、如何运用语言大数据以及语言大数据所带来的影响,想必我们对这一个新型概念已经有了大致的理解。

综上所述,大数据时代是一个需要每一个语言教育者和学习者不断学习不断完善对世界认知的时代。语言大数据不仅仅是一个简单的将互联网和语言学做加法的概念,而是一个大数据渗入语言学习研究,语言的进步同时可以为大数据注入新的活力的复杂而有发展意义的概念。在大数据视野下,语言学研究将在更大范围和规模上使用语言大数据进行实证研究,由过去寻找语言事实背后的因果关系转向追寻语言事实之间的相关关系。大数据对语言研究具有独特的价值。我坚信,随着互联网技术的飞速发展,我们语言大数据这一学科将会不断地查漏补缺,为时代注入新的生机与活力。

参考文献

[1] 张平,彭海燕.大数据时代的汉语研究应对[J].求索,2015(3):139-142.

[2] 李华勇.大数据视野下的语言研究新观[J].重庆交通大学学报(社会科学版),2015(4):134-137.

[3] 李华勇.论语料库语言学的学科地位[J].重庆理工大学学报(社会科学),2014(7):119-124.

猜你喜欢

应用发展
迈上十四五发展“新跑道”,打好可持续发展的“未来牌”
从HDMI2.1与HDCP2.3出发,思考8K能否成为超高清发展的第二阶段
砥砺奋进 共享发展
改性沥青的应用与发展
多媒体技术在小学语文教学中的应用研究
“会”与“展”引导再制造发展
携手同行 共建共享:怎么看我国发展不平衡