APP下载

论语言智能教育

2023-08-01周建设薛嗣媛

语言战略研究 2023年4期
关键词:技术应用

周建设 薛嗣媛

提 要 语言智能教育是数智时代出现的新事物,涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。语言智能学科是基于语言理论的交叉学科,主要涉及脑语智能和计算智能两大主体内容。基于基础理论研究、数据资源建设、关键技术研发和应用系统创新四大主要方向,形成语言智能教育新模式。智能语音、机器翻译、知识图谱、智能内容生成、主题聚合度计算、情感计算、人文基因计算、写作智能评测等语言智能关键技术,是实现语言智能工程的基础。由教学资源建设、智能教学设计、智能读写训练、语言能力评估组成的“四位一体”的语言智能教学平台是语言智能在赋能全社会教育中的应用实践。

关键词 数智时代;语言智能;智能教育;语言智能教育;技术应用

中图分类号 H002 文献标识码 A 文章编号 2096-1014(2023)04-0030-14

DOI 10.19689/j.cnki.cn10-1361/h.20230403

On the Language Intelligence Education

Zhou Jianshe and Xue Siyuan

Abstract Language intelligence education has received much attention in the past decades. Emerging in the era of digital intelligence, language intelligence education includes three layers of meaning: theoretical education with the language intelligence discipline as the object, technical education with language intelligence engineering as the object, and application education with language intelligence services as the object. The language intelligence discipline is an interdisciplinary discipline based on theories of language, mainly involving language-brain intelligence and computational intelligence. Based on basic theory research, data resource construction, key technology development, and application system innovation, a new model of language intelligence education is formed. Key language intelligence technologies such as intelligent speech, machine translation, knowledge mapping, intelligent content generation, topic aggregation degree calculation, emotion calculation, humanistic gene calculation, and writing intelligence evaluation are the basis for realizing language intelligence engineering. The “four-in-one” language intelligence teaching platform, consisting of teaching resources construction, intelligent teaching design, intelligent reading and writing training, language proficiency assessment, is an example of the integration of theory and technology with targeted applications for different age groups, and demonstrates the role of language intelligence in empowering education for the whole society.

Keywords digital intelligence era; language intelligence; intelligence education; language intelligence education; technology application

人工智能技術迅猛发展,驱动着社会快速步入数智时代。为适应数智时代发展需求,认识和掌握人类智性工具,发挥智性工具服务作用,具有重要意义。语言智能是智性工具的典型代表。以ChatGPT为标志的语言智能的问世掀起了智性工具革命浪潮。这场工具革命将逐渐改变与语言交互密切相关的业务、岗位、行业,调整岗位结构和人力物力资源配置,最终引发行业生态变革。语言智能在大规模语料和强大算力的支持下,将助推人类快速回答和解决知识性问题,整体提升人类知识层级,促使人类基于友好知识的智力发展和创造力提升。

要充分发挥语言智能的强大作用,亟待发展语言智能教育,培养和提升人们的语言智能素养。本文拟就语言智能教育的学科定位、关键技术和应用实践做些探讨,为教育数字化转型,促进教育高质量发展提供参考。

一、语言智能、智能教育与语言智能教育

语言智能教育是数智时代出现的新事物,也是语言学、人工智能和教育领域出现的新术语。本节拟结合语言智能和智能教育这两个概念来阐释语言智能教育的内涵。

(一)语言智能

语言智能是研究人類语言与机器语言之间同构关系的科学(周建设,等2017)。语言智能是以人类语言活动元素、活动机制、表现形式为模仿对象,生成、传递、理解、翻译、评测语言的信息处理科学。在计算机科学与人工智能领域,研究者将“语言智能”概念理解为以机器智能为主的自然语言处理技术。黄河燕等(2020)认为,语言智能主要体现为自然语言处理,是利用计算机等工具分析和生成自然语言,使得计算机“理解”和“运用”自然语言,可以让人类通过自然语言的形式与计算机系统进行智能交互。实际上,语言智能和自然语言处理有一定区别,语言智能不能单纯理解为自然语言处理技术。两者在语言符号处理层面基本相同,其不同在于语言智能对于“脑语智能”的深入探索。周建设等(2017)认为,虽然语言智能同样需要处理语言符号,但它的符号计算必须完全基于人脑自然语言的语义和情感表达机制,否则,机器语言就会变成机械语言,而不是类人语言。

语言智能研究面临历史性发展机遇。作为人工智能范畴的一门科学,语言智能研究范式经历了从理性主义到经验主义的转变。在大数据、大算法、大算力的支持下,大规模预训练语言模型(pre-trained language model)通过使用海量文本数据对神经网络进行预训练,使得模型获得更精确的语言知识表征,并通过“微调”范式广泛应用于各种任务。对于此类研究范式,有人认为,以ChatGPT为代表的大规模预训练语言模型可突破制约人工智能发展的瓶颈,逐渐从“弱人工智能阶段”向“强人工智能阶段”过渡。但也有人认为,以数据驱动为主的研究范式依旧存在数据依赖性强、模型不可解释等问题,绕开了人工智能研究的本质问题,即人类利用语言作为媒介对世界知识进行认知的问题。认知能力就是话语人对反映对象进行观察、理解、分析的能力。因此,未来语言智能发展的范式应该具有“小数据执行大任务”的能力,模型包含具身认知能力,即自主实现感知、认知、推理、学习和执行的能力(朱松纯2018)。如果在此问题上能够实现突破,跟它同属认知智能的知识和推理就会得到长足的发展,进而推动人工智能各领域走向融合。正因如此,研究语言智能需要集聚多学科力量协同攻关,构建开放协同的科技创新体系。

(二)智能教育

数智时代,人类思维方式由工业思维转向数字思维。数字空间和语言智能技术将是未来教育的决定性因素,引发教育形态的根本性跃升。教育数字化转型背景下,数字教育、智能教育、智慧教育等成了学术界频繁热议的概念,容易将三者混淆或对等使用。其实,三者侧重点不同,详见表1。

数字教育,微观上指利用数字技术(例如计算机、网络、移动设备等)改善教育教学的全过程,宏观上指教育支撑系统重塑,构建创新性教育生态(杨宗凯2022)。数字教育是教育数字化转型中的具体实践,是实现数字化转型全局性过程中的手段和途径。

智能教育是指将人工智能技术融入教育核心业务与场景,促进关键流程自动化、关键场景智能化,以提升教育的质量,最后实现大规模的独特化教育及精确性服务,帮助教师提升教学效率(吴永和,等2017)。周建设(2019)在首届中国智能教育大会上提出,智能教育是人工智能与教育的深度融合,是基于大数据,利用人工智能技术,精准计算学生的知识基础、学科倾向、思维类型、兴趣偏好、能力潜质,结合认知规律和教育规律,合理配置教育教学内容,科学实施因材施教,促进学生个性化发展和核心素养的全面提升。利用智能技术赋能人类教育,促进教育转型升级,这也是语言智能教育的重点目标。

智慧教育是依托物联网、云计算、无线通信等新一代信息技术的教育信息生态系统(杨现民2014)。祝智庭、贺斌(2012)认为智慧教育是“通过构建技术融合的生态化学习环境,通过培植人机协同的数据智慧、教学智慧与文化智慧,本着‘精准、个性、优化、协同、思维、创造的原则,让教师能够施展高成效的教学方法,让学习者能够获得适宜的个性化学习服务和美好的发展体验,从而培养具有良好的人格品性、较强的行动能力、较好的思维品质、较深的创造潜能的人才”。智慧教育作为数字时代教育新形态,核心要义是创建全面启迪人的教育,实现创新性人才培养。智能教育和智慧教育都是数字教育的新形态,但智慧教育更强调基于新一代信息技术的生态化学习环境,利用数据智慧、教学智慧和文化智慧促进教育的全面升级和人才培养;而智能教育则更注重人工智能技术在教育领域中的应用,提高教育效率和个性化服务水平。智能教育的创新发展能够更好地为智慧教育的实施提供支撑。

(三)语言智能教育

语言智能教育涉及三方面内容:以语言智能学科为对象的理论教育,以语言智能工程为对象的技术教育,以语言智能服务为对象的应用教育。理论、技术和应用,相辅相成,共同构成了语言智能教育的主体内容。

以语言智能学科为对象的理论教育,核心在“识理”,重点探究语言智能的本质、原理,目标是培养掌握语言智能的基础理论和基本知识。语言智能理论是语言智能的基石,探究语言智能的内在规律为技术开发提供指导,语言智能技术为语言智能应用提供实现手段。以语言智能学科为对象的理论教育不仅可以帮助学生深入理解语言智能的本质和内在规律,同时提高学生跨学科研究的创新能力。

以语言智能工程为对象的技术教育,核心在“聚能”,目标是甄别语言智能技术范畴,认识语言智能技术功能。这些技术包括语音识别、自然语言理解、自然语言生成、机器翻译、情感分析等。针对语言智能技术的技术教育需要在对语言智能理论有深入理解的基础上,具备扎实的数学、计算科学、编程等知识。

以语言智能服务为对象的应用教育,核心在“中用”,目标是通过融合各类智能技术辅助语言学习、语言使用和语言测评,在实际场景中改变传统的语言理解与应用模式,促进高质量的语言教育,实现人机语言交互。这种模式旨在培养学生对语言智能理论的深刻理解,掌握相关语言智能技术以及能够将其灵活应用于实际场景中的能力。

下文拟围绕语言智能学科体系、语言智能技术认知、语言智能融合应用这3个方面内容展开探讨。

二、语言智能教育的学科体系建设

语言智能学科是语言智能教育的纲领,受到业界高度关注。探索和完善语言智能学科体系,有利于提高语言智能教育质量。

(一)语言智能学科建设现状

随着全球数字化进程和智能技术的发展,国外高等教育界已经大范围开设与语言智能相关的课程。卡内基梅隆大学开设“语言技術”,约翰斯·霍普金斯大学开设“语言与语音处理”,耶鲁大学开设“语言、信息和学习”,牛津大学开设“计算语言学”,剑桥大学开设“自然语言和信息处理”,多伦多大学开设“计算语言学”,马里兰大学开设“计算语言和信息处理”,等等。麻省理工学院、斯坦福大学、加利福尼亚大学伯克利分校、宾夕法尼亚大学、华盛顿大学、爱丁堡大学等设有自然语言处理研究小组或实验室。“数字人文”相关研究中心和实验室等在全世界已成立180多个(李雪莲2022)。

当前,中国智能学科已经进入快速增长期。国务院学位委员会、教育部发布《研究生教育学科专业目录(2022年)》,增设“智能科学与技术”为交叉学科门类下的一级学科。截至2023年4月,已有495所高校开设“人工智能”本科专业,248所高校设置“智能科学与技术”本科专业。同年,人工智能是继数字经济(77所)之后新增备案数量第二多的专业(59所)。

为了对接学科前沿和社会需求,培养以文理交叉为特色的创新型人才,国内多所高校在“中国语言文学”“外国语言文学”“教育学”“社会学”等一级学科下设置了语言智能专业,作为“语言学及应用语言学”“智能科学与技术”“教育技术”等二级学科下的研究方向。目前,研究生的语言智能教育普及面高于本科生。北京大学、北京语言大学、北京外国语大学、上海外国语大学、上海交通大学、北京师范大学、西安外国语大学、四川外国语大学、鲁东大学、江苏师范大学、苏州大学等都设置语言智能相关课程。

(二)语言智能学科建设内容

语言智能学科主体内容包括类脑智能/脑语智能理论和计算智能理论两部分内容(周建设,等2017)。脑语智能理论主要研究言语神经元特性、神经回路与大脑功能、神经元运作机理等关涉人脑言语生理的内容,探索人脑语言符号的加工、记忆、联结、情感和言语输出规律,把握神经元运作与障碍治疗、言语运作与障碍康复等智力活动。计算智能理论主要研究符号标注、声纹识别、文字识别、语块叠加、句子生成、篇章生成、语义分析、情感计算、语言理解、机器翻译、语言测评等。李佐文、梁国杰(2022)认为,语言、认知、计算三大要素构成了语言智能交叉学科的有机整体。

语言智能学科建立的目标,是培养系统掌握人文社科专业与信息处理等相关的智能科学基础知识,具有面向计算机信息处理和面向人文社科教学开展科学研究的能力,具备较高人文科学素养、数据科学素养、计算思维能力的跨学科交叉复合型人才(朱松纯2022)。

语言智能教育应当围绕学科主体内容和目标,深刻认识语言智能的研究对象、研究方法和研究内容。

1.研究对象

语言智能学科以语言智能为研究对象,系统研究语言智能的学科内涵、基础理论、关键核心技术及其在不同场景中的创新应用。其研究目标是从认识人类语言与计算机智能语言的本质属性开始,探索自然语言和智能语言的多元形态,从语言的多元表现形态探索人脑意象与语言图像的同构认知模式,从识别脑语同构模式考察词项与句子的组配关系,从识别词句组配模式探索语言生成的运行机制,从语言表达模式探索图像生成模式,从语图转化模式探索文化基因,构成“语言形态→脑语同

构→词句组配→语言生成→语图转化→文化发现”的研究路线,最终实现机器模仿人类智能,理解、应用、分析人类语言,实现人机语言交互。

2.研究方法

语言智能的研究方法包括基于形式模型的语言计算方法、基于认知神经科学的语言实验方法、基于语言数据的机器学习方法等(李佐文,梁国杰2022),突破传统人文学科的定性研究方法,走向跨学科融合的研究范式,为人文社科领域认识、分析和解决问题拓展新思路。目前,语言智能研究的交叉融合范式已经走向实践(张凯,等2022)。如:利用可视化统计分析验证语言学中的特定语言现象(李雪莲2022);利用基于概率论的贝叶斯网络,通过对109种汉藏语系语言的近千个词的词根-语义组合进行谱系建模分析,验证汉藏语系起源假说(Zhang et al. 2019);等等。通过结合不同学科领域的研究方法,语言智能研究能够更全面地理解语言现象和语言智能的本质,从而推动语言智能技术的创新和突破。

3.研究内容

语言智能学科既包含学科基础内容,也包含语言应用中涉及的具体问题。基础理论研究、数据资源建设、关键技术研发和应用系统创新,是语言智能发展的4个主要方向。基于四大方向,形成语言智能教育新模式(图1)。

(1)基础理论研究

脑语智能理论,主要探索人类大脑如何处理语言信息,旨在深入理解人类语言能力的本质与机制,为语言智能技术和应用提供理论支持。主要关注以下两个方面:其一,语言与脑,分析人类大脑如何处理语音、词汇、语法等语言信息,探究语言在人脑中的表征方式、加工过程以及相应的神经基础;其二,语言与认知,研究语言与其他认知过程的关系,如注意力、记忆、决策等,揭示人类在语言处理方面的认知加工机制,语言能力的发展变化,如语言习得、语言失调、语言障碍等。围绕脑语智能理论体系,可设置人类语言学、神经语言学、句法语义学、认知语言学、心理语言学、语言与脑科学、语言病理学等课程或教育内容。

计算智能理论,主要研究如何将自然语言转化为计算机能够处理的形式语言,并利用计算机技术来模拟人类语言的生成、传递和理解。形式语言是语言智能教育的一个重要概念,它是一种抽象符号系统,包括一组符号和一组规则。语言智能计算重点是研究词汇、句法、语义、篇章等多个层次的语言知识表征,继而将其形式化、数字化。围绕计算智能理论体系,可设置形式与自动机、计算语言学、计量语言学、数理语言学、计算语法学、机器翻译理论、认知智能、不确定性人工智能等课程或教育内容。

(2)数据资源建设

语言数据在数字经济时代成为生产要素(李宇明,王春辉2022)。语言信息处理的基础是语言数据库,模型效果极大程度取决于文本知识的训练。GPT等自回归大型语言模型的出现,体现出语言资源建设的关键作用。因此,语言资源构建被视作走向“通用人工智能”的捷径。

ChatGPT通过内部设置的迁移回译能够满足大多数中文对话,但是汉藏语系(中文数据占比0.1%)和阿尔泰语系的交互效果,始终无法超过与英语同属印欧语系的语言(英语、法语、意大利语等占比90%)的交互效果。因此,国内大力投入研发基于中文的大语言模型,如百度的文心一言,复旦的MOSS,清华的ChatGLM,阿里的通义千问等,但这些模型目前尚未达到与国外同类产品相同的水平。这反映出中国互联网可用于训练的优质中文数据获取量严重不足,究其原因,实则是语言数据建设不到位,优质语言数据分散、封闭。围绕语言智能数据资源建设可设置语言资源学、语料库语言学、数据结构理论、语言数据分析、文本数据挖掘等课程或教育内容。

(3)关键技术研发

语言智能技术,主要指词汇、句法、篇章、语义、语用层面的知识表征技术、自然语言理解技术、自然语言生成技术、跨模态语言理解技术、预训练语言模型技术、提示工程等。将理论与算法融合,衍生的语言智能技术涉及人类语言与计算机智能语言的本质属性及其多元形态计算、多源成像理论与技术、人脑意象与语言图像的同构认知模式识别与计算、词项元素与句法组配的认知模式识别与计算、智能计算可解释性研究等关键技术。围绕语言智能关键技术可设置自然语言处理、语音识别技术、语言分析技术、知识图谱与知识工程、语图-图语生成技术、人文基因智能计算、篇章测评技术等课程或教育内容。

(4)应用系统创新

语言智能应用是将理论与技术融合起来,开发为语言智能工具,用于语言的技术处理,为全场景、全学科、多主体、个性化的语言活动提供智能化指导性服务。其场景包括语音学习的智能辅助、文字书写的智能纠偏、阅读理解的智能指导、语篇生成的智能导写、诗词文章的智能测评等。语言数据分析工具的应用有助于采集、整理、加工、处理、检索语言数据资源,同时也能提高语言研究的效率。语言智能产品应用,其核心是广大人类用户,因此最具市场潜力和社会意义。语言智能应用表面看来与语言智能教育无关,但这种应用是语言智能教育设计的用户导向。例如,多语机器翻译系统、舆情检测系统、对话机器人、智慧语言康复系统等产品走向市场,其满意度、用户反馈等信息,均可作为语言智能教育发扬优势、改进不足的依据。语言智能产品的社会服务可致力于解决各种语言现实需要,实现语言智能在生产生活中的重要价值。围绕语言智能应用可设置语言智能应用系统设计与创新、语言数据分析和处理、语言智能产品设计与开发、语言智能用户与市场应用等课程或教育内容。

三、语言智能教育的关键技术认知

认识以下几类语言智能关键技术,熟悉其技术原理、模型、功能、作用以及使用方法,是语言智能教育的必修课。

(一)智能语音

语音识别是一种通过计算机算法自动对发音进行评价和检错并反馈的技术(于晓明2019),其中涉及语音合成、声纹识别、语种识别、语音增强等关键技术,是计算机辅助语言学习的重要技术之一。语音评测是智能语音技术在语言智能教育领域的常见应用场景之一,包含朗读评测和口头表达评测两项关键任务。前者基于评测文本和音频的时间对齐,即音频切分技术,考察学习者发音错误和质量;后者直接通过音频评价学习者的口语表达能力,通常先将语音转化成文本,然后基于文本内容提取发音声纹和语义内容,实现口语表达能力水平评估。随着深度学习的发展,神经网络模型可深入表征原始数据性质,强化语音系统性能,促进语音处理技术达到高质量实用水平。

(二)机器翻译

机器翻译是将一种自然语言(源语言)转变成另一种自然语言(目标语言)的智能技术。神经网络机器翻译模型极大提高了翻译准确度,实现了百种以上语言动态互译、多模态语料即时翻译、难译词汇翻译等功能,不断逼近人工翻译水平。目前谷歌翻译等工具已成为有效的教学工具,广泛应用于语言学习(Bin Dahmash 2020)。研究表明,使用智能在线翻译辅助写作训练可获得更好的写作分数(Cancino & Panes 2021)。多语机器翻译技术能够提高跨语种交流的效率,推广至民族地区,可有效缓解当地多语师资力量短缺、语言教学资源匮乏等问题,克服语言交流障碍,促进文化交流互鉴。

(三)知识图谱

知识图谱是以结构化的形式描述客观世界中的概念、实体及其关系的大型知识网络,能将信息表达成更接近人类认知的形式。学科知识图谱将课程知识点以语义关联的方式进行逻辑链接,通过知识资源获取、知识模块和知识点划分、知识融合、知识质量评价等流程,构建学科知识体系。学科知识图谱可在课程教学中发挥重要作用,能够实现知识点查询、知识关联查询、知识自动问答、知识资源推荐、个性化学习路径推荐以及学习興趣迁移等功能,为教师、学生、教育管理者提供多样的教学服务。

(四)智能内容生成

智能内容生成(AIGC)是指通过语言模型实现内容的自动化生成。ChatGPT经过1750亿级别的参数训练后可以理解自然语言中的复杂结构,并结合对用户偏好、意图的理解,根据用户的历史对话,实现多轮次个性化交互;其中内嵌的人类反馈强化学习机制,能够通过不断与人对话实现动态语言纠错、事实校正,不断增强人机交互的准确率、稳定性。ChatGPT在教育场景下可优化教学工具,提升教学效率,具体表现为以下3点。第一,ChatGPT人机对话检索方式可逐渐替代搜索引擎浏览、筛选、查找等烦琐步骤,以对话的形式快速实现信息准确获取,变革学生的知识获取方式。第二,ChatGPT的生成功能可成为教师助理角色,辅助教师自动化生成教案、试题、问题解答、评语、个性化学习分析报告等。第三,ChatGPT与虚拟现实结合可创新教学方式,如作为虚拟伙伴进行语言练习,合成不同学科的数字教师,量身定做学习计划并进行个性化辅导等。当然,ChatGPT还存在事实性错误等技术性局限、学术诚信风险、语言偏见歧视、知识产权确权、数据泄漏风险等各种问题,需要在语言智能发展过程中逐步解决。

(五)主題聚合度计算

主题聚合度是指篇章主题与篇章行文之间语义联系的紧密程度,其评价维度分为篇章级、段落级、句群级、复句级和词语级。主题表现力是评价主题聚合度的重要指标,指语言符号载体与主题表现之间的语义关系,可以体现为千变万化的篇章语义关系网。快速精准判定篇章的主题表现力效果,需要细化篇章类型,发现主题表现规律。

语义判定是语言智能亟待解决的重点和难点。就教师批改作文而言,如果仅仅局限在字词和语句的表层,而没有深层次的认识和评价指导,则不利于帮助指导学生提高写作表达能力。作文智能评测系统,从文章的拼写错误、语法错误的形式检测,不断向高水平测评发展,已经能够检测主语、谓语、宾语核心成分以及诸多语义聚类的主题表现力,这是语言智能为教学服务攻克的重大理论和技术难题。

(六)情感计算

情感计算旨在创建一种能感知、识别和理解人的情感,并能针对人的情感做出智慧、灵敏、自然反应的计算系统,是实现自然化、拟人化、人格化人机交互的基础性技术和重要前提。目前情感计算以智能导师系统形式应用于学校舆情监督、心理观察、学习效应监测等方面。智能导师系统利用多模态数据采集等方法,捕捉教学环境下的互动信息,实时分析和干预学生不良情绪,判断学习者对当前学习内容理解、自我效能、技术接受、教学偏好、注意力发展等情况,为教育管理者及时调整教学活动提供重要参考依据。

情感计算在自然语言处理领域研究的历史不短,但至今仍然多停留在统计式计算判定阶段。未来,情感计算将借助人文基因计算技术,深化其针对性、全面性和准确性。

(七)人文基因计算

人文基因是精神文化意识要素的统称。作为社会生命体的人,既有生命基因又有人文基因。生命基因自身的变化导致其外部条件随之变化,外部条件变化反过来促使生命基因自身变化。同理,人文基因自身的变化导致其外部条件随之变化,外部条件变化反过来也促使人文基因自身变化。调节生命基因,可以改变生命质量甚至生命形态;同样,调节人文基因,可以改变精神质量,甚至意识形态(周建设2022)。

生命基因是天性,人文基因是习性。天性,是自然性,基于物质,因此,生命基因检测的对象是生命基因物质载体核苷酸。习性,是社会性,基于习得。因此,人文基因检测的对象是人文基因习得载体语言文字。习近平总书记多次强调传承中华民族优秀文化基因。新时代的语言文字事业,建设大规模人文基因语言文字资源库,深入研发人文基因智能计算技术,对精准培育强国基因、铸牢中华民族共同体意识无疑具有重大意义。熟悉计算人文基因计算技术,建设大规模人文基因语言文字资源库,分类标注人文基因“成色”度(周建设2022),是语言智能教育的核心内容之一。

(八)写作智能评测

写作智能评测系统是一种重要的语言智能应用程序,也称自动作文批改。其基本思路是通过各种自然语言处理技术,从待评测文章中提取文本特征,让机器对文本特征与分数之间的关系进行学习,实现判定文章、指导写作、提高文章质量的目的。传统的智能评测采用回归、分类、排序的方式实现写作评分。随着深度学习等技术的发展,基于循环神经网络、预训练语言模型、多模态深度学习等技术的评分方法逐渐发展成主流方法,已经成熟应用于各类大型英语语言测试中(薛嗣媛,等2023)。

国家语委中国语言智能研究中心联合高新技术企业研发的写作智能评测系统,可以做到在不同时间地点、不同计算机环境里对同一篇作文的评价结果完全相同,在一定程度上消除评分者之间主观评价偏差的问题(Burstein et al. 2003),实现了作文评价的实时性、客观性、科学性。写作智能评测技术可以为教师评价写作内容提供参考借鉴,降低人工成本,减轻工作负担。对学生而言,该技术能提供即时评阅反馈,更具有公平性、启发性与激励性。

四、语言智能教育的教学应用实践

当下,人才培养创新性不足、教育资源发展不均、教育质量参差不齐、终身教育体系缺失等,是教育发展的痛点。因此,教育高质量发展对语言智能技术提出新的时代要求,即“利用智能技术推动人才培养模式、教学方法改革,构建包含智能学习、交互式学习的新型教育体系”。语言智能在一定程度上优化了教育模式,从本质上变革了以特定知识和技能传授为目的的传统教学范式,更加追求批判、创造、审美、沟通、合作等核心能力的培养。语言智能赋能教育,将语言智能理论技术融合为应用,聚焦核心能力培养,构建语言智能教学平台(图2),为学习者提供个性化学习支持,形成高素质人才培养的良性互动的教育生态。

图2 语言智能教学平台

(一)语言智能教学平台建设

人工智能支持的教育是指以智能为辅助工具的教学行为,这些智能设备帮助人们实现人与人、人与知识、人与环境进行交互的社会功能(何冰艳,刘玉梅2019)。语言智能理论与技术的融合应用创新了语言智能技术赋能教育的应用模式。语言智能教学平台可以作为智能技术辅助语言学习的最新形式,为全社会语言教育提供个性化学习体验,主要体现在以下4个应用场景。

1.教学资源建设

语言智能技术赋能教学辅导需要以大规模教育资源为基础,包含语言知识资源建设和教学数据资源建设。语言知识资源建设旨在整合和加工已有资源,为使用者提供更符合其需求的多媒体、全媒体、融媒体语言教育资源。如纸质资料包含教材、教辅书、教学素材、练习册等,多媒体资源包含视频材料(直播课、在线课程)、音频材料、图片材料等,融媒体资源包含电子辞书、电子百科全书等领域性知识资源等。利用语言数据处理技术将上述语言资源内的知识和概念结构化,连接不同的知识元素和关系,可构建语言教育知识图谱。作为可视化的语言教学知识体系,语言教育知识图谱体现语法、词汇、语用、语音、文化等多个方面的关系和语言规律,帮助学习者更好地理解语言知识之间的联系和衍生,提升资源查询效率,扩大资料共享范围,进而提升使用者学习工作效率。

教学数据资源建设涉及收集、整理、存储和管理与教学相关的数据资源,这些数据体现在课前、课中、课后的教学环节中。学生数据包括基本信息、学习成绩数据(考试成绩、作业成绩、小组项目成绩)、活动参与数据(提出或回答问题、参与小组讨论)、学习进度数据(课堂时间、独立学习时间、作业完成时间)、学习行为数据(学习策略、注意力集中程度、信息处理和解决问题的方式)、资源使用数据(教材、教学视频、学习应用程序等的使用时间、使用倾向)等。教学数据资源管理对于教学辅导的有效性和个性化指导至关重要。教师可以通过分析和解读这些数据更好地了解学生的学习情况和需求,并将之作为评估教学效果和改进教学策略的参考性资料。

2.智能教学设计

智能教学设计场景是系统通过深入分析学习数据自动设置个性化教学活动。从学生学习层面来说,教育信息化深入教学场景,通过数据挖掘等语言信息处理技术分析学生学习行为、学习成绩、学习偏好等,深入了解学生的学习情况和需求,发现学生的学习模式、弱势领域和潜在需求,从而为个性化教学活动设计提供依据。从教学全过程来看,“备课、教学、训练、管理、评价、考试”等学习数據和互动数据都可以得到完好记录,为教师实施精准教学提供科学依据。在智能技术加持下,智能技术赋能教学评价精准干预,根据学习者的能力差异和知识偏好,自适应推荐符合其学习发展的优质教学资源,实现“以学定教-因材施教-以评促教”的新型教育模式。从教研效能来说,语言智能教学平台打破了时空边界,构建线上线下一体化研修环境,实现教研资源、教学课程共享,提升教师教研效率和服务能力。

3.智能读写训练

阅读是智慧采集,写作是思维体操,文章是素养镜像,智能是能力裁判。读写训练场景以学习者练习为基础,以人机交互形式,制订个性化读写训练方案,充分利用语言智能优势,计算阅读基础,推荐阅读资源,强化写作训练,提升语言能力。

阅读是借助语言符号、图像等媒介认知世界的重要途径,是丰富语言表达内容的基础性工作(张文彦,张凯2018)。智能技术辅助学生阅读训练可有效提高阅读效率。阅读资源建设和阅读能力评价是智能化阅读的基础性工作。阅读资源建设需要依据专家经验,科学凝练学科核心“规律”,构建分类细致、深广结合的阅读知识结构体系,制定符合教学年限、学生成长规律的可量化、可计算、可操作的能力评价标准,以便精准定位学生阅读能力短板,全面分析学生知识体系和认知水平,实现阅读计划的个性化生成和阅读材料的差异化定制。

智能评测通过计算机技术对作文中词汇选择、句法搭配、修辞手段、篇章主题、逻辑框架、情感表达等写作维度进行评定,依据写作者的不同学龄层级及时给出不同评分标准及修改意见,具有实时性、针对性、启发性与激励性等特征。对于学生而言,智能评测系统提供即时评阅反馈和提升意见,为学生进行有效诊断和针对性练习,可以极大增强学生写作热情,极大程度减轻教师评阅负担。

4.语言能力评估

语言能力是人的阅读力、认知力、思维力、逻辑力、创造力和表达力的综合体现,而写作涉及多层次认知过程,能够有效反映个体的语言能力水平。写作智能测评的任务就是对学生的上述“六力”进行智能评价。阅读力测评主要体现在两个方面:其一,“量”的检测,读过古今中外多少书;其二,“质”的检测,阅读的质量如何。认知力测评重点在思想深度,包括涉身认知的深度和阅读理解认知的深度。思维力测评,是为了了解思维表现的类型以及思维活动元素组织的规律性和习惯性。逻辑力测评,初级层次是检测表达内容结构安排的逻辑性,深层次检测是了解立论深度以及论证的严密性。创造力测评是语言智能测评的重点和难点。重点自不必说,因为创新人才培养本身就是教育工作的重点。难点是因为,创新力由多个复杂因素综合优化构成,难以量化。对语言智能而言,创新性评价具有很强的挑战性。智能的本质是计算,计算既要算力又要算料,创新能力测评就是提取创新算料,设计创新算法,从细微颗粒中发现不同程度的创新因子。表达力测评,既关注语形符号的物理层面的检测,又关注内在语义关联的检测。“六力”测评是语言智能服务教育卓有成效的应用创新。

语言能力评价,还可以借助人文基因计算这一语言智能的核心技术,对语言符号承载的意识形态进行智能评价。依据意识构成元素,人文基因评价维度包含两方面:其一,基于世界观、人生观、价值观的评价;其二,基于思想倾向、国家意识、行为举措的评价。语言文字是文化载体,语言精神反映民族精神。通过语言文字载体计算人文基因,从既有的语言文字数据中分析发现意识元素,精准构建学生素养画像,客观诊断语言能力,科学定位素养水平,进而科学实施优秀文化教育,培育优秀人文基因,帮助树立正确的历史观、民族观、国家观、文化观,更好地传承弘扬中华优秀文化,为铸牢中华民族共同体意识贡献力量。

综上,由教学资源建设场景、智能教学设计场景、智能读写训练场景、语言能力评估场景组成的“四位一体”的语言智能教学平台对教育数字化转型具有积极作用。这4个场景相互协同,变革课堂教学模式,转变教师角色,促进教学资源共享,为学生提供了多元知识获取途径、开放式学习交互服务。

(二)语言智能教学平台的应用场景

利用智能技术辅助语言教学是语言智能教育的重点目标,语言智能教学平台融合各类先进技术手段,可以为广大学习者提供丰富、高效、灵活的语言学习体验。下文通过该平台面向不同年龄段对象的针对性教学,阐释语言智能在赋能全社会教育中所起的作用。

对于学龄前儿童,幼儿期是语言能力学习的重要阶段。平台可以搭配线上互动学习系统,以多模态趣味交互为主,训练测试为辅,刺激儿童多元感官,启发多元认知能力,建立对语言的基础认识。平台提供不同语种、主题、难度的阅读绘本资料,依据儿童兴趣智能推荐合适的阅读材料和交互形式。其中,智能语音等功能为儿童提供更多高质量精读和重现的机会,帮助儿童的语言学习、发音纠正和词汇扩展等。同时,各类学习内容可结合虚拟现实或增强现实等技术,以教育互动游戏等形式体现,探索互动数字化角色,激发儿童语言学习动力,促进儿童注意力、观察力、理解力等基础能力的发展。

在基础教育阶段,语文教育是个体素质成长的主要来源。落实“立德树人”的根本任务,充分发挥学科育人的基本功能,全面提升学生的核心素养,是信息化时代教育高质量发展的重要使命。语言智能技术可以改变语言课堂教学模式。智能读写训练和智能辅助写作工具能够检查语法错误、提供修改建议、改善句子结构等,帮助学生提高写作的准确性和表达能力;智能阅读技术能够个性化推荐阅读理解练习和资料,优化语言学习路径,以满足不同学生的需求;人文基因技术可以根据学生的语言文字输出,诊断其语言能力,科学定位其语言文化水平,进而科学实施优秀的文化教育,助其树立正确健康的三观。

在高等教育阶段,平台专注于提供更专业的语言学习服务。如为学生提供全面的学术论文写作指导,帮助他们快速掌握学术写作的规范和技巧,涵盖论文结构、逻辑推理和引用规范等关键要素,以满足学生在学术研究方面的需求。此外,平台还提供丰富的文献阅读资源,包括学术论文和相关专业著作,旨在提高学生对学科知识的理解和应用能力,进而提升他们的学术写作能力。

在职业教育领域,平台可以根据不同职业的需求,提供相关的语言技能培训和实践训练,帮助学习者掌握与其职业相关的语言表达和沟通技巧,例如商务信函、金融报告、法律文书、财务报告等。职业学习者可以借助平台灵活地学习和提升与自身职业相关的语言技能,以增强职场竞争力,更好地适应工作需求。

对于老年语言训练者,平台设计考虑老年群体使用智能化设备的困难,积极进行适老化改进,采用简洁明了的界面,易于操作使用。平台整合各类资源,引导老年人进行口语交际、学习互动、阅读写作等多类型语言活动,维持或改善老年人语言认知水平。利用语言智能技术手段可以实现对老年人疾病的早期筛查和干预。老年疾病的早期临床标志物大多体现在语言层面。通过多模态技术识别老年人语言表达中由生理性和病理性衰老导致的疾病语言临床标志物,可以及时了解和干预老年人语言、心理、生理等疾病,缓解老年人语言能力退化,帮助特殊老年群体语言康复。平台也可在一定程度上缓解因社会角色变化形成的语言交际问题,构建多维度、精细化的适老语言信息沟通服务,如搭载线上语言交流等社群服务,促进老年人语言交流,丰富老龄社会的语言服务。

通过语言智能教育平台,人们可以随时随地利用智能设备获得专业的资源支持以及个性化的学习服务。语言智能应用的融合发展为社会各类群体的提供了便利和机会,促进了语言教育的普及和发展。

2022年11月,ChatGPT开放公众测试,成为人类科技史上的一个里程碑。语言智能已经快速渗透到社会生活的各个方面。在人机协同、跨界融合、共建共享的数智时代,在国家政策引导下强化语言智能教育,与时俱进推进语言资源建设,完善语言智能学科体系,掌握语言智能技术,加强语言智能应用,培养具备丰富语言智能素养人才,是教育数字化转型,教育高质量发展的时代责任。

参考文献

何冰艳,刘玉梅 2019 《智能语言学习的认知基础及对SLA的新启示》,《外语电化教学》第1期。

黄河燕,史树敏,等 2020 《人工智能:语言智能处理》,北京:电子工业出版社。

李雪莲 2022 《数字人文推进外语学科建设》,《中国社会科学报》11月8日第2525期。

李宇明,王春辉 2022 《主持人语 从数据到语言数据》,《语言战略研究》第4期。

李佐文,梁国杰 2022 《语言智能学科的内涵与建设路径》,《外语电化教学》第5期。

吴永和,刘博文,马晓玲 2017 《构筑“人工智能+教育”的生态系统》,《远程教育杂志》第5期。

薛嗣媛,周建设,任福继 2023 《写作智能评测的研究综述和发展前景》,《中文信息学报》第2期。

杨现民 2014 《信息时代智慧教育的内涵与特征》,《中国电化教育》第1期。

杨宗凯 2022 《数字教育的内涵、发展目标与路径》,http://theory.people.com.cn/n1/2023/0314/c40531-32643894.html。

于晓明 2019 《语音识别技术的发展及应用》,《计算机时代》第11期。

张 凯,薛嗣媛,周建设 2022 《语言智能技术发展与语言数据治理技术模式构建》,《语言战略研究》第4期。

张文彦,张 凯 2018 《中文智能阅读的困境与突破》,《语言战略研究》第4期。

周建设 2019 《语言智能,在未来教育中扮演什么角色》,《光明日报》3月2日第12版。

周建设 2022 《人文基因智能计算将成为语言文字资源建设的新途径》,《语言战略研究》第5期。

周建设,吕学强,史金生,等 2017 《语言智能研究渐成热点》,《中国社会科学报》2月7日第1141期。

朱松纯 2018 《浅谈人工智能:现状、任务、构架与统一》,《系统与控制纵横》第1期。

朱松纯 2022 《智能学科的源起、演进与趋势——北京大学智能学科的探索与实践》,《大学与学科》第4期。

祝智庭,贺 斌 2012 《智慧教育:教育信息化的新境界》,《电化教育研究》第12期。

Bin Dahmash, N. 2020. “I cant live without Google Translate”: A close look at the use of Google Translate App by second language learners in Saudi Arabia. Arab World English Journal 11(3), 226–240.

Burstein, J., J. Tetreault & N. Madnani. 2003. The e-rater scoring engine: Automated essay scoring with natural language processing. In M. D. Shermis & J. Burstein (Eds.), Handbook of Automated Essay Evaluation, 77–89. New York: Routledge.

Cancino, M. & J. Panes. 2021. The impact of Google Translate on L2 writing quality measures: Evidence from Chilean EFL high school learners. System 98, 102464.

Zhang, M., S. Yan, W. Pan, et al. 2019. Phylogenetic evidence for Sino-Tibetan origin in northern China in the Late Neolithic. Nature 569, 112–115.

責任编辑:韩 畅

猜你喜欢

技术应用
新媒体技术在广电行业的应用研究
高压喷射灌浆施工技术在水利水电工程施工中的应用
物联网技术在智能车辆管理中的应用探究
痕迹检验技术在交通事故处理中的应用
数据库技术在云计算背景下的应用
建筑节能技术的发展与应用
痕迹检验技术在刑事侦查工作中的应用探析
办公自动化中计算机信息处理技术的应用
低碳环保技术在环境治理中的应用分析及阐述
基于高职院校物联网技术应用人才培养的思考分析