马里:用人工智能振兴本土语言
2024-12-11边新楠
| 人工智能进课堂,马里学生“重学”母语 |
在马里西部萨福镇的教室里,坐着十几名“特别”的学生,他们或曾辍学,或从未踏入过校门。与本国的大部分学生一样,他们都不曾接触过成文的本土语言。然而,他们此刻正满怀热忱地拼读着电脑屏幕上的单词,不仅如此,若是一则故事通篇由最受欢迎的马里方言——班巴拉语写就,他们基本上能做到流畅地朗读全篇。
这其中的转机到底从何而来?
马里曾经是法国的殖民地。近年来,随着两国政治关系的紧张,法语在马里的地位逐渐下降。2023年,马里政府正式取消了法语的“官方”地位。如今,虽然政府机构和公立学校仍在使用法语,但班巴拉语以及其他12种民族语言的地位正在逐渐攀升。
得益于这一政策,利用人工智能创作的本土语言童书顺势而兴。马里智能教育公司便是一个好例子。虽然只是一家初创企业,但自2023年以来,这家公司已经通过人工智能技术创作了140多本班巴拉语图书。塞尼·托格尼是创作团队的一员,同时也是马里教育部的职员,一直协助该公司进行编书工作。据他所说,此前政府曾多次尝试在公立学校推广班巴拉语,但均以失败告终,主要原因在于缺乏必要的资金支持和一套健全的教师培训体系,同时,家长们也并不重视法语以外的语言。不过,随着法语失势、本土语言振兴以及这类人工智能公司的蓬勃发展,马里正掀起一股本土语言的学习热潮。
值得肯定的是,这些由人工智能创作的图书真实地描绘了马里人的日常生活,展现了独特的民族文化魅力。例如,该公司团队在创作时并没有一味照搬,简单粗暴地将《小王子》这样的法国经典作品译成班巴拉语,而是有意优化提示词,进一步引导聊天生成式预训练转换器(ChatGPT)“列举出马里儿童常做的恶作剧”等,以实现更加本地化的替换。
工作人员剔除与马里大多数儿童无关的内容后,先用谷歌翻译器完成初步翻译,然后借助人工智能进一步改进,最后再交由托格尼这样的专家来审校润色。除此之外,还会有一位专门的同事负责用人工智能绘图工具匹配插图,确保故事中的角色能让马里的儿童读者产生共鸣。当然,完成整本图书的创作之后,团队会再次利用聊天机器人进行一轮阅读理解测试,保证故事内容流畅易读。
| 非洲本土语言濒危,人工智能如何突围?|
实际上,非洲大约有1000多种语言,但绝大多数在网上难以找到资源,因而大型生成式人工智能平台在训练时很难爬取到充足的数据。
以埃塞俄比亚最通用的两种语言阿姆哈拉语和提格雷尼亚语为例,当你用它们向聊天机器人提问时,即便问一些最简单的问题,得到的答案也是一堆乱码,甚至偶尔还会掺杂着其他语言。因此,阿斯梅拉什·哈德古特别创立了一家公司,专门利用机器学习技术来进行英语和埃塞俄比亚民族语言的互译。他表示,马里智能教育公司的项目证明了人工智能潜力巨大。哈德古说:“如果该项目卓有成效,那么人工智能对推动教育民主化将大有裨益。”
作为马里智能教育公司的联合创始人,迈克尔·利文撒尔把自己位于首都巴马科的一套房子改造成了办公基地。近来的一天,大家在办公室里有条不紊地工作着:一位同事正在审校机器翻译的译文,另一位则利用在线绘图工具生成“非洲妇女舂米图”,与此同时,利文撒尔正在研究一张人工智能绘制的父女合照,思考着其中的非洲男性形象是否塑造得过于刻板化。诚如他所言,这种情况屡见不鲜。
但无论如何,在托格尼看来,人工智能技术的确大幅提高了部门的工作效率。“虽然有很多内容需要优化完善,但过去耗时数周或数月才能完成的翻译工作,现在几秒钟就解决了。”他随后补充道。仅在那一周,托格尼就已经创作了两本书。
教育部的巴卡里·萨霍戈也参与了编书工作,他认为用本土语言进行写作意义重大。他还称赞道:“人工智能丰富了我们的文化和语言历史,让我们能够守护并传承自己的文化。”
华盛顿非洲战略研究中心副教授内特·艾伦认为,尽管美国和中国在人工智能领域“稳居领军地位”,但马里等国也用实际行动证明,“人工智能的风能够惠及世界”。
| 建立更健全的本土语言书面体系 |
利文撒尔曾是硅谷的科技企业家,十年前,他以计算机科学教授的身份来到马里短期支教,却被当地匮乏的教育资源触动,便决心在此扎根。鉴于非洲的本土语言大多停留在口语阶段,所以利文撒尔的终极目标就是利用人工智能技术为马里构建一套更加完善的班巴拉语书面体系。他坚信,随着人工智能系统习得更多的语言数据,这一愿景有望实现。
然而,他们眼下的重点是先从短期项目着手,如萨福的项目,虽然只有短短九周,但90%以上的学生都能从目不识丁的状态迅速提升到一个基础的阅读水平,学习成果格外显著。
当然,这番成绩的背后除了项目团队的尽心尽责以外,学生们的勤恳好学同样功不可没。这一天,老师在分发新教材时发现,尽管气温高达43摄氏度,但孩子们仍然能全神贯注地投入到学习之中。无论过去如何,如今的他们已经能够紧跟老师的步伐,读完一则又一则的儿童故事,同时也能明辨是非,知道哪些行为是值得学习的,哪些是不该做的。为了巩固学习效果,老师还会时不时地点名让学生大声朗读,学生们热情高涨,读得声情并茂,若是有同学发音不准,其他同学也会轻声地予以纠正。
14岁的勃拉玛·迪亚洛说,之前在公立学校学习时,他只能使用法语,因此备感压力,总是绷着一根弦,但现在他真正爱上了学习。
同样痴迷于学习的还有性格内敛的索科·库里巴利,从未上过学的她现在坐在前排,一边指着字一边练习发音。回忆起第一次接触书面语时的情景,她坦言自己当时“有些紧张无措”,心里一直疑惑该怎么学。然而,经过几节课的学习,她感觉掌握这些日常单词变得越来越容易,同时还发现自己对动物主题的图书产生了浓厚的兴趣。值得一提的是,在文盲率高达70%的马里,她的妈妈也没有接受过教育,于是库里巴利在放学之后,会把书带回家和妈妈一起学习。基于这份学习热情,她特别希望能够继续跟着老师上课。对此,利文撒尔表示,项目结束以来,他们的团队已经多次回访,并给孩子们带去了新书,他计划一旦新的资金到位,就立刻重启项目。
库里巴利说,没来上课之前,她甚至不知道电脑是什么,所以当工作人员向她解释这些故事的创作过程时,她仿佛打开了新的世界,情不自禁地沉溺其中。
“你可以用电脑创造一切!”库里巴利的语气中充满了激动和好奇,“它们简直无所不知!”
编辑:马果娜