华侨华人华语基本信息资源数据库建设及应用研究
2021-09-27刘慧
[关键词]华侨华人华语基本信息资源数据库;语言数据;数据类型;字段信息
[摘要]华侨华人华语基本信息资源数据库的建设势在必行。从构成来看,该数据库包含“华侨华人人口数据库、华语相关语言政策规划及华语使用数据库、华语机构数据库”三个子库。文章对各子库所包含的数据类型、采集途径、质量管控、更新管理等内容进行了较为详细的分析。此数据库的建成使用,能在一定程度上解决目前海外华语及华文教学研究“家底不清”的问题。对于未来开展华语使用、华文教学、华侨华人等领域的跨学科研究,有较强的参考价值。
[中图分类号]H08[文献标识码]A[文章编号]1674-8174(2021)04-0062-08
1.引言
语言是人类社会的重要资源。广义的“语言资源”是指语言本体及其社会、文化等价值。狭义的“语言资源”是指语言信息处理用的各种语料库和语言数据库,以及各种语言词典等(陈章太,2008)。语言资源本身也是语言数据②,应属“生产要素”范畴。集聚、管理语言数据并使其发挥最大作用,将成为未来社会发展生产的重要任务(李宇明,2020)。语言资源主要由语言本体和语言社会应用两部分构成,其价值构成可分为隐性价值和显性价值。隐性价值主要是指语言本体的价值,包括语言记录的文献、资料,所承载的文化、信息等。显性价值是语言本体价值的具体体现,包括语言的使用人口、使用领域、社会交际作用、应用效益等(陈章太,2008)。
随着中国综合实力和国际地位的提升,海外华语资源及所蕴含的价值引起了学界的注意。郭熙等(2020)指出,海外华语资源指世界各地的华语,以及使用这些华语产生的言语作品、文献、语言景观等。其包括有形资源和无形资源,前者如华文文献、语言景观、传统音像制品、信息化产品,后者如各地华语传承人士心中的“故事”、谚谣及各种传唱语言艺术等。上述定义关注的是华语本体资源及其所包含的隐性价值。而华语在海外的应用资源及显性价值,是本文的研究对象。具体而言,我们将通过建设华侨华人华语基本信息资源数据库(下文简称“基本信息数据库”),考察海外华语的使用人口、使用领域、传播传承路径、华族认同等内容。
②“数据”是指对客观事物、事件的记录、描述,是可由人工或自动化手段加以处理的数字、文字、图形、图像、声音等符号的集合(郑彦宁、化柏林,2011)。
2.建设意义
基本信息数据库建设势在必行。《华侨华人研究报告(2020)》指出,华侨华人遍布全球各地,是中国最重要的海外资源。华侨华人的数量已从20世纪80年代的约2300万增长到了2020年的约6000万(庄国土,2020:24- 26)。基本信息数据库建设可为且必为,主要原因可以从时代发展、国家战略、华人需求三个层面进行分析。
从时代发展来看,基本信息数据库建设是未来人类社会语言应用场景研究必备的基础数据信息。21世纪的互联网和大数据已深刻影响并逐步改变人类的生活。近年来,在“5G+ AI+大数据+落地应用”的深度融合下,包括语言应用的各种应用场景将实现跨越式发展,全球华人社区也将藉由互联网实现互融互通。华语应用场景将既存在于现实生活,也存在于虚拟世界。如何更好地在现实或虚拟场景中使用华语,需要我们采集整理海外华语使用者分布及特征数据、华语使用与传播的数据,并建设相关信息资源库。
从国家战略来看,基本信息数据库建设对于“一带一路”倡议的实施,对于国家语言安全,对于汉语国际传播等,都具有重要意义。华侨华人作为海外统一战线的中坚力量,是一带一路沿线国家助力“五通”的重要推手。建设基本信息数据库,便于我们动态掌握海外华侨华人分布及其语言生活特征,更好地通过华侨华人与所在国民众联系沟通。
从华人需求来看,基本信息数据库的建设对于了解海外华人社会的语言生态,考察华侨华人对祖籍国语言及文化认同等,也具有重要的参考价值。近年来海外汉语学习者低龄化趋势明显,且仍呈快速发展之态(李宇明,2018),而这其中有相当一部分为华侨华人。调查采集相关数据信息,科学制定华语传播及教育规划,有助于海外华侨华人更好地传承传播族群语言文化。
3.基本信息数据库的构成
基本信息数据库由3个子库构成,即“华侨华人人口数据库(下文简称‘子库1)”“华语相关语言政策规划及华语使用数据库(下文简称‘子库2)”“华语机构数据库(下文简称‘子库3)”。其所包含的具体资源信息如表1所示。
表1中3个子库的设计理念主要参考了以往成果对华语性质及传承特点等的分析。华侨华人在海外诸国多属于少数族群。少数族群语言文化的传承受所在国强势语言文化的影响,常处于弱势甚至濒危的境地。近年来,作为传承语的海外华文教育、华人族群的语言文化認同等问题引起了学界的讨论(周明朗,2014;曹贤文,2014;李计伟、张翠玲,2019;李春风,2019)。郭熙(2015,2017)在长期关注海外华语和华文教育的基础上,把海外华语定义为一种“祖语”,即“祖传之语”,是社会主体语言之外作为语言文化传承的祖辈语言。祖语具有“历史性、象征性、资源性”的性质,以及“边缘化、需要学习”的特点,祖语传承教育也是一个世界性难题。
在子库具体内容的设计方面,主要参考了联合国教科文组织2003年发布的《语言活力与语言濒危》(Language Vitality and Endangerment)文件,该文件所提出的语言活力评估体系包括9项评价指标①,在少数族群语言研究领域具有广泛的影响力。我们将该体系的评估指标作为子库信息采集的重要依据,以保证数据库资源收集整理的系统性和科学性②。子库所包含的华语资源信息相辅相成,互相映证,可确保数据信息的真实性和准确性。
4.基本信息数据库的建设
基本信息数据库建设的首要任务是数据的采集整理。本着“立足基础、突出重点、切实可行”的原则,我们将数据采集分为“基础数据”和“重点数据”两个部分。各子库采集的数据内容及主要字段信息如表2所示。
4.1基础数据的采集管理
近年来海外华侨华人的数量呈上升趋势③,分布区域和籍贯结构也有明显变化(庄国土,2020:22-26),这些都会影响海外华语使用及华文教学。本次基础数据采集的是海外华侨华人的人口数量(表2),此外还将尝试对其中使用华语及汉语方言的人数和比例进行估算。
目前海外华侨华人的数量无法精确统计,只能依据相关材料进行估算(庄国土,2020)。主要原因在于人口统计至少需要两个条件:标准和机构。目前我们对“华侨”“华人”的概念界定,尤其是“华人”的界定方面,缺乏统一明确的标准④。我国管理华侨华
①该体系包括9项指标:(1)语言代际传承;(2)语言使用者的绝对人口;(3)语言使用者占总人口的比例;(4)语言在现存语域的使用趋势;(5)语言对新领域和媒体的反应;(6)语言教育和读写材料;(7)官方语言态度和语言政策;(8)语言族群的语言态度;(9)语言记录材料的种类和质量。
②具体来看,综合“子库1”中的各国华侨华人人口数据,以及“子库2”中华语使用情况调查的数据,可以对“语言活力评估体系”中的指标(2)和指标(3),即“语言使用者的绝对人口”和“语言使用者占总人口的比例”进行估算和推断。“子库2”中的官方语言政策和民间语言规划的数据,可以作为考察指标(7)和指标(8)即“官方语言态度和语言政策”和“语言族群的语言态度”的参考资料。“子库2”中的“华语使用”和“子库3”中的“华语机构”的相关数据,可为考察指标(4)、指标(5)和指标(6)即华语在传统及新型领域和媒体中的使用情况,以及华文教学所用的材料等提供相关参考资料。
③《世界移民报告2020》(中文版)的数据显示,2019年,中国是世界第三大国际移民来源国,居住于中国以外的移民人数达到1070万,仅次于印度(1750万)和墨西哥(1180万)。
④在“华侨华人”的概念界定方面,《中华人民共和国归侨侨眷权益保护法》指出,“华侨是指定居在国外的中国公民。”但李安山(2016:3)也指出,一些旅居他国的华侨具有中国和所在国双重国籍,此类情况下华侨的界定还涉及到主体认同、客体认同等较为复杂的问题。国侨办相关规定指出,“外籍华人是指已加入外国国籍的原中国公民及其外国籍后裔;中国公民的外国籍后裔”。其中“原中国公民”中“原”的时间界限以及“后裔”所指代际范围均较为模糊,影响了华人人口的统计。为了对“华人”作出明晰的、可操作性强的界定,学界尝试采用了综合性的标准,如李安山(2016:3)所提出的“ROOTS”标准,但同时满足这些标准的华人数量也只能大致估算,无法精确统计。
人事务的机构单位有五家,各机构所掌握的相关人口数据信息整合度较低(李安山,2016:95)。这些因素都影响了海外华侨华人数量的精确统计。
因此,本次海外华侨华人人口数据采集将以网络资源和相关文献中数据信息为主,推断性估算、实地调研等方式为辅。具体而言,子库1将以洲际国别为单位,以共时层面的数据为主,历时层面为辅,采集整理各大洲各国华侨华人人口的数据信息。如欧美很多国家的统计局网站上都列出了近年来该国各族群的人口数据资料,部分海外大型华人社团掌握了所在地区华族人口数据。相关研究文献以国别或洲际为单位,对华侨华人人口及中国国际移民人口进行了收集整理,部分文献还根据历时数据对共时的华侨华人人口数量做了推断性估算,这些数据都具有很强的参考价值。我们将按国别对华侨华人人口数据进行分类整理入库,并标注数据的来源渠道、计算方式等信息,此举有助于甄别数据的准确性,为今后的人口估算提供相关的数据资料。此外,我们还将根据实地调研所得的数据信息,尝试对海外华侨华人中使用華语及汉语方言的人口和比例进行估算。
4.2重点数据的采集管理
4.2.1华语相关语言政策规划数据
华语相关语言政策规划的数据采集所依据的字段信息主要包括“政策类别,时效范围,具体内容,实施场域、针对对象、实施效果”等。主要考察宏观显性语言政策和微观隐性语言规划(表2)。前者关注的是海外诸国政府及相关部门制定的、与华语使用和华文教育有关的、具有强制执行力的语言政策。后者在考察各国各地区华语使用情况的基础上,关注海外华人社区、社团、学校、家庭等基层单位制定的,具有基层化、地方化、个体化特点的语言规划。
之所以将海外华侨华人的微观语言规划纳入数据采集的范围,是因为在华语视角下的语言规划实施中,政府的力量已经不占主导地位(郭熙,2009)。微观语言规划①是海外华侨华人为了适应当地语言环境、传承族群语言等需求而制定的,作用范围虽小,但效果明显。郭熙(2009)将华语规划主体概括为“声望规划、华语获得规划、开发利用规划、华语传播规划”,强调声望规划是现阶段华语规划的核心。而Haarmann(1990)通过考察发现,微观层面的规划主体(团体及个人)对声望规划更易发挥实效。采集整理海外华侨华人微观语言规划的相关数据信息,有助于我们全面了解华语资源的显性价值,预测其未来发展趋势。
4.2.2华语使用数据
华语使用主要体现为华语的传承和传播。如前文表2所示,华语使用的数据信息的采集标准之一为“地域分布”。我们将综合华侨华人人口的地域分布特征,参考全球华语社区“三圈说”(徐大明、王晓梅,2009),结合课题组在海外诸国实地调研所获得的信息,采集整理海外华语社区语言使用等相关数据信息。
华语使用的数据采集标准之二为“使用场合”,主要考察华侨华人在不同“语言域”作的语言使用情况,以考察华语使用为主,汉语方言使用为辅。我们以华侨华人在宗教域、家庭域、工作域的语言使用为例加以说明。
在宗教域,我们将采集华侨华人参加宗教仪式、聆听教义、成员交流时的华语使用和汉语方言使用的数据信息。在泰国、印尼、柬埔寨、缅甸、老挝、菲律宾等国都是非常重要的
①微观语言规划指的是商业、社会公共中介(agency)、群体或个人掌控的中介,制定出能被公认为语言政策的东西,计划利用并开发他们的语言资源;微观语言规划并不是某些较大宏观政策的直接结果,而是对其自身需要、自身“语言问题”、自身对语言治理的要求所作出的一种回应(周庆生,2010)。
②Fishman(1972:435-453)提出了“语言域”(domain)的概念。语言域是比言语社区更具体的语言组织和使用单位,其划分主要是基于“参与者、地点、话题”三个参数,在形式上体现为特定的社会空间,例如学校、家庭、工作单位、宗教场所、各级政府等。每个语言域都有自己的语言使用特点,这些特点既有因语言域内部管理所体现出的特点,也有因外界力量影响而产生的特点。博纳德·斯波斯基(2016)在《语言管理》一书中将“语言域”作为全书的核心概念,考察了家庭域、宗教域、工作域、公共域、学校域的语言管理情况,并在此基础上建构了语言管理理论模式,用于解释人类的语言选择现象。
社会力量甚至是政治力量。宗教语言政策能够支持祖裔语言的维持,其作用不可小视(博纳德·斯波斯基,2016:52)。曹云华(2002)指出东南亚华人如果要保持中华文化和本民族的文化认同,提倡信仰华人传统宗教如道教、大乘佛教、各种祖先崇拜等,可能是一个很好的选择。我们在东南亚的实地考察也证实了上述观点。
在家庭域,我们将调研华侨华人的家庭语言使用情况,重点采集华语使用及汉语方言使用的数据信息。海外华侨华人历来重视家庭,华族新生代入学之前的语言发育情况几乎完全取决于家庭语言交际格局。海外部分华侨华人家庭为了保持族群语言文化,坚持在家中说华语或汉语方言。由于所在国语言政策不同,语言环境各异,华人家庭交际语言格局也较为复杂,需要按照国别和区域进行调研及数据采集。
海外华人在世界各大洲建立了社区,他们对全球的贡献以经济为首(王赓武,2013:288-289)。因此在工作域,我们将通过问卷调查、访谈等方式,选取海外唐人街华人经营的商铺,以及具有一定知名度的大中型规模的华商企业、中资企业的海外分公司、中外合资企业进行调研,采集华侨华人及其公司员工使用华语的场合、交际对象、内容、频率等信息。
华语使用的数据采集标准之三为“社会特征”。我们将结合子库1即华侨华人人口数据库所采集到的数据信息,考察华侨华人的性别、年龄、籍贯、居住环境、代际传承、受教育程度、职业、宗教信仰、双(多)语能力等社会特征因素对华语及汉语方言使用的影响。
4.2.3华语机构数据
华语机构是指由海外华侨华人创办的,用于协调管理族群事务、传承传播族群语言文化、宣传报道族群动态信息等相关机构。如被称为“华社三宝”的华人社团、华文媒体、华文学校等。华语机构数据采集的字段信息主要包括机构名称,主办方,成员构成,职责功能,经费来源,发展沿革,社会影响等。在收集整理华语机构基本数据信息的同时,还将考察其在传承传播华族语言文化、建构族群认同中所发挥的具体作用。
4.3数据类型及质量管控
4.3.1数据类型
基本信息数据库的数据从获取途径来看,以公开数据和专有数据为主,自有数据为辅。从数据格式来看,公开、专有和自有数据均以非结构化数据为主,包括各类办公文档、文本、图片、XML,HTML、各类报表、图像和音频/视频信息等。
公开数据的获取途径主要包括纸质书刊和互联网中的电子文献及相关网站等,这方面的数据资源非常丰富,主要类型包括:1)海内外出版的关于华侨华人社会基本信息、华语使用、华文教学等方面的书刊①。可通过检索关键词等方式获取数据库所需的数据信息。2)相关网络媒体及网站作。可通过网络数据挖掘和数据分析等方式获取相关信息。
专有数据的获取途径主要包括政府等发布的数据,以及高校研究机构的数据库等。前者如联合国经济和社会事务部人口司的人口统计资料及报告书、联合国移民署的报告、联合国教科文组织发布的与语言教育相关的文件。我
①相关刊物如《华侨华人历史研究》《南洋资料译丛》《侨务工作研究》《八桂侨刊》《八桂侨史》《东南亚研究》《南亚研究》《南洋问题研究》《暨南学报(哲学社会科学)》《厦门大学学报(社会科学版)》《世界民族》《世界历史》《世界宗教研究》《华侨历史》《华文教学与研究》《语言文字应用》《语言战略研究》《南方人口》《人口与经济》《中国人口科学》等。相关书籍如《华侨华人百科全书》、《华侨华人研究报告(蓝皮书);中国与全球化智库(CCG)的相关研究成果如《中国国际移民报告》《世界华商发展报告》《海外华侨华人专业人士报告》;中国与全球化智库(CCG)与华侨大学联合发布《搭桥引路:华侨华人与“一带一路”》。年鉴如《世界华文教育年鉴》、《广东年鉴》“侨务”专题、《世界杰出华人年鉴》等,以及与华侨华人及华语相关的会议文献、学术报告、论文集等。海外华侨华人创立社团、发展华文教育的专著和论文集等。
②网络媒体如中新网的华人频道、中国侨网、地方侨报、《人民日报(海外版)》,以及海外华文媒体,如新加坡《联合早报》、马来西亚《南洋商报》《星洲日报》《光华日报》、法国《欧洲时报》、意大利《欧华联合时报》、西班牙《欧华报》、加拿大《环球华报》、美国《侨报》等。网站信息如世界人口网、中国侨网等国内各级侨办网站、海外华人民间社团组织的网站、维基百科等网络百科全书的信息等。
国驻外机构官网对当地华侨华人信息的介绍等。海外华侨华人所在国语言管理及教育部门发布的语言政策及语言教育规划的相关文件,欧美等国统计局发布的各族群人口普查数据、移民局发布的移民统计数据,以及部分海外大型华人社团掌握了一些华族人口数据。后者如暨南大学图书馆华侨华人文献中心设有华侨华人文献信息专题数据库,五邑大学设有五邑华侨华人全文数据库,新加坡国立大学设有海外华人特藏库等,这些数据库的建庫思路、模块设置、数据来源、信息字段、呈现方式等也具有参考价值。
自有数据的获取途径主要包括课题组成员赴海外实地考察、访谈等获取的数据。课题组成员曾多次赴海外调研讲学,获得了较丰富的数据资料,与海外华侨华人建立了较密切的联系。在此基础上,项目组还将利用网络通讯手段,就数据库的相关问题对海外华侨华人进行远程调研和访谈。
4.3.2数据质量管控
数据质量的主要评价维度包括准确性(accuracy)、完整性(completeness)、一致性(consistency)、可访问性(accessibility)和及时性(timeliness)等(朱扬勇,2018:258- 259)。数据质量与数据类型有关。如政府数据具有高价值密度性、可靠性、标准性、精确性等特点(朱扬勇,2018:17-18)。学术期刊和高校研究机构的数据库的相关数据也具有较强的客观性和准确性。因此,我们的数据采集将以政府数据、书刊文献等数据信息为主,估算推断、访谈和实地调研为辅,将不同渠道获取的数据加以验证,保证其真实准确。
为保证数据及数据库建设的质量,课题组将草拟《数据采集及建库手册》。手册共分为三部分,第一部分为“工作方案的整体设想”,将明确数据采集及调研的目的、洲际国别与地区、内容、时间、对象、方法、进度、流程、数据质量的自查和抽查、数据的录入、注意事项等内容。第二部分为“任务分工”,将数据采集整理及调查的各项任务细化分解,明确成员职责。第三部分为“数据库建设”,落实数据库建设的设计思路、技术平台、模块呈现、管理更新、用户反馈等步骤。
4.4建库思路
在数据采集之后,如何进行安全、便捷、高效的数据管理,并以这些数据为基础,开发出稳定性好、扩展性强的管理平台,定期对基本信息数据库加以维护更新,也是我们需要关注的问题。
4.4.1建库原则、流程与模块呈现
基本信息数据库的的设计及使用原则主要包括:实用性原则、独立与完整性原则、面向对象的数据库设计原则、建库与更新有机结合的原则,既要充分考虑数据有效共享的需求,也要保证数据访问的合法性和安全性。
基本信息数据库的建库原则主要包括:数据安全存储、信息清晰展示、界面便捷操作、用户高效共享等。在数据输入方面,将采集到的各类数据按照内容特点进行录入。便于录入员和管理员操作,同时尽量满足用户的查询需求。
在数据库建设方面,我们将与该领域专业人员合作,制定建库方案,详细列出需求分析、概念结构设计、逻辑结构设计、数据库物理设计、数据库实施、数据库运行和维护等方面所需的计算机技术及实施流程。
在子库的呈现方式上,基本信息库将以华侨华人人口、华语相关语言政策规划、华语使用、华语机构等为内容模块,从不同角度展示华侨华人及华语使用的基本信息。还将结合不同内容模块的特点,开发出分国别分地区的全文检索功能,以及相关复合检索功能和聚类检索功能。
4.4.2数据库更新与管理
对于基本信息数据库而言,数据挖掘和子库管理都十分重要,不可偏废。一方面,要实现稳定存储海量信息,便于检索统计,满足各地用户实时共享的需求。另一方面,基本信息库所包含的数据都具有动态性特征,因此我们既要保证资料数据的真实有效,也要做到定期维护管理,补充完善最新的数据资料,实现资源库动态更新。
4.5应用前景
刁晏斌(2018)曾提出全球华语研究的“一二三”框架,即应当进一步加强与突显一个基本点,即语言认同;在本体层面加大力度进行两条线索的发掘与梳理,即全球华语从哪里来、向哪里去;此外,还要确立三个基本的着力点,即语言规划、语言保护和语言服务。基本信息数据库所提供的相关数据信息是该研究框架的基石。利用数据库收集的数据信息,我们至少可以展开以下应用研究:
(1)华侨华人社区及语言生态研究。如新老华人社区语言使用的异同,华语或方言的流通度,华侨华人言语社区的类型及特点等。华语传承传播的机制及特点。
(2)华语机构在传承传播华语中的作用。如华侨华人社团、华文学校、华文媒体传承传播华语的方式及效果。华侨华人运用自身多语及跨文化交际能力在华语传承传播中所发挥的作用。
(3)语言政策对华语传承传播的影响。如宏观显性的官方语言政策以及微观隐性的民间语言规划的内容、特点,对华语传承传播的影响等。
(4)华语使用与认同建构。如华侨华人的族群语言文化认同、身份认同的情况,以及影响认同建构与动态变化的语言因素和社会因素等。
5.结语
以往学界主要关注华语资源的隐性价值即语言的本体价值,如海外华语文献、教材的语言文化特点等。本文关注华语资源的显性价值,主要包括海外华侨华人人口、华语使用、华语机构、华语相关语言政策规划等内容,并建立基本信息数据库,将其转化为电子信息资源。
基本信息数据库的建成和投入使用,可以在一定程度上解决目前海外华语及华文教育研究基础信息数据匮乏即“家底不清”的问题。郭熙、王文豪(2018)指出,基本信息库所包含的数据信息是开展华文教育的基础和依据。此外,基本信息库的数据信息对于我们综合运用社会语言学、人类学、民族学、教育学等学科的研究方法,开展华语生态、华文教学、华侨华人认同等相关研究,也是大有裨益的。
无论是华语和华文教学研究,还是华语资源数据库建设,都需要跨学科视角。要建立“大华语”(李宇明,2017)和“大华文教育”(贾益民,2018),一方面需考察全球华语的使用,另一方面也需结合华语传播的背景因素,此二者共同构成海外华语语言生活的基本情况。因此,将跨学科的理论和方法应用于基本信息库建设,可以使华语及华文教学研究具备大视野、广视角、高站位,也可以提升研究的科学性、系统性、理论性。近年来在华侨华人研究领域,王赓武、李明欢、庄国土、李安山、张应龙等学者,从社会学、人类学、民族学、国际关系学等视角出发,对海外华侨华人的政治、经济、文化、人口等状况做了细致考察分析。这些成果及其研究思路、方法和視角,对我们建设基本信息数据库,具有很强的参考价值。
[参考文献]
博纳德·斯波斯基2016语言管理[M].北京:商务印书馆.
曹贤文2014“继承语”理论视角下的海外华文教学再考察[J].华文教学与研究(4).
曹云华2002宗教信仰对东南亚华人文化适应的影响[J].华侨华人历史研究(1).
陈章太2008论语言资源[J].语言文字应用(1).
刁晏斌2018语言安全视角下的全球华语及其研究[J].云南师范大学学报(哲学社会科学版)(3).
郭熙2009华语规划论略[J].语言文字应用(3).
——2015论汉语教学的三大分野[J].中国语文(5).
——2017论祖语与祖语传承[J].语言战略研究(3).
郭熙,刘慧,李计伟2020论海外华语资源的抢救性整理和保护[J].云南师范大学学报(哲学社会科学版)(2).
郭熙,王文豪2018论华语研究与华文教育的衔接[J].语言文字应用(2).
贾益民2018新时代世界华文教育发展理念探讨[J].世界汉语教学(2).
李安山2016双重国籍问题与海外侨胞权益保护[M].南京:江苏人民出版社.
李春风2019国内语言传承研究综述[J].海外华文教育(1).
李计伟,张翠玲2019传承语的保守性与东南亚华语特征[J].华文教学与研究(3).
李宁明2018海外汉语学习者低龄化的思考[J].世界汉语教学(3).
——2017大华语:全球华人的共同语[J].语言文字应用(1).
王赓武2013华人与中国[M].上海:上海人民出版社.
徐大明,王晓梅2009全球华语社区说略[J].吉林大学社会科学学报(2).
郑彦宁,化柏林2011数据、信息、知识与情报转化关系的探讨[J].情报理论与实践(7).
周明朗2014语言认同与华语传承语教育[J].华文教学与研究(1).
周庆生2010語言规划发展及微观语言规划[J].北华大学学报(社会科学版)(6).
朱扬勇2018大数据资源[M].上海:上海科学技术出版社.
Fishman 1972 Domains and the relationship between micro-and macrosociolinguistics [ A ]. In John J. Gumperz& Dell Hymes(eds.),Directions in sociolinguistics [C]. New York:Holt Rinehart and Winston.
Haannann 1990 Language planning in the light of a general theory of language:A methodological framework [J]. International Journal of the Sociology of Language(1).
Research on the Construction and Application of Basic Information Resource Database of Overseas Chinese People and Language
Liu Hui
(College of Chinese Language and Culture/National Center for Overseas HUAYU Research,Jinan University,Guangzhou,Guangdong 510610,China)
Key words:center for basic information resource database of overseas Chinese people and language;language data;data type;field information
Abstract:It is imperative to construct the basic information resource database of overseas Chinese people and language. In terms of composition,the database contains three sub- databases:database of overseas Chinese population,database of language policy and use of overseas Chinese language,and database of organizations for overseas Chinese language. This paper analyzes the data types,acquisition approaches,quality control,field information and update management of each database in detail. The construction and application of the database can solve the problem of unclear situation in the research and teaching of overseas Chinese to a certain extent. It is of great heuristic value for future interdisciplinary research on the overseas Chinese people as well as on the inheritance and teaching of overseas Chinese language.