基于规范科技术语数据库的科技术语多音字研究与读音推荐
2020-03-08魏星王小辉魏亮杜振雷
魏星 王小辉 魏亮 杜振雷
摘 要:基于全國科技名词委规范科技术语数据库,提出包含614个多音字的“科技术语多音字表”,涉及34万余条含有多音字的科技术语。对科技术语多音字读音进行分析和整理,研究读音理据与原则,例析科技术语读音,给出部分科技术语的推荐读音。
关键词:规范科技术语数据库;多音字;科技术语;多音字读音原则
中图分类号: N04; H11; H124.3 文献标识码: A DOI:10.3969/j.issn.1673-8578.2020.06.005
Abstract:Based on the database of standardized terms in China, this paper puts forward a list of 614 polyphonic characters, involving more than 340 000 terms. The paper analyzes and sorts out the pronunciation of polyphonic characters in terms, studies the phonetic reasons and principles, analyzes the pronunciation of terms with examples, and gives the recommended pronunciation of some terms.
Keywords: database of standardized scientific terms; polyphonic characters; terms of science and technology; pronunciation principles of polyphonic character
引 言
科技术语规范化工作是推动中国科学语言发展的关键措施[1],科技术语中多音字的读音具有区分词义等功能,读音规范是科技术语规范中的一项重要内容[2]。我国现有的规范和各类辞书对汉语中的常用多音字做了整理,但目前尚无专门整理科技术语多音字的规范与辞书。“科技名词中多音字读音推荐数据库”项目组于2019年初开展科技术语多音字整理工作,在文献[3]中论述了科技术语中的多音字的研究概况,分析了科技术语多音字的成因和特点。科技术语多音字除具有汉语多音字数量大、形音义关系复杂等特点外,还具有自身的特点:科技术语的读音理据性强;部分读音较为生僻;部分包含常见多音字的科技术语专业性强;由于专业性强、可依据的资料少、实际读音分歧大,部分科技术语的多音字读音较难确定。
本文基于全国科技名词委规范科技术语数据库,进一步对科技术语多音字情况进行分析和整理,研究读音的理据与原则,例析科技术语读音,给出部分科技术语的推荐读音。
一 研究对象
1.规范科技术语数据库
全国科学技术名词审定委员会(以下简称“全国科技名词委”)是经国务院授权,代表国家审定、公布科技名词的权威性机构。自1985年成立至今,全国科技名词委审定公布了140多种、近50万条科技术语,初步形成了较为完整的涵盖自然科学、工程技术、医学、农林科学、社会科学以及诸多交叉学科的科学技术术语体系[4]。这些规范术语成果构成了全国科技名词委的“规范科技术语数据库”。本项目即以此数据库作为研究的数据基础,包含全国科技名词委公布的各学科规范科技术语近50万条。
2.含有多音字的规范科技术语
“科技术语多音字”指专业领域用语中的多音字。语言学界在多音字的整理、成因、辨读、教学等方面做了很多研究,但很少有关于科技术语多音字的研究。规范科技术语数据库较为系统地收录了各专业领域规范科技术语,以规范科技术语数据库为基础,提取出含有多音字的科技术语,即为本项目的具体研究对象。
二 研究方法
多音字科技术语数据提取和读音整理的主要流程为(见图1):(1)参考《普通话异读词审音表》《现代汉语词典》,人工筛选提出“科技术语多音字表”;(2)以“科技术语多音字表”为基础,从“规范科技术语数据库”中提取出“多音字科技术语数据表”;(3)分析整理科技术语多音字的读音,形成“科技术语读音推荐表”。
1.提出“科技术语多音字表”
在《普通话异读词审音表》(1985年)、《现代汉语词典》第7版(2016年)包含的汉字多音字基础上,去除语气词助词、生僻读音、旧读音和部分古音等多音字,并检索规范科技术语数据库,人工判断多音字是否属于科技术语多音字,从而筛选得出“科技术语多音字表”。“科技术语多音字表”共包含614个多音字,共1339个读音。“科技术语多音字表”未收录的多音字包含以下5种:(1)不同读音为语气词、助词,如末(mò,me);(2)不同读音为不常用的地名、姓氏等,如祭(jì,Zhài);(3)不同读音为生僻的方言,如家(jiā,jia);(4)不同读音为古汉语,如脚(jiǎo,jué);(5)各读音字均不涉及科技术语,如坷(kē,kě)等。“科技术语多音字表”是提取含有多音字的科技术语数据的基础。
2.提取“多音字科技术语数据表”
以“科技术语多音字表”中614个多音字为基础,对规范科技术语数据库中的中文规范术语进行了循环遍历,提取了包含多音字的科技术语数据,形成了“多音字科技术语数据表”,数据表共包含34万多条数据记录。“多音字科技术语数据表”即为需要分析整理的数据对象。
3.分析整理科技术语多音字的读音
1)“科技术语读音推荐表”
对所提取的含有多音字的科技术语读音进行人工辨析和归类,标明区分读音的简明依据或说明,列举典型例词,注明例词读音类别等信息,数据存放于Excel文件“科技术语读音推荐表”。不同读音的科技术语例词按读音确定性分为三种类别:确定;推荐;存疑。《普通话异形词审音表》《现代汉语词典》等规范、工具书有收录且与项目组整理的读音一致,或者规范、工具书未收录但项目组认为读音理据充分的科技术语例词,归为“确定”;各规范、工具书有不一致情况,或与项目组整理的读音不一致,但项目组认为该读音可以作为推荐读音的科技术语例词,归为“推荐”;各规范、工具书有不一致情况,或有文献提出争鸣,项目组认为争议较大或无法考据、不能确定读音的科技术语例词,归为“存疑”。表1为“科技术语读音推荐表”的一部分。
2)列举例词
按照多音字各读音涉及的术语词条数量和辨识度不同,可分为三种情况:第一种是其中一个音常见,且术语数量上占绝大多数,而另外音很少见,仅有有限的术语;第二种是各音术语数量都不是很少,且术语中多音字的辨识度较高;第三种是易混难辨识的多音字术语。针对第一种多音字术语,最常见音的术语仅举几例,占少数音的术语尽量列全术语,使用者可用排除法来判断常见音术语。第二种辨识度高的多音字术语可不作为重点词举例,举例能够举一反三即可。第三种易混淆、难分辨的多音字术语作为重点分析和举例,暂时无法确定读音的“存疑”。
例如,“阿”有ā、ē两个读音,在规范科技术语数据库中共有含“阿”的术语473条(已去除重复词条),其中绝大多数读音为ā,仅在“阿胶”“阿房宫”和其相关术语中读ē。对于含有“阿”的多音术语,处理方式为:在ē读音处列出“阿房宫E-Pang Palace”“阿胶ass hide glue”两个例词;在ā读音处列出“阿片样物质opioid”“阿魏Chinese asafetida”“阿月浑子pistache”“阿是穴ashi point”“阿霉素adriamycin”“阿黑皮素原proopiomelanocortin”几个例词即可;并在ā的“区分读音的依据或说明”处注明“多为音译词。除列举的ē读音例词外,读音均为ā”。
又如,“柏”字有bǎi、bó、bò三个读音,在规范科技术语数据库中共有含“柏”的术语44条(已去除重复词条),三个读音区别度较大,较易分辨。bǎi与植物名“柏树”相关;bó多为音译,与“柏林”等地名相关,或与“柏拉图”等人名相关;bò只有一词“黄柏”,同“黄檗”。对于含有“柏”的多音术语,处理方式为:每个音尽量列全基础词,复合词可以不列入表中,并在各音的“区分读音的依据或方法”处注明读音依据。
再如,“拗”字。《普通话异读词审音表》中仅审了ào、niù两个读音。《现代汉语词典》第7版注有ǎo、ào、niù三个读音,释义分别为:ǎo“使弯曲;使断;折”,例词“坳断”;ào“不顺;不顺从”,例词“拗口”“违拗”“拗口令”;niù“固执;不随和;不驯顺”,例词“执拗”“拗不过”。项目组按照《现代汉语词典》第7版的注释,初步判断在“拗拉槽”“山前拗陷盆地”等术语中读ǎo,在“违拗症”“顽拗物”等术语中读ào,因不十分确定各读音,将这个字的相关词条暂放在“存疑”区,有待进一步分析确认。
三 确定科技术语中多音字读音的原则
1.遵照已有规范和权威工具书
1)科技术语中多音字的读音,在原则上应同我国已发布的读音规范协调一致。《普通话异形词审音表》于1985年发布,规范了约860个异读词读音,是项目组确定科技术语中多音字读音的主要依据。另外,因为《普通话异形词审音表》主要是对普通话有异读的词和有异读的作为“语素”的字进行审音,并未列出多音多义字的全部读音和全部义项,所以在确定科技术语中多音字读音时,还应参考其他权威工具书。
2)《现代汉语词典》第6版收录了982个多音字[5],并注明了多音字各读音的义项,给出了常用例词,这些义项和例词都可作为科技术语多音字读音的重要参考,并可根据这些义项和例词类推科技术语的读音。另外,《多音字汇释》[6]等辞书对常用多音字做了整理,也可作为科技术语多音字读音的参考。
3)如推荐的科技术语多音字读音与已有规范或权威工具书的读音不一致,应注明理由。
2.根据科技术语概念来确定读音
多数科技术语能够简明扼要地表达科学概念的内涵,具有较强的理据性。多音字的读音能够起到区别词义的功能。根据科技术语概念内涵、理据来确定多音字读音,是此项工作的一个重要原则。
例如,“缝”有féng和fèng两个读音。féng为动词,“缝补”“缝合”之义,fèng为名词,“缝隙”之义。容易判断在“缝合法”“缝扎法重睑成形术”等术语中的读音为féng,在“无缝集成”“单缝衍射”等术语中的读音为fèng。林学术语“缝植法”的读音则不那么容易直观判断,经查其定义(在移植时用铁锹开缝,然后将苗木放在适当的位置,使其根系舒展,再用土压实的一种栽植方法),可知这里的“缝”为“缝隙”之义,应读fèng。林学术语“缝拼机”定义为“用于缝接单板的专用设备”,据此可知其“缝”为“缝合”之义,应读féng。
3.首选书面语读音
一些科技术语有文白异读,即书面语和口语之分。由于科技术语应用于书面文字表述,科技术语在进行语言交流时,其发音也基本同于书面语,所以科技术语中有文白异读的多音字首选书面语读音。例如,地理学术语“堰塞湖”,从词义“阻塞形成围堰”来说,“塞”读sāi或sè均解释得通,选择读“塞”(sè) 即为书面语读音。
4.考虑读音的系统性
一系列结构化、具有相互关系的概念系统,能够构建起一个领域的知识系统[7]。科技术语读音的系统性能够帮助构建理想的术语系统,并帮助理解科技术语的概念内涵。在为基础术语和衍生术语、同一领域的相关术语、不同领域术语相同多音字确定读音时,均应考虑到读音的系统性。例如,“杆”有gān、gǎn两音,建筑学术语“桅杆”的“杆”是“杆子”之义,确定读gān,那么在其衍生术语“桅杆材”(林学)、“桅杆起重机”(机械)、“斜撑桅杆式架梁起重机”(铁道科技)等术语中也读gān;建筑学术语“电杆”的“杆”与“桅杆”的“杆”同义,也确定读gān;而机械工程术语“连杆”“导杆”“杠杆式天平”、生物化学与分子生物学术语“乳杆菌酸”等系列术语中的“杆”为“器物的像棍子的细长部分”之义,读gǎn。
5.对于意义区别度不大的多音字术语,尽量统读
例如“剥”字,《普通话异读词审音表》提出“表示在‘剥削等书面复合词中读bō,在‘剥皮儿等口语单用时读bāo”。绝大多数科技术语为书面语,所以“剥蚀面”“页状剥落”“剥离膜”“剥离”“角质剥脱术”等术语中的“剥”均读bō;同时考虑到简明性,没有必要区分读音的字以统读为宜,例如剥皮、抗剥强度、剥谱、胎盘早剥等词中的“剥”也均建议读为bō。即建议科技术语中“剥”字统读为bō。
6.充分考虑专业领域的应用情况
不同时期、不同领域、不同地域的学者对同一科技术语概念的理解、读音习惯都可能有不同。专业性较强、较难确定读音的科技术语,需深入调查专业领域的应用情况,征求专家的意见。例如铁道术语“道碴”,《现代汉语词典》中为dàozhǎ,而铁道、土木工程等专业领域多约定俗成读为dàochá,应确定为何种读音仍需进一步研究商榷。
四 结 语
我国目前还没有专门研究科技术语多音字的专著或辞书,涉及科技术语读音的内容散见于一些专业论文中。本项目的研究有助于厘清科技术语中多音字的辨析和规范,促进汉语多音字研究和学术交流,并能够给辞书编排、科技术语排序等工作提供依据。
項目组已对“科技术语多音字表”614个多音字中的316个多音字的科技术语进行了读音整理,涉及科技术语18万条。项目组给出了277个多音字的科技术语的确定读音或推荐读音,尚有36个多音字存疑,有待深入研究。由于数据量大,且部分词条的读音较难判断,读音的整理和推荐难免有疏漏,仍需进一步审核。科技术语多音字读音的原则仍不够完备,需要在后续工作中结合研究的深入加以调整。
参考文献
[1] 裴亚军. 创新开展新时期科技名词规范化工作,努力发挥支撑服务作用[J].中国科技术语,2018(3):7-10.
[2] 王琪.浅谈科技异读词的规范问题[J].中国科技术语,2016(4):16-18.
[3] 魏星,王小辉,魏亮,等.科技名词多音字探析[J].中国科技术语,2019(6):5-10.
[4] 冯志伟.中国术语学研究的八大特点[J].中国科技术语,2019(2):8-10.
[5] 李冉冉.《现代汉语词典》多音字研究[D].济南:山东师范大学,2015.
[6] 王学民.多音字汇释[M].合肥:安徽教育出版社,1992.
[7] 魏星.术语系统性原则在海峡两岸辞书编纂中的应用[J].中国科技术语,2018(2):50-55.