APP下载

基于统计的汉字特征多维度对比分析

2019-12-13布合力齐姑丽瓦斯力温且姆萨迪克热依汉古丽萨迪克木合塔尔沙地克

中文信息 2019年11期
关键词:声调韵母拼音

布合力齐姑丽?瓦斯力 温且姆?萨迪克 热依汉古丽?萨迪克 木合塔尔?沙地克

摘 要:文本对常用字的词性、拼音和韵母进行基于统计的多维度对比分析,得出词性、韵母与声调的关系不太明显,但近20%的拼音只发音同一个声调,其它80%拼音中占比最高的声调分别为二声和四声。

关键词:词性 拼音 韵母 声调

中图分类号:H1文献标识码:A文章编号:1003-9082(2019)11-0-01

《现代汉语常用字表》由国家语言文字工作委员会、国家教育委员会于1988年发布,共收字3500个。其中的常用字部分,共2500字,覆盖率为97.97%。[1]学国家通用语言文字(以下简称国语)是每个中国人的神圣职责,声调是国语灵魂的所在。教育部、国务院扶贫办、国家语委印发的《推普脱贫攻坚行动计划(2018-2020年)》指出,到2020年,实现贫困家庭新增劳动力人口应全部具有国家通用语言文字沟通交流和应用能力,现有贫困地区青壮年劳动力具备基本的普通话交流能力,当地普通话普及率明显提升,初步具备普通话交流的语言环境。国语的基本功能是表达和交流。国语的推广普及程度不高是南疆脱贫攻坚的一大短板。国语普及率低且发音不准严重影响了贫困地区与外部世界的交流。这一障碍,已成为制约扶贫开发、技术培训等活动的重要因素。坚决做好国语的推广普及工作也就成为脱贫攻坚的一项重要而紧迫的任务。鉴于少数民族学国语的弱点和难点,本文对常用的2500汉字的词性、拼音和韵母进行基于统计的多维度汉字特征对比分析,致力于发现与声调的关系,助于正确发音。

一、词性与声调的关系

2500个常用字中共有22个词性,其中前五个词性占88.92%,分别为:名词1007个(其中一声248个、二声302个、三声149个、四声303个、轻声5个)、动词794个(其中一声202个、二声145个、三声138个、四声309个、轻声0个)、状态词178个(其中一声47个、二声34个、三声43个、四声53个、轻声1个)、形容词161个(其中一声32个、二声38个、三声42个、四声53个、轻声0个)、副词83个(其中一声18个、二声15个、三声15个、四声35个、轻声0个),名词中二声四声较多,动词中四声最多,状态词中一声四声较多,形容词中三声四声较多,副词中四声最多。

分析发现,只发音同一个声调的词性共有3个,牵涉到9个汉字:

1.只发音一声的词性有2个,分别为:拟声词、前接分词,牵涉到3个汉字;

2.只发音轻声的词性有1个,是语气词,牵涉到6个汉字。

一声发音率达到50%及以上的词性共有3个,分别为:处所词、拟声词、前接分词,牵涉到5个汉字;二声发音率达到50%及以上的词性共有2个,分别为:非语素字、语素词根,牵涉到5个汉字;三声发音率达到50%及以上的词性有1个,是区别词,牵涉到4个汉字;四声发音率达到50%及以上的词性有1个,是连词,牵涉到6个汉字;轻声发音率达到50%及以上的词性有1个,是语气词,牵涉到6个汉字。

二、拼音与声调的关系

2500个常用字中共有387种拼音(忽略声调),前5个拼音每个均含30个以上汉字,分别为:shi含40个汉字(其中一声7个、二声7个、三声4个、四声21个、轻声1个), ji含36个汉字(其中一声11个、二声7个、三声3个、四声12个、轻声0个), zhi含33个汉字(其中一声10个、二声7个、三声6个、四声10个、轻声0个), yi含32个汉字(其中一声4个、二声6个、三声6个、四声10个、轻声0个), jian含31个汉字(其中一声10个、二声0个、三声8个、四声13个、轻声0个)。

分析发现,只发音同一个声调的拼音共有77个,牵涉到125个汉字。

1.只发音一声的拼音共有19个,分别为:gen、bin、zun、diu、zhua、keng、shuan、ha、zhui、shuo、nie、en、zuan、weng、pou、sen、hei、pie、ca,牵涉到22个汉字;

2.只发音二声的拼音共有23个,分别为:jue、rong、mang、ze、lin、nan、heng、ning、ceng、teng、qun、tuan、za、bie、qiong、ang、nuo、zei、hang、shei、neng、nin、nang,牵涉到48个汉字;

3.只发音三声的拼音共有12个,分别为:ken、sao、nv、ka、fou、leng、ruan、zen、lia、gei、zhun、nuan,牵涉到15个汉字;

4.只发音四声的拼音共有21个,分别为:ce、lie、kuo、mie、kuai、ruo、qia、zang、lve、rui、ri、nei、se、shun、te、run、cou、cuan、cuo、nen、beng,牵涉到38个汉字。

5.只发音轻声的拼音共有2个,分别为me、ne,牵涉到2个汉字。

一声发音率达到50%及以上的拼音共有75个,牵涉到188个汉字;二声发音率达到50%及以上的拼音共有85个,牵涉到257个汉字;三声发音率达到50%及以上的拼音共有40个,牵涉到65个汉字;四声发音率达到50%及以上的拼音共有105个,牵涉到366个汉字;轻声发音率达到50%及以上的拼音共有5个,牵涉到6个汉字。

三、韵母与声调的关系

2500个常用字有37个韵母,前5個韵母每个均含100个以上汉字,分别为:i含302个汉字(其中一声72个、二声67个、三声46个、四声115个、轻声2个)、u含206个汉字(其中一声39个、二声40个、三声48个、四声79个、轻声0个)、ian含135个汉字(其中一声31个、二声33个、三声21个、四声50个、轻声0个)、an含131个汉字(其中一声30个、二声28个、三声27个、四声46个、轻声0个)、ao含116个汉字(其中一声24个、二声21个、三声31个、四声40个、轻声0个)。

分析发现,只发音同一个声调的韵母有1个,一声,是ueng,牵涉到1个汉字。

一声发音率达到50%及以上的韵母有1个,牵涉到1个汉字;二声发音率达到50%及以上的韵母共有2个,牵涉到10个汉字;三声发音率达到50%及以上的韵母没有;四声发音率达到50%及以上的韵母有1个,牵涉到7个汉字;轻声发音率达到50%及以上的韵母没有。

结论

分析发现,词性、韵母与声调间的关系不太明显,但是拼音与声调间的关系比较突出。2500个常用字共有387种拼音,只发音同一个声调的拼音占比19.9%,牵涉的汉字占比5%。同一声调发音率达到50%及以上的拼音有310,占比80.1%,牵涉到的汉字有882个,占比35.28%。另外,一声字有613个、二声字有587个、三声字有444个、四声字有839个、轻声字有17个。387个拼音中,占比最高的声调分别为二声和四声,2500个汉字中,占比最高的声调分别四声和二声。总之,记住好占比近20%的只发音同一个声调的拼音的同时,发音其它占比80%以上的拼音时,若不知怎么发音,不妨先按占比最高的声调来发音,正确率可达近60%,[2]对理解和表达不会有太多的影响。

参考文献

[1]木合塔尔·沙地克,布合力齐姑丽·瓦斯力,汉字的大数据分析与可视化[J].中文信息,2018(5):167-168.

[2]木合塔尔·沙地克,布合力齐姑丽·瓦斯力,用Python数据分析方法进行汉字声调频率统计分析[J].电脑知识与技术,2017,17(35):13-14.

猜你喜欢

声调韵母拼音
声母韵母
声调符号位置歌
坐着轿车学声调
单韵母扛声调
《湘水韵》及其编撰原理要点
单韵母读读读