元音字母表调高缩模式计算机汉字输入拼音代码研究
2021-11-29黄炳羽
黄炳羽
(中共广西北海市合浦县委办公室,广西合浦536100)
在计算机汉字输入技术领域,人们一直期望有一种真正极其简短,表音精确,字母用法符合英语、法语、葡萄牙语等西语惯例及汉语特点,并且能与英语、法语、葡萄牙语充分兼容,简单易学,重码尽可能低的汉字输入所用的汉语拼音代码。本代码方案与现行汉语拼音相比,码长相等,字母用法更加规范和符合国际惯例,特别是能够使汉语字词输入的重码率大大降低。
一、声母的代码方案
用中括号[]表示国际音标,用双斜杠∥表示汉语拼音,下同。[y]是汉语拼音/ü/(鱼)的国际音标,[ye]是汉语拼音/üE/(月)的国际音标。
本方案规定,声母j,q,x,y为复音声母,都含有[i]音位,其中声母y的国际音标为[ji](医),并分别采用j,q,x作汉语拼音“声介母”结构ji-,qi-,xi-的代码。另外,国家标准汉语拼音方案声母c在本方案中也可以写为tc。其余声母与国家汉语拼音方案一致。
在本方案中,j,q,x,y本身都含有音位[i](介音),故而统称为“含[i]声母”。英语双音位字母有o[ou],i[ai],a[ei],u[ju:],x[ks/kz/gz]。
本方案实行声母所用字母及其辅音单一恒定原则,声母辅音不得变读。
二、韵母的代码方案
设计汉语拼音韵母代码,坚持以汉语拼音为绝对基础,同时也主要采用了一些类似于英语的文字设计技术,还借鉴了葡萄牙语和法语文字中适合于汉语的部分设计办法。
本代码方案不排除结合搜狗等汉字输入技术的运用。
(一)用鼻音字母m作为汉语拼音ng的代码
本方案只将汉语拼音后鼻韵母中韵尾ng改为m,后鼻韵母的其余部分一律不得改变。汉语普通话的音节尾没有[-m]音。汉语后鼻韵母比重极大。故而为了设计出精短的后鼻韵母,本方案用鼻音字母m表示汉语后鼻韵尾[ŋ]音位。也就是,采用m作为汉语拼音韵尾ng的代码。在法语中,字母组合am和an,em和en,im和in,om和on,ym和yn发音分别相同,一般读相应的鼻化元音;但在这些字母组合之后还有m或n时,或在外来词中,则发[-m]音。在葡萄牙语中,字母组合am,em,im,om,um一般读相应的鼻化元音,其读音比较接近于英语相应的元音加鼻音n或ng;葡语音节尾的字母m读鼻辅音[-m]的情形与法语相同。可见,鼻音字母m并不是在所有大语种拉丁化文字的音节尾都读[m]音。正因为如此,利玛窦(1605)、金尼阁(1626)、何大化(1671)、刘继善(1914)的汉语拼音方案都用鼻音字母m表示汉语的后鼻韵尾[ŋ]音[1]。
本方案采用鼻音字母m作为汉语拼音后鼻韵尾ng的代码,后鼻韵母的首字母一律不变。其中,自然采用om替代汉语拼音的字母组合ong,以表示[uŋ]∕[oŋ]音。前100个高频汉字(覆盖汉语使用频率的60%)中,存在有以汉语拼音ong为韵母的高频汉字“中、用、工、动、同、种、从”,但不存在以汉语拼音uang为韵母的汉字[2]。所以,本方案采用om替代汉语拼音ong,以表示[uŋ]∕[oŋ]音。字母组合om形体醒目,并且与汉语拼音ong的首字母都是o,有利记忆,不值得改为采用um替代之。例如zhom(中),zom(总),chom(虫),gom(工),hom(红),kom(空),com(从)。
(二)用o作汉语拼音韵母ou的代码
也就是用字母o表示双音位/ou/(欧)。
本方案与英语一样,将字母o的基本读音确定为/ou/,主要用于表示/ou/音位,在除半元音声母w外的所有声母之后都读/ou/音。汉语以/ou/音为韵母的高频字和常用字极多,例如:/dou/都;/tou/头、投、偷;/you/有、又、由、油、优、友、幼、右。所以,将字母o的基本读音确定为/ou/。该规定既利于与英语兼容,又能极大地缩短大批高频汉字的拼式。此外,用yo表示高频词“有”,也避免了用英语高频词you(你)表示汉语的“有”。
(三)用iu表示[y](鱼)音位,作汉语拼音字母ü的代码
用iu表示[y](即/ü/)音位是本方案代码编码的理论基石。其中,汉语拼音/ü/的国际音标是[y]。根据本方案规定的音位聚变公式[i]﹢[u]=[y],所以含[i]声母j,q,x,y与[u]相拼时发生“[y]化聚变”,分别读作jü(聚),qü(去),xü(徐),yü(余)。依此类推,将汉语拼音nü、lü分别拼写为niu、liu。
(四)用ea作汉语拼音ie(“姐”的韵母)的代码
英语采用ea分别表示[iE]音位。本方案采用刚性结构ea恒定地表示汉语拼音ie(“姐”的韵母)的代码。本方案中,ea是读音恒定、不可拆分的刚性结构。例如,jea(结),qea(且),xea(些),yea(业);bea(别),teav(铁),lea(列),mea(灭)。韵母代码ea要与含[i]声母j,q,x,y以及声母b,p,m,d,t,n,l相拼。
由于韵母为/i/的常用汉字极多,在采用ea表示表示以后,就能够空出ie来表示读第一声的/i/音位韵母。这样,就能够采用ae,oe,ie,ue分别表示与读第一声的a,o,i,u同音音位。特别指出,在国家拼音方案中,字母e的基本音位为/e/(鹅),而不是/E/音(“也”的主元音)。
(五)用on分别作为汉语拼音韵母uan的代码
本方案采用on替代汉语拼音的字母组合uan,以表示/uan/和/üan/音位。以汉语拼音uan为韵母的常用汉字极多,例如:关,宽,还,转,穿,全、权,原,圆,元,远,等等。
(六)采用oi作汉语拼音韵母uai和üe(包括省略两点的ue)的代码
由于汉语拼音韵母uai和üe(包括省略两点的ue)永远只与不同声母相拼,故而可以用oi作这两个韵母的代码。
首先,规定oi的基本读音为三元音/uai/。本方案根据汉语的特殊需要,直接规定oi的基本读音为/uai/。韵母oi在声母g,k,h,zh,ch,sh后读其基本音/uai/。法语广泛运用oi表示[wa]音,例如reser⁃voi/水库。
其次,规定oi在含[i]声母j,q,x,y之后一律读/üE/(月)音。即规定oi在含[i]声母j,q,x,y之后首先表现为读双元音/üE/,在发生音位聚变后,最终读/üE/(月)音。音位聚合变化在英语中十分普遍。当英语单词变长和所含音位增多后,就常常发生音位聚合变成相近的音,从而使音位得以减少。例如,字母a在英语nation中读双音素音[ei],在变长的单词internation中就发生音位聚变,聚变为单音素[æ]。
最后,规定oi在声母l,n之后读/üE/(月)音。例如:loi(略),noi(虐)。
(七)韵首oo恒定地表示与第四声u相同的音位
在英语中双写字母oo与单字母o的读音很不一样。字母组合oo在英语中一般只读[u]和[u:]音。鉴于韵母为第四声[u]的汉字极多,为了区分个别高频同音字,借鉴与英语相近的读法,本方案采用双字母oo作为汉拼代码韵首(实际是独体韵母)表示读第四声/u/音。这里,韵首oo称为“韵首双环物”。其中,“物”指读“物”音。例如:woo(物),foo(复),loo(路),boo(部),moo(目)。
(八)韵母uo读[uo]音但是在消[u]声母b,p,m,f后读[o]音
韵母uo的根本读音为/uo/音。韵母uo转换成音节时写为wo(我)。例如:shuo(说),guo(过),zuo(作),luo(落)。
但是uo在消[u]声母b,p,m,f后一律读/o/音。在英语build,buy中,字母u也不发音。本方案将声母b,p,m,f称为消[u]声母。消[u]声母b,p,m,f与韵母uo相拼时,执行如下公式:b/p/m/f+[uo]=b/p/m/f+[o]。本方案将汉语拼音/bo/,/po/,/mo/,/fo/一律分别拼写为buo(播),puo(坡),muo(摸),fuo(佛)。韵母uo读/o/音,仅仅限于与b,p,m,f这四个声母相拼的读音。其中,拼式fuo(读/fo/音)范围内只有一个常用汉字“佛”。
(九)字母组合ao和ea均为绝对刚性结构
规定ao,ea均属于绝对刚性结构,作韵母时可以与一切声母相拼;同时,在韵母iao、eai、eaa等结构中,字母组合ao、ea一律不得简化缩写。
其中,韵母ao在汉语音体系中极为重要,其不仅读音响亮,分布极广,涉及汉字多,而且以极强的逻辑规律贯穿于整个汉语音设计体系,是一种能够与英语完全兼容的语音(英语无此语音)。例如,dau(到),jao(教),qao(巧),xao(小),yao(要),biao(表),miao(苗),tiao(条),整个逻辑关系一脉相承。因此,规定字母组合ao为刚性结构,ao在任何组合结构中,都不得简化缩写。例如,不得将iao缩写成诸如“eo”等双字母结构。
三、韵母代码的标调方案
(一)干韵母中的第三个元音字母一律不发音
本方案将韵母中除韵首介音字母i以外的部分,以及韵首无介音字母i的韵母统称为“干韵母”(即骨干韵母)。例如:①韵母iaoe,iau,iane,iamo,ioa,ia中,除韵首介母i以外部分aoe,au,ane,amo,oa,aa分别都是干韵母;②如果韵首无介母i,则该韵母本身就是干韵母,例如aov,eae,ame,oo,uai,uoo,aie,uie,oie,ono,uamo,omo以及韵母ie,ih,iv,ii等本身都是干韵母。
干韵母中的第三个元音字母一律不发音,只用于表调或区分字意。例如,taoi(桃),jeai(节),huoi(活),haii(氦),qeaa(窃),miaoe(喵),guoo(过),huoo(获),dauo(道),baae(坝)等音节韵母的最后一个字母都不发音,仅用于表调或区分字意。
(二)采用字母表示声调的具体方法
为了确保词根字意的稳定性及拼式分辨率,本方案只标记本调,不标变调。跟第三声汉字相一致,第三声拼写法本身就包含有在特定环境中读变调的内容;依此类推。同时还必须考虑到既要与英语能够兼容,又要兼顾美观。标调方法如下:
①第一声(一般调号e,个别gh):在无调韵母后加不发音的调号e表示读第一声声调。例如gome(公),guame(光),zhame(章)。但是,在韵母e之后则一律采用加-gh表示读第一声,例如hegh(喝);在后鼻韵母am,em,im后加调号e后,当出现与英语高频词形体相混同时也可改用加-gh表示读第一声,例如homgh(轰),tamgh(汤),timgh(厅)。调号e的英语读音和起笔都与汉字“一”相同,而且重心在头部,故表示高平音第一声。
②第二声(一般调号h,个别i):一般情况下,通过在韵母后加调号h,表示读第二声。但是,在实线双字母组合韵母ao,uo,ua,ea后,要添加不发音的虚线字母i,来表示读第二声,例如,taoi(桃),jeai(节),huoi(活),huai(滑)。但“华”要拼写为“huah”。对含有虚线字母i的韵母(如io,ia,iu,ai,ei,oi,ui),一律不得再采用在其后加i来表示第二声(“二声韵母无两虚”规则)。字母h形如长颈鹿之高头上伸,表示扬起的第二声。字母i与h都是形体高挑上指,故表示扬起的第二声。字母a、e、o、u是实线字母,i是唯一的虚线元音字母。
③第三声(调号v):在韵母后加调号v表示读第三声。
④第四声(一般调号是韵尾字母双写,少数是韵尾添加o或a):
首先,所有韵母中的双写字母都是绝对四声符,一律读第四声。例如 maa,hee,tii,haii,boo,tuu,qeaa,huoo均读第四声。其中,韵尾双写字母ii可以改换为y;韵母aoo中的韵尾oo可以改换为u。
其次,所有鼻韵母之后加不发音调号o(例如ano,amo)表示读第四声。字母o像句号,表示排在最后的第四声。
再次,韵母oa,ioa直接读第四声(这里a为不发音调号,表示读第四声)。例如,xoa(秀),lioa(六)。
最后,韵母au,iau,ou(以u结尾)以及韵母y,ay,ey,uy,oy(以y结尾)读第四声。韵母au,iau之后再尾缀以调号o,仍然读第四声。
⑤本调为轻声的语气助词:在单元音字母之后,尾缀以-r表示本调读轻声,且该元音字母只能读其单音素语音。其中,-gh本身不发音。例如,ar(啊),bar(吧),mar(吗),lar(啦),nar(哪),war(哇),ner(呢),mer(么),or(喔),yor(哟),lor(啰、咯),lir(哩)。
(三)用字母e,h,v,o作表调符号的主要原因
用字母e,h,v,o作表调符号,其理由主要有:一是符合英语等国际惯例。二是读/ne/(呢)、/me/(么)、/nou/(耨)音节的汉字极少且不常用。三是读/mou/(牟、谋、某)音节内没有高频字且常用字极少,“牟、谋”拼写为音节moh;“某”拼写为 mov。四是为了避免与后边的声母因相邻而构成gr,gl,cl,fr,ph,dr,ds,dz,th,tr,ts,tz,ar,er,ur,ir,or,ang,ing,eng,ong,zh,ch,sh等英语和汉语拼音字母组群结构,以便与英语及国家汉语拼音方案兼容。
四、韵母代码的具体拼写法
韵母的基本形式(不带声调标志)可以表示读任何声调的汉字。本方案严格限制采用“y+元音字母”和“w+元音字母”的韵母结构。
本方案韵母基本形式【】,中国标准汉语拼音//,以及依序分别为第一、二、三、四声韵母拼写形式,具体罗列如下:
(一)全元音韵母拼写法
开口呼韵母:【a】/a/(啊):ae,ah,av,aa;【o】/o/(喔):uoe,uoi,uov,uoo(本行韵母仅在消[u]声母b,p,m,f,w后读/o/音,在其他声母之后要读/uo/音);【e】/e/(鹅):egh,eh,ev,ee;【ai】/ai/(爱):aie,aih,aiv,ay;【ei】/ei/(欸):eie,eih,eiv,ey;【ao】/ao/(熬):aoe,aoi,aov,au(本行韵母要与包括j,q,x,y在内的所有声母相拼);【o】/ou/(欧):oe,oh,ov,oa(本行韵母除了在半元音声母w后读/o/以外,在其他所有声母之后都读英语音/ou/音)。
齐齿呼韵母:【i】/i/[i](以):ie,ih,iv,ii/y(在本行韵母中i是主元音,不是介音,故而在含[i]声母j,q,x,y后,本行韵母表示空韵,i不省略);【ia】/ia/(呀):iae,iah,iav,iaa(本行韵母一般不得与含[i]声母j,q,x,y相拼);【ea】/iE/(也):eae,eai,eav,eaa(字母组合ea是刚性结构,恒定读/iE/,不可拆分,可与包括声母j,q,x,y在内的一切可能的韵母相拼,例如jea解,qea且,xea些,yea业,lea列,mea灭);【iao】/iao/(腰):iaoe,iaoi,iaov,iau/iaoo(本行韵母不得与含[i]声母j,q,x,y相拼);【io】/iou/(又):ioe,ioh,iov,ioa(本行韵母一般不得与含[i]声母j,q,x,y相拼)。
合口呼韵母:【u】/u/(乌):ue,uh,uv,uu/oo(本行韵母在含[i]声母j,q,x,y后发生音位聚变,分别读:ju聚,qu去,xu须,yu与;其中oo仅用于拼写个别第四声常用字);【ua】/ua/(洼):uae,uai,uav,uaa;【uo】/uo/(窝):uoe,uoi,uov,uoo;【oi】/uai/(歪):oie,oih,oiv,oy(本行韵母在除j,q,x,y,n,l以外的其他声母之后一律读/uai/);【ui】/ui/(微):uie,uih,uiv,uy。
撮口呼韵母:【iu】/ü/(与):iue,iuh,iu,iw(本行韵母只与声母n,l相拼);【oi】/üE/(月):oie,oih,oiv,oy(本行韵母与含[i]声母j,q,x,y及声母n,l相拼时,一律读/üE/(月)音。
(二)鼻韵母拼写法
开口呼韵母:【an】/an/(安):ane,anh,anv,ano;【en】/en/(恩):ene,enh,env,eno;【am】/ang/(昂):ame,amh,amv,amo;【om】/ong/(“中”的韵母):ome,omh,omv,omo;【em】/eng/(“成”的韵母):eme,emh,emv,emo。
齐齿呼韵母:【in】/in/(因):ine,inh,inv,ino;【ian】/ian/(淹):iane,ianh,ianv,iano(本行韵母不得与含[i]声母j,q,x,y相拼);【im】/ing/(应):ime,imh,imv,imo;【iam】/iang/(央):iame,iamh,iamv,ia⁃mo(本行韵母不得与含[i]声母j,q,x,y相拼)。
合口呼韵母:【un】/uen/(温):une,unh,unv,uno;【on】/uan/(玩):one,onh,onv,ono;【uam】/uang/(汪):uame,uamh,uamv,uamo;【om】/ong/(“穷”的韵母):ome,omh,omv,omo(本行韵母与含[i]声母j,q,x,y相拼。例如,jom囧,xom凶,qom穷,yom用)。
五、声韵配合规则
(一)规定音位聚变公式
参照核聚变(聚合变化)原理和英语字母组合发音原理,本方案规定:①[i]﹢[u]=[y](鱼)。口诀:“依屋鱼”。这是本方案设计的基石。②[i]﹢[uai]=[ye](月)。口诀:“意外月”。音节中的[i]和[uai]按序合韵时要聚变成[ye](月)音。
(二)声母j,q,x,y直接与开合呼韵母相拼
含[i]声母j,q,x,y分别与如下韵母相拼:①开口呼韵母a,an,am,ao,o,om;②合口呼韵母u,un,oi,on;③绝对刚性韵母ea。
(三)声母j,q,x,y所含[i]与韵首[u]的音位聚变
含[i]声母j,q,x,y都含有音位[i],合口呼韵母u,un,oi[uai],on[uan],om 的韵首都有音位[u]。所以,根据音位聚变公式[i]﹢[u]=[y],声母j,q,x,y与韵首为[u]的韵母(u,un,oi,on,om)相拼时,则声母中的[i]音位就与韵首[u]音位聚合变成[y](即/ü/)音。其中,ju,qu,xu,yu就分别读作jü,qü,xü,yü,即在读音上ju,qu,xu,yu分别与jü,qü,xü,yü相同。
(四)消[u]声母及其与含[u]韵母相拼时的音位聚变
本方案将声母b,p,m,f,w称为消[u]声母,并执行如下公式:
b/p/m/f/w+[u□]=b/p/m/f/w+[□]。例如:buoe(波),puo(破),muo(莫),fuo(佛),bon(板),fon(反),won(晚),fom(缝),mui(每),fum(丰),等等。上述公式称为“音位聚变公式”。
(五)/i/音韵母在声母f,w后变读/ei/音
声母f,w与/i/音韵母i,ie,ih,iv,y相拼时,则/i/音韵母变读/ei/音,多用于表示个别消极含意的汉字,例如:fie(非),wie(微),wi(未),fii(废),wih(伪),wy(未)。其他/fei/,/wei/音汉字按照正常拼写法采用/ei/音韵母,例如fei(飞),weie(威),wei(为)。英语中,字母i主要有[i]和[ai]两种读音。原理相同,/i/音韵母在韵首u-之后也变读/ei/。例如,hui(会),gui(贵)。
六、整体认读音节的代码拼式
(一)音节拼式空韵
用/i/音韵母 i,ie,ih,iv,y(ii)表示声母 zh(之),ch(吃),sh(是),r(日),z(自),c(刺),s(私)的空韵时,音节拼式要整体认读。第三声iv表示空韵时可以省略为v。正确的拼式所列如下:【zhi】/zhi/(直):zhie,zhih,zhiv(zhv),zhy;【chi】/chi/(持):chie,chih,chiv(chv),chy;【shi】/shi/(时):shie,shih,shiv(shv),shy;【ri】/ri/(日):ri;【zi】/zi/(子):zie,zih,ziv,zy;【ci】/ci/(此):cie,cih,civ,cy;【si】/si/(思):sie,sih,siv,sy。
(二)音节joi,qoi,xoi,yoi拼式
根据音位聚变公式[i]﹢[uai]=[ye](即i﹢oi=[ye]),将汉语拼音jue,que,xue,yue分别拼写为joi,qoi,xoi,yoi。【joi】/jue/(绝):joie(撅),joih(绝),joiv(蹶),joy(倔);【qoi】/que/(却):qoie(缺),qoih(瘸),qoiv(--),qoii(雀);【xoi】/xue/(学):xoie(薛),xoih(穴),xoiv(雪),xoii(血);【yoi】/yue/(月):yoie(约),yoih(--),yoiv(哕),yoy(越)。
(三)音节loi,noi拼式
本方案直接规定,【loi】/lüe/(略):loy(掠);【noi】/nüe/(虐):noy(疟)。
(四)音节woe,woh,wov,woa拼式
由于uo读[uo](窝),wo是uo的变体,与uo同音,所以本方案规定,【wo】/wo/(我):woe(窝);wo(我);woa(卧)。
(五)音节er,err拼式
【er】/er/(儿):er(--),er(儿、而),er(耳),err(二)。加备方案:【er】/er/(儿):er(儿),ir(而),ur(耳),err(二)。字母组合er是无调形式,单独作音节使用时发“儿”音;但er作为韵母与声母相拼时要读“鹅”音,这时韵母er仍然是无调形式。在实际运用中,也可将er当成一个字母看待。注意:表示儿化音时,要尾缀er。
七、特殊汉字的固定代码拼式
(一)个别汉字拼式的调整和缩写
特别字的微调读音拼式:shenme(什么),meyo(没有),lie(例),di(地),dei(得),heh(和),tin(听),tar(它),mee(末、么)。其中,tar(它)是取自英语近音结构。
规定:de(的)→dh(的);le(了)→la(了)。但是,单字母韵母a在加声调符号标志后一律回归读[a]音。这样规定,是为了避免与英语高频开音结构-le,-de相冲突。
缩写:-menh(们)=-mn(们)。
尾缀以-s表示重叠字,例如dasxaos(大大小小)。
(二)部分高频词和数词的拼写法
高频词:zher(者),dau(到),bav(把),wei(为),q(其),zh(之),zhe或zhe-(这),-zhe(-着)。
数词的拼写法(含特殊拼写法):lim(零),yi(一),err(二),san(三),sii(四),wuv(五),lioa(六),qi(七),ba(八),jov(九),shyh(十),bai(百),qane(千),wano(万),yiie(亿)。
(三)对个别常用字多设一套拼式(兼有方案)
对如下汉字除了采用正常拼写法进行编码外,还另外增加准备如下拼式方案,由用户自主选择使用:
增加用oo[u]表示个别第四声汉字的韵母:boo(部),moo(目),foo(复),woo(物),goo(顾),koo(裤),hoo(户),doo(度),loo(路),zhoo(住),choo(处),shoo(束),soo(素),joo(聚),qoo(觑),xoo(序),yoo(预)。
增加用iie[i]表示个别第四声汉字的韵母:yiie(亿)。
在消[u]声母 b,p,m,f,w 之后:bon(板),fon(反),won(晚),mon(满)。
其他:zhv(只),chv(齿),shv(使),baae(坝),laae(蜡),io(又),i(以),liw(率),yeae(椰),yeah(爷),ea(也),yeav(野),yea(业),yeaa(夜),yiea(液)。