汉语关键节点分词探析
2020-08-17钟经华
[摘要]书写方式的变革要以人为本,适当兼顾计算机信息处理。词式书写不具备理论研究价值,全面分词连写的必要性和可行性都比较低,需要深入的理论研究,实践研究层面难以闯过起步关。我国大陆盲文实行全面分词连写,对盲文编校专业人员的难度非常大,普通盲人更是难以承受。如果对汉字文本仅在专有名词和有歧义的关键节点进行分词,分词率控制在1%以内,对现有习惯冲击小、可行性高、效益大。借鉴藏语的间隔号,比空格的接受度可能更高。关键节点分词可以作为汉语书写变革的目的地,也可以作为向全面分词连写前进的中途点。
[关键词]关键节点;分词;间隔号;盲文
[中图分类号]H126.2 [文献标志码]A [文章编号]1005-0310(2020)01-0070-07
1 汉语书写方式的演变
近代以来,汉字的书写方式在不断地发生演化和改进。从竖排改为横排,符合了双眼水平视野大于垂直视野的生理机制,充分利用双眼视野迅速展开,使整行阅读成为可能。竖排则需要双眼过度聚焦,视觉容易疲劳。
标点符号的成功引入使汉字的书面表达系统不断完善,大大减轻了阅读难度,给人们的学习生活带来了方便。分词连写虽然和标点符号同时进人大众视野,但并未受到同样礼遇。严复率先将欧式书写体式运用于中文,只借用了欧式标点符号而没借用欧式分词连写。胡适等于1915年创办的《科学》杂志,也是将分词连写方式弃置一边,只对标点符号情有独钟[1]。
20世纪50年代初,周有光等曾经仿效歐式分词连写格式排印两个小册子,印出来以后却没有得到公众的认可。1952年,曹伯韩的《语法初步》尝试采用分词连写格式,但出版后社会对此反应平淡,从此学界很长时间不再提此事[1]。
在文言文时代,汉语的文和言是一致的。白话进入老百姓语言生活后,汉语的文和言在很长一段时间内严重脱节。白话文进入书面后,表面上汉语的文和言又一致了,但是,内在的脱节被隐藏了。现代白话中汉语词汇发生了前所未有的变化,双音节词在数量上占绝对优势,单音节词、双音节词、多音节词纷呈并存。在文言文中,表义单位和自然单位都是字。现代汉语的表义单位是词,但自然单位还是字,两者很多时候不一致,甚至有歧义。从这个角度来看,汉语书写方式的演变滞后了。
引进标点符号只能表示语法停顿,仍然无法表示逻辑停顿。是否可以这样认为,当年引进标点符号时,漏了一个最常用的、零标记式的标点符号——空格。虽然汉字对空格的迫切性和拼音文字不在一个层级上,但是现在需要重新考虑把漏掉的空格补上,或者设计一个新的标点符号(也可以转借已有的标点符号),表示逻辑停顿,或者区分歧义结构。新增一个标点符号的难度不是很大,很多未在国家标准正式公布范围的标点符号,也有了实用地位,只是都没有表示逻辑停顿的功能。
2 盲文书写方式的演变
我国与世界上绝大多数国家一样,都采用布莱尔6点符号体系作为盲文基础代码。盲文是记录语言的触觉符号,盲文的外形是国际通用的,没有独立于语言的国际通用盲文。在我国,盲文是汉语盲文的简称。由于布莱尔体系只有63个可用符号,依据触觉特点又只能对其线性排列,无法直接表达汉字复杂的字形结构。最早的“康熙盲字”和后来的“心目克明”都是字字连写,“福州盲字”尝试过分词连写。
20世纪50年代,黄乃先生主持设计的现行盲文脱胎于注音字母和“北方话拉丁化新文字”,其核心为“一般不标调、分词连写”,都源于“北方话拉丁化新文字”。“一般不标调”只能适应初级扫盲,妨碍盲人文化水平的提高。现行盲文不仅记录每个汉字的字音,并且在较高层面上反映汉语的词汇、语法关系,其表义功能大大超越了注音符号。现行盲文摆脱了汉字的附庸地位,基本具备了独立的文字品格[2]。分词连写使汉语盲文的文字形态跃升了一个台阶。
瞿秋白在《中国拉丁化字母》中提出:“凡是意义上连成词的字,都应当连写起来。”[3]但是,这种以意义为基础进行连写的思想在盲文分词连写规则中并没有得到较好的体现。从“康熙盲字”到“心目克明”盲字,再到现行盲文,不仅书写方式发生了由连到分的巨变,基本编码也屡屡更迭,我国盲文在一百多年的历史中产生了两次文化断层。
3 词式书写分析
“词式书写是以词为单位的方式,使词和词之间在书写上有明显的距离,逼真地体现口语词的界线。”[4]汉语的词本来就没有一致的标准,口语词就更没有标准。
3.1 词式书写价值小
词式书写倡导者认为,词式书写节约阅读时间,促进阅读理解,最重要的是帮助大众建立词意识。但是汉语的词是无法说清的,这样建立词意识不可能有效,也是不必要和无益的。假设这是词式书写的优点,也是可以忽略的优点。
规范一致的词式书写有利于计算机信息处理,但是追求技术方便,必须以不影响汉字文本阅读习惯为前提。不能为了信息处理,本末倒置。盲文研究先驱黄乃先生为了捍卫“的”连写,发出过著名的“人不是机器的奴隶”的呐喊[2]。信息处理发展的方向应当是着力挖掘已经自然存在的标注信息,像超链接、字体、颜色以及排版标识等可以用作分词的启发式信息[5],而不是费尽九牛二虎之力进行分词,为计算机服务。况且,任意性极大的“反映口语”的词式书写,恐怕只会给计算机自然语言处理带来纷乱和麻烦。
现在看不出汉语采用词式书写的益处,不能简单草率地提倡词式书写。在诸多基本问题还没搞清楚的情况下,词式书写不免破绽百出、问题丛生。如果把词式书写推广开来,只会给汉语的书面书写增加纷乱[6]。
如果对语言没有科学、理性、客观的认识,就极易被盲目激进的情绪支配。必须充分尊重汉语汉字的文化,切忌在误读汉语汉字的基础上得出片面的结论,提出轻率的改革主张。任何一项语言文字的改革都将给人民、社会、文化和经济带来巨大的影响[7]。
3.2 词式书写难度大
刘开瑛认为,分词的主要困难源于汉语语言学研究中悬而未决的一些“经典”问题,譬如“什么是词”及“词是什么”这两个本体论的基本问题没有解决,词与语素及短语的边界划分就有不可逾越的困难[8]。语法学家弹精竭虑地制定出来的分词标准,可能与普通民众日常语言习惯并不吻合。“蓝天”“白云”这些被大多数语法著作当作词组的双音节结构,绝大多数大学生受访者倾向于将其看成是词而不是词组[9]。
为了区分偶尔遇到的词界混淆,将整个文本进行词式书写,相当于手指扎刺,全身手术。仅仅一个“每X”就会卡住词式书写的命门,其说法无法自圆其说,更无法令人信服。倡导者将“每天”写成一个词,那么诸如“每架”“每张”“每筐”“每人次”“每平方公里”,等等,都可以处理成一个词吗?[6]
“左手”是词典词条,是一个词。那么词典没有收的,例如“左脚”“左胳膊”“左肩膀头”“左鼻孔眼”,是词不是词?关于“老虎”“小虎”“小老虎”,语言学家怎么确定?汉语拼音正词法列出的“老”是单音节前附成分[10],通常的词典仅收录“老虎”为名词。在盲文翻译、盲文语料库加工过程中,人们饱尝了“什么是词、什么不是词”的苦头。还有“鸭蛋”是词,“鸡蛋”不是词,这是不可接受的,不论其中的理论多么高深,在实践面前,任何复杂的理论都是苍白无力的。语言是为广大人民群众生活服务的,不是制造麻烦的。
3.3 词式书写疑惑多
支持者提出的词式书写的意义与价值,理论基础不完备,又没有严谨的实验支撑,反对者对此提出了一些疑惑。
读者面对句式书写的文本时,会感知自己作出的语义分割,面对词式书写的文本时,读者就会按已经间隔好的单位去感知。词式书写的阅读线索零碎而混乱,眼睛不得不多次作不必要的跳动和停顿,给读者制造大量的复视频率。词式书写往往使读者把注意力分散到每一个分隔开的词上,几乎导致点式阅读成为必然,使得线式阅读和面式阅读没有可能实现[7]。
词式书写增加了词之间的间隙,等于把语句分割为一个个区块,从心理上来说,不利于读者心理状态的稳定;从生理上会导致阅读者眼部神经的紧张,延长人眼对文本的注视时间[7]。词式书写脱离语言实际,与阅读效率、理解正确率之间的关系却不明确[11]。
4 分词连写研究
4.1 分词连写的意义
分词连写基本上是以词为单位书写,将符合规定条件的词组或者语法结构连写。分词连写早期称为词儿连写,这是转借了汉语拼音的概念。从概念上看,分词连写与词式书写有本质的不同。分词连写不称每个书写单位都是词,更不是为了帮助大众建立词意识。
分词连写便于阅读理解。在阅读汉字文献过程中,读者需要对语句进行切分和逻辑停顿,绝大多数能够在潜意识中完成,但也存在误分影响语意理解的现象。对于初学者和学习汉语的外国人来说,尤其如此。分词连写能够降低阅读的难度,把精力留给理解深层的内涵,而不是在表层就疲劳和紧张。
1995年,国家科委在开放测试条件下,分词精度最高为89.4%,歧义切分字段处理的正确率最高为78%,地名最高为65%,人名最高为58%[12]。可见,歧义字段和专有名词是自然语言处理的瓶颈。20多年来,专有名词切分的准确率未见实质性提高。人名具有随意性、可变性,独立于上下文的内在逻辑,是最难处理的部分。在分词连写文本中,上述问题将不复存在。建立在统一标准之上的分词文本,对网络搜索、机器翻译等计算机自然语言处理将如虎添翼。
分词连写可以绕开“是词不是词”这个无解的问题,有时候不弄清“是词不是词”也能够进行下去。例如“每X”,认为其是一个词,直接写;认为其不是一个词,词组连写,结果是一致的。分词连写可以对一些习惯性分歧放宽标准[13],例如允许长度不大的词组连写,允许夹杂的文言词单独写,不允许一般的不成词语素单独写。
宋柔主张确定分词单位的下界和上界,即确定哪些情况必须切开,哪些情况必须连写,在保证语法完整性和没有歧义切分错误的情况下,介于两者之间的分词单位可以有较大的灵活性。同时,配合下界整理出一个包含基本词的词表,收集内部不可切分的词[14]。分词连写有一定的自由度和灵活性,这正是分词连写的生命力所在。
汉字同音字非常多,词的同音现象大幅度减少。分词连写对于拼音到汉字的转换是很有益的。反过来,汉字到拼音的转换主要需解决的是多音字问题。在词的环境中,多音字的读音一般是固定的,如“长远”“生长”“银行”“行李”“漂浮”“漂白”“漂亮”等。因此,分词连写对于汉字到拼音的转换也是有益的[15]。
汉盲双向翻译正是汉字与拼音转换及分词连写的过程。假如汉语能够普遍实行分词连写,盲人和盲文使用者是非常欢迎的,盲文出版者更加欢迎,汉语分词连写将非常有利于盲文翻译。更重要的是,分词连写缩小了明盲之间的鸿沟,也可以算作多数向少数的回归,也是残疾人与非残疾人融合的一个进步。
4.2 分词连写困难重重
分词连写文本要有比较高的一致性,才能对阅读理解和信息处理产生实际效益。然而,专家学者从系统性、科学性角度出发制定的词语切分规范,与人们直觉并不一致。人们在日常语言生活中,往往把功能词和实体词看作一个单位,而不是根据国家规范标准来判断。一个汉语结构,日常使用频率越高就越容易被当成是词;所代表的概念自身结合得越紧密,越有可能被当成一个词[16],这与语言学家坚持的语法词的切分标准并不一致。不同学者、不同学派的观点看法及处理方式也不相同。人的语感不同,势必会导致人工分词的结果不一致。在对词语切分的实际操作过程中,如果规范标准的可操作性不强,更易造成切分不一致。这样,每个人按照自己理解分词连写的“词”、语言学家总结的“词”、用于信息处理词库中的“词”,三者很难一致。
60多年来,盲文出版业存在分词结果不一致的现象。例如,有的出版社將“分/钟”分写,盲文分词连写规则规定数词与量词、数词与名词连写。作为规则本身没有问题,为什么会出现这么奇怪的结果呢?原因在于时间名词的认定,因为词典没有收录“分钟”,便不认定“分钟”是时间名词,产生了“十分/钟”的写法。这里将不能独立使用的“钟”分写,完全背离了大众语感。类似情况很多,例如刹那/间、偶然/间、国/内外、之/所以、不得/不、越来/越、清炖/甲鱼、毛遂/自荐、名/落/孙山、马/不停/蹄、胸/有/成竹、脍炙/人口、漠/不关心、近朱者/赤、自/以为/是、前车/之/鉴、化险为夷。
如果汉字文本普遍实行分词连写,全国众多的出版社、报纸杂志社的专业编校人员需要大量培训,培训后能否取得一致效果仍然是一个大问号。如果分词连写的一致性达不到可接受程度,后续的计算机语言处理比按照特定的词库资源直接处理还要复杂得多[16]。对已经分词连写的内部一致性较低的盲文出版物,中科院计算所对其进行深度学习的处理难度确实大于未分词连写的普通文本。实际的汉字分词文本很可能与理想情况大相径庭,对汉语信息化的意义和盲文翻译的意义也同样大打折扣。
孙茂松等指出,分词规范直接影响到词表和分词语料库的质量[17]。然而,研制面向大众的分词规范却是一件非常困难的事。《信息处理用现代汉语分词规范》历经很多专家的深思熟虑,汇集当时学界主流观点之大成,在实施过程中仍有很多困难。在开发语言知识库的过程中,开发者们并不直接使用,而是自行制定各自所需的分词规范,如北京大学、清华大学、台北“中研院”等单位都在各自项目中加入了自己的分词内容[16]。
盲文分词连写规则历经60多年的实践磨炼、多次修改,颁行了两个版本的国家标准,执行起来仍然困难重重,规则本身也存在矛盾冲突。普通盲人、盲校教师等盲文使用者,对于分词连写基本上是跟着感觉走,110多条细则是不可承受之重[18]。如果必须严格遵守那些分词连写细则,普通盲人就没有书面语了。盲文出版专业工作者虽然兢兢业业,努力遵守分词连写细则,但是两个盲文出版社执行的结果却大相径庭,奇奇怪怪的分词现象林林总总,分词乱象是盲文规范化的拦路虎。盲文分词连写实践中遇到的问题,固然与其分词连写规则不够完善及可操作性不强有关,但是其根本原因还是由分词连写本身决定的,汉语分词连写的难度比估计的要大得多。
4.3 习惯阻力难以克服
分词连写不像词式书写那样出现很多奇怪的现象,大众的接受度会高一点。但是,让大众改变现有习惯使用分词连写,可能比分词连写本身的技术难度还大。分词连写的本意是节约阅读时间,促进阅读。有人却说,分词连写延长阅读时间,妨碍阅读的连贯性。为什么会事与愿违呢?这是由新旧习惯衔接中的惯性造成的。分词连写有利于消除一些歧义,但是,不习惯分词连写的人,会在空格中停留相对较长的时间,反而觉得浪费时间,时间的延长又会破坏快速阅读的连贯性[19]。约定俗成是语言文字发展的第一要律,新旧衔接过渡历来是语言文字的头号问题。
由于没有分词连写的大环境,读者隔一段时间才能阅读分词连写文本,每次都需要几个小时的适应期,每次阅读的成本都很高,读者自然不愿意接受。要使读者稳定适应分词连写,需要大量的分词连写读物。然而,分词连写读物生存需要大量适应性读者[20],这是一个无解的循环。在习惯势力面前,技术的进步是微不足道的。双拼盲文具有科学、准确、省方的特点,其推广失败的教训,充分证明了这一点。
目前,赞成实行分词连写的人数不容乐观,要想争取中间派,说服反对派,进而赢得政府和社会大众的支持,以直觉判断为论据是远远不够的[21]。尽管引入标点符号有过成功的先例,使得书面汉语的表义功能更强大,但是对汉语是否要实施分词连写,此举能否提高文本阅读速度,甚至对中文信息处理、盲文翻译等其他应用是否有实质性促进作用,还需要进一步研究。
另外,汉语也确实不需要机械的、千篇一律的分词连写,没有歧义的地方可以大片的连写。浪费纸张的问題暂不讨论,关键是阅读习惯。一个改变语言文字习惯的新事物,即便收获远远大于付出,大众也未必接受。盲文领域也存在分词与不分词之争,汉字分词连写的争辩可以打消盲文分词连写的质疑。支持汉字分词者首先支持拼音文字分词,反对汉字分词者把拼音文字才需要分词作为反对的论据。
5 实施关键节点分词的建议
在汉语文本阅读过程中,歧义性逻辑停顿并非普遍存在,绝大多数集中在铰链词和专有名词上,铰链词是交集型歧义字段(如“学生物”),专有名词包括人名、地名、机构名等。本文将铰链词和专有名词称为关键节点,它们容易形成人读和机读的歧义陷阱,是真正需要进行文本切分的关键节点。
5.1 关键节点分词效益高
关键节点分词仅对确有混淆的节点进行分词,其余部分全部连写。分词的方式是加间隔号,间隔号的形式可以是空格,也可以是新设计标点符号,或者借用已有的标点符号。例如:要将“从前门口”的实际含义明确地表达出来,就需要采用一个间隔号。这个符号有时候是很必要的,是汉语标点符号走向完善的极其重要的一步[22]。
针对现有符号不能完全消除歧义,全面分词又太费事的情况,香港学者胡百华提出,确有歧义的情况,才使用“隔词号”。“隔词号”可以备而不用,绝对不能多用[22]。这个主张比分词连写更理性,更具可行性,但是声音却比较弱。内地学者也有相似观点:“只在个别词界易混的地方采用隔词标志,比如在易混词界间加一竖线。”[23]小学生遇到填空题“我国的煤都是()”,要防范把“都是”当作一个整体来认知,尽管“都是”并非一个词,却是陷阱。有的学生读不出“煤都”,苦闷半天,不得已答成“黑的”。只需在“都”和“是”之间加一个间隔号,就可以为学生减去不应有的负担。
关键节点分词对人读的帮助非常接近普遍分词,对机器处理的帮助虽略小一些,但是突破了瓶颈。在阅读过程中,读者在无意识中完成了绝大多数的分词,需要有意识分词的非常少,有歧义难以分词的少之又少。仅对这少之又少的关键节点进行分词,局部问题局部解决,不对全局大动干戈,使每一个间隔号都有实实在在的价值。不像普遍分词,绝大多数的空格仅有名义价值。
人名、地名复杂多变,无特定标记信息,是造成阅读困难的主要根源。特别是专有名词两端的字与紧邻字可组成常用词时,非常难以区分,甚至无法确定是单字名还是双字名。外国人名、地名误读的可能性也很大。使用间隔号是有效解决办法之一,这时“间隔号”兼有“专名号”的作用,汉语曾经用过下划线(竖排时为左划线)表示专有名词,港台地区目前还在使用。间隔号只告诉读者,边界两侧的字需要分开,至于如何将它们与其他字组合,一般不需要明示。句子中的间隔号不能太多,才能恰到好处,成为一种奇妙的表示比逗号更短的停顿的符号[24]。
除了专有名词以外,间隔号出现率应控制在1%以下,好钢用在刀刃上,要惜间隔号如金。关键节点分词只花1%的精力做有用功,该分的才分,不该分的坚决不分。将工作准确投人到确实需要的关键节点,基本达到普遍分词连写的功效,只改变大众1%的习惯。从投人产出比看,关键节点分词效益非常大。先从关键节点分词起步,作为过渡,循序渐进。如果大众普遍接受关键节点分词,进入实践后逐渐成为习惯,学者再做舆论、理论和技术准备,将来也许全面分词连写能够成为现实。如果大众不接受关键节点分词,学者就没有必要研究全面分词连写的工作了。
5.2 关键节点分词阻力小
仅在关键节点分词,不必考虑一致性问题。目的不是为大众建立普遍的词意识,只在可能发生疑惑的地方提示读者,该处两个相邻的字不要作为一个整体认知,其余地方全连写。关键节点分词不必有复杂的规则。例如:“为了安全,开好车。”不用关心“开好”“好车”是不是词的问题,这里“开好车”的具体含义是什么,是阅读难点,也是盲文翻译的难点。关键节点分词只追求表义清楚,不用等到语言学家辨明白什么是词、什么不是词。如果采用词式书写,“开好车”只能全分,而全分等于全连,并没有消歧作用。关键节点分词简单易行,关键时候能更好地分辨歧义。
胡百华[22]等人系统论述了在发生歧义的结构中采用间隔号,这种应急的办法把有歧义的地方有针对性地解决,没有歧义的地方保持不变。把间隔号用作一个新的标点符号,作者和读者都不需要特别的训练。作者非常清楚其文中的地名、人名,将其区分开只是举手之劳。当然,作者最好避开歧义性铰链词,不能避开时加间隔号,如果作者不易发现之处,应由编校人员添加。如果有漏网之鱼,可在相当长的时间内不算编校差错。
关键节点分词对文本呈现方式的改变微乎其微,对大众的阅读习惯几乎没有冲击,大众的接受度会比较高。但这只是推测,大众是否会普遍接纳,需要较大规模的、科学的试点才能知道。从国家通用盲文推广的实践看,虽然其效益仅在声调上,却非常受盲人的欢迎,其核心是盲人习惯的改变非常小,完全在盲人可接受范围内。
5.3发关键节点分词方式举例
本文结合实例列举5种关键节点的分词方式,以抛砖引玉。
1)空格(1/4~1/2字符),例如:“刘旭同志在四方”“菜市口红苹果宣传画”“需要一个半劳动力”。
2)下划线(虚下划线、双下划线),例如:“内塔尼亚胡说”“芳草地区位优势明显”“已经获得高级职称的和尚未获得高级职称的教师”。
3)上分隔号(1或),例如:“李东和平时爱看书”“东四十条例行卫生检查”“这就是我省税的秘密”“赵有利用空余时间思考技术革新”“蒲黄榆树立垃圾分类典型”“第二机场高速建成通车”。
4)下分隔号(_或.),例如:“张光生.活动力足”“西单.位于繁华中心”“无线电法.国别研究”“请别开_关丽娜身边的窗户”“参与了_解体苏联的活动”。
5)变换字体(加粗),例如:“请别提高万荣离婚的事”“热烈祝贺南京市长江大桥管委会成立”“甜水园林业管理处”。
变换字体或者加粗,计算机内码相同,对人读有利,机读困难。实际上,加下划线、加粗或者变换字体,编校者已经有权这样做,无须另行授权,只要编校者愿意去做即可。扩展下划线的新用法,兼“专名号”“间隔号”功能,对下划线的原有功能冲击也不大。借鉴藏语的隔字号,效果可能稍好些,类似单引号,陌生感不那么强。有时候复杂的词式书写和普通分词连写都无法消除歧义,反而是简单的关键节点分词可以使经典悬疑问题有解,如:“咬死了猎人的狗”“咬死了1猎人的狗”。
周有光先生倡导选词,避免使用同音词,可以使文章读起来漂亮,听起来也漂亮[25],对盲文非常有利。本文倡导选词,避免使用铰链词,可以降低间隔号的使用率,不写出有歧义的句子。例如:把“美国会”改成“美国国会”或者“美国可能”;当前面有“和”的时候,用“未”不用“尚未”,对盲文翻译非常有利。
汉语有望实现关键节点分词,盲文也应向这方面靠拢,盲文是拼音文字,表义能力差,需要再加上义群切分。这样可以大幅度简化目前的分词连写,实现黄乃先生词团式分写的夙愿。
[参考文献]
[1]曹德和.中文分词连写的问题与对策[J].北华大学学报(社会科学版),2006(1):21-26.
[2]黄乃.建设有中国特色的汉语盲文[M].北京:中国社会出版社,1999:150,230-236.
[3]瞿秋白.瞿秋白文集:第3卷[M].北京:人民文学出版社,1989;46.
[4]彭泽润,李葆嘉.语言理论[M].长沙:中南大学出版社,2002:242.
[5]孙茂松.基于互联网自然标注资源的自然语言处理[J].中文信息学报,2011,25.(6):26-32.
[6]杨锡彭.汉语词式书写不可行[J].北华大学学报(社会科学版),20(x6(1):16-20.
[7]李彦苓.词式书写分析[J]、东岳论丛,2007(3):80-83:
[8]刘开瑛.中文文本自动分词和标注[M].北京:商务印书馆,2000:122.
[9]陈松岑.词与非词的界限:有关语法专家标准与群众语感异同的社会调查和分析[C]//首届社会语言学国际学术研讨会论文.北京:北京语言大学,2002.
[10]教育部语言文字信息管理司.汉语拼音正词法基本规则:GB/T 16159-2012[S].北京:中国标淮出版社,2012:3.
[11]袁子渊,朱力.词边界标记浅谈[J].文学教育(上),2014(11):130-131.
[12]冯志伟.汉语书面语的分詞连写[J].语文建设,2001(3):12-15.
[13]陆丙甫,谢天蔚.对外汉语教学中的文本多元化[J].世界汉语教学,2014,28(1):113-127.
[14]宋柔.关于分词规范的探讨[J].语言文字应用,1997(3):111-112.
[15]张小衡.也谈汉语书面语的分词向题:分词连写十大好处[J].中文信息学报,1998(3):57-63.
[16]熊文新.汉语真需要词间空格吗:对汉语分词连写献疑[J].语言科学,2014,13(6):655-669.
[17]孙茂松,邹嘉彦.汉语自动分词研究评述[J].当代语言学,2001(1):22-32.
[18]全国残疾人康复和专用设备标准化技术委员会.中国盲文:GB/T15720-2008[S].北京:中国标淮出版社,2008:14.
[19]彭泽润,马庆株.汉语汉字文本词式书写的心理障碍分析[J].北华大学学报(社会科学版),2007(3):54-59.
[20]彭泽润,周纯梅.汉语需从“字式书写”到“词式书写”的改进:“汉字书写系统改进学术研讨会”综述[J].北华大学学报(社会科学版),2004(6):50-51.
[21]王卫兵,中文分词连写可行性考察[J].北华大学学报(社会科学版),2006(1):27-31.
[22]胡百华.汉文需要“隔词号”[J].语文建设通讯,1998(10):52-57.
[23]林廉.汉字分词连写质疑:与讥玉烛同志商榷[J].语文建设,1993(5):17.
[24]曹季南.再论按意群分割的词义空格格式[J].语文建设,1999(5):30-32.
[25]周有光.汉字改革概论[M].北京:文字改革出版社,1961:295.
(责任编辑 白丽媛)
[收稿日期] 2019-09-04
[基金项目]国家社科基金重大项目“汉语盲文语料库建设研究”13&ZD187)。
[作者简介]钟经华(1962-),男,山东昌乐人,北京联合大学特殊教育学院教授,主要研究方向为盲文。E-mail:zhongjinghua@buu.edu.cn