五笔输入法和拼音输入法的认知效率比较
2013-04-20方燕红张积家
方燕红,张积家
(1.井冈山大学教育学院,江西 吉安 343009;2.中国人民大学心理学系,北京 100872)
拼音输入法和五笔输入法是采用最普遍的两种汉字输入方式。拼音输入法,如智能拼音、紫光拼音、搜狗拼音、全拼等,以汉字字音为基础,实行音码输入。把每个汉字的读音拆分为键盘上的字母(即音码),只要知道汉字读音就可以拆分音码,输入汉字时依次输入音码即可以实现汉字输入。大多数计算机使用者使用拼音输入法。五笔输入法,如极品五笔、万能五笔、王码五笔、陈桥五笔等,以汉字字形为基础,实行形码输入。把每个汉字拆分为若干个部件,每个部件给定一个代码(形码),把这些形码分组定义到计算机的英文键盘上。由于五笔输入法对汉字的拆分顺序、编码规则等作了严格规定,只需要按规则依次输入部件代码(对应的字母)即可实现汉字输入。五笔输入法是汉字专业打字的首选。
两种输入法孰优孰劣?这一问题一直为研究者所关注。目前,主要有三种观点:(1)拼音输入法优于五笔输入法。认为拼音输入法简单方便、不容易忘记,有利于汉字拼音的教学。王文弼等人(1998)采用实践操作和理论计算相结合的方法,比较了新智慧全拼输入法和智能五笔输入法的输入效率。结果发现两种输入法均需要大量的时间?才能掌握;在有限的训练时间下,全拼的输入速度和正确率高于五笔;智能五笔的记忆难度大于全拼,且更容易遗忘。[1](P1-4)(2)五笔输入法优于拼音输入法。认为五笔输入法重码率低、效率高,可以实现盲打,有利于汉字字形的教学;[2-3](P11-13)(3)两种输入法各有优缺点。认为拼音输入法的主要优点是易学,可以打出不会写的字,只要会发音即可,且通过系统预先定义的词组有效地排除错字、白字等;缺点是重码率较高,尽管可以通过词组和语句减少重码,但对一些生僻字和单字的输入速度较低。五笔输入法的优点是重码率低,可以打出不认识的字,只要能写即可;缺点是编码规则和拆分规则复杂,难学难记。拼音输入法较适用于具备基础文化素质的人处理现代汉语,而五笔输入法则可适用于不会普通话和汉语拼音的人;[4](P25-29)全拼和五笔的理论输入速度没有显著差别。[1](P1-4)三种观点均有一定数量的支持者。
从王文弼等人的实验研究至今,两种汉字输入法均得到不断改进,输入效率均大有提高。在信息爆炸、生活节奏明显加快的今天,汉字信息处理者若能在两种输入法中优中选优,则更有利于提高工作效率。但是,哪种输入法是优中之优?由当前的研究来看,仅从计算机科学角度来探讨此问题,恐怕仍难以得到令人信服的答案。其实,从认知科学的角度来看,汉字输入是一种认知过程,涉及字形识别、语音编码、词义提取、短时记忆存储等一系列认知活动。因此,从认知角度来设计实验,探讨五笔输入法和拼音输入法的不同,揭示两者的认知效率的差异,则能为两种输入法孰优孰更优提供更充分的实验证据,进而为汉字输入者选择输入法提供启示。我们认为,输入速度、输入的错误率、错误检出率、写作效率等应是考察五笔输入法和拼音输入法认知效率的重要指标。本研究将通过录入文章、检查错误、主题写作任务来比较两种输入法的认知效率。
一、方法
(一)被试
拼音输入法被试和五笔输入法被试各20人。
通过2个阶段选取被试。(1)开放式的问卷调查。向大学生及研究生发放800份问卷,要求填写年龄、性别、计算机使用年限、每天使用计算机的估计时间和每天输入计算机的估计字数、惯用的汉字输入方式、语文水平、普通话水平等信息。共收回758份问卷,其中,惯用五笔输入法的被试273人,占36%;惯用拼音输入法的被试485人,占64%。进一步统计显示,在使用五笔输入法的被试中,惯用极品五笔输入法的被试比例最大,占47%(共128人),其次为万能五笔,占25%,其他种类的五笔输入法被试占28%;在惯用拼音输入法的被试中,使用搜狗拼音的被试比例最大,占32%(共155人),其次为紫光拼音和智能ABC输入法各占20%,其他种类的拼音输入法被试占28%。因此,分别选用比例最大的极品五笔和搜狗拼音输入法作为预实验和正式实验的输入法;惯用极品五笔输入法的128名被试和惯用搜狗拼音输入法的155名被试参加语文水平和普通话水平的自我评定。评定采用5点量表进行,1表示语文水平或普通话水平非常低,5表示语文水平或普通话水平非常高。选取计算机使用年限、每天使用计算机时间和输入计算机字数、语文水平、普通话水平等方面信息相当的极品五笔输入法被试37人和搜狗拼音输入法被试25人参加下一阶段的预实验。
(2)预实验:键盘输入速度和击打键盘正确率测试。利用打字速度测试软件,考察62名被试对键盘的熟练度和击打键盘的正确率。要求被试在5分钟内将计算机屏幕上的一级简码或字母 (音码)重新输入计算机,一级简码在键盘上的位置与字母一致,出现顺序也一致。伪随机安排简码和字母以防止连续敲打同一个键。由于每输入一个简码就需要击打两个键 (简码对应键和空格键),而每输入一个字母只需要击打一个键 (字母对应键),因此给拼音输入法被试呈现的字母材料中每两个字母之间有一空格,以平衡两组被试输入同样数目材料所需击打键盘的总次数。统计每名被试5分钟内正确输入简码(字母)的总量。最终选取五笔输入法和拼音输入法被试各20人参与正式实验,构成五笔输入组(简称为五笔组)和拼音输入组(简称为拼音组)。
五笔组男生11名,女生9名,平均年龄22.6岁,平均使用计算机时间6.6年,自评语文水平和普通话水平分别为3.53和3.39;拼音组男女各半,平均年龄22.5岁,平均使用计算机时间为6.6年,自评语文水平和普通话水平分别为3.59和3.40。t检验表明,两组被试的平均年龄、平均使用计算机时间、平均自评语文水平、平均自评普通话水平差异均不显著,p>0.05。五笔组对键盘的平均熟练程度为113个形码/分钟,拼音组对键盘的平均熟练程度为111个音码/分钟。t检验表明,两组被试对键盘的平均熟练程度差异不显著,p>0.05;五笔组击打键盘的平均正确率为96.32%,拼音组击打键盘的平均正确率为95.89%,差异也不显著,p>0.05。
(二)材料
两篇没有专业倾向的文章,文章中字词均为常用字词。文章Ⅰ没有文字错误,共有1728个汉字,文章Ⅱ共有1395个汉字,60个错别字散布于其中,30个为形误字,即错别字与正确字形码接近,甚至字形也接近,如“未”和“末”;30个为音误字,即错别字和正确字音码(读音)相似,如“中”和“种”。
(三)程序
使用Delphi程序软件编程。Delphi是由Inprise公司推出的可视化编程环境,它提供了一种方便、快捷的 Windows应用程序开发工具。[5]材料呈现在1024×769显示器中央。delphi程序自动控制材料的呈现及呈现时间,被试按“开始”按钮就可以开始实验,到规定时间程序自动停止,并执行下一任务。
任务1:文章录入。在计算机屏幕上呈现文章Ⅰ,要求五笔组被试使用极品五笔输入法、拼音组被试使用搜狗拼音输入法又快又准地把屏幕上的文字重新录入计算机,时间限定在10分钟。完成后,储存每位被试输入文章的文档,统计两组被试的平均输入字数(速度)、输入错误字数及错误类型。
任务2:错误检查。检查两篇文章中的错误。一是把任务Ⅰ中两组被试输入文章的文档提取出来,要求被试在5分钟之内尽快检查出自己输入文章中的错别字,结束后另存文档,并与被试输入的初始文章比较;二是在计算机屏幕上呈现文章Ⅱ,要求被试在5分钟内尽快检查出文章中的错误。统计两组被试查出自我输入文章和文章Ⅱ的错误字数和漏查的错误数及错误类型。
任务3:主题写作。指定主题,要求被试10分钟内在计算机上写出一段话,字数越多,内容越丰富、结构越完整越好。统计两组被试写作的字数和命题数。预调查表明,“我的专业”是一个各专业被试都有内容可写的主题。Ericsson和Kintsch[6](P211-245)、朱晓斌和张积家[7](P555-558)认为,命题可以视为构思和表达中一个有意义和有组织的基本单位,由关系词和主题词组成。只要从意义上能构成一个判断或传达一个较完整的信息,或能说明时空变化的短句,即为一个命题。例如,在下句中,用“/”符号分隔成 2个命题:“4月 5日/是我校一年一度的春游”。实验结束后,5名心理学研究生分别计算每名被试写作的命题数及字数,取平均数作为每名被试主题作文的命题数,求出五笔组和拼音组的平均命题数及总字数。
二、结果与分析
五笔组和拼音组被试输入指定文章Ⅰ的速度和错误情况见表1。
t检验表明,在10分钟之内,五笔组平均输入的汉字数(474.20)显著多于拼音组(378.70),t=2.38,p<0.05,表明五笔组的汉字输入速度显著快于拼音组。两组被试输入的错误字数分别为37和33,t=0.002,p>0.05,差异不显著。从输入错误数和错误类型看,五笔组输入的形码混淆错误 (简称“形误”)比例大,音码混淆错误(简称“音误”)比例小,差异显著,t=14.23,p<0.01;拼音组输入的音误比例大,形误比例小,差异显著,t=18.83,p<0.01。对两组被试输入错误比例的差异性检验表明,五笔组比拼音组出现了更多的形误,t=10.81,p<0.01;拼音组比五笔组出现了更多的音误,t=16.69,p<0.01。
表1 五笔组和拼音组输入指定文章Ⅰ的速度和错误情况
五笔组和拼音组被试对自我输入文档错误检查情况见表2。
表2 五笔组和拼音组检查自我输入错误的情况
比例差异显著性检验表明,对自我输入的错误,两组被试的检出率均显著大于漏查率,t五笔=9.58,p<0.01,t拼音=11.33,p<0.01。 两组被试的检出率差异不显著,t=1.87,p>0.05。拼音组检查出所有的形误字,却容易漏查音误字,t=14.85,p<0.01;五笔组检查出所有的音误字,却容易漏查形误字,t=8.73,p<0.01。
由于被试输入文章时可能就已经获得了对文章整体意义的理解,因而在检查自己的输入错误时,容易忽略文中的文字错误。为进一步考察拼音组和五笔组被试检查音误字和形误字的差异,选用文章Ⅱ,要求被试在5分钟之内找出其中的60个错别字。结果见表3。
表3 拼音组和五笔组检查指定文章错误的情况
拼音组和五笔组检出错误的平均数分别为32.25个和30.85个,漏查错误的平均数分别为27.75个和29.15个,基本相当。检出率差异显著性检验表明,五笔组对音误字检出率高,对形误字检出率低,差异显著,t=2.78,p<0.01;拼音组对形误字检出率高,对音误字检出率低,差异也显著,t=2.81,p<0.01。对两组漏查率的差异显著性检验表明,拼音组对音误字漏查率高于五笔组,t=2.58,p<0.05;五笔组对形误字漏查率高于拼音组,t=2.95,p<0.01。
在10分钟之内,拼音组和五笔组被试写作的平均字数和平均命题数见表4。
表4 拼音组和五笔组写作的平均字数和平均命题数
统计检验表明,在10分钟之内,五笔组写作的平均字数(402)显著多于拼音组(321),t=2.17,p<0.05;五笔组产生的平均命题数(31)也显著多于拼音组(24),t=2.06,p<0.05,五笔输入法更有利于写作效率的提高。
三、讨论
文章录入的结果表明,五笔组的输入速度快,拼音组输入速度慢。主题写作任务表明,在规定的时间内,五笔组比拼音组写出了篇幅更长、内容更丰富的作文。整个研究表明,五笔输入法的认知效率高于拼音输入法,五笔输入法有助于提高计算机汉字处理的效率。所以如此,与两种输入法自身的特点有关,也与使用者的字词心理表征差异有关,还与输入法占用使用者的工作记忆的不同成分有关。
(一)关于拼音组和五笔组录入文章的速度和错误类型的差异
五笔输入法和拼音输入法自身的特点导致拼音组被试汉字录入的速度慢,容易出现音误,五笔组被试文字录入的速度快,容易出现形误。拼音输入法以汉字字音为基础,实行音码输入。由于汉字同音字多,拼音输入时音码的重码率高。如输入音码shi,共显示173个汉字,常用汉字达40个,如时、是、事、实等。要输入正确汉字就必须在众多显示项中选择,因而反应时必然长;而且,选择项越多,时间就越长,且容易发生选择错误,出现以字音相同但字形或字义相去甚远的别字代替正确字的情况。不仅如此,汉语词组或短语共用音码的现象也很多,如输入wubi,共显示五笔、舞弊、务必、勿必等词组,也必须在显示项中选择正确词组。五笔输入法以汉字字形为基础,实行形码输入。由于五笔输入法对汉字的拆分顺序、编码规则等作了严格规定,只需按规则依次输入部件代码(对应的英文字母)即可实现汉字输入[8](P58)。 每个汉字都有独特的字形结构,这就意味着每个汉字都有特定的输入形码,因而汉字输入时形码的重码率低,可以实行盲打,较少在多个显示项中作选择,保证了较高的输入速度和正确率。另外,形码输入时编码长度短,击键次数少,有的汉字可以一键输入,音码输入时编码长度长,击键次数多,大多数汉字需要击打3个以上的键。这种编码长短的差异也影响五笔输入法和拼音输入法的效率,导致五笔输入的输入速度快。但是,由于汉字数量庞大,结构复杂,键盘上的每一个字母键都对应多个部件代码,当五笔输入者只输入一、两个代码时也易出现错误,用第一、第二代码相同的别字代替正确字,发生形码相近但字音和字义相去甚远的错误。
(二)关于拼音组和五笔组错误类型检查的差异
拼音输入组和五笔输入组被试心理表征的差异导致错误类型检查的差异。研究表明,汉字短时记忆有语音编码、词形编码和语义编码三种方式。[9](P166-173)拼音输入法主要采用语音编码,五笔输入法主要采用字形编码。对于汉字的词汇通达,已出现了三种不同的模型:(1)语音转录模型。认为字形只有和语音联系才能表达意义。语音激活是通达词汇的必要条件。汉字虽是表意文字,但形声字占绝大多数,在识别中不可避免地要激活语音。(2)直通假设。认为汉字是表意文字,字形表意作用大。汉字识别是由形达义。(3)双通道模型。认为加工者可以经由两种方式得知汉字的意义:一是由形达义,二是经过语音转录。两条通道平行地发挥作用,并且具有竞争性。[10](P1382-1387)
在检查文章错误时,被试需要根据上下文确定汉字的意义,进而识别错别字。拼音组被试阅读理解时主要走形→音→义的通路,五笔组被试主要走形→义通路或经由双通道来提取词义。不同的汉字编码方式和汉字识别过程,导致两种输入法的使用者在阅读文章或句子时对即将出现的文字形成不同预期。拼音组被试主要产生语音预期,阅读时字词的语音表征得到激活,语音相近(同)的字由于符合预期,会使他们对这种错误不敏感,容易忽略;字形相近的字由于和正确字的语音相去甚远,不符合预期,因而导致他们对这种错误敏感,容易检查出这种错误。五笔组被试在阅读中主要产生词形预期,阅读时词形表征得到了激活。具有共同形码的词形相近的错别字由于符合词形预期,会使五笔组被试对这种错误不敏感,因而容易忽略;而语音相近(同)的错误字与正确字之间词形相差太大,导致五笔组被试对这种错误敏感,容易察觉这类错误。
(三)关于拼音组和五笔组主题写作的差异
Baddeley认为,人的工作记忆由中央执行系统 (Central executive)、 语音回路(Phonological loop)、视空间画板(Visuo-spatial sketch pad)和情境缓冲器(Episodic buffer)组成。[11](P239-241)中央执行系统负责各子系统之间的联系以及它们与长时记忆的联系,管理注意资源并选择策略。语音回路负责以声音为基础的信息的储存与控制。它由两部分组成:一是语音储存,语音代码可以对词保持约2毫秒;二是发音控制,通过默读复述防止语音表征消退。对书面语言和图形,发音控制装置可将其转换成语音代码。视空间画板负责处理视觉空间信息,把心理表征与物体或视觉语言符号核对,识别物体或视觉语言符号。[12](P1012-1024)
写作是一种复杂的认知活动,涉及许多子目标的认知加工。工作记忆与写作关系密切。[7](P555-558)在写作时,作者一边在头脑中构思命题,一边遣词造句,将构思好的命题输入计算机。由于人常需要借助于语音进行思维,因此命题构思需要采用语音加工形式,占用语音回路中的认知资源。认知负荷理论认为,问题解决和学习中的各种认知活动均需要消耗认知资源,若所有活动需要的资源超过了个体拥有的资源总量,会引起资源分配不足,从而影响学习或问题解决的效率。同时进行的两项任务需要的资源若超过人的资源总量,两项任务的成绩将会下降。特定任务资源理论认为,人的认知加工资源或能量是具体的。不同性质的任务可以同时并存,人们可以轻易地同时完成两种性质不同的任务,一旦任务性质有相交或叠加,干扰就会产生。[13](P112-116)这样,在汉语写作中,命题构思和字词输入之间将发生相互干扰。字词输入干扰命题构思,致使命题构思得到的资源少,因而构思过程慢,构思出来的命题少;命题构思也会干扰字词输入,导致字词输入过程得到的资源少,打出的汉字数量也少。字词输入过程因为被试的字词编码方式不同而占用工作记忆的不同成分。五笔组被试在命题构思时占用语音回路的资源,字词输入时采用词形编码方式,占用视空间画板的资源。这样,五笔组被试的命题构思和字词输入分别占用工作记忆不同成分的认知资源,两者之间无须进行竞争,相互间的干扰就小。拼音组被试命题构思需要占用语音回路的资源,字词输入时由于采用语音编码方式,也占用语音回路的资源,两种任务竞争同一种工作记忆的资源,因而相互干扰就大。这一差异导致五笔组比拼音组在用计算机写作时能够得到更多的加工资源,因而能够更顺利地加工,能构思出更多的命题,击打出更多的文字。
本研究表明,相比于拼音输入法,五笔输入法具有更高的认知效率。这一结果与王文弼等人的研究不同。原因在于:王文弼等人的测试对象是没有经过任何键盘输入训练,既不会英文打字,也不会汉字输入的大学生。因此,在有限的训练时间内,拼音组大学生头脑中已有的汉语拼音知识必将有助于其较快地掌握拼音输入法,提高汉字输入速度,显示出拼音输入法的优势,而五笔组大学生头脑中未存有任何关于形码拆分的知识,需要从最基本的拆分规则学起,学习时间长,容易遗忘;本研究的测试对象是具有多年汉字输入经验,对键盘、音码或形码均非常熟悉的大学生。由此我们可以认为,汉字输入训练的初期拼音输入法有助于提高输入效率,当汉字输入者对拼音输入法和五笔输入法熟悉程度相当的情况下,五笔输入法更有助于提高输入效率,提高汉字处理的整体认知效率,是两种汉字输入法中优中更优的输入法。
本研究结果对学校的计算机教学、对计算机使用者选择输入法有重要启示。尽管汉字输入法训练的开始五笔输入法具有一定的难度,但随着使用者对五笔输入法的熟练程度的提高,五笔输入法越来越有助于使用者汉字处理的效率。因此,在教学中,教师应加强学生的五笔输入的训练,这既有利于学生掌握汉字的字形结构,提高学生汉字的正字法意识,也有助于提高学生计算机使用的认知效率。
四、结论
(1)在使用者对两者输入法熟练程度相当的情况下,五笔输入法比拼音输入法具有更高的认知效率。
(2)教学中应加强学生的五笔输入法的训练。
[1]王文弼,廖建桥.对两种汉字编码输入法效率的比较研究[J].人类工效学,1998(4).
[2] Zheng C,Kai-Fu Lee.A new statistical approach to Chinese pinyin input.ACL-2000.In The 38th Annual Meeting of the Association for Computational Linguistics.Hong Kong,2000.
[3]李炜,贾庆成,刘政怡.汉语拼音输入法中拼音流的切分[J].现代计算机(专业版),2007(8).
[4] Tong H, Jin L.Recombinant Chinese pinyin system for efficient processing of information in Chinese[J].Computer Standards & Interfaces,1998(20).
[5]刘瑞新,汪远征,李凤华.Delphi程序设计教程[M].北京:机械工业出版社,2005.
[6] Ericsson K A,Kintsch W.Long-term working memory[J].Psychological Review,1995(2).
[7]朱晓斌,张积家.工作记忆与小学生文本产生、书写活动的关系[J].心理科学,2004(27).
[8]许军亮.如何才能运指如飞——谈谈五笔字型录入[J].办公自动化,2007(105).
[9] 莫雷.关于短时记忆编码方式的研究[J].心理学报,1986(18).
[10]张淸芳.汉语单音节词汇产生中的激活反馈[J].心理科学,2006(29).
[11]鲁忠义,杜建政,刘学华.工作记忆模型的第四个组成部分——情景缓冲器[J].心理科学,2008(31).
[12]张积家,陆爱桃.语音回路和视空间模板对音位流畅性和语义流畅性的影响[J].心理学报,2007(39).
[13]刘丽,李辉.认知负荷和控制性注意对工作记忆广度任务成绩的影响[J].心理与行为研究,2008(6).