APP下载

速度与激情之输入篇

2015-09-10陈捷

中国信息技术教育 2015年15期
关键词:输入法键盘语音

编者按:如果时光倒流回二十年前,五笔字型和WPS就代表了计算机。在当时网络还不普及的时代,能在计算机上打出一串串文字,就代表了你是一个计算机高手。而现在我们整天都在键盘上敲敲打打,把心里的想法变成文字。可大家有没有想过,为什么敲击键盘可以输入文字呢?除了键盘,有没有其他办法输入文字呢?甚至意识是不是能控制计算机呢?在此,主持人和嘉宾将分两期对这一问题进行深入探讨。

主持人:

陈 捷 广东省四会中学

嘉 宾:

金 琦 浙江师范大学附属中学

邱元阳 河南省安阳县职业中专

输入的“速度与激情”

在当今社会,“又好又快”几乎成了人类完成各项任务的基本准则。时光回溯,从最早的穿孔纸带到后来得到人们普遍推广的键盘输入或者高级语音读入等都可看出一点:人们在致力于更改输入方式以方便各类人群使用的同时,也积极不懈地钻研如何提高输入的速度。特别是在各种输入技术异军突起的今天,不同个体的输入需求几乎都得到了满足。所以,创造者们的开发激情就更加倾向于后者。如何在日益注重效率的现代化发展时期占据一席之地,赢得这个充满激情的比赛?输入也有“速度与激情”?我们严阵以待!

陈捷:硬件优化——为爱车提一个档次

看过电影《速度与激情》的朋友们都知道,一部亮瞎观众眼的跑车在电影里绝对是百分之百的点睛之笔。如果主人公驾驶一辆奇瑞QQ在迪拜塔上穿来穿去,这是一万个毕加索也不能画出的诡异。可见,一部好车是决定胜负的关键,同理,磨刀不误砍柴工,要提高输入速度,优化的硬件条件也是不可或缺的。下面将以键盘和手写板为例说明硬件优化对输入速度提高所发挥的作用。

1.键盘优化

为什么键盘键位这么安排?早在1714年,打字机上就出现了键盘。在1868年,克里斯托夫·拉森·肖尔斯获得了打字机模型专利,几年后又首次规范了键盘,也就是现在的QWERTY键盘。

很多人开始学习使用键盘时会觉得奇怪,为什么每个键都处于这么奇怪的位置?不能按字母顺序排列吗?这样会不会大大降低学习成本?原来,最早的打字机的键盘就是按照字母顺序排列的,但打字机是全机械结构,如果打字速度过快,某些键的组合很容易出现卡键问题,于是肖尔斯将最常用的几个字母安置在相反方向,最大限度避免卡键,取得了良好的效果。从此QWERTY键盘开始流行。

现在的机械技术已大大提高,肯定不会出现卡键的现象。那么键盘键位安排能不能进一步改进?1936年,August Dvorak教授设计了德沃拉克(DVORAK)键盘方案。DVORAK键盘布局原则是:①尽量左右手交替击打,避免单手连击;②越排击键平均移动距离最小;③排在导键(食指)位置处的应是最常用的字母。这种方案按照理想化的击键率分布设计,打字速度提高了近乎一倍。但是,因为QWERTY键盘如此深入人心,大家都不愿意为此改变使用习惯,所以只有极少数专业场合使用DVORAK键盘。

2.手写板优化

手写绘图输入设备对计算机来说是一种输入设备,最常见的是手写板,其作用和键盘类似。当然,基本上只局限于输入文字或者绘画,也带有一些鼠标的功能。在手写板的日常使用上,除用于文字、符号、图形等输入外,还可提供光标定位功能,从而使手写板可以同时替代键盘与鼠标,成为一种独立的输入工具。手写板先后经历了三次重要变革。

第一代电阻手写板:电阻手写板主要由两层薄膜构成,其中上层薄膜可以轻微变形,下层固定不动。用手写笔触压上层薄膜并使之变形时,会与下层的薄膜接触,这样就可以判断手写笔的轨迹了。虽然工作原理简单、成本低廉,但使用者必须用力书写才能有较好的识别效果。这样一来,用的人很累,手写板也容易损坏,因此很快就被淘汰了。

第二代电容手写板:电容手写板在技术上做了很多改进,但使用时仍需用力书写,因此没有得到市场的广泛认可。

第三代电磁手写板:电磁手写板采用了目前最先进的电磁压感技术,使用时即使手写笔没有接触手写板,计算机也能感应到手写笔的位置,记录书写的笔迹。这意味着在单位时间里用户可以书写更多的内容,大大提高了使用者的输入速度,同时手写板的使用寿命也延长了不少。

邱元阳:识别判断——你的专用卫星导航

一部好车是赢得比赛的充分条件,但不是必要条件。车再好,不会走、走错路也是白搭,一不小心还会遇到世纪大塞车。所以,我们需要一个专业的卫星导航系统,为我们识别各种路面情况,从而决策出可行之路。同理,各种设备的输入信号,最终都需要计算机能够识别出来才会有意义,因此各种新型的输入方式,实际上就是识别能力的比拼。精准的输入识别判断能力,是我们独一无二的分析系统,提高识别能力有助于更加精准判断。

1.文字识别

除了传统的键盘打字,还有手写输入、语音输入、光电识别等,但由于它们在效率和识别率上还存在很多问题,所以仍然需要不断地改进。

手写输入的识别已经达到很高的程度了,它成熟地应用于手机、平板、手写笔等设备上。但手写输入的效率仍然不高,输入很慢,主要使用群体是不会打字的老年人。

光电识别(OCR)经过这么多年的发展,已经非常成熟了,而且不再依赖于扫描仪扫描图片,可直接用手机拍照,针对现有的图片甚至PDF文档等,都可以完成文字识别,识别率也能让人满意。但是目前对复杂背景下文字的识别、特殊字体文字的识别、手写稿文字的识别,还有很多问题没有完全解决。例如,有些彩色文稿,文字和背景看起来区分非常明显,但是在黑白和灰度模式下,它们却可能没有任何区别,完全混为一体了,甚至在图像处理软件中进行阈值调整都无法分开,识别软件往往就更无能为力了。

值得一提的是,对有些特殊的图案,软硬件可能会拒绝扫描、复印和打印。例如,钱币,在一些扫描仪和打印机、复印机上,以及Photoshop等软件上,就会拒绝进行扫描、复印、打印操作。这是因为各国新版纸币都统一使用了一种名为“EURion星座”的不易觉察的小记号,由五个圆环按照猎户星座(Orion)排列,在纸币上多处分布,最早在10欧元(EUR)纸币上使用。例如,施乐复印机就是如此,当发现这种记号后便拒绝打印、复印,以提高对制造假钞的防范。

2.语音识别

语音输入目前也已经广泛使用,百度网站的手机版上,就可以直接用语音来输入要搜索的内容,系统会自动识别成文字。QQ的语音输入中,也有语音识别功能,方便计算机用户不能听到声音时直接翻译成文字。微软的Windows系统和Office软件也都集成了语音输入功能,不仅能进行语音识别,还能直接使用语音指令,以及把文字朗读为语音。国外的IBM、国内的科大讯飞,都是语音识别领域的佼佼者。TTS引擎还可以被第三方软件直接使用,实现计算机语音功能。例如,“朗读女”软件,本身就非常小,只是借用了现成的TTS来进行语音合成,当然这还需要一定音色和语言的语音库,语音库就非常大了,如果再需要男声、女声、童声,不同人的音色,甚至不同的方言,语音库就需要很多个。目前的TTS已经非常成熟,效果接近人声,但是语调、音变、连读等还不尽人意,仍有生硬的机器感。

无论是文字转换成语音,还是语音转换成文字,在语音输入的领域之外,也还有其他用武之地。例如,将会议录音、采访录音、评书播音等内容快速整理成文字,以及计算机配音、机器对话、电子朗读等。

3.图像识别

相较前两种识别方式而言,图像信号的识别要复杂一些,因此常常可以作为一种安全机制。图像输入一般通过摄像头、扫描仪、数位板、指纹器等设备实现,一般的图片不需要识别,特殊情况下才需要识别。例如,指纹识别、人脸识别、瞳孔识别等,这些特征因为不容易模仿和造假,可以作为安全措施采用,广泛应用于考勤、门禁、加解密等领域。图像识别是采用图像比对的方式进行的,宽严尺度通常可以设定,阈值设置高,识别控制严,但可能会造成经常识别不通过;阈值设置低,识别率高,但可能造成误识别,形成安全漏洞。

一般的图像输入设备,都是接收光信号,一次成像,但数位板和一些指纹识别器却例外,它们接收的不是光信号,而是压力感应。这个特点可以使数位板模拟真实的运笔压力,从而还原绘画图案,在CG领域广泛使用。熟练的设计师可以像在纸上一样,在数位板上进行草图创作,后期再进行计算机处理。

金琦:输入法改良——你会抄小路吗

从A到B的路径不止一条,选择最短的路径可以让我们更快到达目的地。同样,对于不同文字的输入,使用不同的输入法就相当于选择了不同的方向和不一样的道路,很大程度上影响了你的平均输入速度。当然,对于那些只有极少由单字复合而成的语言,键盘按键的数量是足以覆盖单字的范围的。但对于类似于汉语这样拥有几万个单字的语言,想要使用有限的键盘按键又快又好地复合出独一无二的字形来,一套完整的输入规则显然十分必要。使用不同的输入法对输入速度的影响也是巨大的。我们将以汉字输入为例,详细介绍不同的输入法对输入速度的影响。

提起中文输入,这是每个使用计算机的人都必须具备的一项技能,不管是用汉语拼音,还是五笔字型以及各种各样的输入法,输入中文总不像输入英文那样方便,这也是每个中国人用计算机时遇到的第一个问题。中文信息处理中的汉字输入问题一直是国内计算机工作者为之付出不懈努力的一个关键问题,由于汉字属于方块字,同音字多、字符集大,为计算机汉字的输入增大了难度,虽然不懈努力的结果有了从五笔字型的一枝独秀到后来的“万码奔腾”,可以说是前仆后继,但这个问题到现在也没有得到彻底解决。

中文输入有着非常长远的历史,在DOS时代,中国人为了解决计算机处理中文的问题,开发出了DOS中文系统,这种系统的主要功能就是解决汉字的输入、处理、输出三大难题,人们在中文输入方面的研究也花费了大量的精力。中文输入编码曾是中国计算机史上的热点,以至出现了各种各样的输入法争霸天下的局面,特别是1993年、1994年被称为“万码奔腾”的时代。当时主要有三种设计思路,即音码、形码和音形码,五笔字型堪称形码中的代表,由于输入速度快、重码率低,至今仍一直作为专业输入人员的首选,其他一些如郑码、钱码、肖码、太极码、黄金码等,并没有广泛流行开来得到应用,还有一些方法力图从输入技术上做文章,如数字小键盘输入、鼠标输入等。总之,人们对中文输入的研究一直没有停步。

1.五笔字型输入法

解决汉字输入的一个早期方法是将每一个汉字对应一个唯一的四位数数字,这就是区位码,使用这种方法的人需要大量记忆,可以说是种死记硬背的方法,输入速度不能满足要求,与之规则相似的编码中还有电报码等。以五笔字型为代表的输入方式是通过机械的方式对笔型进行编码,俗称型码,它将通过拆分后的汉字字根分布在英文键盘的每一个键上并尽可能地减少重码,为了大量地输入汉字提高输入速度,人们不得不记住许多枯燥的规则,这种方法适合专业的录入人员使用,能极大地提高录入速度,但对一般的计算机使用者来说,它的学习难度较其他方法要大很多,必须经过专门的培训才能真正掌握,而且一旦长时间不用很容易忘记。五笔字型一度成为人们热衷学习的输入技术,甚至学习五笔字型也被异化为学习计算机技术的代名词。

2.拼音输入法

当然,最基本、也是最普遍使用的还是依照汉语拼音规则制定的拼音输入法。汉语拼音是一种标准的而且是人人掌握的汉字注音方式,所以在计算机汉字输入方面的使用极为普遍,尽管其存在输入速度慢、各地方言发音不准等问题,但在实际的计算机使用中还是起到了巨大的作用。

后来出现了在拼音的基础上带有智能化特色的智能拼音输入方法,采用人们普遍熟悉的拼音作为基本的编码,融入适当的智能功能,大大方便了普通用户的使用,最为典型的是北京大学朱守涛开发的智能ABC输入方法,它充分利用计算机的处理能力,让它去适应人的习惯,其具有的自动记忆、模糊匹配等特点大大降低了拼音输入固有的重码多的问题,使拼音真正成为一种简单实用的输入法,因此在中文Windows系统中,将它作为最基本的汉字输入法。

3.智能输入法

随着计算机计算能力的逐步提高,智能输入技术渐渐浮出水面,以前以单字、词组方式进行输入的拼音,现在已经能够以整句输入的方式来实现,在计算机智能技术的帮助下,汉语拼音输入的重码问题得到了比较彻底的解决,输入效率大大提高。由于中文语言的千变万化,整句智能输入的开发涉及语言学、计算机人工智能等多个领域,开发难度极大,国内外软件公司都将其作为一个发展方向来进行研究。微软中国公司投入大量的精力,研究微软智能拼音;搜狗公司也推出了整句输入的搜狗输入法。现在要提的是另一款前辈。中文之星对智能输入的研究早在1992年就开始了,早期在中文之星2.0版本中推出的新全拼输入法,一直被消费者津津乐道,其原理基本上与智能ABC类似,其在输入的流畅性和智能化用户词库方面做了很多改进。1997年中文之星公司成功研制出了CLM(中文语言模型)技术,这是一个分析了多达100亿字的语言材料后所得到的智能技术,使智能整句输入迈上了一个新台阶。

拼音输入技术走过了单字、词汇的发展历程,开始向整句智能输入方向发展;手写输入在解决了单字识别率、手写体识别后,人们开始要求速度和简化操作过程,语音识别输入方面在力图打破地域限制的同时,对输入准确性和使用方便性的要求也越来越高。可以预计,由于智能技术带来的诸多便利,越来越多的计算机使用者将采用智能输入技术,这不仅可以大大增进计算机人机界面的友善性,而且还可以提高使用效率。随着智能软件、智能电子产品的普及,中文输入这一最基本的计算机应用领域,也会向前迈出一大步。

邱元阳:人车合一——输入的未来展望

一直以来,各种输入方式针对的对象都是计算机,通过各种各样的接口和外设实现不同信号的输入。如果,这个对象改成人呢?

人体同样具有复杂的输入输出器官。声带、舌头和嘴巴的配合,形成声音的输出“设备”,而耳朵(鼓膜)则充当了声音的输入“设备”。不过人体上的“输出设备”很少,大部分“外设”都是“输入设备”。当把对计算机输入的控制技术应用到人体时,结果却不是我们想象的那么简单。

人体是生物有机体,不是电子设备,不能简单地输入电子化和数字化的信号,人体输入器官最终输送到大脑的是神经脉冲。人的视觉、听觉、触觉、嗅觉、痛觉,都是通过人体器官来接收信号,并最终转换为神经信号的。大脑通过不同神经的脉冲信号,识别各种外界刺激。

生理学家们做过试验,一个婴儿时期因角膜受伤导致完全失明的人,在成年之后对他进行复明手术,移植角膜的技术当时已经非常成熟,手术也非常成功。但是令人意外的是,恢复视力的这个人,根本看不懂外部世界,只是感受到五颜六色的光线。原来,视觉的形成并不是人眼直接“看”到了外部世界,视网膜上的成像只是通过众多的视细胞来接收光信号,并将光信号转换为神经脉冲传递到大脑,由大脑的视觉中枢进行“解码”识别。而这种识别,是建立在学习过程上的,从婴儿时期开始,逐渐感知外部光线,不断明确不同光信号的实际意义,最终形成完善的视觉系统。不同的生物物种,其眼睛的结构和可视角度也不相同,但都能对外部世界有正确的反应。越是高等的生物,视觉形成的过程越长。心理学的研究也表明,在幼儿时期过早地让孩子识字会适得其反,因为孩子的视觉系统还没有完善,可能在空间上还没有上下左右的区分,他们倒着看东西与正着看完全一样,而成人倒着看东西已经不能适应了。

试验中复明的人,因为缺少视觉学习过程,忽然的复明让他不知所措,在纷杂的大脑视觉反应中,“看”不明白各自代表着什么意义。经过一段时间的适应,他慢慢能够识别出看到的人脸,能够区分开动物和人,能够区分物体的映像和纯粹的光线反射,再后来能够通过视觉感知物体的运动,但仍然不能正常行走,常常会被路沿和台阶绊倒,因为他仍然不能区分图像中某些轮廓和线条的真正含义,这是需要经验积累和学习的。最后,他才慢慢能够通过视觉图像估计物体的远近(双眼视差),形成立体视觉和清晰的图像,视觉系统完成重建,达到正常人的水平。

视觉依赖的是光信号的输入,摄像头可以作为计算机的眼睛,那能否作为人的眼睛呢?科学家们做了试验,为成年已经有了视觉经验之后失明的人进行特殊的手术,“安装”摄像头。摄像头采集的光信号先转换为电信号,通过手术方式植入志愿者脑部带有很多电极的电板,对志愿者的视觉中枢进行刺激。试验的结果让人振奋,尝试接通不同位置的电极后,受试志愿者终于感觉到了摄像头图像中的强光部分。虽然还远远没有达到看到图像的程度,但是能够真切地感受到光线的刺激,这已经是很大的突破了。不通过眼睛,而是通过视觉中枢的刺激,来感觉光线,是个了不起的进步,目前已经做到了让受试者识别出海面上白色的船帆(体验描述是一片亮光),相信在不远的将来,通过摄像头来产生视觉、通过麦克风来产生听觉、通过电子鼻来产生嗅觉等都可能成为现实。

陈捷:结束语

每项新技术的诞生、发展、乃至成熟都是一个复杂及漫长的过程,都是在跟时间比赛。对于输入技术的探讨也许永不止步,我们这场速度与激情的比赛也将没有终点。不过,地平线上的风景总是最让人期待的,也就是这份得不到的渴望驱动我们迎风破浪去探索技术的极致。

猜你喜欢

输入法键盘语音
要命的输入法
微信语音恐惧症
键盘裤
魔力语音
Magic Phonetics魔力语音
ikbc R300机械键盘
背带键盘
对方正在输入……
找回微软拼音输入法设置
输入法顺序听我使唤