免软件 提取在线图片中的文字
2017-11-03老万
老万
现在很多单位都开始推行无纸化办公,这样很多时候就需要将文字信息转换为数字信息,而在转换的过程中必须要使用到OCR这类的软件,可是通常情况下这类软件不但需要收费,而且有的时候操作起来也比较麻烦。如果临时急用,在不用安装软件的情况下,我们也能进行图片文字的提取。
在线分析快捷简单
通过浏览器打开“ Free Online OCR ”这个云服务网站(https://www. onlineocr.net/),这项云服务的操作非常的简单,用户只需要根据页面中的向导一步步进行操作就可以了。首先点击网页中的“Select File”按钮,在弹出的对话框里面选择需要扫描的文件。这款云服务支持的文件类型非常丰富,不但可以对图片信息进行扫描,而且也可以对PDF文件进行扫描。
接下来在“Select language and output format”列表里面选择扫描文字的类型,通常我们都是扫描中文信息,所以选择“Chinesesimplified”这一项就可以了。如果扫描的内容里面还包括有英文等其他文字信息的话,我们就看哪种信息比较多就选择哪一种文字选项。接下来在列表中选择扫描出文字信息的保存文件格式,可以将其导出为纯文本格式以及Word文档格式(图1)。
我们要转换前需要输入网页上出现的验证码,再点击“Convert”按钮就可以开始进行相关的扫描转换操作了。扫描分析出的内容会及时地显示在网页下方的文本框里面,通过对比發现除了少数英文字母的内容出现错误以外,中文信息都完整地被识别出来了。最后点击“Download Output File”按钮就可以将其保存,再对这些内容重新进行编辑排版即可(图2)。
多语言支持更准确
虽然云服务的操作非常方便,但是由于可能会遇到服务器宕机或升级等问题,所以我们还是最好选择一个其他的在线云服务进行备份。而另外一款同样名为“Free Online OCR”的云服务也非常的不错。现在访问它的网站链接http://www.newocr.com/,点击网页中的“选择文件”按钮后,选择需要分析扫描的文件。接下来在“Recognition language(s)”列表中,点击选择要扫描文字的类型。这个云服务和前一个最大的不同之处在于,它可以同时选择多种文字类型,比如同时选择中文和英文等等(图3)。
选择完成以后点击“Upload”按钮进行上传操作,我们之所以不马上进行扫描分析,是因为有的时候在上传的过程中图片会出现翻转等问题。所以当文件上传完成以后,我们要首先对图片进行预览,查看它是否正常进行显示。如果不正常的话,还可以通过旋转的方式进行调整。当所有的调整完成以后,点击“OCR”按钮就可以开始在线分析扫描了。相对于之前那个云服务,该服务的分析结果并没有改变原有的排版格式。而且可以直接在网页的编辑框里面,对扫描结果进行在线编辑以及在线翻译等操作(图4)。endprint