APP下载

从CAJ等文件中提取全文本的方法

2005-04-29崔永锋

大众科技 2005年9期

崔永锋

[摘要]现在网上发布的资料信息都是以CAJ、PDF等文件格式提供的,其中的文本不能直接编辑。文章就这一问题的解决,对OCR识别技术提取全文本的方法进行了介绍。

[关键词]CAJ文件;PDF文件;超星文件;OCR识别

[中图分类号]TP31

[文献标识码]A

[文章编号]1008—1151(2005)09—0078—01