从CAJ等文件中提取全文本的方法
2005-04-29崔永锋
大众科技 2005年9期
崔永锋
[摘要]现在网上发布的资料信息都是以CAJ、PDF等文件格式提供的,其中的文本不能直接编辑。文章就这一问题的解决,对OCR识别技术提取全文本的方法进行了介绍。
[关键词]CAJ文件;PDF文件;超星文件;OCR识别
[中图分类号]TP31
[文献标识码]A
[文章编号]1008—1151(2005)09—0078—01
2005-04-29崔永锋
崔永锋
[摘要]现在网上发布的资料信息都是以CAJ、PDF等文件格式提供的,其中的文本不能直接编辑。文章就这一问题的解决,对OCR识别技术提取全文本的方法进行了介绍。
[关键词]CAJ文件;PDF文件;超星文件;OCR识别
[中图分类号]TP31
[文献标识码]A
[文章编号]1008—1151(2005)09—0078—01