当前位置: 首页 > web >正文

[转]常用OCR软件介绍

转载出处:http://blog.csdn.net/zhulinu/article/details/9095585

常用OCR软件介绍                          

1、ABBYY ***ABBYY FineReader 简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多打印机、扫描仪都自带它为ocr软件。安装程序约300MB,选择词库安装后约500MB。 评价:功能齐全,众多软件中应该是第一。 缺点:占cpu/内存大。有时会识别出一些不存在的字(和正确的字很相像,但不存在。造字?) 友情提醒:Win有Corporate 和Professional (企业和专业)版,也有苹果Mac版,大家选自己要的。 ***ABBYY Screenshot Reader 简介: 功能类似汉王屏幕摘抄、Mini Ocr是专门OCR识别屏幕截图用的。
2、I.R.I.S. Readiris 简介:驰名品牌,全球都在用,国外4大OCR公司之一,众多印机、扫描仪都自带它为ocr软件。安装程序约200MB,选择词库安装后约100MB。 评价:功能可以,对表格的识别率ms比ABBYY FineReader高。没遇到FineReader的造字问题。 缺点:没自带校对功能。 友情提醒: 一定用Asian版,没写Asian的不支持中文! 导入图片时勾上“使用300dpi分辨率” 不然若图片不达标会弹出提示叫你从扫。 (废话,我要是有好的干嘛不用,设计师nc) Win有Corporate 和Professional (企业和专业)版,也有苹果Mac版,大家选自己要的。
3、汉王 简介:国产企业,值得支持 缺点:不支持多页单TIF文档 *** 汉王文本王文豪7600 评价:功能满全的,自带的几个小工具不错(汉王拼图精灵、汉王屏幕摘抄、汉王照片摘抄) 友情提醒: 1.貌似该公司目前开发重点是硬件,2007后出了文本王文豪7600就没更新了。 2.网上一个366MB的是完整CD ,包括了Hwdochasp 和hwdocsafe 这两个文件夹,大家装hwdocsafe 文件夹里的。另166MB的是光光hwdocsafe 这个文件夹。 3.设置里选“忽略段内回车换行”。 4.汉王屏幕摘抄、汉王照片摘抄貌似是用特征库,效果跟Mini Ocr一样。所以识别结果跟文本王不一样。 *** 汉王 PDF OCR 简介: 停止开发文本王但是品牌名声和功能还是要维护的。这个免费使用的才40MB。 评价: 什么PDF OCR啊?我的一个图像pdf就根本识别不了.... *** 汉王尚书七号 简介:尚书OCR软件是MICROTEK中晶科技公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约60MB. *** Founder 方正OCR 简介:本来不想写这个的,方正OCR软件是方正公司,向汉王科技购买授权,赠送给用户使用的旧版OEM软件。安装程序约40MB. *** 汉王文友 简介:旧版 *** 超星阅览器 简介:向汉王买的技术。 *** RapidScan高速扫描影像优化OCR识别系统 简介:向汉王买的技术。
4、清华文通TH-OCR 简介:国产(清华+文通)+国外企业Scansoft Nuance,值得支持,与汉王不同的是清华国际知名度比较好。微软向他买技术,满多印机、扫描仪也带它为ocr软件。 评价:功能还可以,(可以把汉王认为是国内的FineReader ,清华则是Readiris....或者反过来?) 嗯nb!还带语音效稿! 缺点:不支持多页单TIF文档 友情提醒:"清华紫光OCR"是旧版 *** 文通慧视小灵鼠 简介:简单的说就是增加了手写识别的增强版。 *** CAJViewer 简介:向清华买的识别程序。 *** 《文档天地》综合管理与处理系统 简介:向清华买的技术。 *** netocr.net在线OCR 简介:
应用了由清华大学电子系研制的国际领先的最新OCR识别技术,提供一天之内不超过99幅图像的免费的文字识别服务。 还有后台人工校对识别。。。
由文通搞的,貌似搞不下去了。
6、Microsoft微软 简介:微软,nb公司啊!开玩笑,其实用清华(中文?)和Scansoft Nuance(英文?)的引擎。 Office Document Imaging Office OneNote 评价:用的像是清华早期的特征库。比较好笑的是,网上有人测试的比清华现在的词库识别好。 缺点:懒着写 友情提醒: 默认装了跟Office的相同语言的特征库,其他语言特征库手动添加,若装office多语言版ms就免了. ***老马的 UnicornViewerPdg2PicTextForever 简介:套用微软yy过的OCR引擎和词库来实现批量OCR http://www.comicer.com/stronghorse/water/software/pdg2text.htm *** 创华OCR 简介:套用微软yy过的OCR引擎和词库
7、Adobe Acrobat Pro 简介:Adobe,nb公司啊!开玩笑,其实是买IRIS Readiris的技术。 评价: 其实他的OCR技术也是给图片式PDF用的,识别后会在图片PDF的文字上附上识别文字,这样你可以拷贝pdf上的东西. (表达能力有限,类似onenote的使用方法) 缺点:没自带校对功能。 友情提醒:不是免费的Reader,是Acrobat Pro或Acrobat Pro Extended版
8、Mini Ocr 简介:作者马飞涛知道是谁不?是护花使者的作者。用他的话说:
我在开发护花使者反黄图像识别软件的时候,遇到有些图像里,嵌有某些文字,如果能 把文字识别出来,图像的含义就很容易让计算机理解了。

是的,专门设计给截图用的 评价:看看过滤效果,就知道多利害了吧,而且是他自制的特征库. 缺点:可惜无法手动选择识别区域 友情提醒:有点类似汉王屏幕摘抄、汉王照片摘抄
9、文粹OCR 简介:国产企业,值得支持。识别率不比汉王差! 缺点:功能不够强大、完善。 友情提醒: 去worldrobot.NET/download.html 下最新2009版。华军,天空的都不是最新版。 默认快捷方式“文粹OCR”是update.exe,为避免每次升级,把路径改成WencuiOcr.exe。 ***文粹在线OCR 貌似搞不下去了。
10、Newsoft 丹青文件辨识系统 MaxReader、Presto OCR 简介:应该是tw的Newsoft公司和国外Presto合搞的(这不重要)。 这Presto公司在9x年代买了ABBYY的识别引擎,然后丹青又买/合作/使用了Presto版的ABBYY识别引擎。(10年前旧版的ABBYY不支持中文,所以有的搞,不过现在。。。。) 评价:看他网上上吹的多nb(10年前的技术也敢吹?!),但是识别繁体竖排或简体都不见得有多好。安装程序越越约300MB,安装后130MB。 缺点:懒着写 友情提醒:我情愿用汉王,这不过是个旧版的ABBYY
11、Scansoft Nuance 简介:国外4大OCR公司之一,自己号称全球都在用(估计没算中国),微软、清华还向他买技术 ***OmniPage (最贵的,$499.99 ) ***PaperPort (才$79.99 ) ***TextBridge (才$79.99 ) 友情提醒+评价 缺点:吹的多nb。下一个MULTi LANGUAGE多语言版,500MB,吓一跳。打开后发现带2个软件OmniPage和PDFCreate5。我们当然装最贵的OmniPage咯,实际安装程序越越约300MB。选择安装后250MB,kao,中文词库只不过是做样子呢!难怪微软也同时向清华买OCR技术。
12、ExperVision TypeReader 简介:新人可能不知道,但是n年前还是满有名的。 (才$395.00 )同时也曾是国外4大OCR公司之一。 评价:ms2008年后就没更新,以前拿了n多奖,若oem盘有带,用来ocr英文还可以。 25MB。 缺点:不支持中文算不? 友情提醒:此东东不好下,没特别需要别下
13、赛酷OCR 简介:使用云系统来OCR,说土点就是叫你装一个客户端,把图片上传到服务器上,识别后再发回来。 优点:机子配置不好的,用这东东占资源少。客户端安装文件也小。 缺点: 识别率不咋的,可能还没丹青好。除了简体,繁体竖排根本不行。 机密文件你甲认为我会安心上传给你? 万一断网,偶要OCR咋办? 友情提醒:偶就纳闷,网上关于该软件的评价很高。 (有人发帖问用啥OCR软件好,基本上就有人回“用赛酷”)就首次使用送10次识别,网上可能有那么多有钱的潜水支持者?可见肯定是1毛党!
14、SimpleOCR 简介:本来不想写这个的,但是这免费的东东名声蛮大的,我不说,人家可能会去下。 缺点:不支持中文
15、奥普ocr 简介:停止开发的东东。

 

注1:以上,就前9名OCR软件值得试! 注2:在线网页OCR不实际 注3:该软件的比较写于2010年,估计5年内有效 注4:此贴由winny社长验证,内容非常包青天 注5:软件按引擎Engine+词库分类

 

备注:

本人测试过Tesseract,汉王,识别看看三款软件。

识别看看的识别率最高。好像是一个人开发的。牛啊。 顺便给他做个推广吧,http://blog.sina.com.cn/u/2863794612

转载于:https://www.cnblogs.com/Crysaty/p/6080281.html

http://www.xdnf.cn/news/11119.html

相关文章:

  • 牛腩新闻发布系统小结
  • Google世界第一机 T-Mobile G1全程评测
  • zzuli OJ 2353: 小明学长给学弟的任务
  • diy纸壳机器人模型图片_超详细的模型制作教程等你来pick!
  • Java-面向对象编程
  • HTML代码实例:详细讲解超级链接--网页制作
  • 07-SNAP处理Sentinel-1 IW GRD数据
  • Java:设计模式之结构型-装饰者模式(decorator pattern)
  • 获取加载后就自动删除的驱动SYS文件
  • 聚合命令
  • 勒索病毒的策略与建议
  • psp记忆棒测试软件,PSP记忆棒有问题?修复软件MS-Format帮你解忧
  • 最新传奇木马及其防范全攻略
  • 经典网页设计:25个优秀的个人网站设计欣赏
  • 另类的中文乱码
  • Webmax简易入门操作手册(一)
  • QQ在线聊天代码
  • 代理商丨UltraEdit是一套功能强大的文本编辑器
  • 小知识·BitTorrent 简介
  • SELinux入门:了解和配置SELinux
  • .NET下的内存分配机制
  • oracle10g oui-10118,使用ORACLESTREAMSTRMMON监控工具
  • 硬件和软件的关系
  • 51 地图基本接口(三)
  • JS中设置按钮不可用的disabled属性
  • 对战平台原理分析
  • Java中的二进制及基本的位运算
  • 基于51单片机的电子秤设计
  • 基于wifi的室内定位算法设计与实现
  • 2023-2025 时序大模型相关工作汇总