找回密码
 欢迎注册
查看: 23396|回复: 9

[讨论] ocr 数字识别

[复制链接]
发表于 2010-4-21 15:25:36 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?欢迎注册

×
ocr 数字(只有0,1,2,3,4,5,6,7,8,9)识别一般有什么好的软件或算法? 知道的xd说说
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-21 15:56:14 | 显示全部楼层
只有10个数字应该比较好办,样本不大.
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2010-4-21 16:07:47 | 显示全部楼层
图片加了噪声,例如下面的图片: digs.JPG
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-21 17:19:29 | 显示全部楼层
你这里有几个问题: i)对多个数字的划分.连通性通常应该能够解决这个问题,不过可能会有些特殊情况需要特殊处理 ii)去取噪音不是大问题,比如通常的close/open/erode/dilate等操作 然后我们可以先进行大量数据采样(人工划分和识别结果),通过统计方法得出不同数字的一些特征数据的分布函数. 最后,就可以进行识别工作了
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-21 17:37:38 | 显示全部楼层
对于阿拉伯数字,拉丁字符的OCR识别,可以说现在已经能99%的识别出来,而对于那些复杂的字符集则至今还是难题 涉及到的算法基本上 随便一本 模式识别的书里都会讲到。。。 windows 7 的手写板有 手写输入功能 foxit pdf reader , Adobe pdf reader也 都有OCR识别功能 要想更专业点的如 汉王,清华紫光。。。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-22 09:13:42 | 显示全部楼层
还好,噪声不大,而且数字规整。按列积分应该可以分割出来了。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-22 09:18:49 | 显示全部楼层
这种图片,识别不是问题(微软的API都有了), 去噪是关键。 看你这个图的话,我想先膨胀,再算联通区域面积应该会有较好效果
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-22 09:59:14 | 显示全部楼层
还好,噪声不大,而且数字规整。按列积分应该可以分割出来了。 风云剑 发表于 2010-4-22 09:13
如果同时计算每列的方差应该会更加好
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2010-4-22 10:10:37 | 显示全部楼层
呵呵,如果是印刷体数字,加了一点噪声的话, 用一般的图像处理算法就没什么问题吧,如去噪,边缘检测啥的,只是门槛值得人工设置,。。。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2022-3-29 19:39:55 | 显示全部楼层
wayne 发表于 2010-4-21 17:37
对于阿拉伯数字,拉丁字符的OCR识别,可以说现在已经能99%的识别出来,而对于那些复杂的字符集则至今还是难 ...

技术发展真快,这几年深度学习技术突飞猛进,人脸识别都已经是家常便饭。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-11-21 19:28 , Processed in 0.029676 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表