ocr 数字识别
ocr 数字(只有0,1,2,3,4,5,6,7,8,9)识别一般有什么好的软件或算法?知道的xd说说 只有10个数字应该比较好办,样本不大. 图片加了噪声,例如下面的图片:
你这里有几个问题:
i)对多个数字的划分.连通性通常应该能够解决这个问题,不过可能会有些特殊情况需要特殊处理
ii)去取噪音不是大问题,比如通常的close/open/erode/dilate等操作
然后我们可以先进行大量数据采样(人工划分和识别结果),通过统计方法得出不同数字的一些特征数据的分布函数.
最后,就可以进行识别工作了 对于阿拉伯数字,拉丁字符的OCR识别,可以说现在已经能99%的识别出来,而对于那些复杂的字符集则至今还是难题
涉及到的算法基本上 随便一本 模式识别的书里都会讲到。。。
windows 7 的手写板有 手写输入功能
foxit pdf reader , Adobe pdf reader也 都有OCR识别功能
要想更专业点的如 汉王,清华紫光。。。 还好,噪声不大,而且数字规整。按列积分应该可以分割出来了。 这种图片,识别不是问题(微软的API都有了),
去噪是关键。
看你这个图的话,我想先膨胀,再算联通区域面积应该会有较好效果 还好,噪声不大,而且数字规整。按列积分应该可以分割出来了。
风云剑 发表于 2010-4-22 09:13 http://bbs.emath.ac.cn/images/common/back.gif
如果同时计算每列的方差应该会更加好 呵呵,如果是印刷体数字,加了一点噪声的话,
用一般的图像处理算法就没什么问题吧,如去噪,边缘检测啥的,只是门槛值得人工设置,。。。 wayne 发表于 2010-4-21 17:37
对于阿拉伯数字,拉丁字符的OCR识别,可以说现在已经能99%的识别出来,而对于那些复杂的字符集则至今还是难 ...
技术发展真快,这几年深度学习技术突飞猛进,人脸识别都已经是家常便饭。
页:
[1]