ocr 数字识别

medie2005 发表于 2010-4-21 15:25:36

ocr 数字（只有0,1,2,3,4,5,6,7,8,9）识别一般有什么好的软件或算法？
知道的xd说说

mathe 发表于 2010-4-21 15:56:14

只有10个数字应该比较好办,样本不大.

medie2005 发表于 2010-4-21 16:07:47

图片加了噪声，例如下面的图片：

mathe 发表于 2010-4-21 17:19:29

你这里有几个问题:
i)对多个数字的划分.连通性通常应该能够解决这个问题,不过可能会有些特殊情况需要特殊处理
ii)去取噪音不是大问题,比如通常的close/open/erode/dilate等操作
然后我们可以先进行大量数据采样(人工划分和识别结果),通过统计方法得出不同数字的一些特征数据的分布函数.
最后,就可以进行识别工作了

wayne 发表于 2010-4-21 17:37:38

对于阿拉伯数字，拉丁字符的OCR识别，可以说现在已经能99%的识别出来，而对于那些复杂的字符集则至今还是难题

涉及到的算法基本上随便一本模式识别的书里都会讲到。。。

windows 7 的手写板有手写输入功能
foxit pdf reader ， Adobe pdf reader也都有OCR识别功能

要想更专业点的如汉王，清华紫光。。。

风云剑 发表于 2010-4-22 09:13:42

还好，噪声不大，而且数字规整。按列积分应该可以分割出来了。

shshsh_0510 发表于 2010-4-22 09:18:49

这种图片，识别不是问题（微软的API都有了），
去噪是关键。
看你这个图的话，我想先膨胀，再算联通区域面积应该会有较好效果

mathe 发表于 2010-4-22 09:59:14

还好，噪声不大，而且数字规整。按列积分应该可以分割出来了。
风云剑发表于 2010-4-22 09:13 http://bbs.emath.ac.cn/images/common/back.gif
如果同时计算每列的方差应该会更加好

wayne 发表于 2010-4-22 10:10:37

呵呵，如果是印刷体数字，加了一点噪声的话，
用一般的图像处理算法就没什么问题吧，如去噪，边缘检测啥的，只是门槛值得人工设置，。。。

xiaoshuchong 发表于 2022-3-29 19:39:55

wayne 发表于 2010-4-21 17:37
对于阿拉伯数字，拉丁字符的OCR识别，可以说现在已经能99%的识别出来，而对于那些复杂的字符集则至今还是难 ...

技术发展真快，这几年深度学习技术突飞猛进，人脸识别都已经是家常便饭。

页: [1]

数学研发论坛's Archiver

ocr 数字识别