数学研发论坛

 找回密码
 欢迎注册
查看: 197|回复: 5

[求助] 求在线免费的文字和【数学公式】识别OCR网站

[复制链接]
发表于 2020-3-14 23:40:03 | 显示全部楼层 |阅读模式

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?欢迎注册

x
本帖最后由 zeroieme 于 2020-3-15 18:45 编辑

需要能识别数学公式,把图片转为可复制的PDF。  我找到某所谓 PNG to pdf 居然只是图片打包
贪心点的话 1 能识别中文更好;2 能把老文献中用打字机符号搭建的数学公式识别出来成为标准数学公式。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-3-15 01:18:58 | 显示全部楼层
https://app.xunjiepdf.com/ocr/ 这个 识别中文不错
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2020-3-15 14:00:40 | 显示全部楼层
northwolves 发表于 2020-3-15 01:18
https://app.xunjiepdf.com/ocr/ 这个 识别中文不错

无法正确识别公式
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-3-17 16:21:12 | 显示全部楼层
目前能识别公式的是有,甚至不少是基于深度学习的那种。但问题是对于某些公式(比如一些矩阵或复杂求和求积之类)识别准确度有待提升。其实公式中单个字母识别并不是问题,但是公式不仅是字母的组合,很多时候其间距大小宽度也包含了一定的隐藏信息,这种信息想要准确识别还是挺难的(因为要涉及到逻辑,一旦涉及到逻辑,目前计算机还不是很擅长)。比如哪怕没有公式,仅仅是中文的识别,在分段上就不是特别好。又比如,目前的深度学习的翻译,如果被翻译段落存在上下文依赖关系(比如某些代表人名,不能按字面意思翻译;有些是公式或缩写,就不能翻译),机器就无法判断了。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-3-19 10:12:56 | 显示全部楼层
识别中文可以试试这个,据说效果还行。识别公式就不好办了。
https://github.com/ouyanghuiyu/chineseocr_lite
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2020-3-19 12:28:45 | 显示全部楼层
公式和中文还是分开吧...

公式可以试试:
https://mathpix.com/
https://zhuanlan.zhihu.com/p/83678942
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2020-3-29 08:19 , Processed in 0.058749 second(s), 16 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表