找回密码
 欢迎注册
楼主: KeyTo9_Fans

[原创] 错排密文的破解方法

[复制链接]
发表于 2017-6-11 10:08:23 | 显示全部楼层
真是巧。
就发生在昨天,媒体上深度学习 跟 NLP两个圈子出现了一场口水战,闹得沸沸扬扬的。知乎有人为此开了问答,响应也真够迅速,

从Yoav Goldberg与Yann LeCun争论,看当今的深度学习、NLP与arXiv风气  http://www.xwtoutiao.cn/p/7bg18a3e/

如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper? https://www.zhihu.com/question/60902505
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2017-6-11 15:50:17 | 显示全部楼层
本帖最后由 282842712474 于 2017-6-11 23:48 编辑

这个问题相对容易些,字母毕竟只有26个,根据使用频率、成词等因素,决定应该不算难。

更一般化的问题是:

如果将汉字映射为数字,并给出足够多的映射后的id序列,能够解码出映射表?

如果将英文或者分词后的中文语料,每个词映射为一个唯一的数字,并给出足够多的映射后的id序列,能够解码出映射表?

点评

映射为拼音再还原,不就是输入法所做的事情么,这个简单呀~映射为数字是一般文本的脱敏办法。我觉得不像计算超大乘法,反而像是大数分解...  发表于 2017-6-14 08:35
汉字 映射成拼音,估计也不难。 弄成数字的话,就不那么好玩了。 就相当于要人脑去计算两个超大数的乘法一样,不是 很有趣  发表于 2017-6-12 22:26
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-3-29 22:37 , Processed in 0.040231 second(s), 16 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表