就发生在昨天,媒体上深度学习 跟 NLP两个圈子出现了一场口水战,闹得沸沸扬扬的。知乎有人为此开了问答,响应也真够迅速,:L
从Yoav Goldberg与Yann LeCun争论,看当今的深度学习、NLP与arXiv风气http://www.xwtoutiao.cn/p/7bg18a3e/
如何看待Yoav Goldberg 怒怼来自MILA的GAN for NLG的paper? https://www.zhihu.com/question/60902505
本帖最后由 282842712474 于 2017-6-11 23:48 编辑
这个问题相对容易些,字母毕竟只有26个,根据使用频率、成词等因素,决定应该不算难。
更一般化的问题是:
如果将汉字映射为数字,并给出足够多的映射后的id序列,能够解码出映射表?
如果将英文或者分词后的中文语料,每个词映射为一个唯一的数字,并给出足够多的映射后的id序列,能够解码出映射表?
页:
1
[2]