mathe 发表于 2008-6-15 07:43:49

原帖由 无心人 于 2008-6-14 22:09 发表 http://bbs.emath.ac.cn/images/common/back.gif
:)

光听懂特定人的话语都难阿
听懂那就更加难了。机器理解自然语言应该还是很遥远的事。
现在的语音识别水平,不需要要求理解,计算机的能力还是差很远。也许真的需要做到机器能够理解自然语言的水平,语音识别才能够有突破吧(通过上下文分析提高识别率)

无心人 发表于 2008-6-15 09:00:04

:)

我老感觉人对语音的识别靠经验而不是算法

比如听到“西瓜, 酸梅汤,冰激淋”等

应该是一个超高效的比较算法确定词义的

而不是什么现在的计算机的算法来确定

另外,是否存在同化算法,把别人发出的语音转化为自己特有的语音

比如别人说,“西瓜”

我们大脑用 :lol 数字信号处理转化为自己的音调和习惯,

即自己说的,“西瓜”,发自己特定的音

再和储存的经验对比

这么就能解释,为什么自己听到不懂的词语

会有个试图解释成字组合的尝试

而对国外的没学习的语言

只能达到模拟语音的水平

但这个模拟却能做到以自己的音调模拟

即国外人学中文,“你好”

发出的却是不准确的音

不是完全模仿国内发音的

哈哈

有点长,即兴写的,希望大家能看清楚

无心人 发表于 2008-6-15 09:04:51

或者说,对于语音

大脑存在和音乐和噪音和自然音不同的处理区域

而且存在特定的声音符号,即若干种不同的频谱组合

无论什么语音,均能分解成声音符号

这个符号和遗传有关

不同语言的人,这个符号可能有差异

即国内人学外语,有的音汉语模拟不出的现象

而具体的语音都被分解成声音符号的

当然,可能和国际音标是无关的

也可能有关吧
页: 1 [2]
查看完整版本: 机器人首次能同时听懂3个人不同的声音