机器人首次能同时听懂3个人不同的声音 - 第2页 - 业界资讯 - 数学研发论坛

mathe 发表于 2008-6-15 07:43:49

原帖由无心人于 2008-6-14 22:09 发表 http://bbs.emath.ac.cn/images/common/back.gif
:)

光听懂特定人的话语都难阿
听懂那就更加难了。机器理解自然语言应该还是很遥远的事。
现在的语音识别水平，不需要要求理解，计算机的能力还是差很远。也许真的需要做到机器能够理解自然语言的水平，语音识别才能够有突破吧（通过上下文分析提高识别率）

无心人 发表于 2008-6-15 09:00:04

:)

我老感觉人对语音的识别靠经验而不是算法

比如听到“西瓜，酸梅汤，冰激淋”等

应该是一个超高效的比较算法确定词义的

而不是什么现在的计算机的算法来确定

另外，是否存在同化算法，把别人发出的语音转化为自己特有的语音

比如别人说，“西瓜”

我们大脑用 :lol 数字信号处理转化为自己的音调和习惯，

即自己说的，“西瓜”，发自己特定的音

再和储存的经验对比

这么就能解释，为什么自己听到不懂的词语

会有个试图解释成字组合的尝试

而对国外的没学习的语言

只能达到模拟语音的水平

但这个模拟却能做到以自己的音调模拟

即国外人学中文，“你好”

发出的却是不准确的音

不是完全模仿国内发音的

哈哈

有点长，即兴写的，希望大家能看清楚

无心人 发表于 2008-6-15 09:04:51

或者说，对于语音

大脑存在和音乐和噪音和自然音不同的处理区域

而且存在特定的声音符号，即若干种不同的频谱组合

无论什么语音，均能分解成声音符号

这个符号和遗传有关

不同语言的人，这个符号可能有差异

即国内人学外语，有的音汉语模拟不出的现象

而具体的语音都被分解成声音符号的

当然，可能和国际音标是无关的

也可能有关吧

页: 1 [2]

数学研发论坛's Archiver