语音识别算法请教。

swch305 发表于 2008-1-23 17:31:27

小弟要做个语音识别系统，只是识别一百多个的单词，请教各位高手，语音识别是从哪些地方入手的啊？？
大家能指点些方向吗？？我完全没有头绪。:hug: :hug: :hug:

mathe 发表于 2008-1-23 20:14:06

建议看一下IEEE PAMI (Pattern Analysis and Machine Intelligence)方面的论文

swch305 发表于 2008-1-24 09:45:01

在哪里能下载啊？？都打不开啊。。大家再帮帮吧。。

mathe 发表于 2008-1-24 11:28:53

你在学校里吗？通常在学校图书管里面里面会有。不过通常不能外借，只能在期刊室里面阅读

mathe 发表于 2008-1-24 17:08:12

其实我觉得语音识别主要涉及一下几方面：
i)特征提取，就是对一个输入的声波，要如何提取出一些比较有效的特征数。这个应该需要比较专业的知识，前人应该已经积累了不少经验，到底怎样的特征数据是比较有效的。
ii)模式匹配问题，模式识别方面的教材应该介绍了很多比较简单的方法，由于你这里使用的单词数目不多，也应该不需要使用特别复杂的方法。我觉得基本上基于线性的统计模型就可以了，就假设每个单词对应的特征都是符合多维正态分布的。对于一个输入数据，最后发现跟某个单词特征的均值最接近，就认为是那个单词就可用了。
iii)语言模型。在实际使用过程中，我们还可以通过使用语言模型，通过分析语法信息和上下文信息来得到更加准确的结果。如果要将语音识别实用，是无法离开语言模型的。其实人类自身的识别过程就用了语言模型，比如我们听到“你好”，是不会听错成“泥好”的，虽然它们发音相同。当然你这里由于识别要求比较简单，所以也不需要考虑。

mathe 发表于 2008-1-24 17:16:26

通过google找到一篇清华的论文，应该对你有帮助：
http://cst.cs.tsinghua.edu.cn/~fzheng/THESES/200204-D-WF.pdf
其中介绍到的MFCC应该是现在比较实用的特征提取方法。

swch305 发表于 2008-1-25 11:36:58

谢谢大家的热心帮助，我已经不在学校里了，很多东西想查资料也没得查啊。。只能靠各位热心帮助了。

mathe 发表于 2008-1-25 11:49:26

那有必要开发一个这样的语音识别系统吗？为什么不使用现成的呢？

swch305 发表于 2008-1-28 09:45:07

现成？？有吗？？哪里有啊？？

mathe 发表于 2008-1-28 11:26:50

比如微软的MAPI就支持语音识别。
比较有名的是IBM的viaVoice

页: [1]

数学研发论坛's Archiver

语音识别算法请教。