swch305 发表于 2008-1-23 17:31:27

语音识别算法请教。

小弟要做个语音识别系统,只是识别一百多个的单词,请教各位高手,语音识别是从哪些地方入手的啊??
大家能指点些方向吗??我完全没有头绪。:hug: :hug: :hug:

mathe 发表于 2008-1-23 20:14:06

建议看一下IEEE PAMI (Pattern Analysis and Machine Intelligence)方面的论文

swch305 发表于 2008-1-24 09:45:01

在哪里能下载啊??都打不开啊。。大家再帮帮吧。。

mathe 发表于 2008-1-24 11:28:53

你在学校里吗?通常在学校图书管里面里面会有。不过通常不能外借,只能在期刊室里面阅读

mathe 发表于 2008-1-24 17:08:12

其实我觉得语音识别主要涉及一下几方面:
i)特征提取,就是对一个输入的声波,要如何提取出一些比较有效的特征数。这个应该需要比较专业的知识,前人应该已经积累了不少经验,到底怎样的特征数据是比较有效的。
ii)模式匹配问题,模式识别方面的教材应该介绍了很多比较简单的方法,由于你这里使用的单词数目不多,也应该不需要使用特别复杂的方法。我觉得基本上基于线性的统计模型就可以了,就假设每个单词对应的特征都是符合多维正态分布的。对于一个输入数据,最后发现跟某个单词特征的均值最接近,就认为是那个单词就可用了。
iii)语言模型。在实际使用过程中,我们还可以通过使用语言模型,通过分析语法信息和上下文信息来得到更加准确的结果。如果要将语音识别实用,是无法离开语言模型的。其实人类自身的识别过程就用了语言模型,比如我们听到“你好”,是不会听错成“泥好”的,虽然它们发音相同。当然你这里由于识别要求比较简单,所以也不需要考虑。

mathe 发表于 2008-1-24 17:16:26

通过google找到一篇清华的论文,应该对你有帮助:
http://cst.cs.tsinghua.edu.cn/~fzheng/THESES/200204-D-WF.pdf
其中介绍到的MFCC应该是现在比较实用的特征提取方法。

swch305 发表于 2008-1-25 11:36:58

谢谢大家的热心帮助,我已经不在学校里了,很多东西想查资料也没得查啊。。只能靠各位热心帮助了。

mathe 发表于 2008-1-25 11:49:26

那有必要开发一个这样的语音识别系统吗?为什么不使用现成的呢?

swch305 发表于 2008-1-28 09:45:07

现成??有吗??哪里有啊??

mathe 发表于 2008-1-28 11:26:50

比如微软的MAPI就支持语音识别。
比较有名的是IBM的viaVoice
页: [1]
查看完整版本: 语音识别算法请教。