语音识别成文字的工作原理?

现在有很多语音识别成文字的服务。但是一直不明白其工作原理。猜测是那语音的波形了标准声音波形对比,然后识别。可能先要进行FFT。请教专业人士。另外类似汉语这样的带音调的语言,语音系统是靠什么识别音调的?

推荐  (0) | 4人关注关注
3个答案
1 0
支持者: donizyo

这是一个很复杂的过程,早期的孤立词识别是用的与标准波形对比的方法。现在一般用的是隐马尔科夫模型结合DNN。涉及到自然语言理解、声学模型以及解码等多个方面。

0 0

四尾鱼搜索引擎优化师

2013-09-11 22:22

单个的有 语音库进行对比, 词组根据使用频率进行推测。

0 3

这是一个太专业,而现在又是很流行的话题。
各种商业的公司其实都提供语音识别产品和掌握了相关的技术。
Google、微软、苹果等美国公司和一些有名的日本公司,包括中国的也有在语音识别做得不错的。
在youtube上谷歌已经实现了对上传的英文视频的自动加同步字幕技术,微软demo了同步语音识别和翻译。
中国的科大讯飞在手机上有语音输入法。等等。
建议查阅专业的学术论文、专著去了解该领域的发展现状和核心技术。
本人不是该领域的,故暂时不能回答。

查看更多

添加回答

登录 后回答问题,你也可以用以下帐号直接登录

相关问答

关于我们 加入果壳 媒体报道 帮助中心 果壳活动 家长监控 免责声明 联系我们 移动版 移动应用

©果壳网    京ICP证100430号    京网文[2018] 6282-492号    新出发京零字东150005号     京公网安备11010502007133号

违法和不良信息举报邮箱:jubao@guokr.com    举报电话:18612934101    网上有害信息举报专区    儿童色情信息举报专区