新沂城市论坛

查看: 4412|回复: 0
打印 上一主题 下一主题

语音识别的基础知识与CMUsphinx介绍

[复制链接]

该用户从未签到

跳转到指定楼层
楼主
 楼主| 发表于 2018-7-28 15:00:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式 来自 广东省深圳市
语音识别的基础知识与CMUsphinx介绍
语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术。
       基于语音识别芯片的嵌入式产品也越来越多,如Sensory公司的RSC系列语音识别芯片、Infineon公司的UnispeechUnilite语音芯片等,这些芯片在嵌入式硬件开发中得到了广泛的应用。在软件上,目前比较成功的语音识别软件有:NuanceIBMViavoiceMicrosoftSAPI以及开源软件HTK,这些软件都是面向非特定人、大词汇量的连续语音识别系统。
        语音识别本质上是一种模式识别的过程,未知语音的模式与已知语音的参考模式逐一进行比较,最佳匹配的参考模式被作为识别结果。
        语音识别的目的就是让机器赋予人的听觉特性,听懂人说什么,并作出相应的动作。目前大多数语音识别技术是基于统计模式的,从语音产生机理来看,语音识别可以分为语音层和语言层两部分。
        当今语音识别技术的主流算法,主要有基于动态时间规整(DTW)算法、基于非参数模型的矢量量化(VQ)方法、基于参数模型的隐马尔可夫模型(HMM)的方法、基于人工神经网络(ANN)和支持向量机等语音识别方法。

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 分享淘帖
新沂城市论坛免责声明:站内会员言论仅代表会员个人观点,并不代表本站同意其观点,本站不承担由此引起的法律责任。
您需要登录后才可以回帖 登录 | 注册账号

本版积分规则

QQ|Archiver|手机版|小黑屋|新沂城市论坛

GMT+8, 2024-11-26 20:38 , Processed in 0.043573 second(s), 12 queries , Xcache On.

苏公网安备 32038102000111号

快速回复 返回顶部 返回列表