离线语音识别方案开发

2021-10-25 17:56:43


离线语音识别方案开发简介

ASR(Automatic Speech Recognition)自动语音识别技术是基于关键词语列表识别的技术。每次识别的过程,就是把用户说出的语音内容,通过频谱转换为语音特征,和这个关键词语列表中的条目进行一一匹配,最优匹配的一条作为识别结果。比如在手机的应用中,这个关键词语列表的内容就是电话本中的人名/手机的菜单命令/T卡中的歌曲名称等,不论这个列表的条目内容是什么,只需要用户设置相关的寄存器,就可以把相应的待识别条目内容以字符形式传递给识别引擎。

识别引擎不关心关键词语列表中的关键词语的内容,可以是命令,人名,歌曲名字,操作指令等等任何的汉字字符串。

每条关键词语最大可以支持的字数,从算法角度是限制在30字以内。但是从实际情况来看,用户一口气说超过8个字以上的条目时,几乎肯定会出现说错字/说漏字/说多字/打嗝/停顿等情况,这些情况都会严重影响识别并造成识别错误。因而一般来说如果要获得理想的识别效果,建议每条关键词语的字数不要过长,避免影响效果

ASR技术最重要的意义在于提供了一种脱离按键、鼠标的基于语音的用户界面,使得用户对于产品的操作更自然,相对手动控制更加快捷、方便,可用于智能家电、智能穿戴,声控智能玩具等诸多领域。

目前在线语音识别方案价格较高,产品接入复杂周期冗长,响应时间受网络影响。 本方案提供的是基于大量语音数据库的非特定人声离线语音识别。本方案具有成本优势,接入简单周期短,识别响应速度快(0.5秒以内),不需要连接网络。整体方案成熟、稳定、可靠,可以让传统产品快速升级智能语音功能。

离线语音识别技术,是基于关键词语列表识别的技术。只需要设定好要识别的关键词语列表,通过语音识别系统就可以对用户说出的关键词语进行识别,不需要用户作任何录音训练。

无需联网即可轻松

实现语音操控

市场应用:

智能语音灯、智能玩具、家电产品(电风扇、抽油烟机、空调)、眼部按摩仪、颈部按摩仪,智能音箱等诸多产品。

方案优势:

识别率95%以上,距离3M范围内精准识别

支持32国语言,支持多个小语种

无需联网,离线识别,响应迅速

支持语音反馈播报,增加互动娱乐

性价比高,SOC架构,集成Codec

稳定性高,工业级芯片

指令灵活设计,无需客户录音

开发时间短,技术支持到位

技术参数:

工作电压范围可选3.3~5.5V

输入专用MIC引脚 增强级为26dB,最大总增益为65dB

差分音频PWM输出,直接驱动1W/8Ω扬声器

2路PWM信号输出,可用于LED调光

提供I2C/UART接口和自定义通讯协议,可用于外接模块、与外部MCU通讯

合作方式:

提供语音识别完整设计方案,客户可以根据自己的需求设计功能,我司负责声控部分的开发,跟客户的主控对接

芯片授权:客户自己开发应用,生产PCB,自行购买相应的元器件生产,我司提供芯片、相关的参考路线、语音识别命令制作。

成功案例:

1、智能语音灯

2、智能小家电

3、保健按摩器

4、智能中控

语音降噪模块:

针对环境噪音进行有效抑制,提升嘈杂环境下的识别效率。

适用于有机械运动的产品,如风扇,暖风机,抽油烟机,扫地机器人等

欢迎各开发工程师前来咨询了解。