【问答互动+全新音频资料下载】便携式音频与智能语音识别

TI 管理员

Other Parts Discussed in Thread: TPA3128D2, TPA3130D2, TPA3118D2, TLV320AIC3254, TAS5756M, TAS5782M, TAS5766M, TAS5754M, TAS5753MD, BQ25703A, BQ24617, OPA728, TLV320AIC3256, TLV320AIC3262, TAS2557, TLV320ADC3101, PCM1864, TPA6141A2, BQ24040, BQ21040, TPA3136D2, TLV62568, TPS709, BQ25606, BQ25700A, MSP430FR2533, CC2640R2F, CC2564, CC3200, TXS0102, TXS0104E, LP55231

2017 年的 CES ASIA 充满了浓浓的科技范儿，智能热度有增无减，有线产品层出不穷，你 Get 到潮流了吗？凭借在音频领域 30 多年的丰富经验，TI 的音频产品足以满足您最挑剔的耳朵！

在寻找最新版的音频设计资料？2017 年新版资料在这里！

技术直播视频回放（音频+电源+语音识别）
技术资料下载：

与此同时，由行业专家整理的常见技术问答也新鲜出炉啦！

党庆昆

TI 高级模拟应用工程师

14年行业从业经验，专注音频产品与系统设计，TI高级模拟应用工程师，为您解析音频芯片领域的新技术和最热门的音频解决方案。

在开始回答网友们的问题之前，我先总结一下两个经常被提及的问题：

1）选择方案应该重点关注哪些指标？

2）目前主流的蓝牙音箱使用方案有哪些？

一、关注哪些指标？

简单讲，因为蓝牙音箱都比较小，所以要求没有很高，需要注意的都是最基本的音频指标，比如功率，效率，频响和失真度。

其他方面就是电池的播放时长和充电速度。到终端客户，往往需要用更形象的指标来描述，比如适用于多大空间，或者多远距离可以听。其他的效果主要在主观评介。很少有产品把自己的客观指标作为宣传点来告知终端用户。所以市场上很低端的低价蓝牙音箱则只关心功率。这种音箱通俗来讲就是“听个响”。影响到听音体验和使用体验的指标一般都没有测量。

而追求品质的产品，都对影响声音和电池使用时长的基本指标做设计保证和质量管控。另外，指标也是相对静态的数字，因为测试信号是相对稳定的，而音乐和音频是复杂变化和大动态的，所以同样的指标，并不意味着有同样的主观表现。只能说，客观指标是基础。这些指标有时候是相互制约的，所以一般要根据自己需要的产品的特点，选择合适的芯片和设计。

二、主流蓝牙音箱方案有哪些？

主流蓝牙音箱的方案来说，一般蓝牙音箱的功率都小于10W, 一般是3~6W之间。

小功率的单声道蓝牙音箱，主要使用LM48511, 自带升压部分，4欧姆喇叭的话可以到5.4W 1% THD+n. 因为是H类的功放（就是功放的升压电压会随着输入信号而调整），所以效率很高。

中、大功率的，比如5W到10W的蓝牙音箱，单声道或者双声道，一般用TPA3130D2, TPA3118D2, TPA3128D2做功放，而DAC和处理一般用PCM5121，PCM5101或者TLV320AIC3254. PCM5121和TLV320AIC3254都是内部有miniDSP, 可以做一些声音处理，包括基本的EQ等。

这几个功放的性能都很好，因为是闭环反馈的，TPA3130D2是QFN封装的体积比较小，TPA3128是混合输出模式的的，静态电流很小，有助于提高系统效率。TPA3130D2是15W每声道的双声道功放，TPA3118D2/TPA3128D2是30W每声道的双声道功放，所以内阻都很小。

数字输入的功放也用的非常广泛，而且有更高级的音频处理。

普通声音处理的数字输入功放，一般来说，都具有多段EQ (5 bands to 10 bands)和1到3段DRC (按照频率分段），失真度控制等功能。蓝牙音箱用的比较多的比如TAS5711, 支持2.1输出组合，TAS5709/TAS5715这样的，支持2段DRC等等。

还有一些数字输入功放具有更强大的声音处理功能，内置了 miniDSP和RAM/ROM, 比如TAS5756M/TAS5754M, 我们提供了一些预先做好的处理流程可以选择使用，比如多达10段的EQ，增强功能的多段DRC，低音增强，自适应EQ等。而更先进的声音处理，则是“智能功放”，比如TAS5766M/TAS5782M/TAS2557M，这种算法对喇叭进行建模，播放音乐的时候，实时预测喇叭的状态，对震动幅度和温度进行实时的控制，避免喇叭损坏，在这个基础上面，喇叭的瞬时功率可以轻松达到额定功率的3倍以上，喇叭的功率越大短时间峰值可以达到的功率越大，这样就可以实现传统算法无法实现的很好的低音效果和更高的响度，弥补小口径喇叭以及小音腔的不足。

另外我们还新推出了一些性比更高的数字输入功放比如TAS5733L，TAS5753MD，有15段EQ和3段AGL，后续更会推出不需要输出电感的产品。

这里的EQ实际上是BiQuad滤波器，就是不仅能做EQ，也可以做高通，低通，Notch, Bass/Treble shelf 等滤波器。

软件工具上走向高度统一，就是熟悉了一个功放的使用，就可以很快的上手其他功放的使用和调试。便于快速产品化缩短开发时间，在及时使用新产品新技术的同事减少出错的机会。

===================================华丽的分割线===================================

1. 问：在双节蓝牙音箱中实现充电五分钟，听歌两小时，最少需要多大的充电电流？（设定蓝牙音箱的电池是2200mA/7.4V）

答：蓝牙音箱的电池容量通常是7.4V*2200mA·h=16280mW·h。以10W蓝牙音箱为例，其平均功率为1.5W左右，其播放时间 T=16280mW·h/1.5W=10H。

因此，两小时的音乐播放的功耗为 W=1.5W*2H=3W·h。因此，需要在5分钟内充入3Wh的能量，因此其充电功率应该为 P=3W·h / （5/60 h）=36W。因此充电电流应该设置为 I=36W/7.4V=4.86A。TI 的充电IC，BQ24617/BQ25703A同步的控制器可满足此需求。

2. 问：音响发烧友追求的“发烧运放”到底好在哪？就我所了解的，从运放的专业角度看运放的技术指标，那些被认为非常好的运放的指标并没有现在的一些优秀的音频运放的指标那么好。究竟这些“发烧运放”是真好吗？还是被市场炒起来的呢？

答：其实有一个非常重要的问题是，主观性。人比较喜欢自己常听的声音，特别是在差距不大的时候。所以在客观指标到达一定的程度之后，往往需要对比。另外客观指标来讲，指标的测量是相对静态的，比如固定的幅度或者固定的频率的测试信号。和音乐的动态是有差异的。谐波成分的差异和非常微小的低噪会造成主观听感较大的差别。谐波和电路结构和制程相关。另外也与供电和外围电路设计关系很大。TI也有很多新的非常好的音频运放，比如OPA728。

3. 问：可否推荐一下音频的消噪方案？

答：对常驻噪声，比如风声\马路噪声等可以用TLV320AIC3254/TLV320AIC3256/TLV320AIC3262这样的内置DSP的codec来处理。ANC现在官方不支持。

4. 问：为什么现在很多智能产品的信号传输都采用2.4GHz的模块芯片呢？它的优势是什么？没有其他的频段可以发代替吗？

答：民用free band,便于实现，成本低，5G是当前开始广泛使用的另一个频段。

5. 问：蓝牙音箱设计中，如何选择合适的充电芯片和DC芯片，避免PA过流掉电保护？

答：你说的这种，主要因为电源承载能力不够或者瞬态不够造成的，所以在设计的时候设计足够多的余量。另外使用功放的PLIMIT功能。

6. 问：现在很多音响都是追求体积更小，音质更好，在这方面有什么好的设计和推荐？采用TI的那款芯片可以提高音质和稳定性呢？

答：主打推荐TAS5782M, TAS2557。

7. 问：智能音响、电视等智能应用的语音识别需要外加几个codec？codec型号是？需要用几路MIC？

答：2到4片TLV320ADC3101。一般是4到8路MIC。

8. 问：TAS5782M对喇叭有什么要求？

答：如果用智能算法的话，一般是3欧姆到8欧姆，功率1W以上。

9. 问：TI是否有成熟的用于智能音响的语音识别的多MIC语音采集和前置处理方案？

答：推荐采用TLV320ADC3101或者PCM1864, 消噪和阵列算法用DA10xx芯片。

10. 问：无线耳机采用的哪款放大器？续航能力如何？

答：推荐采用TPA6141A2, 从效率来讲，属于很高的水平，续航能力主要取决于电池大小和耳机。

11. 问：无线耳机在电池管理方面采用了哪些方案？

答：推荐采用BQ21040, BQ24040。

12. 目前TI的20W左右的两进一出的功放哪款比较常用？

答：推荐使用TPA3136D2。

13. 问：如果Soundbar和移动电源功能结合，TI 有类似的方案吗？

答：其实直接用的整体方案，TI还比较少，但是可以组合起来用的。一般蓝牙音箱和移动电源结合。Soundbar因为体积大，不便于携带。要想更好的蓝牙音箱效果，可以用TAS5782M这种有特殊算法的芯片。

14. 问：Soundbar支持几种输入？

答：一般来说HDMI,蓝牙，光纤，同轴，模拟，3.5mm模拟，这六种，有的支持USB播放。

15. 问：TPA3136D2对于开关频率是如何设置的？闭环反馈如何设计？

答：50k，所以一般不必考虑调整频率，不易干扰am。本身芯片就是闭环反馈，如果想要滤波器后反馈，可以改为LC滤波然后增加反馈，一般没有必要。

16. 问：如何优化无线传输音频信号的音质呢？

答：传输软件什么往往改的余地不大，都是芯片厂商提供的，所以你能做的，可能就是优化天线设计，减少噪声，提高灵敏度。另外也要看功放部分的音质，确定是哪部分产生的噪声多。

17. 问：总是听说蓝牙音响音质不是特别好，是蓝牙通信的速率限制、编码解码的原因，还是后面DA的输出和功率放大器的设计有些问题呢？

答：主要是国内比较流行低端产品造成的。从头到尾都要节省成本所以都会有点问题，音质就没办法做好。就是便宜。有些品牌的做的要好一些但是品牌溢价又比较多。

18. 问：利用蓝牙传输的时候如何确保信号不中断，提高稳定性。蓝牙传输距离一般是10米左右？

答：是10米左右，5.0之后会更好，一般软件没问题的话主要是硬件提高灵敏度。

19. 问：Soundbar 内置无线发射器能做到多远？

答：一般是20米以内，因为是2.4G的，在有人遮挡的时候还要重传。

20. 问：在进行语音识别时，是否必须要联网，能否可以使用离线数据，TI的方案有没有较好方案？

答：需要联网。TI方案的优点是，提供了一定的本地化的语音识别，所以有些命令不必联网，所以在不能联网的时候也能完成一些基本操作。

8 年多前

Karen Liang38 8 年多前

TI__Prodigy 300 points

给大家推荐几款比较好的参考设计和产品，希望有所帮助。

热门参考设计：适用智能语音识别、蓝牙音响、Soundbar、无线耳机、低音炮、家庭影院等。

参考设计	设计指南	原理图	Gerber 文件
采用 66AK2G02 的用于语音应用的声音预处理系统参考设计（语音识别新发布，支持特殊功能如杜比开发）
采用 C5517 的用于语音应用的声音预处理系统参考设计（语音识别新发布！）
具有数字输入和处理功能的高保真 175W D 类音频放大器参考设计
采用 TPS61088 的音频放大器的包络跟踪电源参考设计
WiLink 8 Wi-Fi/蓝牙/Bluetooth Smart Audio Multiroom Cape 参考设计
无线超低音放大器参考设计
用于便携和智能手机应用的高保真音频耳机回放
针对电流输出音频 DAC 的高保真耳机放大器参考设计

热门产品：

应用领域	器件	说明	数据表	立即订购
蓝牙音箱	TPA3136	10W 超低 EMI 无电感立体声 (BTL) D 类音频放大器（高性价比！）
	TPA3128	采用 SpeakerGuard™ 的 30W 立体声 (BTL) D 类音频放大器
	TPS61178	具备负载断开功能的 20V 全集成同步升压（新发布！）
拉杆音响、KTV	TAS5751	采用 EQ 和 AGL 的数字音频功率放大器
拉杆音响、KTV	TAS5754	具有混合 RAM/ROM 处理器的数字输入、闭环 D 类放大器
低音炮	TAS5782	采用 96kHz 架构的数字输入闭环 D 类放大器评估模块
低音炮	TAS5711	具有扬声器均衡、DRC 和 2.1 支持的 20W 立体声 I2S 音频放大器
麦克风	TLV320ADC3101	92dB SNR 低功耗立体声 ADC，支持数字麦克风和 miniDSP
便携式播放器	TLV320AIC3254	采用可编程 miniDSP 的超低功耗立体声音频编解码器
家庭影院、电视、语音识别音箱	PCM1864	具有智能前端的 SW 控制、4 通道音频 ADC

user5008092 8 年多前回复 Karen Liang38

Prodigy 110 points

现在爬山旅游（那种野外爬山）带个随身小音箱越来越多，听下歌缓解疲劳。带蓝牙语音的就很放方便，人机互动很舒适。我们公司也正在开发试水两款。硬件开发没有过多问题，在软件是有些小问题。蓝牙技术和语音识别的结合目前都是将语音识别模块放在AG上，然后让用户对HF发出语音指令，随后HF再进行录音并且对录音进行压缩编码处理，编码后的音频通过蓝牙通信协议发送到AG端，在AG端对音频进行解码恢复，再将恢复后的语音送入语音识别模块进行识别，然而现有的音频编码方式多为有损压缩，在编码再解码后，语音质量会有变化，影响识别效果。现在正在就这方面问题进行改进，以达到更好的使用效果。准备参考TI的一些专用芯片试试改进。

Simon Liu 8 年多前回复 Karen Liang38

Prodigy 20 points

我曾经也做一个简单的语音识别播放系统，同时还有物联网WIFI插座控制功能，基于关键词识别的，但是有中文SDK，简单开发很方便。

不知道TI的方案，是不是也是基于关键词识别的？

SDK开发是否方便？

播放的语音是否支持板载Flash，最大支持多大的Flash，是否支持TF/SD扩展？

能否实现固件的OTA升级？

user4831301 8 年多前

Prodigy 80 points

关于蓝牙音箱蓝牙耳机我就有问题了，这两个我都有，还不止一个。。主要是蓝牙耳机，我带在耳朵上，手机就放在口袋，这才几米啊，骑自行车的时候就会出现，有时候站着，蓝牙就会卡顿，自行车骑行过程中又不会，按道理来说，路上能有什么干扰，只要是停下了等红灯，口袋稍微低了点，就会卡顿，然后腿跳起来，没事。。但是走路的时候又没有。。还有关于语音识别的，我真的很好奇，比如我说一个地名，汉字这么多同音字，为啥他就能识别出我想说的地名，奇怪了，你要是出现几个相同声音的字我还可以理解，但是每次好像都是对的，我普通话也没这么标准啊。。

user1694587 8 年多前

Intellectual 310 points

个人认为语音识别技术在未来会有广泛的应用，尤其是远场语音识别技术和针对单个声音的特定语音识别技术，其好处是结合无线网络传输技术如低功耗蓝牙、WiFi等，可以实现用户通过语音控制家里的智能设备，实现智能应用。

核心处理器可以采用有线供电技术，做为组网的核心连接端子，其他小的语音收集装置可独立放置在放假的任何区域，做为语音收集和有效去燥的子设备，有必要采用低功耗技术。让整个语音识别形成单空间内的语音场，判别用户的使用。

user1147286 8 年多前回复 Karen Liang38

Expert 1910 points

随着科学技术的发展，人类正在变得越来越'懒惰'，键盘的出现，使人类甩掉了纸笔。语音识别技术也迟早会使人类，将能动嘴不动手的天性发挥得淋漓尽致。

xiaobo mu 8 年多前回复 user1147286

Intellectual 290 points

这个想法很好，集成了音频输入与输出，输出可以是标准普通话，没有问题，但是语音输入需要考虑各个地方的口音等问题，并不一定都是标准普通话。

user4882006 8 年多前

Prodigy 201 points

语音识别的最大困难在于声学

为什么会说语音识别最大的落地还是在场景之中，因为这涉及了语音交互用户场景的变化，当用户从手机切换到类似Echo智能音箱或者机器人的时候，实际上麦克风面临的环境就完全变了，这就如同两个人窃窃私语和大声嘶喊的区别。
前几年，语音交互应用最为普遍的就是以Siri为代表的智能手机，再到这两年的微软小娜和小冰等等...这个场景一般都是采用单麦克风系统。单麦克风系统可以在低噪声、无混响、距离声源很近的情况下获得符合语音识别需求的声音信号。但是，若声源距离麦克风距离较远，并且真实环境存在大量的噪声、多径反射和混响，导致拾取信号的质量下降，这会严重影响语音识别率。而且，单麦克风接收的信号，是由多个声源和环境噪声叠加的，很难实现各个声源的分离。这样就无法实现声源定位和分离，这很重要，因为还有一类声音的叠加并非噪声，但是在语音识别中也要抑制，就是人声的干扰，语音识别显然不能同时识别两个以上的声音。
显然，当语音交互的场景过渡到以Echo、机器人或者汽车为主要场景的时候，单麦克风的局限就凸显出来。为了解决单麦克风的这些局限性，利用麦克风阵列进行语音处理的方法应时而生。麦克风阵列由一组按一定几何结构（常用线形、环形）摆放的麦克风组成，对采集的不同空间方向的声音信号进行空时处理，实现噪声抑制、混响去除、人声干扰抑制、声源测向、声源跟踪、阵列增益等功能，进而提高语音信号处理质量，以提高真实环境下的语音识别率。
但是仅靠麦克风阵列提供的这些技术还是不够的，这只能解决部分远场化的问题。事实上，真实场景下我们需要更复杂的识别技术，能不能不依赖于云端？能不能同时追踪和识别多个人讲话？能不能识别语调和情感？等等这些环节，都是急需要解决的问题？而很多技术的瓶颈就在于声学能否也有一个较大的突破。

地瓜patch 8 年多前

Intellectual 335 points

TI的智能语音识别方案是否支持麦克风阵列？最多能支持几个？TI有没有麦克风阵列的相关资料

user4800847 8 年多前

Prodigy 90 points

今天看了百度AI 开发者大会，会上推出了一款智能语音系统 duer OS,个人觉得duer OS将在中国智能音响行业占很大的比重

主要是该系统的智能语音识别能考虑之前的对话，识别处所针对的话题，或者对象是什么，不像siri那么古板，只会识别当前的问题。

而且duer OS还有唤醒功能，我们只要给我们的智能设备设置一个唤醒关键字，我们连开机键都不要按了。

duer OS提过了大量的api，开发方便，我都想搞个开发版玩玩

user4058737 8 年多前回复 Karen Liang38

Prodigy 212 points

不管是音响还是蓝牙耳机方案，音质是一个很重要的指标，续航能力也是非常重要的，在户外，现在的电池能工作两三小时已经不错了，就是有移动电源，也就五六小时，能够保证10小时续航很难，就需要音响方案的功耗设计。

user4995760 8 年多前

Intellectual 255 points

先学习了解一下，因为以后的项目有可能用到音频，目前还没有用过音频。初步估计其他功能没有特殊要求，但是有两点要求。一、稳定性必须好，因为是医疗行业；二、支持多语言，因为仪器要进行出口。

Tony Tang 8 年多前回复地瓜patch

TI__Guru 64206 points

可以。

麦克风阵列：

http://www.ti.com.cn/tool/cn/tida-01454

jiaozi tianzhi 8 年多前

Intellectual 570 points

开一下脑洞！语言识别可以作为安全密码防护吗?如果可以，如何做到更安全加密，更简单便捷！

Tony Tang 8 年多前回复 jiaozi tianzhi

TI__Guru 64206 points

jiaozi tianzhi 说：
开一下脑洞！语言识别可以作为安全密码防护吗?如果可以，如何做到更安全加密，更简单便捷！

这是属于声纹识别的范畴。是由算法实现的，跟用什么平台没有强相关。

user3688025 8 年多前

Expert 2260 points

语音识别还是要选择好一个好的云平台。
目前好多智能家居上已经用上了语音识别，只要说说话就可以控制家里的家电了，一方面是方便了，一方面人又变懒了。

用过几种蓝牙音箱，也都是中低档的，太高档的，也只有发烧级的才会去用吧。对于市场所导向的，还是大众品，那么价格也就在那个水平了。
所以一般大众的要求就是满足省电、声大（广场上的大妈的要求）。
现在好多电动车上都会安装一个音箱，蓝牙音箱也是不错的选择，这种可以与电动车共用一个电源，那么对于功率就会有一定的要求。

user4671742 8 年多前

Intellectual 396 points

对语音识别而言，对于各种方言，有没有好的识别方法呢。我是指稍微带点口音，并不是听不懂的。还有英文的，发音的准确是不是会有较大的影响？至于蓝牙，总感觉同品质的无线和有线，有线的音质总是比蓝牙的音质要好，这是不是调制解调的问题？音质必然会受到些许影响

user4638972 8 年多前

Prodigy 70 points

语音识别技术在操控领域有很大的发展空间，在生物识别安全领域的应用很发展会怎么样？

user4310529 8 年多前回复 Karen Liang38

Prodigy 180 points

一致在采用TI的一些方案研制便携式音响，带蓝牙功能的，TI的相对来说功耗还可以，能够进一步优化是很不错的，

软件方案也有一些bug需要解决。

Junbo Zhao 8 年多前

Prodigy 250 points

语言识别技术的应用与发展，这几年确实不容小觑。还记得四五年前，大学的课程设计还是用的只能识别简单几句命令的小单片机，后来出现了可以识别自己定制的十句命令的芯片，而且还大都要求飘准滴普通话呢，它们都是本地离线芯片解决方案。一直觉得语音识别是一个很高端的东西，需要提取语音特征，利用算法什么什么的（语音关键词检测 KWS  本地语音识别 ASR  声纹识别 SPR  语音合成 TTS）。现在网络更加发达，结合云技术，出现了网络识别，而且识别率大大增加，还可以识别方言，目前IOT更加推动了语音识别技术队发展，看来以后会成为重要的生活组成部分哦。此前一直不知道TI还有自己的语音识别方案，在此学习一下TI的语音识别和语音唤醒，收获不小。

Huaguo Zou 8 年多前

Prodigy 112 points

语音识别技术可以控制电灯的启停，

电风扇、空调、洗衣机、冰箱、热水器的启停等等，

应用在智能家居方面，一定大有作为！

TI提供了本地化的语音识别，在不能联网时也能完成一些操作，挺方便的。

user4441475 8 年多前

Intellectual 281 points

关于语音识别从技术层面来讲，我认为难点在于声纹的精准分析，通过傅里叶变换以及幅频匹配等算法搞定。不过目前的神经网络算法也大大提高了语音识别的准确性，通过建模和多次的学习，从而达到精准学习。以前本科的师弟就研究神经网络。另一种就是建立语音识别库，说白了就是内存大小与算法复杂度的矛盾而已。

user4070022 8 年多前

Prodigy 70 points

我觉得语音识别目前关键还是准确性的问题，还有就是有没有大数据支撑，可以做模糊匹配，如果只是单纯的识别的话，必须说什么就是什么，不能通过关键字定位，意义不是很大

user1538729 8 年多前回复 Karen Liang38

Intellectual 380 points

对语音识别方案有兴趣，目前所居住的城市对于安保非常重视，各个小区及单位都加装了门禁系统，个人配备的都是IC钥匙扣。单位、父母、岳父母、家各一个，腰间都挂满了，再加上其它的钥匙真是累赘，在进小区刷门禁卡时还要人工识别一次到底是哪一只？所以就设想能否采用语音识别技术对现有小区门禁系统进行替代呢？个人这一想法可能不太现实，感觉语音识别区分难度比较大。

user3687004 8 年多前

Intellectual 680 points

语音识别是个系统工程。首先音频输入，相当于模拟输入，需转换为高频数字机器语言，再次硬件识别和特征辨识，最后再合成音频输出。现在同声翻译应用到了该技术。难点就在识别技术，目前有三种主流的识别方法：1）基于声道模型和语音知识的方法；2）模式匹配的方法；3）人工神经网络的方法。三种方法真正能实用的是模式匹配的方法，难点是模型数据库的建立，不同的语种，不同的地区应该有不同的数据库，根据实际情况选择模式识别，复杂度可想而知。个人认为语音识别还有很长的路要走。
有机会试试PCM1864，看看前端ADC有多智能：）

user44997812 8 年多前

Expert 1190 points

对于蓝牙音响和语音识别我有以下一些想法，说出来跟大伙一起交流一下：

1 对于蓝牙音响我认为可以搞成类似手环的那种样式，小巧而又非常实用；

2蓝牙音响可以加入两种模式一种是个人模式一种是集会模式便于灵活选择；

3蓝牙音响如果可以最好加入定位功能，便于用户紧急情况下使用

4语音识别最好能够将开发板或者IC搞的再“傻瓜”一些便于开发者使用

5 语音识别最好能加入方言模式

user3473280 8 年多前

Intellectual 342 points

智能音箱是个很好的创意，让智能家居的人机交互简单化实用化了，应用前景很广阔，对智能家居的发展有着极大的推动作用。智能音箱极有可能成为智能家居的脑袋，这就要把可靠性、安全性提到重要位置，在各种环境下的语音识别的成功率和准确性，还有很多工作要做，算法的实现需更加强大的计算能力的支持。音箱要在多人中或电视等的背景音中识别出主人的语音命令，对语音传感器精确定位和降噪都提出很高要求，都需要进一步的完善。希望今后的方案能高度集成，软件支持到位，减低产品开发人员工作量，降低成本，加速普及。

user1333909 8 年多前

Prodigy 70 points

应用智能语音识别同步转换文字技术在庭审中的运用是不错的！庭审通过智能语音识别系统软件，将庭审语音同步转化为文字记录，自动生成完整的庭审笔录，同时进行同步语音录像，时间效率都不错！庭审记录效果良好。将高科技运用于庭审环节，以提升庭审效率和公开透明度。

这点运用很好但也需要使用过程中完善！

user4009018 8 年多前

Intellectual 380 points

在我的个人感觉里，智能时代在几十年里不会有理想的高度，相信这几十年里进步不会飞跃，每年也只会一点点的变化，因为理想的智能语音识别是完全没有缺点的，而目前的产品要求似乎属于很基本的生活标准，远远达到不了完美的程度。
网络和蓝牙无疑是目前最先进的两大进步，从蓝牙键鼠，蓝牙耳机，蓝牙音箱等就可以看出，无疑蓝牙音箱的技术层次更高一点，需要达到的理想化要求更高。在性价比，体积，容量，寿命，效能，性能等等方面做到基础作用，要做到理想化还是有点距离的。语音识别系统确实是比较好玩，比较先进的技术，而它的不出错的最终完美也是一种生活的价值，蓝牙针对手机的普及率远远高于电脑也是一个问题，电脑所需要硬件的累赘也是一个缺陷，从需要安装软件到即插即用等，在以后的硬件设计和软件设计上希望达到更完美的状态。

qiang wu4 8 年多前

Intellectual 390 points

智能语音识别是人工智能的一个发展方向，可以使人们的办事效率更高，主要克服的问题是针对不同地区人的口音差异，如何提高识别的成功率。

guyue 8 年多前

Intellectual 385 points

个人理解，语音识别就是将人所说的话能够最大限度无失真的传输出去，接受方能够基本无失真的听到几乎原音，以前语识别应该是模拟方法居多，所以音效器材比较体积比较大，现在已经偏向数字化处理了，而且通信方式也偏向无线化了，蓝牙、WiFi、3G、4G语音识别越来越成熟了，以后大家耳朵更有福了！

shenlan 8 年多前

Intellectual 251 points

现在的蓝牙无线音箱都是基于classic蓝牙技术，即BR/EDR的A2DP，HFP profile，但是对于未来的方向，VOBLE，即voice over ble，也是大有可为的。在蓝牙5.0 spec中，对于BLE做了极大的增加，速率也提高了2M，在语音应用方面还是可以满足的。我觉得现在蓝牙音箱的发展方向，是提高蓝牙音箱的音质，可以针对蓝牙音频数据的编码方向入手。

Karen Liang38 8 年多前回复 Karen Liang38

TI__Prodigy 300 points

根据大家聊到的各个问题，整理了一套比较详细的内容，包括参考设计和配套选型。如果有选型方面的需求，也可以下载音频选型表看看。

分享一下，希望对大家有所帮助。

基于 C5535 eZdsp™ 的语音识别参考设计

采用 TI 嵌入式语音识别 (TIesr) 库，突出了 C5535 和 C5545 DSP 器件的语音识别能力；并且可基于成功的关键字采集，指示如何运行在 C5535eZdsp OLED 屏幕上打印预编程关键字的语音触发示例。

特性及功能：
• 本地语音识别算法不需要联网即可实现语音控制
• 开放源代码库，经典隐马可夫语音识别算法
• 可解码所有常见格式音乐，miniDSP CODEC 可做消噪处理辅助语音识别，并可增强播放音效

相关语音识别参考设计

参考设计	设计指南	原理图	Gerber 文件
基于 PCM1864 的环形麦克风阵列参考设计
基于 C5517 的声音预处理系统语音应用参考设计
基于 66AK2G02 的声音预处理系统语音应用参考设计(支持杜比开发！)
基于 C6747 的声音预处理系统语音应用参考设计

智能音频系统配套器件

产品	说明	数据表	立即订购
音频功放及升压类
TAS5733L	具有 EQ 和 3 波段 DRC 的开环数字音频功率放大器
TAS5751M	采用 EQ 和 AGL 的数字音频功率放大器
TAS5782M	采用 96kHz 架构的数字输入闭环 D 类放大器
TPS61088	具有 10A 开关 13.2V 输出，同步升压转换器
电源类
TLV320ADC3101	高性能低功耗小封装，支持 TDM 格式数据，支持各种麦克风
TPS54302	28V 3A 降压 SOT23-6 内部补偿
TPS562208	17V 2A 降压 SOT23-6
TPS563208	17V 3A 降压 SOT23-6
TLV62568/9	5V 1A/2A 降压 SOT23
TPS709	30V 输入 1.35uA 待机功耗 LDO
电池管理/充电类
BQ25606	I2C 控制单节 2.5A 快速充电器
BQ25700A	具有 OTG 功能升降压充电控制器
微处理器及无线连接
MSP430FR2533	带触摸按键的微处理器
CC2640R2F	低功耗蓝牙 SOC,支持蓝牙 4.2/5.0.
CC2564	蓝牙 Smart Ready 控制器
CC3200	具有内置 Wi-Fi 连通性的单片微控制器单元
其他
TXS0102	I2C 电平转换
TXS0104E	I2S 电平转换
LP55231	9通道可编程自动控制模式 LED灯/光环驱动器
* 点击此处可下载TI音频系统常用选型表

Jesse Lee1 8 年多前回复 Karen Liang38

Prodigy 30 points

你好，请教一下：

1.对中文的语音识别支持怎么样？

2.网络方面的支持我没有看到，如果我点播的歌曲本地没有，需要联网获取，如何实现？

音频

音频论坛

【问答互动+全新音频资料下载】便携式音频与智能语音识别

TI的智能语音识别方案是否支持麦克风阵列？最多能支持几个？TI有没有麦克风阵列的相关资料

麦克风阵列：