This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TLV320ADC6120:VAD 压降中句。

Guru**** 2381080 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/audio-group/audio/f/audio-forum/1326918/tlv320adc6120-vad-dropout-mid-sentence

器件型号:TLV320ADC6120

我正在使用 ADCx120EVM-PDK 开发板在 ADC CH3上测试 VAD 的功能。 我评估的一部分是通过靠近开发板的扬声器播放多个音频数据库文件以模拟交谈。 对于短而隔离的语音模式、VAD 语音检测和记录是准确的。 但是对于附加的 WAV 文件、 在句子的开头和中间有一个样本丢失。  在这些窗口期间、 语音不会被记录。 第一个原因可能是语音检测和/或 ADC 上电时间延迟、这种延迟即使仅在语音检测开始时也是可以接受的。 它位于 第二个窗口中、VAD 过早关闭、并且不会记录一些语音。

在此图中、顶部波形是在为附加的 WAV 文件禁用 VAD 的情况下捕获的。 底部启用 VAD 自动模式。

此图是 SDOUT 引脚和 GPIO1中断引脚的逻辑输出、用于识别 VAD 以及相应的 ADC CH1何时开启和关闭。 我的经验是 VAD 在演讲中短暂的停顿期间迅速关闭,但即使在演讲结束后,它仍然保持很长一段时间。 我们希望记录后一种情况、直至不再检测到语音。 有人能解释为何前者如此迅速出现?  

附件是在这种情况下使用的语音测试文件和寄存器转储。 唯一的修改是通过 GUI 启用/禁用 VAD。

e2e.ti.com/.../p232_5F00_003.wav

e2e.ti.com/.../6567.TLV320ADC6120.csv

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    明天回复

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    如果您有一段很长的对话时间、例如30秒、您在开始时是否总是在语音检测中看到掉线?

    在增加扬声器的音量创建语音时、剪辑的情况是否会发生变化?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我对同一音频片段在不同音量下执行了相同的测试。 VAD 检测对于小容量非常有效。 在容量适中的情况下、在我认为对话处于的水平上、VAD 在中端仍在关闭 ADC 电源。 如果替换成一个较长的削波、那么性能将会更好、但仍无法满足我们的应用要求。

    在自动模式下使用 VAD 对我们来说不是必需的、因此我不会在这个指标上停留太久。 我在用户模式下使用 VAD 执行了上述测试。 在此模式下、我看到用于 VAD 检测的 IRQ 点亮频率更高。 这些触发器足以对 ASI 输出进行时间切片。  

    我注意到、当 VAD 处于自动模式并配置为一次性的2ms 脉冲时、IRQ 脉冲持续2ms。 当它为用户模式时、脉冲变为4ms。 为了隔离这种行为、我屏蔽了 IRQ、以便只有 VAD 上电的一个事件应该触发 IRQ。 是否会出现这种脉冲延长、或者宽度延长的原因可能是什么?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我会在几个小时内回复

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我已将您的问题发布给我们的设计团队。 我正在等待他们的回复

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我注意到 INT_CFG 寄存器具有一些用于中断输出的选项。 注册表在您的设置中的价值是什么?