我正在使用 ADCx120EVM-PDK 开发板在 ADC CH3上测试 VAD 的功能。 我评估的一部分是通过靠近开发板的扬声器播放多个音频数据库文件以模拟交谈。 对于短而隔离的语音模式、VAD 语音检测和记录是准确的。 但是对于附加的 WAV 文件、 在句子的开头和中间有一个样本丢失。 在这些窗口期间、 语音不会被记录。 第一个原因可能是语音检测和/或 ADC 上电时间延迟、这种延迟即使仅在语音检测开始时也是可以接受的。 它位于 第二个窗口中、VAD 过早关闭、并且不会记录一些语音。
在此图中、顶部波形是在为附加的 WAV 文件禁用 VAD 的情况下捕获的。 底部启用 VAD 自动模式。
此图是 SDOUT 引脚和 GPIO1中断引脚的逻辑输出、用于识别 VAD 以及相应的 ADC CH1何时开启和关闭。 我的经验是 VAD 在演讲中短暂的停顿期间迅速关闭,但即使在演讲结束后,它仍然保持很长一段时间。 我们希望记录后一种情况、直至不再检测到语音。 有人能解释为何前者如此迅速出现?
附件是在这种情况下使用的语音测试文件和寄存器转储。 唯一的修改是通过 GUI 启用/禁用 VAD。