工具/软件:
您好!
在将模型的执行卸载到硬件加速器时、我面临着一个奇怪的精度问题。 我查看了故障排除指南、并使用了模型的 accurity_level 和 tensor_bits 参数、但这对结果产生了轻微的积极影响。 根据我迄今为止所确定的情况、问题似乎与模型应处理的输入数量或输入处理顺序密切相关。
举例说明我的问题、可以考虑我的模型、该模型旨在处理具有4个元数据功能的输入并为其提供标签。 我经常遇到的问题是、考虑到要在硬件加速器上处理的一批 X 输入、只有第一个输入始终由模型正确标记。
下图说明了我的问题:如果我向 CPU 提供一批5个输入、则准确度很少低于98%。 如果我将同一批输入到已卸载的模型中、则只有第一个输入正确标记、而剩余的4个输入将面临精度急剧下降的问题。 如绿色突出显示所示、已卸载模型的第一个输入与 CPU 中针对同一数据集推断的值密切相关。 此行为也可与其他批次值(如20,100等)重复 正如预期的那样、当批号为1时、精度始终与 CPU 相当。
您是否碰巧对可能发生的事情有任何见解? 我查看了其他用户的帖子、但他们的问题似乎与我遇到的问题没有任何共同点。
感谢您的观看!
此致、
Giann。