以下是我观察到的细节:
-
输入:我将提供一个 nv12格式的图像作为输入到 PreprocNode。 当我将 PreprocNode 的已保存 r_input_arr 与原始 nv12映像进行比较时、我发现它们是相同的。 这表明预处理节点正确处理了输入。
-
输出:PreprocNode 的 I_output_arr 是已处理图像的可视化表示。 它是一个经 int16格式化的 RGB 图像、大小为[3x704x256]字节。 但是、对 I_output_arr 进行可视化后、我注意到通道之间的偏移。
- 通道1偏移:I_output_arr 的通道1中的结果与通道0相比偏移了1408x2个字节。
- 通道2偏移:与通道1相比、I_output_arr 通道2中的结果偏移了1408x2个字节。
视觉表示表明、与通道0相比、通道1在右侧有额外的空白区、与通道1相比、通道2在右侧有额外的空白区。
此外、我观察到 TIDLNode.r_input_arr 被设置为 PreprocNode.i_output_arr。 此外,我还跟踪了 inDataLayer0层,观察到的现象是一致的。