This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] 66AK2H06:SL2/MSMC 存储器中的一位错误

Guru**** 2547900 points
Other Parts Discussed in Thread: 66AK2H06

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1547782/66ak2h06-single-bit-error-in-the-sl2-msmc-memory

器件型号:66AK2H06


工具/软件:

你(们)好

最近、使用 66AK2H06 处理器的器件报告了 SL2/MSMC 存储器中的一位错误、该错误持续存在。 我们已经进行了仿真测试、希望您尽快提供反馈和跟进。


症状:66AK2H06 处理器 SL2 存储器的常量数据中出现一位错误。 内存地址为 0x0C3A4048、内存数据从 0x0C38CB04 更改为 0x0C18CB04(位 21 从 1 更改为 0)。 设备已开机并运行 9 个月、日志显示 SL2 内存中有两个单位错误更正。


问题分析:问题的疑似原因是对同一 SL2 内存子库中的其他数据执行写操作。 小规模写入导致 ECC 校验和暂时无效、再加上粒子辐射、导致 SL2 存储器中的一位错误持续存在。

仿真测试:禁用 SL2 存储器后台扫描功能、比较对同一子存储体的大数据写入和小数据写入、模拟同一子存储体中的一位错误、并观察访问错误数据是否会触发 ECC 中断。

此致

Zekun

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zekun:

    我已通知相应的专家对这一问题进行了调查。

    提前感谢您的耐心。

    此致

    Gokul

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Gokul

    由于这个问题是 在大规模生产过程中发生的、因此迫切需要为我们提供线索。 感谢您的支持。

    此致

    Zekun

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zekun:

    问题分析:问题的可疑原因是对同一 SL2 内存子库中的其他数据执行写操作。 小规模写入导致 ECC 校验和暂时无效、再加上粒子辐射、导致 SL2 存储器中的一位错误持续存在。

    是的、完全正确。 我认为 SL2 存储器中的部分存储器写入操作导致了问题。 我们必须始终对受 ECC 保护的存储器使用位对齐和全宽写入。  

    此致、

    Betsy Varughese.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Betsy

    对于此写入操作、我们是否有更详细的要求?

    像 32 位或 64 位对齐地址写入一样、最小大小= 128k 或 256k?

    此致

    Zekun

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zekun:

    您可以 在下面找到这些详细信息。

    参考链接: https://www.ti.com/lit/ug/spruhj6/spruhj6.pdf

    此致、

    Betsy Varughese.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    1) 进一步补充之前的仿真测试用例说明:禁用 L1D 高速缓存和 L2 高速缓存、关闭 SL2 内存后台扫描功能、比较大或小颗粒到同一子存储体的写入、模拟同一子存储体中的一位错误、并观察访问错误数据是否会触发 ECC 中断。
    2) 现场设备实际上使用 L1D 高速缓存和 L2 高速缓存,其高速缓存行分别为 32 字节和 128 字节。 将数据写入 SL2 内存需要通过高速缓存、这意味着从理论上讲、将数据写入 SL2 内存是一个大批量写入。
    3) 我可以问,在上述实际工作条件下, SL2 内存 ECC 校验码是否有小颗粒写入或短期无效? 请帮助分析并再次提供反馈。 谢谢!

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    勘误表报告了在某些条件下错误的 DDR3(而不是 MSMC)写入 ECC 错误、并提供了可能的权变措施。

    您能看一下这个 https://www.ti.com/lit/er/sprz402f/sprz402f.pdf?、但我们需要检查它是否也适用于 MSMC。

    此致、

    Betsy Varughese.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Betsy

    1)我们已经检查了 DDR ECC 配置并启用了 RMW 函数。 MSMC 存储器是否具有类似的功能?

    2)现场设备实际上使用 L1D 高速缓存和 L2 高速缓存。 如果不考虑后台清理引擎、MSMC 存储器 ECC 校验代码是否可能在短期内失败?

    此致、

    GQ Zhou

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    1)我们已经检查了 DDR ECC 配置并启用了 RMW 函数。 MSMC 存储器是否具有类似的功能?

    MSMC 存储器不像 DDR 存储器那样支持读取 — 修改-写入 (RMW) ECC。 其 ECC 依赖于对齐写入和标准错误更正、对部分或未对齐写入没有特殊处理。 RMW 是 DDR3 存储器控制器独有的。

    2)现场设备实际上使用 L1D 高速缓存和 L2 高速缓存。 如果不考虑后台清理引擎、MSMC 存储器 ECC 校验代码是否可能在短期内失败?

    如果您的系统严重基于高速缓存(L1D/L2 高速缓存)、许多存储器访问都从高速缓存提供、而不会立即在 MSMC 中触发 ECC 校验。如果没有主动清理、MSMC 中的一位错误会一直未被检测到、直到执行直接 MSMC 读取或清理引擎循环通过地址运行。

    此致、
    Shabary S Sundar.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    感谢您的答复!

    1) 我们分析一个可能的原因是 L1D 高速缓存中发生了一位错误。 由于 L1D 高速缓存没有 ECC/EDC 函数、因此、当将高速缓存数据写回 MSMC 存储器时、如果 MSMC 存储器中永久出现一位错误、

    2) 设备实际上使用 L1D 高速缓存和 L2 高速缓存。 当将高速缓存数据写回 MSMC 存储器时、ECC 校验代码是否会同步计算、无需等待清理引擎?

    3) 基于理论分析,是否还有其他可能的原因?

    此致、

    GQ Zhou

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    2) 器件实际上使用 L1D 高速缓存和 L2 高速缓存。 当将高速缓存数据写回 MSMC 存储器时、ECC 校验代码是否会同步计算、无需等待清理引擎?

    在写操作期间、MSMC 存储器硬件会同步计算 ECC。ECC 校验代码在写回数据时立即生成并存储、从而确保数据完整性而没有延迟。 在正常缓存写回过程中、无需等待清理引擎来计算 ECC。

    3) 根据理论分析、是否有其他可能的原因?

    我没有注意到任何其他情况。 但我一定会检查一下、然后返回给您。

    此致、
    Shabary S Sundar  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    感谢您的答复!

    1) 将数据写回 MSMC 存储器时、是否存在 ECC 校验代码不同步计算或暂时无效的情况?

    2) 使用高速缓存时、是否在不经过高速缓存的情况下向 MSMC 写入了任何数据?

    此致、

    GQ Zhou

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    [quote userid=“405471" url="“ url="~“~/support/processors-group/processors/f/processors-forum/1547782/66ak2h06-single-bit-error-in-the-sl2-msmc-memory/5978994 “>1) 将数据写回 MSMC 存储器时、是否存在 ECC 校验代码无法同步计算或暂时无效的情况?

    这是一个很棒的地方,很棒的一个景点。 在正常工作条件下、同步计算 MSMC 存储器的 ECC。 我会检查这个,并尽快回来给你。

    此致、
    Shabary S Sundar

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    2) 使用高速缓存时、是否在不经过高速缓存的情况下向 MSMC 写入了任何数据?


    默认情况下、如果启用了高速缓存、则 L1D 和 L1P 缓存均可缓存 MMSMC/2 级存储器、除非显式将存储器区域配置为不可缓存。

    此致、
    Shabary S Sundar

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    感谢您的答复!

    1) 我们的使用场景是 MSMC 存储器仅存储数据、而不存储代码。 因为高速缓存数据写回 MSMC 存储器和 ECC 校验代码会立即生成并存储。 启用 L1D 缓存时是否无需清理引擎?

    2) 回到原来的问题( MSMC 内存中出现一位错误并持续存在),是否还有其他可能的原因? L1D 缓存错误是唯一的原因吗?

    此致、

    GQ Zhou

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    1) 我们的使用场景是 MSMC 存储器仅存储数据、而不存储代码。 因为高速缓存数据写回 MSMC 存储器和 ECC 校验代码会立即生成并存储。 启用 L1D 缓存时是否无需清理引擎?

    即使在写回时使用 L1D 高速缓存和 ECC、也需要清理引擎通过定期查找和修复随时间推移出现的错误来保持 MSMC 存储器可靠。

    2) 返回到我们的原始问题(MSMC 存储器中出现一位错误并持续存在)、是否有其他可能的原因? L1D 缓存错误是唯一的原因吗?

    我将在一天内检查并更新。

    此致、
    Shabary S Sundar

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    是否有任何最新信息? 是否有其他可能的原因导致我们原来的问题?

    此致、

    GQ Zhou

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    是否有任何最新信息? 是否有其他可能导致我们最初问题的原因?

    根据文档、最可能的原因似乎是部分写入和对齐问题。 目前、我们尚未确定与您的问题相关的任何其他因素。 器件勘误表也未指明与此相关的任何其他问题。

    此致、
    Shabary S Sundar