主题中讨论的其他器件:AM3874
大家好、
我是否知道 DM8168上的调整峰值性能(APP)?
提前感谢。
B.R.
OC
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
大家好、
我是否知道 DM8168上的调整峰值性能(APP)?
提前感谢。
B.R.
OC
您好、Omin、
我们对 AM387x 器件有类似的问题。 您可以重复使用 DM816x 器件的信息:
AM3874 @600MHz APP = 1.8 x 10^-4 WT
AM3874 @800MHz 应用= 2.4 x 10^-4 WT
采用 VFPv3的 ARM Cortex-A8计算:
频率(时钟速度)、F = 600MHz
浮点运算、FPO = 1
架构调整因子、W = 0.3 (对于非矢量)
APP = 1 (内核)* 0.6 (GHz)* 1 (FPO)* 0.3 (W)* 10-3 = 0.00018WT
来自 ARM 技术支持;
----------------------------------------------------
计算结果取决于 FPOi (每个周期64b 浮点运算的数量) FI (处理器频率) WI (架构调整因数)、其中矢量处理器的 WI = 0.9、非矢量处理器的 WI = 0.3
"注意:在确定 FPO 时、仅包括64位或更大的浮点加法和/或乘法。 所有浮点运算都必须用每个处理器周期的运算来表示;需要多个周期的运算可以用每个周期的分数结果来表示。
对于不能对64位或更多的浮点操作数执行计算的处理器、有效计算速率 R 为零。"
因此、对于 ARM 内核、我们可以考虑 FPO = 0、因为它不能在64位值上运行。
VFP 可在64位双精度值上运行。
VFP 可以在每个周期发出一条指令、并且可以在每个周期完成一个64位加法、因此 FPO=1。
"注7:"矢量处理器"定义为具有内置指令的处理器、可同时对浮点矢量(64位或更大数字的一维数组)执行多项计算、至少具有2个矢量函数单元和至少8个矢量寄存器、每个矢量寄存器至少包含64个元素。"
VFP 执行短向量运算、但它以串行方式执行、它不会在单周期内对多个64位值执行并行运算。 因此、我们应将其视为非矢量处理器、WI = 0.3。
您需要指定 CPU 频率。 如果我们假设是600MHz
APP = FPO x F x W = 1 x 600 x^μ s -6 x 0.3 = 1.8 x 10^-4 WT (加权 teraflops)
------------------------------------------------------
关于 CA8的参数,如果您的产品具有 VFP,FPOi 为1,而 W 为0.3。
此致、
帕维尔