NEW BOT Телеграм, страница

David's random thoughts

AMD设计SEV居然有这么大一条漏网之鱼……malicious hypervisor能随意drop guest的dirty cache可太刺激了。

https://twitter.com/InstLatX64/status/1724656517993959614

🤯3👍1

900 viewsDavid Huang, 05:58

David's random thoughts

早些时发现523.xalancbmk这个子项在x86平台非常的cache latency bound，而较大且低延迟的L2是M1/M2的一大特色，12-16M提供足够高的命中率又能维持比x86低得多的延迟。M1可以在这个子项里达到同频将近两倍于Zen3/4的性能可能就有一个主要原因在此。

不过前段时间经过观察发现M3 max的L2延迟以及延迟周期数都有显著增加，可能是为了做6核cluster以及同时拉高频率导致。那么523.xalancbmk的ipc掉的这么狠也不难理解了……

JamesAslan - M3Pro的败北：太阳底下没有新鲜事，即便是苹果也。。。。

知乎专栏

M3Pro的败北：太阳底下没有新鲜事，即便是苹果也。。。。

CPU体系结构“自古以来”就有两个流派：speed demon和brainiac。用现代CPU来举例，那么Intel与AMD就是前者的典型代表：冲击极限频率，搭配尚可的PPC性能（IPC），获得极高的总性能。Apple与Arm则是后者的中坚力量…

👍1🔥1

920 viewsDavid Huang, 06:05

David's random thoughts

更新了M3 Pro的成绩。4GHz的Avalanche还是挺猛的，直接登顶。

🔥4

704 viewsDavid Huang, 11:41

David's random thoughts

SPECint2017.png

334.5 KB

SPECint2017-details.png

642.7 KB

❤‍🔥1

743 viewsDavid Huang, 11:44

David's random thoughts

醒醒，这是Linux！

804 viewsDavid Huang, 15:20

David's random thoughts

MI300X：一个主要为了高精度HPC场景设计的平台，“恰好”在AI所需要的低精度矩阵计算这方面也非常有竞争力。于是它在现在这个市场环境下被AMD将错就错拿来当AI芯片营销，发布会后AMD喜提股价大涨10%。

https://www.zhihu.com/question/633725195/answer/3319382295

❤1

562 viewsDavid Huang, 08:50

David's random thoughts

数框框时间到~

🤩9🔥1

601 viewsDavid Huang, 08:39

David's random thoughts

数框框时间到~

😭 A770亮机卡计划失败了，进KDE wayland就花屏。只能暂时用7800XT先顶着，改天再研究Intel。

🥰6🌚4👏2

679 viewsDavid Huang, 16:18

David's random thoughts

Threadripper 7000系列动任何跟OC有关的设置(PBO/任何主频/任何电压/内存频率和时序）都要熔断fuse并且永久丢失保修。AMD这是跟三星手机学的吗……

我就说怎么华硕这TRX50主板默认配置这么符合POR规范，原来是主板厂商BIOS自己也动不了任何东西，笑死。

🔥3💩2

1.03K viewsDavid Huang, 03:54

David's random thoughts

😭 A770亮机卡计划失败了，进KDE wayland就花屏。只能暂时用7800XT先顶着，改天再研究Intel。

Lessons learned: Intel GPU不要开DSC……

735 viewsDavid Huang, 04:33

David's random thoughts

TRX50是我过去两百年内见过的内存效能最高的平台。4通道DDR5-5200B JEDEC内存，理论带宽166G，实际跑出>150G的读取吞吐，效率超过90%

对比之前AM5的测试不难看出，两倍的内存通道和CCD 在同频下跑出了>2.2倍的内存带宽，根本不需要任何OC就能跑出AM5永远达不到的效率…只能说AM5的UMC完全是个笑话。

🔥8

766 viewsDavid Huang, 10:59

David's random thoughts

多核感觉测了等于没测😅

502.gcc_r以及505.mcf_r这俩比较吃内存带宽的测试在AM5 Raphael上表现还是一如既往的烂

👍2

769 viewsDavid Huang, 06:04

David's random thoughts

Threadripper 7000系列动任何跟OC有关的设置(PBO/任何主频/任何电压/内存频率和时序）都要熔断fuse并且永久丢失保修。AMD这是跟三星手机学的吗…… 我就说怎么华硕这TRX50主板默认配置这么符合POR规范，原来是主板厂商BIOS自己也动不了任何东西，笑死。

这两天有空摸了一圈，看起来不开OC mode也可以在SMU菜单里调不少东西，但是没有OC菜单那么高的自由度。

尝试过的不触发熔断的调整：手动拉高FCLK，SoC电压自动1.2V，最高试过2133开机不过会报WHEA所以调回2000了；功耗墙可以完全解锁，32核prime95 small fft全核4.7GHz跑到500W。可惜内存不能拉5600。

🔥1

777 viewsDavid Huang, 01:05

David's random thoughts

测Meteor Lake的LP E-core能效是个很折磨人的事情，仅次于之前测手机的Cortex-A5x/A5xx。。跑的太慢了，测一个频点的时间相当于测大核3个频点🙃

630 viewsDavid Huang, 12:23

David's random thoughts

Meteor Lake (155H)中低频能效进步比较大，比我预期还强点。单核10W内相比13700H中频提升>20%性能。

不过这并非公平对比。13700H用的是DDR4内存，155H的LP5X以少量绝对性能为代价换取低功耗的优势。

当然……拿去跟Apple或者AMD去比则是完全不行了。其它核心的曲线还在跑，明天发完整版。

🔥6

938 viewsDavid Huang, 09:27

David's random thoughts

4种核心的性能倒是可以先更新。即便排除内存敏感的子项，Meteor Lake的IPC也是大多倒退的。

672 viewsDavid Huang, 09:31

David's random thoughts

SPECint2017.png

357 KB

SPECint2017-details.png

708.5 KB

628 viewsDavid Huang, 09:31

David's random thoughts

MTL的低功耗做的相当不错，E-core 5W以下比7840U低几百mW，轻负载大概是6800U水平。

E-core终于拿掉刷分核的帽子，全频段能效战胜P-core，可以当正经“能效核”跑到死不怕拖累能效。

LP E更像是低功耗待机核，为了快速响应事件设计而非运行任何实际的负载。等compute tile唤醒之后就可以摸鱼睡大觉了。

👍14

892 viewsDavid Huang, 05:09

About

Blog

Apps

Platform