AMD设计SEV居然有这么大一条漏网之鱼……malicious hypervisor能随意drop guest的dirty cache可太刺激了。
https://twitter.com/InstLatX64/status/1724656517993959614
https://twitter.com/InstLatX64/status/1724656517993959614
🤯3👍1
早些时发现523.xalancbmk这个子项在x86平台非常的cache latency bound,而较大且低延迟的L2是M1/M2的一大特色,12-16M提供足够高的命中率又能维持比x86低得多的延迟。M1可以在这个子项里达到同频将近两倍于Zen3/4的性能可能就有一个主要原因在此。
不过前段时间经过观察发现M3 max的L2延迟以及延迟周期数都有显著增加,可能是为了做6核cluster以及同时拉高频率导致。那么523.xalancbmk的ipc掉的这么狠也不难理解了……
JamesAslan - M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
不过前段时间经过观察发现M3 max的L2延迟以及延迟周期数都有显著增加,可能是为了做6核cluster以及同时拉高频率导致。那么523.xalancbmk的ipc掉的这么狠也不难理解了……
JamesAslan - M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
知乎专栏
M3Pro的败北:太阳底下没有新鲜事,即便是苹果也。。。。
CPU体系结构“自古以来”就有两个流派:speed demon和brainiac。用现代CPU来举例,那么Intel与AMD就是前者的典型代表:冲击极限频率,搭配尚可的PPC性能(IPC),获得极高的总性能。Apple与Arm则是后者的中坚力量…
👍1🔥1
❤🔥1
MI300X:一个主要为了高精度HPC场景设计的平台,“恰好”在AI所需要的低精度矩阵计算这方面也非常有竞争力。于是它在现在这个市场环境下被AMD将错就错拿来当AI芯片营销,发布会后AMD喜提股价大涨10%。
https://www.zhihu.com/question/633725195/answer/3319382295
https://www.zhihu.com/question/633725195/answer/3319382295
❤1
David's random thoughts
😭 A770亮机卡计划失败了,进KDE wayland就花屏。只能暂时用7800XT先顶着,改天再研究Intel。
Lessons learned: Intel GPU不要开DSC……
David's random thoughts
Threadripper 7000系列动任何跟OC有关的设置(PBO/任何主频/任何电压/内存频率和时序)都要熔断fuse并且永久丢失保修。AMD这是跟三星手机学的吗…… 我就说怎么华硕这TRX50主板默认配置这么符合POR规范,原来是主板厂商BIOS自己也动不了任何东西,笑死。
这两天有空摸了一圈,看起来不开OC mode也可以在SMU菜单里调不少东西,但是没有OC菜单那么高的自由度。
尝试过的不触发熔断的调整:手动拉高FCLK,SoC电压自动1.2V,最高试过2133开机不过会报WHEA所以调回2000了;功耗墙可以完全解锁,32核prime95 small fft全核4.7GHz跑到500W。可惜内存不能拉5600。
尝试过的不触发熔断的调整:手动拉高FCLK,SoC电压自动1.2V,最高试过2133开机不过会报WHEA所以调回2000了;功耗墙可以完全解锁,32核prime95 small fft全核4.7GHz跑到500W。可惜内存不能拉5600。
🔥1
测Meteor Lake的LP E-core能效是个很折磨人的事情,仅次于之前测手机的Cortex-A5x/A5xx。。跑的太慢了,测一个频点的时间相当于测大核3个频点🙃