David's random thoughts – Telegram
David's random thoughts
1.75K subscribers
273 photos
1 video
31 files
175 links
个人想法合集,主要同步来自Twitter (𝕏)、博客等账号发布的内容。

注:本频道并非纯粹包含技术相关内容(虽然以它们为主),本人不会刻意回避政治观点表达。可能包含一些直言不讳的主观评价,慎入。

个人博客:https://blog.hjc.im
Download Telegram
新的Speedometer 3.0 benchmark,我们Firefox终于站起来了🙃
😁5
加入Exynos 2400的测试成绩 (Cortex X4+两种频率的A720+A520)
5
Exynos 2400的GPU (12CU/6WGP的RDNA3 mobile)

系统自带Standard/Light性能模式控制,除了可用于CPU之外,对GPU也有效。粗略测得前者最大整机功耗10W左右对应WLE ~4300,后者锁<6W对应WLE跑分~3400。Light性能模式应该就是可持续运行的功耗了。

OpenCL ICD载入有问题所以只能暂时跑几个简单测试。
👍91
简单翻下Xclipse 940的驱动,Vulkan基于AMDVLK,OpenCL是AMDGPU Proprietary,二者都自带LLVM所以体积巨大

虽然基于RDNA3,但与桌面不同,LLVM target是gfx4020而非gfx11xx。PAL SettingsLoader配置里又叫把它叫做mgfx2。同样的位置还出现了gfx1040(E2200),gfx4010 (死掉的E2300?),gfx4030 (E2500?)

跟桌面架构的异同:ISA是正宗的RDNA3,但无论是OpenCL还是Vulkan都强制wave64模式运行,不支持wave32所以看不到RDNA3新增的VOPD指令。

相比桌面RDNA3的FP32减半(FP32:FP16=1:2)。这个并不意外,上一代E2200也相比桌面砍半(1:4)。FP16 FMA wave64可单周期执行,FP32则需要两个周期。

L0/L1/L2分别为32K/128K/1MB (780M分别为32K/256K/2MB)。缓存结构比高通Adreno 7更复杂,L2以内带宽远强于高通,但除了L0之外延迟略高(粗估延迟周期数大致等同于桌面RDNA3)。

出GPU L2后的SLC/Mem延迟和带宽由于受到SoC节能的干扰,不具备参考和对比的价值。内存疑似只有6400频率(带宽47GB/s左右)
👍2
https://pigsty.io/zh/blog/db/redis-oss/

一觉醒来发现自己变成开源社区头号公敌了(不

其实关于这个问题,还是得看做FOSS的目的是什么。比如Linus当年做Linux就比较纯粹,一个GPLv2足矣。

但是现在更多的公司开源是把“开源”本身为了作为卖点培养生态,以后卖商业产品赚大钱。本质上还是在混淆自由软件和开源软件。
👍12
现在的知乎首页推荐除了营销号和广告就是一堆反智内容,屏蔽都屏蔽不过来。有的内容已经屏蔽一万次了还是照推不误。不仅如此,UI还越来越难用,想只看自己关注的人而不是什么见鬼的推荐/精选需要的操作越来越多

要不还是退了知乎不玩了吧……只可惜确实关注了那么几个内容比较专业的想偶尔看看,唉🙃
😁11😢3🤡2
赶在Zen5/ARL发布之前简单测试最后一代6-wide x86大核性能特性

有趣的是虽然两家在Zen3-4/GLC-RWC这几代IPC接近,性能瓶颈却大相径庭。粗略观察,Intel分支预测失效代价巨大;AMD处理大code footprint的能力不太行而且后端mem bound严重(哪怕是缓存内)

两家PMC有细微区别,数值对比只能算是图一乐
👍16