David's random thoughts – Telegram
David's random thoughts
1.73K subscribers
268 photos
1 video
29 files
173 links
个人想法合集,主要同步来自Twitter (𝕏)、知乎、博客等账号发布的内容。

注:本频道并非纯粹包含技术相关内容(虽然以它们为主),本人不会刻意回避政治观点表达。可能包含一些直言不讳的主观评价,慎入。

个人博客:https://blog.hjc.im
Download Telegram
Please open Telegram to view this post
VIEW IN TELEGRAM
🥰15🤔4
David's random thoughts
时隔多年升级存储,感觉这速度都能拿来跑llama 4了(逃
实际用下来这个速度的存储直接把C/C++标准IO API报废了。。各个层面大量buffering/拷贝导致内存带宽被干爆,10 GB/s读取在CPU端观察到70 GB/s带宽,4通道HEDT都扛不住。

换Linux API会好一些,但依然只有O_DIRECT能跑出比较接近理论值的性能,而它对offset对齐要求过于严格,日常实用价值也不大。。🙃
2
用某群友的thinkpad跑R7 H350 (Krackan Point DDR5-5600B)能效与性能,大核能效要比HX370强差不多有半代的水平,同功耗频率增加200MHz左右。小核除Fmax略高外变化不大,依然不适合单核高负载。

目前为止HX370的表现是所有Zen5处理器里独一份的差,后出的SKU都好很多。怀疑是工程进度上的一些取舍导致
👍16
进入2025年LLM给我的感觉是这条路线离所谓的AGI越来越遥远了。2023年展望更大更通用的模型,两年后模型的评估标准与发力方向越来越集中在特定高难度和高价值场景。被吹的天花乱坠的头部模型明摆着到处都是刷分痕迹,刷遍AIME竞赛题的CoT模型普遍做不出小学生都能想出来的简单思考题之类的,就很滑稽。
👍48🤡32👎2👻1
一个个都活成了微信的样子
🤣49😁9🤡9👎1
Media is too big
VIEW IN TELEGRAM
好多年没用过能完全放平的手机了,但是让人如此高血压的也是活久见😡
😡22😁11👻2🤪2
公司申请更新办公电脑居然已经不给Intel选项了,离谱。。。本来还想着发个ARL顺便跑个分呢
😁32🤣9👍3🤡1
小米每隔一段时间就会出来提醒我不要忘了为什么不喜欢这个牌子

https://x.com/Im_Sdog/status/1967464632253309018
25😁20
今年的ARM新架构是让人评都懒得评了😅
😁20😭2
吃个螃蟹看看
9
跑路了(
🥰306🔥3👍1
更新GB10 (N1X)、Thor、8700G、H350的测试成绩。 https://blog.hjc.im/spec-cpu-2017

GB10的X925比我预想中的性能要好得多:单核稍强于x86 H45笔记本,接近9955HX。全核接近100分。

Thor的单核则比我想象中要低,可能是因为没有L3导致。不过Thor 14核跑分刚好是单核的14倍,在automotive场景可以理解这种取舍。
🔥18
David's random thoughts
更新GB10 (N1X)、Thor、8700G、H350的测试成绩。 https://blog.hjc.im/spec-cpu-2017 GB10的X925比我预想中的性能要好得多:单核稍强于x86 H45笔记本,接近9955HX。全核接近100分。 Thor的单核则比我想象中要低,可能是因为没有L3导致。不过Thor 14核跑分刚好是单核的14倍,在automotive场景可以理解这种取舍。
修正Thor的成绩。Thor平台默认状态下单核负载并不能将uncore/DRAM性能带起来,内存延迟高达500ns+且单线程带宽只有不到10GB/s。

使用jetson_clocks锁频可以获得比较符合V3AE性能预期的6.8分成绩(官方手册参考分数为6分),IPC接近Exynos 2400的X4。此时内存延迟为170ns,单线程带宽24GB/s。
6
为什么我这个自古以来就在用日本IP访问的Twitter/X账号会被识别成美国……
🥰18😁3