David's random thoughts
时隔多年升级存储,感觉这速度都能拿来跑llama 4了(逃
实际用下来这个速度的存储直接把C/C++标准IO API报废了。。各个层面大量buffering/拷贝导致内存带宽被干爆,10 GB/s读取在CPU端观察到70 GB/s带宽,4通道HEDT都扛不住。
换Linux API会好一些,但依然只有O_DIRECT能跑出比较接近理论值的性能,而它对offset对齐要求过于严格,日常实用价值也不大。。🙃
换Linux API会好一些,但依然只有O_DIRECT能跑出比较接近理论值的性能,而它对offset对齐要求过于严格,日常实用价值也不大。。🙃
❤2
进入2025年LLM给我的感觉是这条路线离所谓的AGI越来越遥远了。2023年展望更大更通用的模型,两年后模型的评估标准与发力方向越来越集中在特定高难度和高价值场景。被吹的天花乱坠的头部模型明摆着到处都是刷分痕迹,刷遍AIME竞赛题的CoT模型普遍做不出小学生都能想出来的简单思考题之类的,就很滑稽。
👍48🤡3✍2👎2👻1
❤25😁20
更新GB10 (N1X)、Thor、8700G、H350的测试成绩。 https://blog.hjc.im/spec-cpu-2017
GB10的X925比我预想中的性能要好得多:单核稍强于x86 H45笔记本,接近9955HX。全核接近100分。
Thor的单核则比我想象中要低,可能是因为没有L3导致。不过Thor 14核跑分刚好是单核的14倍,在automotive场景可以理解这种取舍。
GB10的X925比我预想中的性能要好得多:单核稍强于x86 H45笔记本,接近9955HX。全核接近100分。
Thor的单核则比我想象中要低,可能是因为没有L3导致。不过Thor 14核跑分刚好是单核的14倍,在automotive场景可以理解这种取舍。
🔥18
David's random thoughts
更新GB10 (N1X)、Thor、8700G、H350的测试成绩。 https://blog.hjc.im/spec-cpu-2017 GB10的X925比我预想中的性能要好得多:单核稍强于x86 H45笔记本,接近9955HX。全核接近100分。 Thor的单核则比我想象中要低,可能是因为没有L3导致。不过Thor 14核跑分刚好是单核的14倍,在automotive场景可以理解这种取舍。
修正Thor的成绩。Thor平台默认状态下单核负载并不能将uncore/DRAM性能带起来,内存延迟高达500ns+且单线程带宽只有不到10GB/s。
使用jetson_clocks锁频可以获得比较符合V3AE性能预期的6.8分成绩(官方手册参考分数为6分),IPC接近Exynos 2400的X4。此时内存延迟为170ns,单线程带宽24GB/s。
使用jetson_clocks锁频可以获得比较符合V3AE性能预期的6.8分成绩(官方手册参考分数为6分),IPC接近Exynos 2400的X4。此时内存延迟为170ns,单线程带宽24GB/s。
❤6
这东西被Apple先做出来是让人没想到的一个事情。
相比之下Linux的usb4-net就是个玩具,Strix halo跑多机tp还得装个nvidia网卡而不是用现在很多深圳小主机厂展示过的雷电/usb4互联方案。Intel前些年做的tb share也是走的雷电以太网套壳。根本没人认真想过这些消费级硬件的真正潜力,简直拉完了😅
https://x.com/ivanfioravanti/status/1999874264129065190
相比之下Linux的usb4-net就是个玩具,Strix halo跑多机tp还得装个nvidia网卡而不是用现在很多深圳小主机厂展示过的雷电/usb4互联方案。Intel前些年做的tb share也是走的雷电以太网套壳。根本没人认真想过这些消费级硬件的真正潜力,简直拉完了😅
https://x.com/ivanfioravanti/status/1999874264129065190
X (formerly Twitter)
Ivan Fioravanti ᯅ (@ivanfioravanti) on X
Entering the Thunderbolt RDMA world! Thanks @anemll for your experiments here! https://t.co/k8asJOjkw8
❤14😁4
有人吹AI替代一切,有人说是泡沫而还是得人来干活
现实是AI既不完全解放生产力,又不完全没用而不影响岗位。反而公司烧太多💰给AI再随机降本增笑让一个老人借助AI加班替代10个人,再让需要经验积累的新人找不到工作。最终还会因为投资过热物价上涨,泡沫爆炸又经济萧条,所有人每个阶段生活都变差了😃
https://x.com/silsrc/status/2005313458838118484
现实是AI既不完全解放生产力,又不完全没用而不影响岗位。反而公司烧太多💰给AI再随机降本增笑让一个老人借助AI加班替代10个人,再让需要经验积累的新人找不到工作。最终还会因为投资过热物价上涨,泡沫爆炸又经济萧条,所有人每个阶段生活都变差了😃
https://x.com/silsrc/status/2005313458838118484
👍27😁11😭4👎3🥴2❤1