NEW BOT Телеграм, страница

David's random thoughts

在微软工作是什么体验：

- 周二/周三早上七点半跟美国人开会
- 周三/周四凌晨两点跟美国人code review
- 周五到周日继续正常工作三天
- 然后打开群发现群友在聊微软养老院等话题

不知道的还以为微软被马斯克收购了🙃🙃🙃

👍24🤣15🐳3⚡1😡1

1.59K viewsedited 15:39

David's random thoughts

字越少，事越大。给我往死里狠狠查。

🤣32😁3👍2

1.43K views11:50

David's random thoughts

在business practice(而非技术)方面我最看不惯的两个公司，一个是Google，另一个就是NVIDIA。前者导致我一直坚持Firefox，后者导致我把全天下non-NVIDIA的GPU都用了个遍。

DOJ把Chrome从Google剥离出来独立运营之后当天我就会卸载Firefox，不过NVIDIA这次估计还是只能罚点钱，本性难移。

👍20😁1🤔1

1.35K views11:57

David's random thoughts

最近Debian和Linux就是在反复以各种不同姿势炸我的smb client，从kernel cifs炸到kio，反正就是一个apt update下去就是一会这个爆炸一会那个停摆的！

https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=1088117

佩服……尤其是这个看起来就很厉害的解决方案

😇16👍3

1.41K views17:52

David's random thoughts

一个处理器名字碰瓷三个公司的产品，还凑齐了pro plus max🙃

https://x.com/BenchLeaks/status/1866285964856860841

X (formerly Twitter)

Benchleaks (@BenchLeaks) on X

[GB6 GPU] Unknown CPU
CPU: AMD RYZEN AI MAX+ PRO 395 8060S (16C 32T)
Min/Max/Avg: 4757/5121/5087 MHz
Codename: Strix Halo
CPUID: B70F00 (AuthenticAMD)
GPU: Radeon
https://t.co/y5YK2wG2CP

😁25🤮5🔥1

1.65K views02:24

David's random thoughts

🙃新玩具来咯

❤26

1.15K views03:20

David's random thoughts

没有人比我更懂显示输出

🤯41🔥3

1.96K views05:04

David's random thoughts

AMD CPU + Intel GPU = ?

🥴22😁1

1.27K views05:41

David's random thoughts

B580还需要一段时间才能在Debian下正常用，现在Debian和flatpak默认的mesa版本都太老，能正常玩的游戏比较少。flatpak的mesa-git似乎直接连Steam都起不来。

1.32K views08:31

David's random thoughts

llama.cpp SYCL版本抛exception跑不起来，想着看看vulkan版怎么样，结果发现你I目前的cooperative matrix实现是废的。手动去掉这个check也跑不出符合xmx理论吞吐的性能。

1.36K views12:47

David's random thoughts

2024年连AMD都在新游戏卡上架前几个月就把ROCm支持做好发布了，Intel依然在文档上不写清楚哪一版oneAPI支持哪些显卡。。从非常简单的demo都报错来看大概率是没支持B580的。

😁11❤1

1.3K views14:14

David's random thoughts

我大概明白怎么回事了，不是toolkit不支持而是Debian的intel level zero版本不够新🙃

1.5K views15:08

David's random thoughts

llama.cpp用上SYCL之后终于展现出XMX的优势，B580的prefill性能赶上了规格比它大50%的7800 XT，不过decode的效率还是稍微低了点，带宽差距不应该这么大。

当然目前SYCL版本的flash attention kernel看起来性能还是不太好，性能会减半，目测有不少优化空间。提高batch size性能也会立刻锐减。

❤13

1.66K views15:54

David's random thoughts

当年的偷懒最后害的还是自己！

https://x.com/hjc4869/status/1332569705912041475

😁32🤣17😇3⚡2

2.34K views08:26

David's random thoughts

B580虚拟化看起来也没什么问题，设备直通，驱动，虚拟显示器设备，以及关机重启reset之类的都ok。

👍11

1.49K views15:35

David's random thoughts

拿长5B这种大国重器打互联网卫星，放在美国是不是相当于拿SLS发星链🙃

1.47K views15:59

David's random thoughts

llama.cpp用上SYCL之后终于展现出XMX的优势，B580的prefill性能赶上了规格比它大50%的7800 XT，不过decode的效率还是稍微低了点，带宽差距不应该这么大。当然目前SYCL版本的flash attention kernel看起来性能还是不太好，性能会减半，目测有不少优化空间。提高batch size性能也会立刻锐减。

B580在Win下用最新驱动运行llama.cpp的Vulkan版本会获得比较正常的文本生成性能，与7800XT对比性能与显存带宽大致成比例，后者8B q8_0 >50 t/s。但是依然没有cooperative matrix所以prompt processing性能稀烂（vkpeak的matrix测试也跑不了）

SYCL则是全盘比Linux还差，flash attention也没什么好实现

👍10

1.67K views03:18

About

Blog

Apps

Platform