This media is not supported in your browser
VIEW IN TELEGRAM
第一个推理模型 = 全球第1,000,000名最佳程序员
o1(2024年9月)排名 = 第9800名
o3(2025年1月)排名 = 第175名
(今天)内部模型 = 第50名
2025年底之前会成为超人级程序员吗?
-- 更多详情
o1(2024年9月)排名 = 第9800名
o3(2025年1月)排名 = 第175名
(今天)内部模型 = 第50名
2025年底之前会成为超人级程序员吗?
-- 更多详情
👍18😱8❤3🥱1🍓1
Please open Telegram to view this post
VIEW IN TELEGRAM
YouTube
硅谷视角深聊:DeepSeek的颠覆、冲击、争议和误解【深度】
DeepSeek以破局者的姿态,搅动了原本趋同的AI界,它以6700亿参数的V3大模型强势入局,短短几周引发轩然大波:比OpenAI o1更低成本的R1实现了不逊色的推理性能,甚至一度引发英伟达股价大跌17%。与此同时,关于DeepSeek的讨论与质疑也接连不断,因此我们硅谷101在春节期间组成了5人研究小分队,off/on the record采访了超10位AI技术从业者及投资人,一起讨论下:DeepSeek到底有哪些创新?是不是蒸馏了OpenAI的模型?是否存在“数据盗窃”?对开闭源模型市场会带来哪…
👍12❤7🤯2🤮2
Media is too big
VIEW IN TELEGRAM
中国一新能源汽车自动驾驶实录,5分钟左右,乡村路,道路狭窄,且有对向来车,本车道也有随机的停车,这个环境下驾驶难度很高,整个过程很顺利,令人惊讶
👍42🤮10❤3👏3🔥2
Media is too big
VIEW IN TELEGRAM
如果是真的,这种场景AI硬件应用值得给个大拇哥😑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍111❤11👎8🤯4🆒3✍2🫡1
Perplexity发布开源DeepSeek R1 1776推理模型的无中国审查版本
Perplexity 开发了一个新的开源 R1 版本,称为 R1 1776,该版本已经过"后期训练,以提供公正、准确和真实的信息"。 Perplexity 的后期训练主要通过聘请人类专家确定了约 300 个已知被中国政府审查的主题。利用这些话题开发了审查分类器,并在此基础上进行数据训练。
🤗 Hugging face
👉 Sonar API
-- 更多详情
Perplexity 开发了一个新的开源 R1 版本,称为 R1 1776,该版本已经过"后期训练,以提供公正、准确和真实的信息"。 Perplexity 的后期训练主要通过聘请人类专家确定了约 300 个已知被中国政府审查的主题。利用这些话题开发了审查分类器,并在此基础上进行数据训练。
🤗 Hugging face
👉 Sonar API
-- 更多详情
😁47👍33❤14👎6👏4😎3🦄1😡1
This media is not supported in your browser
VIEW IN TELEGRAM
Clone Robotics 的世界首台可双足行走的肌肉骨骼机器人 Protoclone V1
按照人类解刨结构设计,拥有超过 200 个自由度、1000 块人造纤维肌肉和 500 个传感器!
👉 clone robotics
-- 更多
按照人类解刨结构设计,拥有超过 200 个自由度、1000 块人造纤维肌肉和 500 个传感器!
👉 clone robotics
-- 更多
😱94😨42👍21❤19👻7👎2🔥2🫡2🤗1🦄1
cnBeta.COM
想并肩 DeepSeek 不能靠自嗨和邀请码
如果根据AI自媒体们的标题来看,昨天全世界AI圈应该无人存活,因为他们又被“炸”了。这次扔炸弹的是一个叫做“Manus”的产品。它是一个中国团队开发的只通过一部全英文的宣传片发布的,没有邀请码就用不了的AIAgent产品,官方称它为“全球首个通用Agent”。
Please open Telegram to view this post
VIEW IN TELEGRAM
👍55❤18😁15💔1🫡1
M3 Ultra Mac Studio运行DeepSeek 671B模型与官网速率相当
综合各家测试结果,满血M3 Ultra运行 R1 671B 4bit量化版:GGUF框架下15.78 tokens/s,MLX框架下19.17 tokens/s,整机功耗约60w。在短序列生成场景中,其持续输出速率接近8张A100(FP16精度)集群的基准表现。
当前QwQ 32B测试结果约20 tokens/s(量化版),在线版本因采用更高精度计算和复杂提示工程,实际体验可能优于本地量化部署。
-- 更多详情 张黑黑 | 小白测评 | Flypig
综合各家测试结果,满血M3 Ultra运行 R1 671B 4bit量化版:GGUF框架下15.78 tokens/s,MLX框架下19.17 tokens/s,整机功耗约60w。在短序列生成场景中,其持续输出速率接近8张A100(FP16精度)集群的基准表现。
需特别注意:
关键指标差异:该对比未包含prefill阶段(提示词处理)速度,该环节Mac因内存带宽限制显著慢于GPU集群
精度差异:对比采用4bit量化模型,而A100常规使用16/32bit精度,同等精度下性能差距可能扩大
吞吐量限制:Mac的单任务延迟表现虽优,但多并发吞吐量仍无法与专业计算卡抗衡
当前QwQ 32B测试结果约20 tokens/s(量化版),在线版本因采用更高精度计算和复杂提示工程,实际体验可能优于本地量化部署。
-- 更多详情 张黑黑 | 小白测评 | Flypig
👍55❤48😇16🍓5🌭3😴1