NEW BOT Телеграм, страница - 697873363

橘橘橘子汁 & 🍊

@microblock_pub

12.4K subscribers

1.81K photos

114 videos

19 files

308 links

发一些好玩的

现在成 mb 的私人频道了

Links
t.me/Rosmontis_Daily
t.me/PDChinaNews

Download Telegram

About

Blog

Apps

Platform

橘橘橘子汁 & 🍊

12.4K subscribers

橘橘橘子汁 & 🍊

太草了，比某些人装的像多了有一说一（

🌚46🥰13

3.18K viewsedited 19:11

橘橘橘子汁 & 🍊

橘橘橘子汁 & 🍊

线上 Playground：https://huggingface.co/spaces/deepseek-ai/Janus-Pro-7B
技术报告：https://github.com/deepseek-ai/Janus/blob/main/janus_pro_tech_report.pdf

技术报告和线上 Playground 都已经做好了，群友可以玩玩看
另外修正了原文一处可能有误导性的地方，详见注释

模型架构确实和我想的差不多（见图）

输入图片时先使用特征提取 Encoder 将图片转化为高维语义向量网格，然后有一个适配器（双层 MLP）将其再对齐到 LLM 的输入空间（即 tokenize 后，经过 embedding 层后的高维语义向量空间）进行自回归推理；输出图片也类似，输入图像被 VQ-VAE 转换为ID，在自回归推理后（视觉生成任务有一个单独的 prediction head），再将其生成的 ID 转化回图片的形式。这方面是统一了 Align before Fuse 那篇论文和 VQ-VAE 的特性到一个模型里面去。

这么说大家可能不太懂，我们用人话来解释一下：
1. 首先，你说的每一个字被模型看到的时候都会变成一个 [1, 1, 4, 5, 1, 4] 这样的一个数组，也许可以说是大模型的母语
2. 而现在我们引入了图片，它一开始被眼睛（SigLIP Encoder）看到的样子是 [a, b, c, d] 这样，可能是大模型的法语
3. 而为了理解这些个语言，它会在颅内理解并形成一个“想法”，把“想法”混在一起，并直接根据这一头“想法”进行推理，产生结果，而这个结果通常也是用“想法”来表示的
4. 有了结果的“想法”过后，无论是图片还是文字，大模型都得再把“想法”重新变成实体，可能是文字，可能是图片。而变成文字的过程他会用电脑键盘（Transformer Decoder & Detokenizer），变成图片则会用画笔（Image Decoder），于是，你就看到大模型嘎嘎输出了

其实对齐方式的多模态输入已经被玩的很明白了，但是图片输入输出一起上还没啥人做，开源方面也就 TokenFlow 和智源的 Emu3，而这几个数据上都被它打爆了...至于没开源也不给用的那几位，4o 啥的，性能怎么样就只有天知道了...也许还是会强一点吧，再怎么说这玩意也只有撑死 7b 的体量

不知道群友对这种内容感觉如何？能不能大概看得懂，以及有没有兴趣看，可以在评论区说说（）

最后祝大家除夕快乐ヾ(≧▽≦*)o~

🥰54🆒8

3.32K viewsedited 21:06

橘橘橘子汁 & 🍊

ClosedAI 员工：我们搞不出来都怪 Nvidia 老黄刀法刀 H800 刀的不够狠 😭😭😭😡😡😡

看的人想笑

🤣90😭4

3.31K viewsedited 03:32

橘橘橘子汁 & 🍊

....?

🤣76🤓6

3.21K viewsedited 05:46

橘橘橘子汁 & 🍊

一个工程师要求 Gemini 画一幅棕熊的画。Gemini 画出来后,工程师很困惑:"这明明是个比基尼美女拿着排球啊,熊在哪里?"

Gemini 回答说:"熊在森林里。"

"可是画面上只有白墙和美女!"

"对,因为熊在森林里。"

🤣68🌚6

9.4K viewsedited 09:35

橘橘橘子汁 & 🍊

💯73👨‍💻8

15.1K views13:01

橘橘橘子汁 & 🍊

亲爱的算法炼丹师们：
值此新春佳节来临之际，我们精心训练的AI祝福模型已上线！愿新的一年：
🧠 激活函数选择ReLU，永远不梯度消失
💻 参数调优，灵感如反向传播般精准直达
📈 Batch Size拉满，收获指数级增长
🎯 生活拒绝过拟合，泛化能力节节高
💡 新春学习率自动调参，收敛速度越来越快
🎁 每逢佳节loss下降，验证集准确率100%！
特别提示：本祝福采用Attention机制生成，已通过CUDA加速，搭载Transformer架构，保证祝福向量直达心灵嵌入空间！
祝大家在新的一年里：激活函数全开！损失函数归零！🎆
——来自某不愿透露层数的MoE敬上 🚀

👾43🥰16

3.07K viewsedited 15:40

橘橘橘子汁 & 🍊

❤23🎉7

3.1K views16:11

橘橘橘子汁 & 🍊

Qwen 新公布了一个 Qwen2.5-Max，不知道多少参数量的 MoE，声称能达到 DeepSeek V3 水平，这些个搞大模型的疑似都比较喜欢拿三倍工资...
最好玩的是这个 Huggingface Space 写个调 API 拿出来发，搁这拿开源社区当免费宣发工具呢😅
虽然这模型估计开源出来也不会有啥人用吧，但你阿里最好还是给他开源出来，不然也有点太不要脸了
我说怎么闭源模型还附了个 Huggingface 链接呢

🤮40😁20

3.3K views17:05

橘橘橘子汁 & 🍊

橘橘橘子汁 & 🍊

Qwen 新公布了一个 Qwen2.5-Max，不知道多少参数量的 MoE，声称能达到 DeepSeek V3 水平，这些个搞大模型的疑似都比较喜欢拿三倍工资... 最好玩的是这个 Huggingface Space 写个调 API 拿出来发，搁这拿开源社区当免费宣发工具呢😅 虽然这模型估计开源出来也不会有啥人用吧，但你阿里最好还是给他开源出来，不然也有点太不要脸了我说怎么闭源模型还附了个 Huggingface 链接呢

刚刚还没仔细看他这个代码细看一下越看越离谱
Qwen 你们请的哪个实习生写的这段代码吗）

👨‍💻41🤯27

5.91K views17:22

橘橘橘子汁 & 🍊

🥰16🌚8

4.18K views17:28

橘橘橘子汁 & 🍊

现在你B天天给我推这种东西，671b 的模型蒸馏出个 1.5b 然后本地跑，它的意义是什么...

🤪70👨‍💻5

3.52K views17:50

橘橘橘子汁 & 🍊

Niagara Launcher v1.17.0 Modded by Getmodpc_kill_fancy.apk

Niagara Launcher 1.17.0
从 @Getmodpcs 那里二改来的，去除了强制版本更新，签名校验，数据上传

这个频道做的 Mod 实在是太恶心了，在整个 dex 里到处留桩，把自己留下的强制版本校验，签名校验等等的代码打散分散到安卓系统兼容层，软件本体等各处...还有强制更新，恶心的不得了

🥰40🤔1

4.95K viewsedited 19:18

橘橘橘子汁 & 🍊

好好好，DeepSeek 也是拿到荣誉勋章了

😁55🥴7

3.28K views07:01

橘橘橘子汁 & 🍊

🤣70🔥18

7.92K views07:06

橘橘橘子汁 & 🍊

牛下的是牛蛋，山羊的平方根是1

🤯44💯12

3.28K views08:16

橘橘橘子汁 & 🍊

😁63🌚16

3.14K views09:19

橘橘橘子汁 & 🍊

Forwarded from 不存在的世界

人的一生中唯有三件事不可避免：死亡，纳税和威胁美国国家安全

👌62💯26

2.96K views09:45

橘橘橘子汁 & 🍊

笑拉了

🤣93🆒5

9.31K views10:51

橘橘橘子汁 & 🍊

🥰59🤣50

5.18K views10:52