NEW BOT Телеграм, страница

gonzo-обзоры ML статей

Forwarded from gonzo_ML_podcasts

❤4

4.32K views16:47

gonzo-обзоры ML статей

This media is not supported in your browser

VIEW IN TELEGRAM

4.59K views16:48

❤4

gonzo-обзоры ML статей

Всё, приехали!

🤣61⚡1🤯1🥴1

6.13K views17:06

gonzo-обзоры ML статей

Gemini Ultra пока не дождались, зато дождались
* Супербыструю текстовую диффузию в Gemini Diffusion (5x faster than 2.0 Flash Lite)
* Улучшенную Gemini 2.5 Pro Deep Think
* Будущее развитие в направлении World models и Universal AI assistant

1👍6

5.85K viewsedited 17:43

gonzo-обзоры ML статей

5.3K views17:43

gonzo-обзоры ML статей

4.88K views17:58

gonzo-обзоры ML статей

А также появилась новая Gemma 3n, Matryoshka Transformer (MatFormer) для on-device deployments.

https://ai.google.dev/gemma/docs/gemma-3n

Google AI for Developers

Gemma 3n model overview | Google AI for Developers

🔥12

5.33K viewsedited 18:24

gonzo-обзоры ML статей

Про Gemini Diffusion.

Скорость генерации (sampling speed excluding overhead) 1479 tokens / sec!

Google DeepMind

Gemini Diffusion

Gemini Diffusion is our state-of-the-art research model exploring what diffusion means for language – and text generation.

🔥14🤯10❤1

6.65K viewsedited 18:31

gonzo-обзоры ML статей

This media is not supported in your browser

VIEW IN TELEGRAM

🔥17👍1

6.55K views18:32

gonzo-обзоры ML статей

Дождались ультры. Но не той.

250$ в месяц однако...

😁35😢3☃1

6.06K views18:39

gonzo-обзоры ML статей

Также неделя креатива объявляется открытой.

* Lyria 2. Our latest music generation model (waitlist)
* Flow. AI filmmaking tool на базе новой Veo 3 (US)
* Gemini 2.5 Native audio output. Может всё-таки до ризонинга шёпотом недалеко?
* Imagen 4. Новый генератор картинок, 10x быстрее и лучше предыдущего

Google DeepMind

Lyria

Lyria 2 is our latest music generation model. It delivers high-fidelity music and professional-grade audio, across a range of genres and intricate compositions.

🤗2

12.1K viewsedited 18:46

gonzo-обзоры ML статей

В семействе Gemma пополнения!

* DolphinGemma (предобучена на звуках коммуникации дельфинов) уже не новость, но всё равно прикольно. Помните Project CETI, кстати?
* SignGemma для языка жестов (в первую очередь American Sign Language)
* MedGemma для медицины
* Gemma 3n с матрёшками внутри для эффективного on-device, уже упоминали сегодня.

Кстати, бахнул авторазбор статьи про MatFormer, на базе которого матрёшечная Gemma построена. Читать тут: https://news.1rj.ru/str/gonzo_ML_podcasts/144

gonzo_ML_podcasts

MatFormer: Nested Transformer for Elastic Inference
Authors: Devvrit, Sneha Kudugunta, Aditya Kusupati, Tim Dettmers, Kaifeng Chen, Inderjit Dhillon, Yulia Tsvetkov, Hannaneh Hajishirzi, Sham Kakade, Ali Farhadi, Prateek Jain
Paper: https://arxiv.org/abs/2310.07707…

🔥15❤1

7.27K viewsedited 21:44

gonzo-обзоры ML статей

🔥3

7.2K views21:44

gonzo-обзоры ML статей

👏1

7.02K views21:45

gonzo-обзоры ML статей

❤14

7.01K views21:45

gonzo-обзоры ML статей

Свежего Бенжио вам в ленту

https://youtu.be/qe9QSCF-d88?si=Xp2zLxiKIcAkVjap

YouTube

The Catastrophic Risks of AI — and a Safer Path | Yoshua Bengio | TED

Yoshua Bengio — the world's most-cited computer scientist and a "godfather" of artificial intelligence — is deadly concerned about the current trajectory of the technology. As AI models race toward full-blown agency, Bengio warns that they've already learned…

❤10😁5🤡2🖕2

7.65K views08:27

gonzo-обзоры ML статей

Yo!

https://www.anthropic.com/news/claude-4

Anthropic

Introducing Claude 4

Discover Claude 4's breakthrough AI capabilities. Experience more reliable, interpretable assistance for complex tasks across work and learning.

1❤13👍7

7.69K views18:01

gonzo-обзоры ML статей

❤4

7.7K views18:03

gonzo-обзоры ML статей

❤9🔥3😁2

8.43K views18:03

gonzo-обзоры ML статей

Тем временем продолжаются эксперименты с автообзорами статей в канале https://news.1rj.ru/str/gonzo_ML_podcasts.

Из последнего и свежего:
* Статья от Тегмарка и ко про выучивание сильных узких моделей. Для которых правильный прунинг из большой общей модели оказывается лучше дистилляции, а в целом широкие и разнообразные данные таки нужны для более быстрого и качественного выучивания определённых навыков.
* Статья про ризонинг токены где на модельной задаче с поиском A* и лабиринтами показано, что трассировки CoT не обязательно являются достоверным отображением «рассуждений» модели, и «бессмысленные» промежуточные токены могут быть поразительно эффективны.
* Статья про механистичную оценку способностей трансформеров и SSM, показывающая что модели со схожей поведенческой производительностью могут использовать принципиально разные внутренние стратегии.

Поток статей каждый день валится огромный, всё разобрать нереально, так что буду продолжать делать это автоматически для статей, которые любопытны, но не настолько чтобы разбирать вручную. Режим вручную оставлю для самого вкусного.

gonzo_ML_podcasts

gonzo_ML sister channel with automatically generated reviews and audio podcasts.

Будь осторожен, прогон возможен!

1🔥24👍13❤7

7.67K views23:05

gonzo-обзоры ML статей

Глубже — значит умнее? Или просто длиннее? Разбираемся, как языковые модели используют свои слои

В продолжение темы про mech interp в трансформерах, свежая работа Криса Маннинга и ко разбирает важность глубины трансформера и приходит к выводам, что более глубокая сеть скорее растягивает те же вычисления на большее число слоёв.

Это прикольная тема, я тоже экспериментировал с выкидыванием слоёв в LLM (можете взять код и поэкспериментировать на более новых моделях, или на более глубоких, у кого DGX под рукой есть), и в канале мы регулярно писали про подобные работы (Transformer Layers as Painters или LayerShuffle).

Ждём более умных подходов к обучению, им явно есть место!

P.S. Обновил автогенератор ревью и среди прочего пофиксил там глупую багу, из-за которой на перевод отправлялась не самая финальная версия ревью. Теперь должно стать ещё лучше, особенно это помогло в борьбе с галлюцинациями и выдумыванием ссылок. До канала такие примеры не доезжали, но проблема была регулярная.

Wikipedia

Глубже!

российский кинофильм 2020 года

1😁18🔥5👍2❤1🍾1

9.14K views13:26

About

Blog

Apps

Platform