NEW BOT Телеграм, страница

Love. Death. Transformers.

*Офис ресерч лабы. джуниор ресерчер со шваброй туалет чистит и бубнит:
- Все зассали, все засрали, каждый день говно соскребаю, как это все заебало!
Другой мужик сидит на очке, все это слышит и говорит:
- Так уволься, в чем проблема?
- Чтоо? Бросить ресерч? - да никогда!

by @degentradingggg

😁17530👏5🔥2🥴2🙈2❤‍🔥1🤡11

10.8K viewsedited 11:30

Love. Death. Transformers.

много думал

😁35👏10👍1👎1

8.9K viewsedited 15:21

Love. Death. Transformers.

Forwarded from AbstractDL

COCONUT: Учим LLM думать не словами, а эмбеддингами (by Meta)

С появлением моделей серии o1 от OpenAI интерес к "ризонингу" языковых моделей стал расти ещё быстрее. Давно было известно, что если попросить LLM поразмышлять шаг за шагом "вслух", то точность ответов повышается, это называется Chain-of-Thought (CoT). А вы сами-то пробовали с ходу умножать 10-значные числа? Я только в столбик умею "step-by-step" 😁

Так вот, постепенно появляются идеи, что человеческий язык не оптимален для размышлений (вспоминаем QuietSTAR), он их только ограничивает. Более того! Есть исследования, что и люди на самом-то деле не словами думают — языковой отдел в мозге практически не активен в моменты рассуждений.

Вот и авторы COCONUT предлагают цепочку мыслей генерировать не в виде текстовых токенов, а в виде эмбеддингов, которые рекуррентно скармливаются обратно в LLM. Это должно развязывать моделям руки и позволять думать в более абстрактных сущностях, а не конкретными токенами.

Обнаружилось, что у COCONUT появляется суперпозиция нескольких альтернативных логических цепочек, своего рода breadth-first-search внутри эмбеддингов. Это позволило моделям решать задачки на планирование и логику быстрее и точнее, чем при обычном текстовом CoT. Не на всех бенчмарках выросли метрики, но сама идея классная, лично я в масштабирование таких подходов верю больше, чем в рассуждения на обычном языке.

Но пока тут есть два серьёзных минуса:
1. Для файнтюнинга LLM в режиме COCONUT всё ещё нужны ground truth словесные цепочки рассуждений, которые потом дистиллируются в латенты постепенной заменой текстовых шагов на латентные.
2. Обучение жрёт много компьюта и памяти, т.к. по сути это рекуррентная модель, через которую нужно N раз пропустить градиенты насквозь.

P.S. Более подробный разбор можно почитать у Андрея Лукьяненко тут.

Статья, GitHub

👍75🔥23💋8❤‍🔥2🥴2🆒11

7.38K views22:00

Love. Death. Transformers.

TRANSFORMER2: SELF-ADAPTIVE LLMS

Идея какая: c помощью LORA мы доставляем матрички и учим в них новые знания на фиксированном сете, получаем на выходе примерно тоже самое что учили.

Что предлагают авторы: давайте с помощью RL и SFV(их метод представленный в этой статье ) найдем и затреним такой вектор внутри модели который будет отвечать за новую задачу(модель сама учится решать это новая или старая задача)

А зачтем на инференсе модель сама выберет какой вектор или комбинацию векторов использовать!

Бонусом: такие вектора переносятся между моделями(Mistral - LLama)

paper

От автора:

https://sakana.ai/transformer-squared/

ребята из

sakana.ai

на мой взгляд делают один из самых интересных ресерчей в индустрии, идеи прям ОЧЕНЬ хороши, да еще и подробные ИНТЕРЕСНЫЕ статьи пишут

🔥60❤‍🔥7👍6

9.24K viewsedited 07:59

Love. Death. Transformers.

Мой сосед по телеграмму - Артем из @ai_newz

Чтобы преуспеть в век ускоряющегося AI вам не стоит тратить время на техноблоги, а нужно копать глубже: научные статьи, пейперы и технические отчёты из первых рук. Так вот, @ai_newz — это не очередной ИИ технобложек, которых в телеге развелось в последнее время. На канале Артёма, Staff Research Scientist-а в Meta, можно почитать пейперы из первых рук Meta GenAI. Ну и кроме того, обзоры других пейперов и важных новостей.

Вот, например:

— Артем рассказал о MovieGen, в обучении которого его команда принимала непосредственное участие
— Артём рассказал о новой модели Imagine Flash для риалтайм генерации картинок, которую он и его команда обучили — был ещё один громкий релиз от Meta.
— Пост про модель для генерации стикеров, которую Артём лично оптимизировал. Моделька уже крутится в Инсте и WhatsApp в проде.
— Актуальный список книг для изучения ML в 2024.
— Статья Артёма об ускорении диффузии с помощью кеширования, без потери качества, конечно же.
— Лонгрид про парижский стартап Mistral и знакомство Артёма с фаундером.
— Пост про грейды в бигтехе [ч1, ч2] и компенсации. Все же в курсе, что сеньор это еще не все?:) Ну и туда же запись стрима про собеседования в БигТех.

Такие люди как Артем, двигают SOTA и делают наступление AGI все ближе. Рекомендую подписаться, чтобы не потерять себя, когда наступит AGI: @ai_newz.

🤡84👍34🤮13💩10🔥76❤‍🔥5😁3💋1

10.1K viewsedited 10:12

Love. Death. Transformers.

Forwarded from Проветримся!

Планирую запись следующих выпусков. Времени на всё не хватает, но вот вам долгий предновогодний разговор с Лизой Осетинской.

Кажется, душевно вышло.

https://youtu.be/TxBBzRp0lcM?si=vaklT7TI2btA5BsU

YouTube

Про жизнь и искусственный интеллект. Большой разговор с профессором Иваном Ямщиковым

НАСТОЯЩИЙ МАТЕРИАЛ (ИНФОРМАЦИЯ) ПРОИЗВЕДЕН И РАСПРОСТРАНЕН ИНОСТРАННЫМ АГЕНТОМ ЕЛИЗАВЕТОЙ НИКОЛАЕВНОЙ ОСЕТИНСКОЙ ЛИБО КАСАЕТСЯ ДЕЯТЕЛЬНОСТИ ИНОСТРАННОГО АГЕНТА ЕЛИЗАВЕТЫ НИКОЛАЕВНЫ ОСЕТИНСКОЙ 18+

Подписывайтесь на телеграм Лизы Осетинской! https://news.1rj.ru/str/osetinskayaliza…

🤡13👍9

10.9K views12:39

Love. Death. Transformers.

This media is not supported in your browser

VIEW IN TELEGRAM

погодите это реально?

ориг тут

55🤮14🗿4🙈3👍1🔥1😁1🥴1👾1

13.5K viewsedited 12:51

Love. Death. Transformers.

Когда у айтишников-парней две работы все такие типа вау

Но когда она...

А на самом деле ситуация оч страшная, надеюсь ее не уволят и все будет хорошо, профессианальные доклады на конфах неплохие.

Лучше найти лида на онлифансе чем его телеграмм канал

👍23067😁28🍓15🤡11😢3🔥1💯1🍌1

27.3K viewsedited 17:19

Love. Death. Transformers.

Когда у айтишников-парней две работы все такие типа вау Но когда она... А на самом деле ситуация оч страшная, надеюсь ее не уволят и все будет хорошо, профессианальные доклады на конфах неплохие. Лучше найти лида на онлифансе чем его телеграмм канал

руководству респект!

5👍388❤‍🔥99🤡2825💩9🔥3👎2🤮2💯2🤓2

86.3K views17:49

Love. Death. Transformers.

🔥16🤔5👍3

12.3K views07:55

Love. Death. Transformers.

Тренируете нейронку для создания изображений и столкнулись с кучей проблем? Нет легальных датасетов для тренировки, и это может стать серьезной юридической проблемой в самом ближайшем будущем. Боитесь, что в обучение попадет много синтетики. Нужно прокачать нейронку под определенную тематику или стиль, но у вас мало качественных входящих данных. А вы же знаете золотое правило ML: говно на входе — говно на выходе?

Но есть решение! Ребята из Bang! Bang! AI подготовили качественные датасеты для тренировки — как общие, так и с фокусом на конкретные темы. Сейчас доступны десятки тысяч лицензированных иллюстраций, и скоро обещают увеличить до сотен тысяч.

Bang! Bang! Ai

🥴47👍1614👎2🤡2💯1

12.1K views08:03

Love. Death. Transformers.

Inference-Time Scaling for Diffusion Models
beyond Scaling Denoising Steps

забавная статья, оказывается если сэмплить из диффузии несколько раз шум и фильтровать то можно получить результаты получше.

paper

😁24👍5💯2

11K viewsedited 21:41

Love. Death. Transformers.

ищу челиксов которые торгуют 3090/4090 с 48gb памяти, отпишитесь в @transformerslovedeatch речь про перепаянные карты с 48гб памяти

Вышел первый обзор на 4090 c 48gb
Читаем!

main

Testing the 4090 48GB

🤡19👍11🔥6😁3🤮3🥱3

9.86K views11:29

Love. Death. Transformers.

Forwarded from эйай ньюз

DeepSeek R1 - уровень o1 бесплатно

Бенчи говорят сами за себя. Модель уже бесплатно доступна в чате (50 сообщений в день), веса выложены на HuggingFace. API дешёвый - в 30 раз дешевле o1, в 6 раз дешевле o1 mini. И всего в два раза дороже чем DeepSeek V3 без скидки.

Веса R1
Пейпер
Код

@ai_newz

👍37👎3🤡3😍3😁2

5.7K views14:35

Love. Death. Transformers.

на бенчах как о1, но бенчи скам, тестите сами

r1 довольно приятный, будто лучше о1 но не лучше o1 PRO

👍60😁20🤔6

8.4K viewsedited 14:36

Love. Death. Transformers.

Forwarded from Labrats

#от_подписчика
2029 год, республиканская партия проигрывает выборы.
Журналист CNN приглашает Илона Маска на интервью.

«Эти либеральные журналисты — коварные подонки, — думает Маск. — Наверняка будут провокационные вопросы задавать про то, что я зигу в 2025 кидал. Надо придумать, что отвечать».

Стоит Маск перед зеркалом и репетирует:

«Вы кидали зигу — Ну кидал и кидал, вам-то что?.. Нет, так не пойдёт...»

«Правда, что вы кидали зигу? — Нет, что вы, это я просто обратился к зрителям!.. И это плохой ответ…»

«Правда, что вы кидали зигу? — Какие-то вопросы у вас дурацкие, давайте по теме или мы закончим интервью!» — «Во! Вот так и отвечу!» — решил Илон Маск и пошёл на интервью.

Студия CNN, начинается эфир, задают первый вопрос:

— Илон, это правда, что вы дали согласие на то, что ваш сын станет биоинформатиком?

— Кто? Я? Да я у Трампа на инаугурации зигу кидал!

😁182🎅13🥴9🌚4🔥3💊2

7.84K views09:26

Love. Death. Transformers.

Очень короткий обзор на DeepSeek r1.

читать обзор
paper

46😁12🔥7👎4🤡3👍2

8.19K views15:59

Love. Death. Transformers.

альтман: критерий agi это 100 млрд. прибыли
трамп: вбухивает 500
альтман: всем спасибо, аги достигнут пятикратно

https://openai.com/index/announcing-the-stargate-project/

Openai

Announcing The Stargate Project

😁257🔥14👍73💅1

9.51K views06:39

Love. Death. Transformers.

TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training - Этот простой трюк ускорит претрен вашего DIT в 25 раз!

Идея такая: не все токены одинаково полезны на всех слоях, не все слои одинаково полезны для всех токенов. Давайте дадим модели самой выбирать на какие слои передавать токены, а на какие слои нет.

авторы получают х25 ускорение претрена и модель лучшую по метрикам чем классический DIT.

paper

❤‍🔥62🔥18👍111

13.6K views08:44

Love. Death. Transformers.

Чёт какой то пиздец творится в Abby, всех уволили одним днём. Пока не понятно, по цвету паспорта или просто всю разработку. Ребята в революте нанимают: - Computer Vision - Natural Language Processing - Engineering - Product Owners pavel.nesterov@revolut.com…

По Мотивам увольнений в Abby

Теперь масштабные увольнения идут в Купер, он же Eком. Если у вас есть вакансии, кидайте @transformerslovedeatch

Recraft FrontEnd+Seo
https://www.recraft.ai/careers

стажера https://yandex.ru/jobs/vacancies/spetsialiststazhyor-po-dokumentooborotu-v-sluzhbu-reklamnogo-biznesa-28933

аналитик https://yandex.ru/jobs/vacancies/analitik-geomediynoy-reklami-v-karti-27074

Aiwing https://www.notion.so/Backend-Developer-17a91434cc4780ba8f3cd3a10425a228

Пост будет обновлятся

6😁38🥴12💔76👍5

8.14K viewsedited 11:45

About

Blog

Apps

Platform