ML physicist – Telegram
ML physicist
2.38K subscribers
131 photos
6 videos
1 file
79 links
Download Telegram
Вчера вышла o3-pro. Как обычно плюс пару процентов к бенчмарку, ничего мозговыносящего. UX аналогичный o1-pro.

Из более важного, o3 flex теперь стоит 1/4 бакса за млн токенов (это дешевле gpt-4o!!!). С такой ценой открывается куча новых юзкейсов для ризонеров от openai в задачах, в которых не справляются конкуренты.
7👍3❤‍🔥2
Будущее неясно пока нам, однако в данный момент более привлекательного направления чем ML найти на рынке невозможно!

Я решил подтвердить это статистикой и собрал первый онлайн бенчмарк для айти рынка.

С 25 одинаковых джуновских резюме по 5и направлениям (ML/Back/Front итп) я откликался в разные компании на hh, и смотрел на конверсию из отклика в собеседование.

По итогу со статзначимо лучшей конверсией впереди оказалось ML, уступив 1.5 процентных пункта разработке на Golang.

Как считаете, такой подход лучше чем просто смотреть на число вакансий на hh? Стоит сделать такое же исследование уже на сеньерские позиции?
18👍8😁3🤔2💯2😍1
Наконец закончил ГРАФАНУ СВОЕЙ ЖИЗНИ 🖥

1) burnrate задачек из сингулярити (GTD планер) (привык трекать работу и личную жизнь в перемешку, что бы более четко осозновать загрузку на неделю
2) с телеграм ботом записывающим вес и потребление калИнтеграцияорий
3) Интеграция с Google Health connect для треканья сна (и шагов)
4) Интеграция с тинькофф инвестициями и Freedom Finance для контроля инвестиций
5) Интеграция с приложухой для треканья расходов

В ближайшее время добавлю график MoodScore по сентимент анализу своего дневника. Останется только настроить алерты и назначить дежурных.

P.S. сори за пост не по тематике канала, просто не мог не поделиться)
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥47🤩9🤯65👍5🤷‍♂1
Аким закончил собеседоваться на тимлида, успешно сдал ЕГЭ и теперь у него нашелся час для совместного стрима который состоится в конце следующей недели (вечером в четверг)

Помимо его опыта работы обсудим то, как он стал фаундером в Калифорнийском стартапе, не разу не побывав в США, его планы на жизнь и карьеру

Если у вас есть какие то вопросы, которые хотелось бы обсудить на стриме - задавайте их в коментариях заранее или в чате в онлайне
🤣2911😁3🤔2💔2😭2👀1
Agents training in RL gym
12🍓4🥰3😁2🤣2👍1
Reflections on OpenAI

Потрясающее чтиво от инженера, который недавно покинул OpenAI. Пишет про культуру, атмосферу, и как всё работает.

Очень душевное и как будто честное, хочется верить. Выжимки делать специально не буду, идите читать. Я мгновенно залип и прочитал целиком.

https://calv.info/openai-reflections
6👍2
Нашел очень классный тред на реддите

Человек прикрутил Claude к дейтингу с использованием компьютер юз (когда нейронка сама нажимает на элементы интерфейса) и эмулятора андроид. В итоге автоматизировал лайки и первичное общение с девушками

Пару лет назад выходила хайп статья от одного человека из рф, где он рассказывал что якобы сделал такую же систему на базе GPT-3 + api дейтингов. Но как позже выяснилось это было фейком, никакой системы у него не было он просто ее придумал.

Оно то и понятно, разработка такой системы выглядит очень оверкомпликейтед просто для пет проекта, особенно учитывая то что прийдется значимо подолбиться с апи всех дейтингов

Но с выходом Computer Use и общим развитием ЛЛМок те продукты которые требовали бы сотню часов разработки превращаются в написание хорошего промпта для LLM
17🤡10👍4💔2🍓1
А что ли не всем до сих пор очевидно что уход топов из openai это спланированная Семом операция, что бы не платить выходные пособия.

Новая gpt-5 делает ресерчи в разы лучше любого ресерчера и не требует 900 мультов долларов в год;
😁23👍5🤡42🤨1
Ща летел в самолете 4 часа без инета и 4 часа кодил

Блин это были лучше 4 часа в моей жизни

Просто ты, IDEшка и клавиатура, больше ничего - никаких вайбкод инструментов, копайлотов, никакого продвинутого код комплишна, никаких тян зовущих попить вместе вино вечером, никаких уведомлений с телеграм каналах а то что зарелизили очередную модель модель gpt-sonet-2.5 pro которую обязательно надо затестить именно сегодня, никаких ..., 0% отвлечений, 100% концентрация на коде

Всем безумно советую устраивать деткос от всего
43🤡18❤‍🔥13🔥8🤣4
Немного грустная статистика по доходам физтехов (выпускников МФТИ)

Опрос был в канале с входом только для выпускников/студентов, 95% членов – айтишники, почти все 3+ курс бакалавра, около половины выпускники

Это российскому рынку так плохо или долгопрудненские выше 15 грейда шмяндекса не проходят?
😭15😁6😢1
Вижу что в коментариях разгорелась очень оживленная дискуссия. А как вы считаете?
🔥5😁2
Не буду писать про gpt-5, думаю уже все про это писали

Наткнулся на прикольный пост про (open source) reasoning OCR от NuMind🇫🇷.

Они зарелизили Image -> text авторегрессионный трансфорер который может "подумать" перед распознанием текста. Обучался этот ризонинг как обычно через GRPO. Говорят что это поднимает метрики в этой задаче, особенно в сложных документах.

Звучит довольно интересно, в каких еще задачах ризонинг может бустить метрики?
🔥9👍2😁1🍌1
В твитере заметили интересный спайк на потреблении токенов моделями openai в опенроутере.

Вроде никаких релизов моделей в этот день не было, так что весьма вероятно что кто то большой генерировал очень много синтетики

получается, что большие AI компании в основном продают свои модели по API… другим компаниям с ЛЛМ, чтобы те генерировали кучу синтетических данных. Эти данные потом используют для обучения или дообучения новых моделей. Прибыль в отчетах растёт, за счёт этого привлекаются новые инвестиции, на которые снова покупаются токены друг у друга.

https://openrouter.ai/openai
🤯106😢4🤝2👍1
А вот вам и просто айти пузырь
7🤩4🙈2
Я спросил GPT-5 как работает код, а она сгенерировала мне картинку с гайдом на социальную жизнь

https://chatgpt.com/share/68970994-d940-8003-93ac-16f4664d7182

Думаю релиз gpt-5 явно не оправдал всех ожиданий, это признал даже сама, сказав что они возвращают 4o в список моделей

https://x.com/sama/status/1953893841381273969
😁31🌚21💔1
Хочу рассказать про Groq (не путать с Grok от Маска).
Около года назад он жутко хайпавали, а месяц назад компанию оценили в $6 млрд — примерно как NVIDIA 10 лет назад, хотя прошлый год они произвели всего несколько тысяч чипов.

Groq делает Language Processing Unit - специализированные процессоры для быстрого инференса LLM.
На больших моделях они выдают сотни токенов в секунду. Для примера — перевод моего прошлого поста на английский OSS 120b сгенерил за ~300 мс. У ChatGPT на это время даже не успевает рассчитаться KV-кеш и выйти первый токен.

Главная особенность — веса и KV-cache хранятся в большой SRAM прямо на чипе (~230 МБ на LPU) плюс небольшой объём сверхбыстрой регистровой памяти.
Модель разбивается на много LPU, и данные идут по стриминговому пайплайну — без постоянных обращений к внешней памяти.

Почему это важно: основное узкое место LLM — это доступ к памяти, а не вычисления.

На GPU:
1.Загрузить Q для нового токена из HBM
2.Загрузить K,V cache из HBM
3.Вычислить attention scores
4.Загрузить выходные проекции из HBM
5.Сохранить результат в HBM

На Groq LPU:
1.Q уже в SRAM в предопределённом месте
2.KV-cache тоже в SRAM, адреса известны заранее
3.Вычисления идут через streaming pipeline
4.Результат сразу передаётся в следующий слой без записи в память

Chat gpt мне привела интересную аналогию
• CPU — ресторан с поваром-универсалом
• GPU — кухня с несколькими поварами
• LPU — конвейер по сборке бургеров в McDonald’s, где каждый знает свою операцию и делает её за доли секунды.

Что бы все это попробовать не обязательно покупать/арендовать чип, есть облако, продающее токены
https://groq.com/
19🔥15🤩4👍1