Поздравляем подписчиц с Международным Женским Днем!
Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.
С праздником!🤍
Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.
С праздником!
Please open Telegram to view this post
VIEW IN TELEGRAM
3😁187💘96❤65🍓8🗿5❤🔥4🔥3 3👌2🤗1 1
Autoresearch от Андрея Карпаты
Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.
Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.
Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себе несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям⬆️ ).
Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.
https://github.com/karpathy/autoresearch
Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.
Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.
Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себе несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям
Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.
https://github.com/karpathy/autoresearch
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥197👍40❤30 15🤯13😁4🤨4🤔3❤🔥2
Современные туториалы от мировых математических гениев такие типа ⬆️
Кажется, для математиков пора официально вводить термин вайбпрувинг
А ссылка на новое видео Тао вот: https://youtu.be/JHEO7cplfk8
Кажется, для математиков пора официально вводить термин вайбпрувинг
А ссылка на новое видео Тао вот: https://youtu.be/JHEO7cplfk8
Please open Telegram to view this post
VIEW IN TELEGRAM
❤127😁101👍23🔥13🤔3😎1
This media is not supported in your browser
VIEW IN TELEGRAM
В стартапе Eon Systems ученые сделали первую полноценную цифровую эмуляцию мозга животного, которая способна управлять телом
Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.
Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.
Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.
Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.
Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.
Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.
Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.
Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.
Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.
Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.
Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.
Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.
Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.
Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.
1❤🔥121🔥55🤯47❤14 12 7😁6🤔2
Please open Telegram to view this post
VIEW IN TELEGRAM
🕊131😁104❤15🔥8🤔6🤓4🤨3💯2❤🔥1 1
Ничего необычного, просто в Китае прямо на улицах устанавливают всем желающим OpenClaw
Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.
Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.
Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.
Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.
Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.
Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.
Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.
Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.
3😁177🔥119👍40❤21 18🤯14🗿7🕊3🐳2 2🤔1
This media is not supported in your browser
VIEW IN TELEGRAM
Новый агент для Code Review от Anthropic
Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.
При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.
Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:
– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.
Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов🤑
Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.
https://claude.com/blog/code-review
Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.
При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.
Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:
– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.
Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов
Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.
https://claude.com/blog/code-review
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥57🤯40😁17❤8👍5❤🔥1🤝1👾1
Как работают рекомендательные системы в огромных сервисах
11 марта в 19:00 Школа Высшей Математики проводит очень крутой (и абсолютно бесплатный!) вокршоп по рексис. Вы узнаете:
– Как рекомендательные и поисковые системы работают в реальных продуктах
– Какие ML-архитектуры, метрики и подходы используются на каждом этапе
– Как учитываются бизнес-требования и ограничения реальных систем
Все это продемонтрируют на живых примерах из e-commerce, стриминга и соцсетей. То есть вы разберете настоящие кейсы, увидите именно те подходы, которые действительно работают в огромных сервисах, и посмотрите на практические детали их реализации и оптимизации.
Вести воркшоп будет Осиновсков Илья – Руководитель отдела Рекомендательных технологий в Ozon.
Мастхэв для инженеров и всех видов DS-спецов. Не пропускайте и регистрируйтесь здесь
11 марта в 19:00 Школа Высшей Математики проводит очень крутой (и абсолютно бесплатный!) вокршоп по рексис. Вы узнаете:
– Как рекомендательные и поисковые системы работают в реальных продуктах
– Какие ML-архитектуры, метрики и подходы используются на каждом этапе
– Как учитываются бизнес-требования и ограничения реальных систем
Все это продемонтрируют на живых примерах из e-commerce, стриминга и соцсетей. То есть вы разберете настоящие кейсы, увидите именно те подходы, которые действительно работают в огромных сервисах, и посмотрите на практические детали их реализации и оптимизации.
Вести воркшоп будет Осиновсков Илья – Руководитель отдела Рекомендательных технологий в Ozon.
Мастхэв для инженеров и всех видов DS-спецов. Не пропускайте и регистрируйтесь здесь
❤28🗿14👍9🤯6😁4🔥2👾2
Data Secrets
Подвезли свежие подробности о стартапе Яна Лекуна Напоминаем, что ученый спустя 12 лет работы уходит из Meta и собирается строить собственный стартап. Компания будет заниматься разработкой world models, то есть систем, которые понимают физический мир,…
Стартап Яна Лекуна вышел из стелса и закрыл первый раунд финансирования на 1 миллиард долларов
Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).
В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.
Также стал известен официальный список ко-фаундеров⬆️
Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер
Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).
В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.
Также стал известен официальный список ко-фаундеров
Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер
Please open Telegram to view this post
VIEW IN TELEGRAM
2🔥103😁50❤18👍6⚡2🤔2👾1
Мультиагентность – про реальную эффективность или про понты?
Недавно вот тут прочитали обзор Серёжи из Яндекса на новую статью Anthropic про мультиагентность.
Собственно, в этом обзоре затронуты две важные темы:
1. Вопрос эффективности мультиагентных систем относительно цены (они могут съедать в 3–10 раз больше токенов, а выхлопа часто как от одного простого агента).
2. Вопрос разумности их применения. Не превращаемся ли мы из инженеров в охотников за хайпом, когда пытаемся впихнуть рой агентов туда, где не понимаем, зачем оно надо?
Конечно, есть ситуации, когда много агентов действительно в кассу, в посте они перечислены. Но на практике часто выясняется, что основной bottleneck вообще не там и вездесущая мультиагентность – это лишь стадия индустрии.
Да, мы пока только учимся работать с LLM как с системой, и поэтому естественная реакция – добавлять новые уровни сложности. Но если серьезно собираетесь идти в эти дебри, то хотя бы подумайте:
(а) зачем оно вам, и будет ли игра стоить свеч: будет ли в вашем продукте такая система реально работать лучше или просто начнет громче говорить сама с собой и кушать токены?
(б) как именно вы организуете архитектуру: сейчас принято делить агентов по ролям, но может ВАМ больше подойдет – по контексту, как предлагают Anthropic.
И давайте помнить, что хороший инжиниринг– это все таки про бережливость и рационализм, а не про тренды.
Недавно вот тут прочитали обзор Серёжи из Яндекса на новую статью Anthropic про мультиагентность.
Собственно, в этом обзоре затронуты две важные темы:
1. Вопрос эффективности мультиагентных систем относительно цены (они могут съедать в 3–10 раз больше токенов, а выхлопа часто как от одного простого агента).
2. Вопрос разумности их применения. Не превращаемся ли мы из инженеров в охотников за хайпом, когда пытаемся впихнуть рой агентов туда, где не понимаем, зачем оно надо?
Конечно, есть ситуации, когда много агентов действительно в кассу, в посте они перечислены. Но на практике часто выясняется, что основной bottleneck вообще не там и вездесущая мультиагентность – это лишь стадия индустрии.
Да, мы пока только учимся работать с LLM как с системой, и поэтому естественная реакция – добавлять новые уровни сложности. Но если серьезно собираетесь идти в эти дебри, то хотя бы подумайте:
(а) зачем оно вам, и будет ли игра стоить свеч: будет ли в вашем продукте такая система реально работать лучше или просто начнет громче говорить сама с собой и кушать токены?
(б) как именно вы организуете архитектуру: сейчас принято делить агентов по ролям, но может ВАМ больше подойдет – по контексту, как предлагают Anthropic.
И давайте помнить, что хороший инжиниринг– это все таки про бережливость и рационализм, а не про тренды.
Telegram
DevFM
Мультиагенты – может не надо?
Сейчас мультиагентность – одна из самых горячих тем. Фреймворки, оркестраторы, архитектуры с несколькими взаимодействующими агентами.
И вот Anthropic выпустили статью, которая мне очень зашла. Потому что мне кажется они достаточно…
Сейчас мультиагентность – одна из самых горячих тем. Фреймворки, оркестраторы, архитектуры с несколькими взаимодействующими агентами.
И вот Anthropic выпустили статью, которая мне очень зашла. Потому что мне кажется они достаточно…
👍46❤14🔥11🗿7🤨2😁1🤯1
Meta* купила Moltbook – ту самую вирусную соцсеть для AI агентов
Помните, в конце января в Интернете хайповала Reddit‑подобная соцсеть, в которой общались не люди, а агенты? В основе своей это были агенты на базе OpenClaw: они постили, голосовали, комментировали и тд.
Рост популярности был тогда взрывной, на пике было около 3 миллионов зарегистрированных агентов.
Сейчас волна хайпа спала, но Цукерберг решил, что Moltbook зачем-то ему нужен. В основном, вероятно, дело в самой технологии always‑on directory, что значит – постоянно работающий каталог агентов, через который их можно находить и подключать к задачам.
Финансовые условия сделки не раскрываются, но известно, что основатели соцсети Matt Schlicht и Ben Parr переходят в Meta Superintelligence Labs.
Напоминаем, что ранее Цукерберг также охотился и за самим OpenClaw, но OpenAI оказались быстрее. Ну хотя бы с Moltbook повезло🔵
Помните, в конце января в Интернете хайповала Reddit‑подобная соцсеть, в которой общались не люди, а агенты? В основе своей это были агенты на базе OpenClaw: они постили, голосовали, комментировали и тд.
Рост популярности был тогда взрывной, на пике было около 3 миллионов зарегистрированных агентов.
Сейчас волна хайпа спала, но Цукерберг решил, что Moltbook зачем-то ему нужен. В основном, вероятно, дело в самой технологии always‑on directory, что значит – постоянно работающий каталог агентов, через который их можно находить и подключать к задачам.
Финансовые условия сделки не раскрываются, но известно, что основатели соцсети Matt Schlicht и Ben Parr переходят в Meta Superintelligence Labs.
Напоминаем, что ранее Цукерберг также охотился и за самим OpenClaw, но OpenAI оказались быстрее. Ну хотя бы с Moltbook повезло
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔61😁49❤16👍10👾3🗿2🔥1 1
This media is not supported in your browser
VIEW IN TELEGRAM
Вайбкодинг пошел не по плану: в Amazon инженерам устроили разбор полетов после серии крупных сбоев
В начале марта в компании зафиксировали несколько инцидентов уровня Sev‑1 (максимальный уровень серьезности), причем четыре из них пришлись на одну неделю.
Сначала примерно на 6 часов легли сайт и шоппинг сервис, потом 13 часов не работал счетчик цен, потом не работал фронт и тд.
В официальных документах в числе причин прямо указано «novel GenAI usage».
Например, счетчик цен (для AWS, по крайней мере) не работал конкретно из-за того, что ИИ-ассистент Kiro решил пофиксить мелкий баг, удалив все текущее окружение и пересоздав его с нуля. Без человеческого фактора не обошлось, конечно: обычно действия агентов должны подтверждать двое инженеров, но тут из-за расширенных прав хватило одного, да и тот зазевался.
Короче, по итогам всего этого в Amazon собрали крупную внутреннюю встречу инженеров под кодовым названием «Любишь вайбкодить – люби и выговоры от начальства получать».
На ней провели deep dive по сбоям и обсудили новые меры безопасности. По итогам встречи в Amazon пришли к гениальной и совсем не очевидной любому ежу мысли: видимо, в критических компонентах базы ревьюить сгенерированный код должны опытные разработчики, а перед деплоем AI-кода его все таки должны проверить еще раз☝️
В начале марта в компании зафиксировали несколько инцидентов уровня Sev‑1 (максимальный уровень серьезности), причем четыре из них пришлись на одну неделю.
Сначала примерно на 6 часов легли сайт и шоппинг сервис, потом 13 часов не работал счетчик цен, потом не работал фронт и тд.
В официальных документах в числе причин прямо указано «novel GenAI usage».
Например, счетчик цен (для AWS, по крайней мере) не работал конкретно из-за того, что ИИ-ассистент Kiro решил пофиксить мелкий баг, удалив все текущее окружение и пересоздав его с нуля. Без человеческого фактора не обошлось, конечно: обычно действия агентов должны подтверждать двое инженеров, но тут из-за расширенных прав хватило одного, да и тот зазевался.
Короче, по итогам всего этого в Amazon собрали крупную внутреннюю встречу инженеров под кодовым названием «Любишь вайбкодить – люби и выговоры от начальства получать».
На ней провели deep dive по сбоям и обсудили новые меры безопасности. По итогам встречи в Amazon пришли к гениальной и совсем не очевидной любому ежу мысли: видимо, в критических компонентах базы ревьюить сгенерированный код должны опытные разработчики, а перед деплоем AI-кода его все таки должны проверить еще раз
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1