NEW BOT Телеграм, страница

Data Secrets

Google предложили, как обучать LLM становиться умнее по ходу диалога

Есть довольно известная проблема: LLM плохо обновляют убеждения по мере получения новой информации. Хотя от модели ожидается, что она должна понимать предпочтения пользователя по его ответам и при накоплении таких данных становится полезнее, на самом деле LLM в этом плохи.

С математической точки зрения это означает, что у моделей нет байесовского мышления, то есть умения обновлять вероятность гипотез при поступлении новой информации. У людей, кстати, такое мышление развито хорошо.

Здесь исследователи предлагают интересный подход. Вместо того, чтобы учить модель обновлять знания с помощью файнтюна на обычных диалогах, они берут и дистиллируют в нее настоящий байесовский алгоритм. То есть:

1. Строится обычный автомат Байеса, который знаком всем, кто изучал классический ML. Он решает задачу, просто обновляя вероятность разных гипотез по формуле.

2. LLM файнтюнят на ответах алгоритма, чтобы она переняла общую логику обновления, но уже без формулы.

Например, нам нужно понять, какие фильмы любит пользователь – боевики, комедии или драмы:
– В начале вероятности равные, по 33%.
– Мы советуем ему три фильма разных жанров, и он выбирает боевик. Мы также знаем вероятность выбора боевика при условии предпочтении каждого из жанров (например, 80%, 20% и 30%).
– Алгоритм на основе всего этого обновляет вероятности по формуле и получается, что они равны уже 62%, 23% и 15%.
– Такие априорные и апостериорные вероятности показывают LLMке.
– Постепенно она учится вести себя как алгоритм.

Результаты получились интересные.
Во-первых, модель действительно начинает вести себя ближе к байесовскому оптимуму и учитывать новые данные. На основной задаче рекомендаций качество заметно увеличилось.
Во-вторых, появилось обобщение. То есть модель фактически выучивает сам принцип рассуждения, и начинает использовать эту стратегию в других задачах, где ее напрямую не обучали.

Короче говоря, довольно показательно, и авторы делают вывод о том, что обучение на демонстрациях алгоритмов в целом – работает. В действительности, мы ведь и правда хотим от LLM, чтобы они были не просто генераторами текста, а универсальными имитатороми алгоритмов мышления.

research.google/blog/teaching-llms-to-reason-like-bayesians/

1❤172❤‍🔥40👍38🔥13🤯3🤗33😁2👾22

27.6K views07:46

Cursor теперь может мониторить вашу кодовую базу автономно и постоянно

Теперь там есть возможность настроить ИИ‑агентов, которые автоматически выполняют задачи в вашей базе по расписанию или по событиям (push, Slack, PagerDuty и т.п.).

Каждый такой агент крутится в отдельной cloud‑sandbox, может ходить в твой репозиторий, CI, Slack и внешние сервисы через MCP (Model Context Protocol).

То есть при срабатывании триггера поднимается изолированная среда, в нее подтягивается свежий код, и агент выполняет нужный сценарий. Настройки могут быть максимально гибкими.

Внутри уже есть типовые шаблоны: ежедневные дайджесты изменений в базе, поиск уязвимостей и простых багов, обновление документации. Пробуем!

cursor.com/blog/automations

😁66❤33👍33🔥12🤨53

22.6K views17:37

Data Secrets

Поздравляем подписчиц с Международным Женским Днем!

Желаем, чтобы в жизни было больше прорывов, чем в новостях про очередную AI-модель, и чтобы мечты сбывались чаще, чем обещания Илона Маска.

С праздником! 🤍

Please open Telegram to view this post

VIEW IN TELEGRAM

3😁187💘95❤65🍓8🗿5❤‍🔥4🔥33👌2🤗11

19.5K views09:29

Data Secrets

Autoresearch от Андрея Карпаты

Встречаем новый проект от гуру: агент, который автономно проводит эксперименты и обучает LLM.

Autoresearch состоит из: самого агента, одной GPU и простой среды обучения маленькой LLM. Агент самостоятельно изменяет train.py, запускает короткие сессии обучения модели по 5 минут, оценивает улучшение метрик и сохраняет или отбрасывает изменения.

Так он может провести десятки экспериментов за ночь. Вы встаете – и получаете уже улучшенную модель, экономя себе несколько часов рутинного копания в коде (см.график с изменениями метрики по итерациям ⬆️).

Все свои дополнительные инструкции можно дописать в program.md: где менять гиперпараметры, что исследовать. Исходный program.md сделан предельно простым, но при желании можно упороться и добавить мультиагентность, новые метрики, стратегии и прочее.

https://github.com/karpathy/autoresearch

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥196👍40❤2915🤯13😁4🤨4🤔3❤‍🔥2

20.4K viewsedited 12:31

Data Secrets

Современные туториалы от мировых математических гениев такие типа ⬆️

Кажется, для математиков пора официально вводить термин вайбпрувинг

А ссылка на новое видео Тао вот: https://youtu.be/JHEO7cplfk8

Please open Telegram to view this post

VIEW IN TELEGRAM

❤126😁100👍23🔥13🤔3😎1

18.7K views07:38

Data Secrets

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

В стартапе Eon Systems ученые сделали первую полноценную цифровую эмуляцию мозга животного, которая способна управлять телом

Короче, на равных с искусственным интеллектом аля Джарвис в науке уже давно существует и другая идея: не обучать саму машину, а взять настоящий биологический мозг, полностью скопировать его в цифровую модель и запустить на роботе или компьютере. Особенно этот концепт знаком любителям научной фантастики.

Так вот ученые из Eon Systems заявляют, что они впервые создали такую систему и могут показывать ее в действии.

Они взяли мозг плодовой мухи, скопировали его и создали так называемый connectome: как бы полную карту всех нейронов мозга и связей между ними. То есть все нейроны, все соединения и сигналы синапсов.

Сам мезанизм такого копирования не свеж, и, вообще говоря, сама копия мозга мухи существует уже с 2024 года, НО что Eon Systems сделали впервые – так это соединили эту модель с настоящим телом в симуляции.

Другими словами, они впервые продемонтрировали полный цикл среда → сенсоры → мозг → моторные команды → движение тела. Это называется closing the sensorimotor loop – замыкание петли восприятия и действия. Причем получившаяся виртуальная муха демонтрирует не какой-то один тип поведения, а сразу несколько базовых паттернов.

Никаких искусственных нейросетей. Просто взяли карту мозга, подключили к телу, и это заработало. Хотя говорить, что совсем никакого ML там нет, было бы нечестно: даже если мы видим карту мозга, его динамика (пороги возбуждения, сила синапсов и тд) остается неизвестной, и ее тут как раз приближают моделями. Но это все равно нельзя назвать ИИ в привычном смысле слова.

Главное – что в целом работоспособность принципа brain upload +-подтверждена. Авторы пишут, что дальше все дело в масштабируемости. Для понимания, в мозге мухи примерно 140к нейронов (и даже его скопировать непросто), а у человека нейронов ~86 млрд.

1❤‍🔥116🔥53🤯43❤14127😁6🤔2

19K views12:29

Data Secrets

🤔

🍴

🤨

Please open Telegram to view this post

VIEW IN TELEGRAM

🕊127😁100❤15🔥8🤔6🤓4🤨3💯2❤‍🔥11

18K views14:09

Data Secrets

Ничего необычного, просто в Китае прямо на улицах устанавливают всем желающим OpenClaw

Конкретно эти фотографии сделаны у офиса Tencent в Шэньчжэне. Там разработчики провели бесплатный ивент по установке OpenClaw. Говорят, пришло около тысячи человек.

Подобные мероприятия прошли также в Шанхае, Пекине и нескольких других городах.

Кстати, в Китае в целом сейчас планируют развернуть огромную программу поддержки OpenClaw. Они хотят создавать так называемые Lobster service zones: физические или облачные места, где OpenClaw уже развернут и настроен. Операторам будут выделять бюджет на хостинг, а люди и компании смогут пользоваться (почти) бесплатно.

Плюс разработчикам или компаниям, которые контрибьютят приложения/скиллы на OpenClaw для приоритетных отраслей, обещают до 2 млн юаней субсидий на проект. А проекты, которые признают «демонстрационными» (успешные применения OpenClaw), получают разовую выплату до 1 млн юаней. Это примерно 140к доллларов.

3😁169🔥114👍38❤1818🤯14🗿7🕊3🐳22🤔1

20.2K views16:34

Data Secrets

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

Новый агент для Code Review от Anthropic

Стартап выкатил новую фичу для Claude Code: многоагентный инструмент для ревью кода. Он интегрируется с GitHub и анализирует PR, оставляя комментарии прямо в диффе + один сводный комментарий с основными находками.

При этом над PR организованно работают сразу несколько параллельных агентов, которые смотрят на изменения с разных сторон.

Несколько месяцев Anthropic тестировали систему в собственных проектах. Результаты:

– Доля PR с содержательными ревью комментариями выросла с 16% до 54%.
– Меньше 1% результатов ревью отмечены инженерами как неверные.
– В крупных PR (~1000 строк) бот находил хотя бы одну проблему в 84% случаев, а в среднем по 7.5 на PR.

Короче, все круто. Вот только цена за один PR будет примерно в районе 15-25 долларов

🤑

Мягко говоря, немало. Есть ощущение, что больше всего инструмент подходит как раз для крупных PR (вероятнее всего, сгенерированных). На больших объемах вайбкода такие траты могут быть оправданы, в остальных случаях цена вряд ли окупится.

https://claude.com/blog/code-review

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥52🤯35😁16❤7👍4🤝1

12.7K views09:51

Data Secrets

Как работают рекомендательные системы в огромных сервисах

11 марта в 19:00 Школа Высшей Математики проводит очень крутой (и абсолютно бесплатный!) вокршоп по рексис. Вы узнаете:

– Как рекомендательные и поисковые системы работают в реальных продуктах
– Какие ML-архитектуры, метрики и подходы используются на каждом этапе
– Как учитываются бизнес-требования и ограничения реальных систем

Все это продемонтрируют на живых примерах из e-commerce, стриминга и соцсетей. То есть вы разберете настоящие кейсы, увидите именно те подходы, которые действительно работают в огромных сервисах, и посмотрите на практические детали их реализации и оптимизации.

Вести воркшоп будет Осиновсков Илья – Руководитель отдела Рекомендательных технологий в Ozon.

Мастхэв для инженеров и всех видов DS-спецов. Не пропускайте и регистрируйтесь здесь

❤22🗿9👍7🤯5😁4🔥2👾1

10.3K views11:28

Data Secrets

Подвезли свежие подробности о стартапе Яна Лекуна Напоминаем, что ученый спустя 12 лет работы уходит из Meta и собирается строить собственный стартап. Компания будет заниматься разработкой world models, то есть систем, которые понимают физический мир,…

Стартап Яна Лекуна вышел из стелса и закрыл первый раунд финансирования на 1 миллиард долларов

Если быть точным, они привлекли даже чуть больше: 1.03 миллиарда. Пре-оценка стоимости при этом оказалась где-то в районе 3.5 миллиардов (напоминаем, что стартапу меньше трех месяцев и продуктами там еще и не пахнет).

В Лекуна вложились Cathay Innovation, Greycroft, Hiro Capital, HV Capital, а еще Джеф Безос. Для seed раунда цифры, конечно, ошеломительные. Возможно, это даже новый рекорд для европейской компании.

Также стал известен официальный список ко-фаундеров⬆️

Что ж, теперь ждем, кто выпустит хоть что-нибудь раньше: Лекун или Суцкевер

Please open Telegram to view this post

VIEW IN TELEGRAM

1🔥57😁41❤12👍3⚡2🤔1

8.38K views12:31

About

Blog

Apps

Platform