Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
Apple Intelligence здесь!

Правда, если вы не из определенного списка стран или у вас не определенное устройство, то вас отправят в Waitlist ☹️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍36🔥8🗿82
Помните недавнюю статью Anthropic про новую технику RAG, которая навела столько шума?

Кратко: исследователи предложили технику аннотирования чанков и смешивания обычных эмбеддингов с TF-IDF. Количество галлюцинаций на таком пайплайне понизилось относительно классических техник RAG на 35% (!). Более подробный разбор статьи мы делали здесь.

Так вот, теперь появился шанс познакомиться с архитектурой еще ближе: появилась опенсорсная реализация от ребят из Together AI. Они используют Llama 3.2 3B для аннотирования, и Llama 3.1 405B как основную модель.

Код здесь. Если вы исследователь, то будет супер полезно поиграться и разобраться. А если крутите RAG где-то на проде – то сохраняйте имплементацию на заметку.
39🔥11👍8❤‍🔥2
⚪️ The Information сообщает, что Meta разрабатывает собственную поисковую систему с ИИ

⚪️ Perplexity привлекает новый раунд инвестиций и собирается забрать львиную долю рынка поиска

⚪️ OpenAI продолжает тестировать SearchGPT

Google: 😭
Please open Telegram to view this post
VIEW IN TELEGRAM
👍43🔥14🫡81
This media is not supported in your browser
VIEW IN TELEGRAM
Там в Твиттере случайно сгенерировали классическую реакцию на новость про шестидневку
🔥82😁50🫡5🤝3😐1
This media is not supported in your browser
VIEW IN TELEGRAM
Вот так коллаб: NVIDIA совместно с xAI построили Colossus – самый большой в мире суперкомпьютер

Colossus был создан всего за 122 дня и работает на базе сетевой платформы NVIDIA Spectrum-X Ethernet, которая была разработана специально для обучения ИИ. Ее соль в повышенной пропускной способности: 95% с нулевой задержкой.

В Colossus (приготовьтесь) 100 000 видеокарт NVIDIA H100. И, судя по твитам Маска, туда собираются добавить еще столько же H200. Кластер будет использоваться для обучения моделей Grok.
👍51🔥326👀5
⚡️ Вышла Stable Diffusion 3.5 Medium

В модельке 2.5В параметров, так что, как создатели написали в релизе, запустить ее можно даже «на тостере». Для малышки потребуется всего 10 Гб видеопамяти, а на метриках это SOTA в своем размере.

Самое приятное: модель открыта как для личного, так и для коммерческого использования.

Веса | Блог
Please open Telegram to view this post
VIEW IN TELEGRAM
34👍20🔥9💘2❤‍🔥1👏1
Более 25% кода, который сейчас пишут в Google, создается ИИ

Об этом рассказал Сундар Пичаи. Политика такова, что инженерам разрешают и даже рекомендуют активно использовать ИИ для генерации нового кода (но, конечно, сгенерированный код затем внимательно проверяется).

Кроме того, CEO поделился занятными цифрами: бизнес Google Cloud увеличился на 35%, и аналитики считают, что в основном это заслуга ИИ, который помогает заключать крупные b2b сделки.
🔥56🤯22👍5😁41🌚1
Reuters: OpenAI создает свой первый чип

Но амбиции пришлось подурезать: раньше Альтман хотел полностью автономное производство, но сейчас стартап работают с TSMC. Да и в целом компания уходит от планов перейти полностью на собственные чипы просто к стратегии максимальной диверсификации: например, OpenAI также начинает закупать карты AMD.
👍275🔥5
К такому даже его жизнь не готовила
😁163🔥21🫡8
Что-то интересное: ученые из M-A-P и ByteDance слепили AutoKaggle – мультиагентный фреймворк для автономного решения DS/ML соревнований

Библиотека работает по итеративной схеме. На каждом этапе агенты выполняют определенные привычные нам шаги: в начале очищают и обрабатывают данные, а потом экспериментируют с моделями, отлаживают код, тестируют и тд.

Под капотом агенты в ролях Reader, Planner, Developer, Reviewer и Summarizer, которые взаимодействуют по определенной схеме (см., например, псевдокод). На практике это работает, как горячая картошка – агенты перекидывают задачи друг другу, и каждый из них внутри себя имеет собственный алгоритм того, что с задачей нужно сделать и кому отдать дальше.

В качестве базовой модели пробовали gpt-4o и o1-mini. Оказалось, что перформят они плюс-минус одинакого. Вообще, результаты получились неплохие: на восьми валидационных хакатонах в среднем фреймворк выбил скор 0,85.

Код | Статья
🔥50🫡17👍12🤯41🤔1🍓1😎1
Media is too big
VIEW IN TELEGRAM
В Лондоне прошел OpenAI DevDay

Больше всего внимания уделили Realtime API: показывали, как o1 в реальном времени пишет приложение для интерактивной демонтрации солнечной системы, заказывает пироги и работает гидом по городу. Демо, в общем-то, OpenAI всегда показывать умели, но в этот раз оно особенно удалось. Шоу еще раз доказывает, что ИИ-агенты станут революционным будущим, если компании найдут способ снизить косты на инференс.

В остальном, ничего шокирующего или нового: по поводу o1 говорили, что раскатят скоро. Объясняли пользу файнтюнинга и дистилляции своих моделей, напоминали, что у них есть json структурирование и сервис для эвала.
👍29🔥75
This media is not supported in your browser
VIEW IN TELEGRAM
Миниатюра: я после того как заполнил .yml и запустил trainer.train()
👍109😁65❤‍🔥10💯103
Media is too big
VIEW IN TELEGRAM
Boston Dynamics показали новое видео своего робота Atlas

На демо он перемещает крышки двигателей из одних контейнеров в другие. Стартап подчеркивает, что гуманоид делает все автономно, без радиоуправления или других читов (это, видимо, камень в огород Маска, который постоянно хитрит со своим оптимусом 😀)

Демо поражает: робот стабильно ходит, почти ничего не путает и выполняет разумные действия. Если это не черрипикинг, а демонстрация реальных возможностей, то перед нами самый продвинутый на данный момент робот в мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥2782🗿2
Что надеть на Хэллоуин, чтобы быть страшнее всех?

Подобрали для вас костюмы, по сравнению с которыми Пеннивайз и Фредди Крюгер покурят в сторонке.

С праздником 🎃
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👻46🎃229👍5😁2🍌1🏆1