Data Secrets – Telegram
Data Secrets
78.8K subscribers
6.44K photos
669 videos
20 files
2.71K links
Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN
Download Telegram
while True:
проснулся()
опять что-то новое в ИИ()
уснул()
😁56👍246❤‍🔥1🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
"Я не буду вдаваться в подробности о данных, на которых обучалась модель"

CTO OpenAI, Мира Мурати, дала интервью журналистке из Wall Street Journal. Та спросила Миру о том, на каких данных обучалась SORA, на что CTO ответила просто "на публично доступных". Никаких уточнений от нее добиться так и не удалось (таймкод отрывка видео: 4:25).

Неудивительно, никому ведь не хочется получить в свой адрес очередную пачку исков об авторских правах и личных данных.

Хотя, конечно, стоит учитывать, что такое поведение Миры не обязательно означает, что что-то обучалось нелегально. Говорить о данных просто-напросто может запрещать NDA.

Также из интересного в интервью: SORA станет доступна в этом году, возможно даже в ближайшие 2 месяца.
👍36🔥10🤯5🐳4🤔3😁21
Что посмотреть вечером в пятницу: отличный спич от X5 Tech о том, как они прокачивали ML модель под поведение пользователя

Спикер рассказывает про реальные задачи SberBoom, про трудности их решения и детально разбирает:

– Как различается поведение пользователя на устройствах с экраном и без?
– Какие изменения в ML-пайплайне определения намерения пользователя были сделаны, чтобы учесть эти различия для умной колонки SberBoom, и повысить качество?

Необычная DS-задача + крутое решение + интересный рассказ + красивая презентация = рекомендуем посмотреть
👍15🔥52
Большая вещь: Maisa представили KPU (Knowledge Processing Unit) для улучшения способности LLM рассуждать

По сути это обертка для LLM, которая состоит из так называемого мыслителя, исполнителя и виртуального контекстного окна.

Мыслитель, опираясь на выходы LLM, организует пошаговый план решения задачи пользователя. Исполнитель выполняет команды мыслителя и возвращает ему же результаты для перепланировки. А последняя компонента как бы обеспечивает оптимальное «общение» между этими двумя.

Архитектура не только изящная, но и, судя по бенчмаркам, очень многообещающая. Особенно повышает способности модели решать сложные многоэтапные задачи (в том числе математические и алгоритмические).
🔥47👍8🥰8❤‍🔥31
Реалии современной науки

* статья с картинки 1; статья с картинки 2
🗿103🫡29😁27👍5😨3🤯2👾211
rules_of_ml.pdf
449.5 KB
Что почитать на выходных: руководство от Google "Как делать ML"

Это Best Practices ML System Design бигтеха, священные скрижали «как делать нужно» и «как делать не нужно». Не обращайте внимание на то, что документу много лет. Он все еще как новый (и в некоторых моментах даже более актуальный, чем современные письмена).

Для тех, кто готов преисполниться
60👍18🔥8
В Google Maps только что вышло огромное количество AI-обновлений. В комплекте:

– Иммерсивный вид карт. Помогает на основе снимков со спутника сгенерировать ваш маршрут в 3D и пройти по нему.

– Исследование объектов в real-time. Включаешь камеру, наводишь на что-либо, а карты рассказывают тебе, что это за место, какие в доме есть заведения и прочее.

– Расширенная навигация и advanced подсказки в пути.

– Запросы в поиске на естественном языке. Например: «найди место поблизости с винтажным вайбом».
👍49🔥157❤‍🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Мы или не мы?
😁90👍8🔥83🤨2🥰1
Где лучше всего учиться ML в Росиии? Конечно же в Школе Анализа Данных от Яндекса.

Но вот проблема: чтобы попасть туда, нужна сильная математическая база и скилл щелкать олимпиадное программирование.

Со всеми теми, кто не хочет упустить возможность усилить свои знания, делимся школой Shad Helper, которая готовит к поступлению в ШАД.

Очень скоро, 25 марта, у них стартует 13-месячная программа под руководством сильной команды (преподаватели кандидаты и доктора из МГУ, МФТИ, ВШЭ). Стоимость – 5999 в неделю, остановить обучение можно в любой момент. В комплекте также система скидок за хорошую успеваемость, чат-бот для студентов и регулярные домашние задания с менторской проверкой.

Остались вопросы? Подключайся к ребятам на вебинар 21 марта в 19:00, чтобы узнать больше про курс и подготовку к ШАД.
🤯33🙈10🫡9🤨52😁2
Традиционно, воскресно, и в этот раз не очень очевидно. Задача!

В группе первокурсников n человек и они видят друг друга впервые. А в парке аттракционов сегодня дают скидку, если приходит компания ровно из k друзей, среди которых каждый дружит с каждым.

Дружба между любой парой однокурсников независимо возникает с вероятностью р. Ваня, один из первокурсников, хочет пойти на аттракционы со скидкой.
Каким в среднем количеством способов он может это сделать?


Кто готов попробовать свои силы?
👍173
Data Secrets
Как и обещали, Grok появился в опенсурс 😬
Ладно-ладно, теперь серьезно. X.ai выложили веса и код Grok-1. Оказалось, что это опять-таки Mixture of Experts. Поражает только размер: 314 млрд параметров. Для сравнения, в Gemini Pro 100 млрд.

GitHub | HuggingFace
👍31🔥14🤯75
Data Secrets
Ладно-ладно, теперь серьезно. X.ai выложили веса и код Grok-1. Оказалось, что это опять-таки Mixture of Experts. Поражает только размер: 314 млрд параметров. Для сравнения, в Gemini Pro 100 млрд. GitHub | HuggingFace
Разобрали modal.py этого чуда и готовы погрузить вас в архитектуру. Итак, Grok-1 Илона Маска – это:

– 314В параметров, 86В активных. Mixture of Experts, 8 экспертов, 2 активных (то есть по 2 на токен).
– Вместо позиционных эмбеддингов используются Rotary эмбеддинги размерностью 6144.
– Размер словаря токенизатора: 131 072 (в GPT-4, кстати, примерно столько же).
– 64 слоя в трансформере, каждый с декодером (мультихэд внимание + denseblock). Размерность ключей – 128.
– Длина контекста – 8192 токена (bf16).
– 8-битное квантование весов, то есть ~ 314Гб.

Лицензия – Apache 2.0. Вот такие дела.
🎉64🔥16👍102🤨1
😕
Please open Telegram to view this post
VIEW IN TELEGRAM
😁96🥰9👍6🔥4🏆3🫡1
erid: LjN8KbxG8

Построение DWH в Yandex Cloud: кейс крупной логистической компании

21 марта в 16.00 

 На вебинаре эксперты iiii Tech и Yandex Cloud совместно с клиентом Рулог поделятся кейсом, как в рамках локализации отчетности развернуть DWH (КХД) на Yandex Cloud. 

Расскажем о:
- современном стеке аналитических инструментов
- бесшовной миграции с международных облачных платформ 
- о проекте построения DWH (КХД) на основе дата-контрактов 

Вебинар будет полезен CDO, CTO, руководителям направлений по работе с данными, архитекторам данных, аналитиками и дата-инженерам. 

Спикеры:

Георгий Цыганков, 
руководитель направления BI

Андрей Суренский, 
архитектор по работе с партнёрами Yandex Cloud

Венера Никитина, бизнес-аналитик логистической компании Рулог

Зарегистрироваться можно по ссылке 
🗿5👍1