This media is not supported in your browser
VIEW IN TELEGRAM
Вот так коллаб: NVIDIA совместно с xAI построили Colossus – самый большой в мире суперкомпьютер
Colossus был создан всего за 122 дня и работает на базе сетевой платформы NVIDIA Spectrum-X Ethernet, которая была разработана специально для обучения ИИ. Ее соль в повышенной пропускной способности: 95% с нулевой задержкой.
В Colossus (приготовьтесь) 100 000 видеокарт NVIDIA H100. И, судя по твитам Маска, туда собираются добавить еще столько же H200. Кластер будет использоваться для обучения моделей Grok.
Colossus был создан всего за 122 дня и работает на базе сетевой платформы NVIDIA Spectrum-X Ethernet, которая была разработана специально для обучения ИИ. Ее соль в повышенной пропускной способности: 95% с нулевой задержкой.
В Colossus (приготовьтесь) 100 000 видеокарт NVIDIA H100. И, судя по твитам Маска, туда собираются добавить еще столько же H200. Кластер будет использоваться для обучения моделей Grok.
👍51🔥32❤6👀5
В модельке 2.5В параметров, так что, как создатели написали в релизе, запустить ее можно даже «на тостере». Для малышки потребуется всего 10 Гб видеопамяти, а на метриках это SOTA в своем размере.
Самое приятное: модель открыта как для личного, так и для коммерческого использования.
Веса | Блог
Please open Telegram to view this post
VIEW IN TELEGRAM
❤34👍20🔥9💘2❤🔥1👏1
Более 25% кода, который сейчас пишут в Google, создается ИИ
Об этом рассказал Сундар Пичаи. Политика такова, что инженерам разрешают и даже рекомендуют активно использовать ИИ для генерации нового кода (но, конечно, сгенерированный код затем внимательно проверяется).
Кроме того, CEO поделился занятными цифрами: бизнес Google Cloud увеличился на 35%, и аналитики считают, что в основном это заслуга ИИ, который помогает заключать крупные b2b сделки.
Об этом рассказал Сундар Пичаи. Политика такова, что инженерам разрешают и даже рекомендуют активно использовать ИИ для генерации нового кода (но, конечно, сгенерированный код затем внимательно проверяется).
Кроме того, CEO поделился занятными цифрами: бизнес Google Cloud увеличился на 35%, и аналитики считают, что в основном это заслуга ИИ, который помогает заключать крупные b2b сделки.
🔥56🤯22👍5😁4❤1🌚1
Reuters: OpenAI создает свой первый чип
Но амбиции пришлось подурезать: раньше Альтман хотел полностью автономное производство, но сейчас стартап работают с TSMC. Да и в целом компания уходит от планов перейти полностью на собственные чипы просто к стратегии максимальной диверсификации: например, OpenAI также начинает закупать карты AMD.
Но амбиции пришлось подурезать: раньше Альтман хотел полностью автономное производство, но сейчас стартап работают с TSMC. Да и в целом компания уходит от планов перейти полностью на собственные чипы просто к стратегии максимальной диверсификации: например, OpenAI также начинает закупать карты AMD.
👍27❤5🔥5
Что-то интересное: ученые из M-A-P и ByteDance слепили AutoKaggle – мультиагентный фреймворк для автономного решения DS/ML соревнований
Библиотека работает по итеративной схеме. На каждом этапе агенты выполняют определенные привычные нам шаги: в начале очищают и обрабатывают данные, а потом экспериментируют с моделями, отлаживают код, тестируют и тд.
Под капотом агенты в ролях Reader, Planner, Developer, Reviewer и Summarizer, которые взаимодействуют по определенной схеме (см., например, псевдокод). На практике это работает, как горячая картошка – агенты перекидывают задачи друг другу, и каждый из них внутри себя имеет собственный алгоритм того, что с задачей нужно сделать и кому отдать дальше.
В качестве базовой модели пробовали gpt-4o и o1-mini. Оказалось, что перформят они плюс-минус одинакого. Вообще, результаты получились неплохие: на восьми валидационных хакатонах в среднем фреймворк выбил скор 0,85.
Код | Статья
Библиотека работает по итеративной схеме. На каждом этапе агенты выполняют определенные привычные нам шаги: в начале очищают и обрабатывают данные, а потом экспериментируют с моделями, отлаживают код, тестируют и тд.
Под капотом агенты в ролях Reader, Planner, Developer, Reviewer и Summarizer, которые взаимодействуют по определенной схеме (см., например, псевдокод). На практике это работает, как горячая картошка – агенты перекидывают задачи друг другу, и каждый из них внутри себя имеет собственный алгоритм того, что с задачей нужно сделать и кому отдать дальше.
В качестве базовой модели пробовали gpt-4o и o1-mini. Оказалось, что перформят они плюс-минус одинакого. Вообще, результаты получились неплохие: на восьми валидационных хакатонах в среднем фреймворк выбил скор 0,85.
Код | Статья
🔥50🫡17👍12🤯4❤1🤔1🍓1😎1
Media is too big
VIEW IN TELEGRAM
В Лондоне прошел OpenAI DevDay
Больше всего внимания уделили Realtime API: показывали, как o1 в реальном времени пишет приложение для интерактивной демонтрации солнечной системы, заказывает пироги и работает гидом по городу. Демо, в общем-то, OpenAI всегда показывать умели, но в этот раз оно особенно удалось. Шоу еще раз доказывает, что ИИ-агенты станут революционным будущим, если компании найдут способ снизить косты на инференс.
В остальном, ничего шокирующего или нового: по поводу o1 говорили, что раскатят скоро. Объясняли пользу файнтюнинга и дистилляции своих моделей, напоминали, что у них есть json структурирование и сервис для эвала.
Больше всего внимания уделили Realtime API: показывали, как o1 в реальном времени пишет приложение для интерактивной демонтрации солнечной системы, заказывает пироги и работает гидом по городу. Демо, в общем-то, OpenAI всегда показывать умели, но в этот раз оно особенно удалось. Шоу еще раз доказывает, что ИИ-агенты станут революционным будущим, если компании найдут способ снизить косты на инференс.
В остальном, ничего шокирующего или нового: по поводу o1 говорили, что раскатят скоро. Объясняли пользу файнтюнинга и дистилляции своих моделей, напоминали, что у них есть json структурирование и сервис для эвала.
👍29🔥7❤5
This media is not supported in your browser
VIEW IN TELEGRAM
Миниатюра: я после того как заполнил .yml и запустил trainer.train()
👍109😁65❤🔥10💯10❤3
Media is too big
VIEW IN TELEGRAM
Boston Dynamics показали новое видео своего робота Atlas
На демо он перемещает крышки двигателей из одних контейнеров в другие. Стартап подчеркивает, что гуманоид делает все автономно, без радиоуправления или других читов (это, видимо, камень в огород Маска, который постоянно хитрит со своим оптимусом😀 )
Демо поражает: робот стабильно ходит, почти ничего не путает и выполняет разумные действия. Если это не черрипикинг, а демонстрация реальных возможностей, то перед нами самый продвинутый на данный момент робот в мире.
На демо он перемещает крышки двигателей из одних контейнеров в другие. Стартап подчеркивает, что гуманоид делает все автономно, без радиоуправления или других читов (это, видимо, камень в огород Маска, который постоянно хитрит со своим оптимусом
Демо поражает: робот стабильно ходит, почти ничего не путает и выполняет разумные действия. Если это не черрипикинг, а демонстрация реальных возможностей, то перед нами самый продвинутый на данный момент робот в мире.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍62🔥27❤8☃2🗿2
Что надеть на Хэллоуин, чтобы быть страшнее всех?
Подобрали для вас костюмы, по сравнению с которыми Пеннивайз и Фредди Крюгер покурят в сторонке.
С праздником🎃
Подобрали для вас костюмы, по сравнению с которыми Пеннивайз и Фредди Крюгер покурят в сторонке.
С праздником
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👻46🎃22❤9👍5😁2🍌1🏆1
OpenAI совсем скоро раскатит SearchGPT
Об этом сообщил один из твиттерских ИИ-инсайдеров, который часто прокидывает какую-то информацию о ведущих стартапах или лабораториях – Jimmy Apples. Он написал, что OpenAI и вовсе планировали релизиться на прошлой неделе, но не захотели соревноваться за внимание с обновлениями от Anthropic.
Стартап любит релизы в четверг вечером, так что ждем подарка на Хэллоуин👻
Об этом сообщил один из твиттерских ИИ-инсайдеров, который часто прокидывает какую-то информацию о ведущих стартапах или лабораториях – Jimmy Apples. Он написал, что OpenAI и вовсе планировали релизиться на прошлой неделе, но не захотели соревноваться за внимание с обновлениями от Anthropic.
Стартап любит релизы в четверг вечером, так что ждем подарка на Хэллоуин
Please open Telegram to view this post
VIEW IN TELEGRAM
👍37🔥11❤6
This media is not supported in your browser
VIEW IN TELEGRAM
Nvidia обучили фундаментальную модель HOVER для управления телом роботов – в ней всего 1.5M параметров
Модель была обучена на базе NVIDIA Isaac. Это среда симуляции на базе GPU, которая ускоряет физику в 10 тысяч раз относительно реального времени. То есть, пока в симуляции робот учится на годе движений, в "нашем мире" это занимает примерно 50 минут. Самое интересное, что для того чтобы перевести робота в реальное время не нужен даже файнтюнинг.
Нужно, однако, понимать, что HOVER – это не автономная система внутри робота, а именно система управления, которая на вход принимает какой-то вид "промпта" (движения джойстика, позы, экзоскелет), и переводит это в полноценные движения гуманоида. За счет этого HOVER становится еще и очень удобной системой для сбора данных.
Под капотом, по сути, алгоритм дистилляции, который действия тренера сжимает в понятные роботу маски (есть отдельные маски для низа тела и верха). Таким образом, любой ввод действий мы переводим в единое пространство политики, и за счет этого избавляемся от проблемы непереносимости управления между различными режимами.
Статья здесь
Модель была обучена на базе NVIDIA Isaac. Это среда симуляции на базе GPU, которая ускоряет физику в 10 тысяч раз относительно реального времени. То есть, пока в симуляции робот учится на годе движений, в "нашем мире" это занимает примерно 50 минут. Самое интересное, что для того чтобы перевести робота в реальное время не нужен даже файнтюнинг.
Нужно, однако, понимать, что HOVER – это не автономная система внутри робота, а именно система управления, которая на вход принимает какой-то вид "промпта" (движения джойстика, позы, экзоскелет), и переводит это в полноценные движения гуманоида. За счет этого HOVER становится еще и очень удобной системой для сбора данных.
Под капотом, по сути, алгоритм дистилляции, который действия тренера сжимает в понятные роботу маски (есть отдельные маски для низа тела и верха). Таким образом, любой ввод действий мы переводим в единое пространство политики, и за счет этого избавляемся от проблемы непереносимости управления между различными режимами.
Статья здесь
🔥57👍17🤯9🏆3🤔2
Forwarded from Data Secrets | Карьера
Оффер или жизнь? 🧛♂️
Хэллоуин… В этот день ведьмы собираются на ежегодный шабаш, нежить вылезает из болот, а админы составляют для вас подборку культовых ужастиков на вечер. Приятного просмотра.
@data_secrets_career
Хэллоуин… В этот день ведьмы собираются на ежегодный шабаш, нежить вылезает из болот, а админы составляют для вас подборку культовых ужастиков на вечер. Приятного просмотра.
@data_secrets_career
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👻24😁10👍7🎃4❤1🔥1