NEW BOT Телеграм, страница

Data Secrets

Продолжение истории про Reflection

Для тех, кто успел подзабыть: Reflection – это та самая модель Шредингера, которая породила так много споров в начале сентября (мы писали об этом случае тут). Вкратце, авторы наобещали невероятные метрики, а потом модель сдулась. Разрабы при этом написали, что у них почему-то "не получается воспроизвети результаты экспериментов".

Месяц про модель ничего не было слышно. А сегодня тот самый разработчик, у которого не воспроизводились эксперименты, написал, что готов "исправить ошибку".

Он выложил веса, код и другие артефакты и написал, что воспроизвел все, кроме двух показателей на MATH и GSM8K ("Scores differ due to a bug in the initial benchmarking code").

"Надеюсь, этот постмортем внесет ясность в то, что произошло", – написал он.

😁33👍9❤4🤨3

9.08K views12:04

Data Secrets

Тайна модели blueberry раскрыта!

Контекст: примерно неделю назад на text-to-image арене появилась загадочная модель 🫐, точнее целых две. Они с отрывом порвали всех остальных и вышли на первое место по ELO. Все думали, что это новый Dall-E или SORA, но это оказалась…

Свежая FLUX1.1 от Black Forest Lab. Стартап анонсировал модель в Твиттере в в блогпосте, и ходят слухи, что раскатить ее могут уже сегодня 🥳

Please open Telegram to view this post

VIEW IN TELEGRAM

😎61👍15❤6☃4

9.23K views15:08

Data Secrets

В дополнение к утренней новости про новый раунд финансирования OpenAI стало известно, что для компании еще и открыли кредитную линию на $4 млрд

Это возобновляемые деньги, стартап будет платить по ним примерно 6% (+- айти ипотека в России).

Получается, что общие инвестиции этого раунда перешагнули за $10 миллиардов

😨

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥44🤯14😁8👍1

9.4K views17:39

🚀

OpenAI выпустили Canvas – надстройку над ChatGPT для работы с кодом и текстом

По дизайну Canvas походит на Anthropic Artefacts: это отдельное окно рядом с чатом. Инструмент предназначен для задач, где нужно много править или пересматривать один и тот же проект. Он, в отличие от чата, будет лучше запоминать контекст + работать над конкретными разделами.

Например, при работе с текстом он может предложить правки конкретных кусочков, отредактирует длину, тон повествования или грамматику.

Но самое интересное – это, конечно же, код. Canvas просто идеально подходит для программирования:
— исправление багов
— код-ревью
— добавить комментарии
— перевести на любой другой ЯП
— добавить логи

В общем, мини VSCode прямо в чате на основе GPT-4o. И уже раскатили на Plus и Team!

Please open Telegram to view this post

VIEW IN TELEGRAM

❤59🔥22👍10🤨4

10.2K views06:37

Data Secrets

Что ни день, то новость про то, что кто-то ушел из OpenAI

На этот раз компанию покинул Тим Брукс. Он был одним из руководителей проекта SORA. Ушел он в DeepMind, где будет также работать над генерацией видео и "world simulators"

🤔60😁21❤7🫡4👍2🔥1🙈1

14.1K views09:06

Data Secrets

Ваши ставки, куда уйдет следующий ключевой сотрудник из OpenAI?

Anonymous Poll

Откроет свою компанию

😁53🤪17🍓11👀4👍1

1.91K voters9.8K views11:16

Data Secrets

Смотрите, какая интересная статистика. Оказывается, что Anthropic зарабатывает на API примерно столько же, сколько OpenAI. Интересно, изменятся ли числа после DevDay?

👀54👍15🔥11🙈3🐳1

9.27K views12:42

Data Secrets

Как правильно отдыхать: пособие от Илона Маска

Стали известны подробности той самой AI-тусовки Илона Маска, которая проходила в бывшем офисе OpenAI (начинается уже многообещающе, да)? И это еще не принимая во внимание то, что вечеринка проходила день-в-день с OpenAI DevDay.

Вообще, изначально целью вечеринки было привлечение крутых специалистов в xAI. Однако, кажется, HR-бренд прокачать так и не удалось: уже спустя час Маск, буквально стоя на столе, вещал про то, что он выступает за свободную разработку ИИ, не обусловленную получением прибыли (интересно, в чей же огород камень?)...

Завершилась туса тоже эпично – пожарной сигнализацией (наверное, у Маска слишком сильно подгорело). Вишенка на торте: у эвакуировавшихся из здания людей замечали рюкзаки OpenAI.

В общем, записывайте идею на вечер пятницы

🔥54😁29👍9❤4🤨1

9.58K views14:51

Data Secrets

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

Meta только что анонсировала Movie Gen – семейство фундаментальных медиа-моделей

Что может Movie Gen:

➡️ генрировать видео до 1080p с различным соотношением сторон
➡️ генерировать звук в формате video-to-audio и музыку
➡️ редактировать видео на основе промптов (промптом может быть текст или изображение)

По архитектуре трансформер, конечно. Самая большая модель имеет 30B параметров и обучена на контексте в 73K видеотокенов (это примерно 6 секунд 16fps).

В статье есть детали про данные, устройство латентного пространства, оптимизацию архитектуры и лоссов.

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥31👍10❤9🔥4🙈2

10.6K views16:17

Data Secrets

Профессиональный праздник, получается 🥳

Please open Telegram to view this post

VIEW IN TELEGRAM

😁257👍19❤14🔥5🗿3🤩2😈1

13.1K views06:36

Data Secrets

Андрей Карпаты опять завозит контент на выходные: он за два часа сгенерировал 10 эпизодов подкаста про конспирологические теории

В программе: Антлантида, Антикитерский механизм, тайна Марии Целесты и многое другое

Сценаристы и режиссеры-постановщики: ChatGPT, Claude, Gemini

В ролях: NotebookLM

Художник: Ideogram

Уже доступно на Spotify

👏62😎18❤11😁8🤪7👍3

10.6K views08:49

Data Secrets

Как там говорится? «Кажется, началось»?

❤94😁47👍12🤪4🤯3

9.23K views10:50

Data Secrets

Новость дня: активисты разослали необычные посылки Сэму Альтману, Марку Цукербергу и президенту комиссии ЕС

Внутри оказались… перчатки с шестью пальцами. Так сообщество Saidot хотело напомнить бизнесменам про их ответственность за дипфейки, авторские права и угрозу ИИ в целом.

И это не все. Под раздачу неожиданно попала еще и Скарлетт Йоханссон, голосом которой когда-то якобы говорил gpt-4o.

Интересный выбор 😁

Please open Telegram to view this post

VIEW IN TELEGRAM

😁82👍14🙈9🤗4❤2

9.61K views13:03

Data Secrets

Кратко о нейминге в ресерче

😁150🤪18❤8🙈4🔥2🐳2👍1

9.75K viewsedited 09:16

Data Secrets

Мини-подборка новых статей выходного дня, которые точно стоит прочитать:

⚙️

Обучаемый метод прунинга от Nvidia. Основан на идее Semi-Structured прунинга, но, в отличие от классических подходов, маска прунинга выбирается не вручную, а с помощью стохастического алгоритма.
Подробнее – в нашем разборе статьи.

⚙️

Новый метод генерации синтетических 3D-данных для беспилотных авто. Self-driving – сфера, где синтетика нужна больше всего, но где генерировать ее качественно очень сложно. SytheOcc из статьи использует MIPs и ребалансировку, и это впервые позволяет решить одновременно и проблему учета глубины сцен, и вопрос детальной управляемости геометрии.
Подробнее – в нашем разборе статьи.

⚙️

Закон слабого звена: ученые из Meta предложили новый бенчмарк. Они показали, что существующие тесты проверяют только базовые навыки по отдельности, в то время как в задачах реального мира, для которых требуется объединение способностей, модели перформят сравнимо хуже.
Подробнее – в нашем разборе статьи.

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍34🤯8❤4🔥3

9.6K views11:19

Data Secrets

Начинаем понедельник с заряда мотивации.

😁175🫡39👍25🔥11🤯6❤5

10.6K views07:19

Data Secrets

Разработчик написал промпт, который может вывести ризонинг Claude Sonnet на уровень o1-preview

Сам промпт – на картинке. В целом получается какое-то обучение с подкреплением понарошку: модель крутит теги reflection, reward и thinking по кругу, пока не потратит назначенный ей «бюджет».

По кастомному датасету создателя Sonnet стал рассуждать на этом промпте лучше, чем o1. По MMLU (тестировали уже пользователи) до o1 все-таки не дотягивает, но точность все-таки повышает неплохо.

Код эксперимента лежит тут

🔥82👍26❤10😁4🍌2

10.9K views09:36

Data Secrets

Forwarded from XOR

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

Божественно: в Лондоне создали «GPU орган». Он «воспроизводит музыку, управляя частотой вращения каждого вентилятора».

При этом музыка бесконечно генерируется ИИ, обученном на данных 15 хоров.

@xor_journal

🔥80❤12🤔8😎5🗿3🆒3

8.42K views11:58

Data Secrets

This media is not supported in your browser

VIEW IN TELEGRAM

Nvidia представили EdgeRunner – модель для генерации высококачественных 3D-объектов

EdgeRunner справляется даже со сложными моделями, в которох число граней достигает 4000. Предыдущие поколения алгоритмов не тянули такую детализацию.

Недавний тренд таких 3D генераций – авторегрессионные модели: за счет своей структуры они способны сохранять больше топологической информации. И на мелких примерах они действительно работают хорошо, но есть нюанс: на большее количество граней и высокое разрешение они не масштабируются.

В Nvidia чуть-чуть докрутили архитуктуру и предложили автоэнкодер (тоже авторегрессионный). За счет наличия в нем скрытого пространства появляется возможность обучить латентную диффузию и получить лучшую генерализацию; а для оптимизации исследователи прикрутили meshes-to-1D токенизатор.

В итоге результаты получились действительно крутые: вот тут можно посмотреть и покрутить 3D-модельки в рамках демо. А полный текст статьи лежит вот тут.

🔥32👍10❤5

9.93K views14:46

About

Blog

Apps

Platform