Пупырка AI – Telegram
Пупырка AI
116 subscribers
730 photos
371 videos
1 file
702 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Сиолошная
OpenAI выпустили новую GPT-5 😑 ...заточенную на программистов, GPT-5 Codex. Эта модель заменит o3 в Codex в веб-клиенте (наконец-то) и уже доступна в локальном Codex CLI / плагине для вашей IDE. Если вы ещё не пробовали — обязательно попробуйте! Это бесплатно…
Видео-подкаст от OpenAI про апдейт и планы Codex

Вот краткое содержание подкаста “Codex and the future of coding with AI” с YouTube, где сооснователь OpenAI Грег Брокман и инженерный лидер Codex Тибо Соттио обсуждают эволюцию Codex, GPT-5 Codex, новые подходы к агентному программированию и будущее совместной работы с ИИ для разработчиков.

Основные моменты выпуска

- Истоки Codex:
Разработка Codex началась с первых попыток GPT-3 автоматически генерировать код по docstring’у. Вскоре команда поняла, что ИИ способен писать большие объёмы связного кода. С тех пор проекты сфокусированы на углубленной работе именно с кодом, в отличие от прочих задач обобщенного ИИ.

- Понятие “harness” для агентов: “Harness” — это инфраструктурная прослойка между моделью и её окружением: инструменты, цикл агента, интеграция с внешними системами. Только так ИИ становится настоящим соавтором, способным не просто выдавать текст, а работать с файлами, управлять средой, взаимодействовать с терминалом или IDE.

- Уроки GitHub Copilot: В разработке Copilot важны не только интеллектуальные возможности модели, но и удобство интеграции и низкая задержка вывода. Например, автодополнение должно происходить за сотни миллисекунд, иначе пользователь перестанет им пользоваться. Более “умные”, но медленные модели требуют других интерфейсов.

- Эволюция агентных сценариев: Внутри OpenAI экспериментировали с “10X” — агентом в терминале, а сейчас доводят Codex до такой формы, чтобы он мог действовать через облако, IDE, локально и асинхронно, вписываясь под разные рабочие среды. Главная цель — сделать агента максимально удобным в самых разнообразных условиях без сложной настройки.

- Применения и агентный подход: Codex сегодня может исполнять длинные задачи — например, рефакторить большие кодовые базы, проводить миграции, автоматизировать ревью. Эту работу можно запускать, уходить, а результат получать потом. Такие демонстрации проложили путь к облачным, параллельным и асинхронным агентам.

- Вызовы и будущее: Крупный челлендж — поддержка сложного контекста (memory) и эффективное взаимодействие с неоднородной инфраструктурой (например, со специфическими разработческими окружениями). В будущем ИИ будет всё автономнее, сможет не только писать и проверять код, но и администрировать сервисы, создавать собственные инструменты, автоматизировать документацию и сопровождение кода.

- Безопасность и ответственность: Этим вопросам уделяется особое внимание: эксперименты строятся с учётом человеческого надзора, прозрачности и безопасности автоматических изменений в коде.

Выводы

Codex уже сейчас становится не просто подсказчиком, а настоящим “кодовым соавтором”, способным брать на себя длительные и сложные разработки, ускоряя процессы ревью и рефакторинга в больших командах. Следующий этап — полная интеграция ИИ-агентов в привычные инструменты разработчиков, поддержка безшовной мульти-modal работы и появление по-настоящему автономных ИИ-сотрудников.
⚡️ Оживляйте любимые фотографии в приложении «Алиса» — бесплатно и без VPN

Теперь все пользователи чата в приложении могут бесплатно превращать семейные фото, аватарки, детские рисунки и другие изображения в короткую анимацию длительностью 4 секунды. В мире Хогвартса для этого требовалась магия, а вам поможет нейросеть Алиса.

1️⃣ Запустите приложение «Алиса» на телефоне, нажмите кнопку «Оживить фото» в чате и загрузите изображение.
2️⃣ Опишите, что должно произойти с картинкой, нажмите «Создать» и немного подождите.
3️⃣ Поделитесь ссылкой на ролик с близкими и друзьями или скачайте его к себе. Например, чтобы смонтировать видеоряд сразу из нескольких анимаций.

Если не знаете, с чего начать, вдохновитесь примерами и подсказками по составлению запроса в чат или попробуйте такой промпт:

Оживи эту фотографию, добавь плавные естественные движения лица и глаз, придай тёплую атмосферу и лёгкое мерцание, сделай анимацию деликатной и реалистичной, сохрани оттенки и характер ретростиля фотографии.


Пробуйте новую фичу в приложении и делитесь самыми классными и необычными результатами в комментариях.

Подписывайтесь на 💜 «Алиса, что нового?»
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Сиолошная
SemiAnalysis — про xAI:
— кластер Colossus 1, построенный за рекордные 122 дня и вмещающий примерно 200'000 H100/H200 и ~30'000 GB200, остаётся самым большим одиночным действующим датацентром.

— суммарное энергопотребление Colossus 1 составляет прмерно ~300 MW, что мало по сравнению с гигаваттными дата-центрами, которые строят OpenAI, META и Anthropic.

— SemiAnalysis пишет, что xAI планирует не отставать на следующем витке развития с Colossus 2. По их оценкам, к третьему кварталу 2025 года общая мощность у xAI превзойдет Meta Superintelligence и Anthropic.

— Для Colossus 2 потрубется привлечь много капитала на закупку GPU, десятки миллиардов долларов. При этом бронь у Nvidia на железо уже есть, и поставки планируются в начале следующего года.

— в отличии от прошлого ДЦ, на этом формально не будут стоять газовые турбины для выработки электроэнергии, так как Мемфис и Теннеси запретили. Поэтому... новый ДЦ строят на границе с Миссисипи, и турбины будут стоять по соседству прямо у границы.

— на данный момент установлено или устанавливается турбин на примерно 460 MW, а выход на 1.1 GW планируется ко второму кварталу 2027-го (как-то долго, мб опечатались в статье? Elon любит побыстрее)

— Но вот незадача: у xAI нет денег на чипы. Сейчас компания ведёт переговоры о новом раунде инвестиций, FT пишет про привлечение 40 миллиардов при оценке в 200. В раунд может зайти Суверенный фонд Саудовской Аравии. Также часть капитала может быть реаллоцирована из X.com или даже Tesla.

— Кроме этого, у компании есть проблемы с текучкой кадров, в том числе и из-за режима работы, по сравнению с которым китайский 996 выглядит отпуском. Банда 007 за работой 😎

— В xAI обсуждают возможность запуска RL поверх интеракций с чатботом Ani, выпущенным ранее, где в качестве обратной связи для алгоритма будет рассчитываться вовлечённость пользователя. LLM и всё приложение может затачиваться на удержание, что может привести к росту популярности и выручки, с которой у компании — даже несмотря на запуск неплохих моделей — наблюдаются проблемы.

Картинка 1: мощности 4 компаний в сравнении (Google почему-то решили не наносить, мб сложно подсчитать)

Картинка 2: Colossus 2 и станция питания на границе двух штатов
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Media is too big
VIEW IN TELEGRAM
Стартап по генерации миров из картинки выкатил бета превью своей модели - самому закачать картинки пока не дают, зато дают походить по чужим генерациям:
https://marble.worldlabs.ai/

Вот и гауссины пригодились (эти «полоски» цветные)

P.S. с телефона качество симуляций хуже
Forwarded from Нейродвиж
Media is too big
VIEW IN TELEGRAM
Генерация 3D-моделей мощно усилилась — Hunyuan выпустили v3 своей модели 😮

Сделали акцент на четкости: мелкие детали объектов больше не замыливаются, как и лица персонажей. Сами китайцы говорят, что увеличили качество генераций аж в 3 раза!

Попробовать можно здесь — 20 генераций дают БЕСПЛАТНО.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from vc.ru
Google начала тестировать экспериментальное приложение для Windows в виде поисковика, которое позволяет искать информацию в файлах на компьютере, установленных приложениях, «Google Диске» и в интернете.

Пока оно доступно только на английском языке пользователям из США

vc.ru/services/2218492
👍1
Forwarded from Сиолошная
Реструктуризация OpenAI в двух графиках

OpenAI уже довольно долгое время ведёт диалог со всеми заинтересованными лицами о том, чтобы превратиться из некоммерческой компании в коммерческую (даже PBC, Public Benefit Corporation, где члены совета правления могут принимать решения не в пользу инвесторов, а общества; так, например, устроен Anthropic и был устроен xAI).

Основная причина — во-первых, компания перестала фокусироваться исключительно на исследованиях и начала получать существенную выручку от продуктов, а во-вторых при таком размере компании уже фактически невозможно привлекать инвестиции без обещания возврата.

Про то, что текущие инвесторы фактически владеют ничем (ни технологией, ни голосом, только долей в компании-пустышке, которая обязуется всё отдавать НКО OpenAI), я писал в деталях вот тут. OpenAI как НКО привлекли несколько самых крупных раундов инвестиций в мире буквально под честное слово; Sama'е тут остаётся только отдать должное.

После реструктуризации будет учреждена полноценная коммерческая структура, существенной долей в которой будет владеть НКО. По данным TheInformation (на основе презентаций и документов, рассылаемых инвесторам), эта доля составит 27%, или примерно 135 миллиардов долларов при текущей оценке компании в 500.

Чуть крупнее доля у Microsoft, 28% — за все те инвестиции, что были вложены с ранних времён существования OpenAI, когда ещё даже GPT-3 не вышла. Оценка доли — $140B.

Четверть компании будет принадлежать сотрудникам — так что доля НКО в сумме с сотрудниками составляет больше 51%. И ещё 13% получат инвесторы, чьи деньги привлекаются в этом году.

У OpenAI есть обязанности отдавать часть прибыли (с 2030-го года, согласно планам компании) ранним инвесторам — см. вторую картинку:
— первые 194 миллиона долларов полностью уйдут самым ранним инвесторам
— из последующих $17.3B 75% будет уходить Microsoft, 25% — сотрудникам и инвесторам
— следующие $257 миллиардов (это прибыль Google за чуть меньше чем 2 года, и META — за 3) уйдут ранним инвесторам (до $165B, не более 51% прибыли) и Microsoft (до $92B, не более 49% прибыли)
— после этого все доходы будут перенаправлены в НКО OpenAI. Наверняка часть из них будет зарезервирована под новые раунды инвестиций для покупки чипов и постройки ДЦ.
Forwarded from Сиолошная
Можете скринить: когда LLM-система решит какую-то из известных нерешённых задач (малоизвестные уже были), то скептики будут говорить «да там всего лишь комбинация уже известных человечеству знаний, ничего удивительного» 🙂
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Psy Eyes
This media is not supported in your browser
VIEW IN TELEGRAM
Krea: в широкий доступ запустили генерацию видео в реалтайме. Пока только для платных подписчиков.

Собственно мы тут были уже больше года назад. Котанам работающим с Animatediff для живых выступлений и других перфомансов эта тема знакома. StreamDiffusion вообще в 2023 вышел. Сплаты в реалтайме нонче тоже ваяются.

Другое дело, что у Krea интерфейс юзабельный и под капотом модельки помощнее.

Ждём опенсорсной китайской ответочки на 3..2..1..

Сайт
Твит
Лол, что
На YouTube добавили Veo 3 Fast

Veo 3 Fast генерирует по текстовому запросу короткие видео со звуком для раздела Shorts. Скоро обещают добавить анимацию картинок, выбор стилей и редактирование видео.

Пока Veo 3 Fast доступен бесплатно для авторов из США, Великобритании, Канады, Австралии и Новой Зеландии.

Также на YouTube добавили модель Lyria 2 для создания песен из фраз и диалогов в видео.
This media is not supported in your browser
VIEW IN TELEGRAM
Reve выпустил AI-редактор изображений

В Reve можно редактировать загруженные и сгенерированные изображения через диалог с чат-ботом.

На каждый запрос Reve генерирует по три картинки. А еще он пока не так сильно ограничен цензурой, как более популярные AI-редакторы.

Попробовать бесплатно можно тут: https://app.reve.com/home
👍1
Forwarded from Not Boring Tech
🎙️ Мой любимый генератор озвучек ElevenLabs пошёл дальше и научился монтировать видео — вышла Studio 3.0! В одном месте доступна куча нейронок для монтажа и работы со звуком:

• Генерирует закадровый голос на любом языке, музыку и звуковые эффекты
• Клонирует ваш голос за пару секунд
• Убирает шумы из любого ролика
• Правит неудачные дубли и делает переозвучку текста, если вы где-то ошиблись
• Генерирует готовую музыку под настроение видео, писал тут
• Автоматически добавляет субтитры
• Больше не нужно экспортировать озвучку и саунд-эффекты из ElevenLabs в другие видеоредакторы
• В Studio 3.0 можно полноценно монтировать — обрезать видео, править аудио-дорожки на таймлайне и многое другое!

Ваша личная студия звукозаписи и монтажа — тут.

@notboring_tech