Что умеет Agent Mode:
— Просматривает сайты как человек (визуально), а не только читает HTML
— Комбинирует текстовый и визуальный режимы — как в DeepResearch + Operator
— Кликает по кнопкам, заполняет формы, переключается между вкладками
— Интегрируется с Gmail, Google Drive, GitHub и другими сервисами
— Имеет доступ к терминалу и умеет работать с API
— Пишет и исполняет код, генерирует презентации, структурирует информацию
— Может собирать данные с десятков сайтов и оформлять их в отчёты
Пока агент работает, отображается «анимация мыслей» — видно, как он принимает решения.
Включается через пункт Agent Mode в меню ChatGPT.
Доступен на тарифах Pro, Plus и Team.
— Просматривает сайты как человек (визуально), а не только читает HTML
— Комбинирует текстовый и визуальный режимы — как в DeepResearch + Operator
— Кликает по кнопкам, заполняет формы, переключается между вкладками
— Интегрируется с Gmail, Google Drive, GitHub и другими сервисами
— Имеет доступ к терминалу и умеет работать с API
— Пишет и исполняет код, генерирует презентации, структурирует информацию
— Может собирать данные с десятков сайтов и оформлять их в отчёты
Пока агент работает, отображается «анимация мыслей» — видно, как он принимает решения.
Включается через пункт Agent Mode в меню ChatGPT.
Доступен на тарифах Pro, Plus и Team.
Forwarded from Cерафимодальный AI
OpenAI, агенты и как превратить недостатки в преимущества
OpenAI представили сегодня пачку новых функций для агентов: смотреть веб, делать задания, собирать презентации, подбирать билеты. Их разбору посвящено множество других телеграм постов, потому что в этом я хочу поговорить совсем о другом.
Чтобы продемонстрировать работу новых функций OpenAI отсняли серию видео. В каждом из них повторяется один и тот же жест: герой даёт задание нейросети, затем эффектно закрывает крышку ноутбука и блаженно улыбается, ведь теперь он сможет сходить на обед, провести время с любимой, погулять с собакой, вы поняли.
Забавно, как «наша новая функция опизденеть как долго работает» была переупакована в классический формат: позабыты хлопоты, остановлен бег.
OpenAI представили сегодня пачку новых функций для агентов: смотреть веб, делать задания, собирать презентации, подбирать билеты. Их разбору посвящено множество других телеграм постов, потому что в этом я хочу поговорить совсем о другом.
Чтобы продемонстрировать работу новых функций OpenAI отсняли серию видео. В каждом из них повторяется один и тот же жест: герой даёт задание нейросети, затем эффектно закрывает крышку ноутбука и блаженно улыбается, ведь теперь он сможет сходить на обед, провести время с любимой, погулять с собакой, вы поняли.
Забавно, как «наша новая функция опизденеть как долго работает» была переупакована в классический формат: позабыты хлопоты, остановлен бег.
😁2🔥1
Forwarded from Нейродвиж
This media is not supported in your browser
VIEW IN TELEGRAM
Маркетологи, это вам — Higgsfield выпустили ультимативный генератор коротких рекламных видео 🤔
Выбираете шаблон, закидываете фото человека, картинку с товаром, прописываете события и текст, который должен произнести сгенерированный человек, а на выходе получаете креативную рекламу от Veo 3.
Пробуем — здесь.
Выбираете шаблон, закидываете фото человека, картинку с товаром, прописываете события и текст, который должен произнести сгенерированный человек, а на выходе получаете креативную рекламу от Veo 3.
Пробуем — здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3
Forwarded from Нейродвиж
This media is not supported in your browser
VIEW IN TELEGRAM
Suno вернулся — вышла новая модель Suno v4.5+ 😇
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
Обещают улучшенный звук, но главная фишка модели в почти идеальной генерации audio2audio — закидываете свой вокал или наоборот, бит и превращаете его в полноценную песню.
Пробуем имбу — здесь.
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from deadsimple
Последний из них я назвал Ленка — чат бот для агрегации каналов телеги.
Как-то перед сном я поймал себя на мысли что я трачу много времени на пролистывание новостных телеграм каналов. В курсе событий в мире и в IT-новостях быть надо, но информации приходит просто ппц.
Появилась идея — а нет ли телеграм бота который за меня все это будет читать и мне пересказывать только важное? Я поискал и, к удивлению, не нашел. Если знаете такие — напишите пожалуйста в комментах.
Дальше попробовал собрать себе такое через ChatGPT, но не вышло. Он почему-то не умеет читать чаты.
Так что решил собрать такого бота, причем как саас-сервис. Назвал Lenka — как виртуальную подругу Ленку, которая все знает и тебе рассказывает 🙂
MVP уже доступно — @lenka_the_bot
Как-то перед сном я поймал себя на мысли что я трачу много времени на пролистывание новостных телеграм каналов. В курсе событий в мире и в IT-новостях быть надо, но информации приходит просто ппц.
Появилась идея — а нет ли телеграм бота который за меня все это будет читать и мне пересказывать только важное? Я поискал и, к удивлению, не нашел. Если знаете такие — напишите пожалуйста в комментах.
Дальше попробовал собрать себе такое через ChatGPT, но не вышло. Он почему-то не умеет читать чаты.
Так что решил собрать такого бота, причем как саас-сервис. Назвал Lenka — как виртуальную подругу Ленку, которая все знает и тебе рассказывает 🙂
MVP уже доступно — @lenka_the_bot
❤1🤔1
Forwarded from Denis Sexy IT 🤖
Интересная под-фича нового Агентского режима ChatGPT – она может запускаться по расписанию
Мне кажется вижн тут понятен, хотите по субботам получать пиццу с винишком к 8 вечера – пожалуйста
Или если вы делаете анализ рынка каждую неделю
Или ищите работу/клиента и смотрите что нового каждый понедельник
В общем, классная штука
Мне кажется вижн тут понятен, хотите по субботам получать пиццу с винишком к 8 вечера – пожалуйста
Или если вы делаете анализ рынка каждую неделю
Или ищите работу/клиента и смотрите что нового каждый понедельник
В общем, классная штука
Forwarded from GPT/ChatGPT/AI Central Александра Горного
Netflix начал использовать генеративный AI в своих сериалах и фильмах
Первой такой работой стала сцена обрушения здания в аргентинском сериале El Atonata. Компания утверждает, что с AI сделала её в 10 раз быстрее и дешевле, чем традиционными методами.
AI-модели уже работают в поиске Netflix и скоро заработают в рекламе — во второй половине 2025 года обещают запуск интерактивных рекламных форматов с AI-генерациями.
https://techcrunch.com/2025/07/18/netflix-starts-using-genai-in-its-shows-and-films/
Первой такой работой стала сцена обрушения здания в аргентинском сериале El Atonata. Компания утверждает, что с AI сделала её в 10 раз быстрее и дешевле, чем традиционными методами.
AI-модели уже работают в поиске Netflix и скоро заработают в рекламе — во второй половине 2025 года обещают запуск интерактивных рекламных форматов с AI-генерациями.
https://techcrunch.com/2025/07/18/netflix-starts-using-genai-in-its-shows-and-films/
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Runway Act-Two - mocap + нейронный рендеринг
Пока мы не научились полностью контролировать действия персонажа и делать качественный липсинк, у актёров всё ещё есть работа.
Runway анонсировали Act-Two — прямого наследника первой версии, но теперь с улучшенным трекингом лица и новой фичей — трекингом движений и рук. Полноценный AI-мокап. Не показали только ноги — кажется все туловище еще не завезли?
Выглядит очень добротно. На вход принимает видео с актёром и референсную картинку или видео.
Вроде бы ничего сложного, похоже на обычный video-to-video, где на вход идут токены видео актера, а рядом подаются токены референсного персонажа - для переноса внешности. Нужно только хороший датасет насобирать :)
Генерит до 30 сек в 1MP разрешении, 24 fps. Не очень много, но достаточтно чтобы склеивать клипы. 1 секунда — 5 токенов ~ $0,09.
Дипфейки вышли на новый уровень.
Анонс
@ai_newz
Пока мы не научились полностью контролировать действия персонажа и делать качественный липсинк, у актёров всё ещё есть работа.
Runway анонсировали Act-Two — прямого наследника первой версии, но теперь с улучшенным трекингом лица и новой фичей — трекингом движений и рук. Полноценный AI-мокап. Не показали только ноги — кажется все туловище еще не завезли?
Выглядит очень добротно. На вход принимает видео с актёром и референсную картинку или видео.
Вроде бы ничего сложного, похоже на обычный video-to-video, где на вход идут токены видео актера, а рядом подаются токены референсного персонажа - для переноса внешности. Нужно только хороший датасет насобирать :)
Генерит до 30 сек в 1MP разрешении, 24 fps. Не очень много, но достаточтно чтобы склеивать клипы. 1 секунда — 5 токенов ~ $0,09.
Дипфейки вышли на новый уровень.
Анонс
@ai_newz
Forwarded from Сиолошная
Но есть ещё 4 главных бенчмарка, которые выпятили OpenAI, и все они — про экономически ценные задачи, основанные на анализе реальной ежедневной работы специалистов.
1. Общий бенчмарк «Economically important tasks», про который деталей особо нет. «Эти задачи, порученные экспертам из разных профессий и отраслей, отражают реальную профессиональную работу, такую как подготовка конкурентного анализа поставщиков услуг неотложной помощи по требованию, составление подробных графиков амортизации и определение перспективных скважин для нового объекта по производству экологически чистого водорода». Тут оценивается доля ответов, где было отдано предпочтение ответу модели нежели написанному человеком — в разрезе длительности выполнения задачи человеком.
2. SpreadsheetBench, который оценивает модели по их способности редактировать электронные таблицы, созданные на основе реальных сценариев. Примеры вопросов смотрите тут на 25 странице и далее.
3. Ещё один внутренний бенчмарк « ...измеряющий способность модели справляться с задачами моделирования, выполняемыми аналитиками инвестиционного банкинга в течение первого-третьего года работы, например, с составлением финансовой модели из трёх отчётов для компании из списка Fortune 500 с корректным форматированием и ссылками или с построением модели выкупа с использованием заёмных средств для приобретения частной компании». Каждая задача оценивается по сотням критериев, связанных с корректностью и используемыми формулами.
4. BrowseComp, свежий бенчмарк OpenAI от апреля. Измеряет способность агентов находить труднодоступную информацию в интернете. Статья тут.
В общем, нужно подождать ~месяц, чтобы понять ценность в реальных рабочих задачах (хотя Денис вон уже кайфует), но направление, в котором делаются улучшения, понятно.
И всё это доступно и Plus пользователям с подпиской за $20 в месяц!
1. Общий бенчмарк «Economically important tasks», про который деталей особо нет. «Эти задачи, порученные экспертам из разных профессий и отраслей, отражают реальную профессиональную работу, такую как подготовка конкурентного анализа поставщиков услуг неотложной помощи по требованию, составление подробных графиков амортизации и определение перспективных скважин для нового объекта по производству экологически чистого водорода». Тут оценивается доля ответов, где было отдано предпочтение ответу модели нежели написанному человеком — в разрезе длительности выполнения задачи человеком.
2. SpreadsheetBench, который оценивает модели по их способности редактировать электронные таблицы, созданные на основе реальных сценариев. Примеры вопросов смотрите тут на 25 странице и далее.
3. Ещё один внутренний бенчмарк « ...измеряющий способность модели справляться с задачами моделирования, выполняемыми аналитиками инвестиционного банкинга в течение первого-третьего года работы, например, с составлением финансовой модели из трёх отчётов для компании из списка Fortune 500 с корректным форматированием и ссылками или с построением модели выкупа с использованием заёмных средств для приобретения частной компании». Каждая задача оценивается по сотням критериев, связанных с корректностью и используемыми формулами.
4. BrowseComp, свежий бенчмарк OpenAI от апреля. Измеряет способность агентов находить труднодоступную информацию в интернете. Статья тут.
В общем, нужно подождать ~месяц, чтобы понять ценность в реальных рабочих задачах (хотя Денис вон уже кайфует), но направление, в котором делаются улучшения, понятно.
И всё это доступно и Plus пользователям с подпиской за $20 в месяц!