Пупырка AI – Telegram
Пупырка AI
115 subscribers
725 photos
370 videos
1 file
697 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
ChatGPT 5.2

На сайте куча примеров, как всё становится лучше

https://openai.com/index/introducing-gpt-5-2/
Forwarded from Адель и МЛь
Всё, что нужно знать о бенчмарках в этом году.

Год назад мы проверили предварительную версию ещё не выпущенной OpenAI o3 (High), которая набрала 88% на ARC-AGI-1 при ориентировочной стоимости $4,5k за задачу.

Сегодня мы проверили новый GPT-5.2 Pro (X-High) с рекордным (SOTA) результатом 90,5% при стоимости $11,64 за задачу.

Это означает примерно 390-кратное улучшение эффективности за один год.
Google экспериментирует с браузерами

Disco — это экспериментальный браузер Google, который на базе GenTabs и Gemini 3 превращает обычные вкладки и запросы в мини‑приложения под задачу пользователя (путешествие, учёба, ресёрч и т.п.).

Что такое Disco
• Разработан командой Chrome как отдельный эксперимент, а не замена браузера Chrome.
• Запускается через Google Labs / Search Labs и пока позиционируется как полигон для новых AI‑фич веб‑браузинга.

Как работает GenTabs
• Пользователь вводит запрос в чат (например, спланировать поездку в Японию), после чего Disco сам открывает набор релевантных вкладок.
• На основе открытых вкладок и запроса AI собирает интерактивное веб‑приложение (planner, флэшкарты, визуализации и т.п.), которое можно дальше донастраивать текстом.

Роль вкладок и коллаборация
• Ключевая идея — не просто чатить с ИИ, а активно добавлять свои сайты и вкладки, которые GenTabs «пережёвывает» и встраивает в итоговое приложение.
• Команда увидела, что когда ссылки просто выдаются в чате, люди по ним не ходят, поэтому Disco теперь сам открывает вкладки и подталкивает к исследованию веба.

Для чего это нужно
• Инструмент пытается соединить привычный серфинг (много вкладок) и «веб‑апп под задачу здесь и сейчас», который собирается за минуту поверх вашего ресёрча.
• Варианты использования: планирование поездок, учёба, научный ресёрч, проекты, где из разрозненных вкладок нужно быстро собрать структурированный рабочий инструмент.

Статус и ограничения
• Disco — эксперимент в Google Labs, с ограниченным доступом и пока фокусом на macOS.
• В Google подчёркивают, что это тестовая площадка для GenTabs; неясно, останется ли это отдельным приложением или фича в итоге переедет в Chrome / Поиск / Документы.


https://youtu.be/I-rAE40ggbc

https://blog.google/technology/google-labs/gentabs-gemini-3/
Forwarded from e/acc
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree запустил аппстор для гуманоидов, в котором за $0,99 вы можете скачать своему роботу навык тверка, игры в мячик с котом или владения гранатометом.
This media is not supported in your browser
VIEW IN TELEGRAM
Cursor обещает скоро сделать поддержку симулятора для мобильной разработки
1
This media is not supported in your browser
VIEW IN TELEGRAM
Genspark научился простой, но эффективной вещи — кидаешь в него любую презентацию, он делает из неё шаблон для последующих през.
This media is not supported in your browser
VIEW IN TELEGRAM
Обновление Manus.im

Manus 1.6 привёз три главных штуки: новый агент Manus 1.6 Max (существенный буст в качестве и автономности), полноценную мобильную разработку (iOS/Android‑приложения по описанию) и Design View — интерактивный визуальный редактор картинок прямо внутри Manus.
👍2
Это интервью a16z с Ryo Lu из Cursor — и важно, что оно вышло три недели назад, до большого апдейта Cursor.

YouTube

О чём говорят
• Как индустрия сначала разделила софт на «дизайн» и «инженерию», а теперь AI снова склеивает это в один поток — от идеи до живого интерфейса в коде.
• Почему в мире AI-редакторов важнее не «красивый дрибббл», а системы, в которых пользователи сами создают и меняют продукт.
• Что «вкус» всё ещё важен, но становится надстройкой над мощными инструментами и рабочими пайплайнами, а не главной ценностью сам по себе.

Дизайнер как девелопер
• Рё рассказывает, как раньше его макеты «умирали» на передаче разработчикам, а теперь с Cursor дизайнер может сам собирать рабочие прототипы и фичи.
• AI в редакторе сокращает цикл: идея → прототип → проверка → итерация — за минуты, а не недели.
• Роли размываются: появляется фигура «full builder» — человек, который держит в руках и продукт, и UX, и реализацию.

Философия и личный OS
• Дизайн описывают не как про «красиво», а как про структуру, ограничения и систему, которая задаёт рамки для хороших решений.
• Рё показывает свой персональный «ryOS» — кастомную ретро-операционку, которую он собрал на Cursor как соло-дизайнер с AI.
• Это хороший пример того, как один человек с AI-инструментами может делать то, что раньше требовало команды.
🔥2
Это второе интервью с Ryo Lu, на этот раз у YC, и оно хорошо дополняет его разговор с a16z. И вышло всего 3 дня назад. Тут меньше про визионерство и больше про конкретный дизайн‑процесс и то, как именно он перестраивал Cursor под мир агентов.

https://youtu.be/3JiVDYL20G4?si=gNHBESFzwvdslEes

KPI: превратить дизайнеров в кодеров

Ryo прямо формулирует личный KPI в Cursor: «в этом году моя задача — превратить всех дизайнеров в кодеров». Не в смысле «идите учите синтаксис и Git», а в том, что общим языком команды становится код, а не фреймы в Figma. Дизайнеры начинают собирать живые вещи сами, а агенты закрывают им дырки в low‑level знаниях и ресёрче.

Он чётко проговаривает сдвиг: раньше дизайнеры годами жили в коробке «ты вот тут про пиксели и UX, дальше — не твоё». Сейчас с агентами вход в прототипирование и разработку становится значительно менее страшным: можно начать «кодить, не умея кодить», и уже по ходу разбираться, как всё устроено.

Учиться, пока строишь

Вместо классического пути «сначала курс, потом pet‑project» Ryo топит за формат «learning by building». Он сам так учился: сначала сайт, потом комьюнити, потом стартапы — и только потом формальные термины из CS. В мире с Cursor и агентами это радикализируется: ты можешь стартовать с расплывчатой идеи, отдать её агенту и быстро получить 60–70% результата.

Дальше начинается самое интересное: именно доводка этого «сырого» результата — зона мастерства дизайнера. Не модель решает, что красиво, уместно и системно, а человек, который видит продукт целиком, понимает контекст и может направлять агента, а не просто принимать его выводы.

Как устроен дизайн в Cursor

Внутри Cursor дизайн‑команда крошечная по сравнению с общей компанией, но все в ней пишут код. Параллельно множество инженеров «дизайнит» продукт, потому что Cursor — инструмент для разработчиков, и почти каждый сотрудник сам его power‑user. Из‑за этого нагрузка на дизайн — не в том, чтобы «рисовать экраны», а в том, чтобы держать систему целостной.

Ryo рассказывает, как Cursor буквально раз в несколько месяцев приходится «пересобирать» изнутри: фичи множатся, разработчики экспериментируют, появляются новые кнопки и режимы. Задача дизайна — вычленять общие примитивы, сшивать похожие сущности, убирать лишние уровни навигации и не давать продукту превратиться в свалку режимов «для всех и ни для кого».

От VS Code‑надстройки к миру агентов

Он очень конкретно описывает путь продукта. В начале Cursor был скорее набором фич поверх VS Code: таб‑completion, чат‑панель, composer, какой‑то скрытый агент, отдельный bug finder. Всё это жило в разных местах, с разной логикой и даже разными терминами. Пользователь по сути пользовался «кусочком магии» поверх привычного IDE.

Первый большой шаг Ryo — объединить всё это в одну сущность: агент. Чат, composer, режимы — это не отдельные продукты, а разные «маски» одного и того же агента с чуть разными настройками и ограничениями. Второй шаг — сделать агента дефолтом: открыть Cursor и сразу «говорить с системой», а не искать чекбокс «включить магию».

Следующий перелом — Cursor 2.0: переворот иерархии интерфейса. Вместо файлового дерева в центре и агента сбоку — один агент как главный экран, а код и структура проекта становятся вторым слоем, который открывается по мере надобности. Это принципиально другая модель: ты смотришь не на «файлы», а на «работу агентов» и состояние задач.

Baby Cursor и прототипирование в коде

Один из самых показательных моментов выпуска — «Baby Cursor». Это мини‑версия Cursor, которую Ryo собрал за несколько часов как личную песочницу. Там есть горячие клавиши, мультиагентные сценарии, встроенный браузер, превью кода — всё, что нужно, чтобы почувствовать будущее поведения, не лезя в огромный прод‑код.

Он честно говорит: сложные живые состояния, особенно с AI, невозможно адекватно прожить в статичных макетах. В Figma ты либо рисуешь фейковое состояние, либо тонешь в вариациях. В Baby Cursor он строит настоящее взаимодействие: пара промптов агенту — и у тебя уже рабочий прототип новой концепции, который можно прожать до ощущения «круто / не круто».
🔥2
Продолжение суммаризации:
Дизайн как скульптура

Очень яркая метафора из этого интервью — переход от «рисования» к «скульптуре». Старый pipeline: рисуем вайрфреймы, красим их слоями визуала, передаём в разработку, потом когда‑то там появляется «настоящий» продукт. Ты всё время работаешь с артефактом, а не с живой системой.

Новый подход: ты просишь агента собрать «ком», сырой, несовершенный объект, но это уже реальное приложение. Дальше работа дизайнера — отсечь лишнее, переформулировать, заскоупить, объединить части, пока форма не станет правильной. Это принципиально другой навык: не «как красиво нарисовать state», а «как направить систему туда, куда нужно продукту».

Системы, а не фичи

В какой‑то момент разговор уходит в чистый системный дизайн. Ryo противопоставляет подходу «human‑centered как чек‑лист фич» мышление через устойчивые примитивы. Ты не добавляешь новую кнопку под каждый сценарий — ты находишь базовые элементы, которые будут жить и через 10 лет, а потом конфигурируешь их под задачи.

В качестве примера он приводит Notion: блоки, страницы, базы, люди и команды. Всё, что мы видим как «функции», на самом деле комбинации этих штук. В Cursor он стремится к такой же модели: меньше именованных режимов и отдельных экранов, больше продуманной системы примитивов, которые можно пересобирать и расширять без визуального хаоса.

Будущее ролей и интерфейсов

Финальный слой — про будущее профессий. По его картине, дизайнеры, PM и инженеры постепенно сходятся в одном поле: вокруг кода и агентов. Главное преимущество — не в том, чтобы идеально знать инструмент, а в способности системно мыслить, чувствовать ограничения прод‑среды и использовать агента как усилитель, а не как чёрный ящик.

По интерфейсам он ожидает, что привычные «функциональные» приложения (доки, таск‑менеджеры, борды) будут всё сильнее распадаться на компоненты. Агент станет тем, кто подбирает, комбинирует и отображает нужные представления под конкретного человека и конкретную задачу. При этом стабильными останутся базовые структуры данных и примитивы, а UI поверх них станет намного пластичнее и индивидуальнее.

Так что если резюмировать в одну фразу: это видео — хороший манифест того, как выглядит дизайн‑процесс в мире, где твой основной инструмент — не Figma, а агент, которому ты умеешь объяснять, чего именно хочешь от живого продукта, а не от картинки.
🔥2
Media is too big
VIEW IN TELEGRAM
ChatGPT Images

Аламан объявлял красный код из-за двух причин — обгон Google в основной модели и картиночной, ChatGPT генерацию изображений не обновляли пол-года. Первое решили GPT 5.2, а вот и ответ на второе подоспел.

https://openai.com/index/new-chatgpt-images-is-here/
Amazon начал раскатывать свой чат с Alexa

https://alexa.amazon.com/about
Forwarded from эйай ньюз
SAM-Audio: находка для шпиона

Meta продолжает расширять возможности SAM (Segment Anything Model), и теперь туда добавилась аудиомодальность.

Выделяешь объект на видео и получаешь звук, который исходит исключительно из этой точки. Как вы понимаете, это просто находка для шпиона, ведь можно выделить диалог двух людей на видео и слышать только его, отделив от всего остального шума. Какие у этого другие применения — думайте сами. А так проект выглядит довольно интересно.

В основе лежит Perception Encoder Audiovisual (PE-AV), который выступает в роли ушей системы. Сама же архитектура построена на flow-matching diffusion transformer, который принимает на вход аудиомикс и промпт, а на выходе генерирует целевой и остаточный аудиотреки.

Модель умеет отделять звук по трём типам промптов, которые можно комбинировать. Это текстовый, визуальный (клик на объект в видео), span prompting (выделение временного отрезка, когда появляется звук). Но вот выделить что-то совсем похожее пока не удастся, например, одного певца из хора вырезать не получится.

При этом модель работает быстрее реального времени (RTF ≈ 0.7) и скейлится от 500M до 3B параметров.

Веса и код выложены в опенсорс, но под некоммерческой лицензией (CC-BY-NC 4.0).

Блогпост
Демо
GitHub

@ai_newz
🤯2
Forwarded from Яндекс
Media is too big
VIEW IN TELEGRAM
🔴 В этом году не просто YaC. А YaC AI Edition — большой разговор о том, как всё начинается с ИИ.

Что, опять нейросети? Да, в 2025 году весь бигтех, включая Яндекс, говорит об искусственном интеллекте больше, чем когда-либо, потому что он стал ещё полезнее. Доказываем и показываем — в этом фильме.

Что внутри:

Реальные примеры пользы от ИИ-разработок Яндекса. Бизнес, юристы, врачи, родители, путешественники используют нейросети в работе и жизни и показывают, как именно.

Вы увидите это впервые. Носимые ИИ-устройства: наушники Яндекс Дропс и диктофон с Алисой Про.

И новые возможности, которые открываются сейчас. Первые пользователи попробуют Алису AI в Яндекс Go, агента «Найти дешевле» и режим «Исследование» в Алисе AI, а также обновлённый ИИ-агент в Маркете.

Технологии Яндекса изнутри. Что интересного в автономном грузовике, как работает завод роботов-доставщиков, поможет ли VLM-модель убрать за котом? 🐱

↘️ Смотрите YaC AI Edition — на yandex.ru/yac, VK Видео и YouTube.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
В ChatGPT добавили интеграцию Apple Music и сделали страничку со всеми апками. Можно добавлять свои и монетизировать

https://developers.openai.com/apps-sdk
2