Пупырка AI – Telegram
Пупырка AI
115 subscribers
725 photos
370 videos
1 file
697 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
Forwarded from Denis Sexy IT 🤖
Илья дал большое интервью:
https://www.youtube.com/watch?v=aR20FWCCjAs

Вот главное:

– Сейчас модели выглядят намного умнее на тестах, чем в реальных задачах: они переобучены на эвалы и плохо обобщают, особенно в сложных многошаговых сценариях

– Главный технический барьер к AGI - ненадёжное обобщение и низкая «человеческая» обучаемость; простое масштабирование предобучения и RL это не решит

– Эпоха «масштабируем всё предобучением» заканчивается: данные конечны, RL жрёт много вычислений; начинается новая «эпоха исследований» с поиском новых рецептов обучения (в т.ч. ценностные функции, архитектур моделей, другие виды RL и т.п.).

– Будущее AGI видится как система, которая учится как человек: один и тот же базовый разум может быстро осваивать разные профессии, постоянно дообучаясь в реальном мире, а не «готовый мозг, который знает всё из коробки»

– Массовое распространение таких АИ-учеников по экономике почти неизбежно приведёт к очень быстрому росту производительности и ВВП; скорость будет сильно зависеть от регулирования в разных странах

– Скорее всего появится много сверхсильных АИ от разных компаний, специализирующихся по нишам (право, медицина, R&D и т.д.), а не один «богоподобный» монополист-суперинтеллект (аниме Пантеон смотрели? Пора если нет)

– Основной риск - огромная мощь: если сделать чрезвычайно сильного целеустремлённого агента, даже с «хорошей» целью, результат может сильно не понравиться людям; желательно ограничивать максимальную мощность единичных систем

– В качестве цели для первых суперинтеллектов он рассматривает «заботу о чувствующих существах» (в т.ч. о самом АИ) как более реалистичную и устойчивую, чем «забота только о людях», но признаёт, что это не идеальное решение

– Он ожидает постепенный, но всё более заметный показ мощных АИ обществу: по мере роста реальной силы моделей компании и государства станут намного более параноидальны и начнут активно координироваться по безопасности и регулированию

– Краткосрочный «хороший» сценарий - универсальный высокий доход и то, что АИ делает почти всю работу; долгосрочно это нестабильно, потому что люди выпадают из активного участия в принятии решений

– Один из возможных (ему самому не очень нравящийся) способов долгосрочной стабилизации - частичное слияние людей с АИ через продвинутые нейроинтерфейсы, чтобы люди разделяли понимание с системами и оставались в контуре управления

– Оценка горизонта: до АИ, который учится как человек и может стать базой для суперинтеллекта, примерно 5-20 лет; текущий «чистый масштабинг» в какой-то момент упрётся в потолок

– SSI (его АИ лаба) он описывает как «чисто исследовательскую» компанию с другим техническим подходом к обобщению и безопасности, которая не ставит ставку на простое наращивание масштаба текущих архитектур, и ожидает, что в итоге крупные игроки всё равно сойдутся в общих стратегиях по безопасному выводу суперинтеллекта в мир
Media is too big
VIEW IN TELEGRAM
Ну вы уже видели наверное, ChatGPT склеил свой голосовой режим с чатом. Теперь удобнее можно и картикни видеть во время разговора и текстом потом продолжить. При этом осталась возможность перебивать и другие приколы про характер голоса.
This media is not supported in your browser
VIEW IN TELEGRAM
Supermemory в Comet

Perplexity улучшило память в своём браузере. Теперь там supermemory. Это расширенная функция персонализации, которая автоматически запоминает предпочтения и контекст из диалогов, а затем использует эти данные вместе с историей запросов для более точных и персонализированных ответов в будущих сессиях.

Память и персонализация между чатами и сессиями это одна из самых важных фичей на мой взгляд для всех ассистентов будущего, похожих новостей думаю будет ещё очень много.
1
This media is not supported in your browser
VIEW IN TELEGRAM
Ещё Perplexity сделали вкладку переводчика. Эти карточки с озвучкой были и раньше теперь просто сделали пункт в меню.

Кстати, ловите ссылки на мои GPTs переводчиков на английский и сербский в ChatGPT.
Похоже, что хорошая генерация дизайна в Фигме задерживается —

Figma столкнулась с коллективным иском в США: компанию обвиняют в том, что она без явного согласия пользователей использовала их дизайнерские файлы и другие данные для обучения своих генеративных ИИ-инструментов.

Говорят, что это нарушает обещания Фигмы не применять пользовательский контент для собственных целей, а также затрагивает интеллектуальную собственность дизайнеров и компаний.

Источник
😢2
Конструкторы миниаппов внутри AI-инструментов упираются в быстрый доступ к запуску своих созданных приложений. Самое простое решение для таких платформ — виджет с быстрым доступом к вашим аппам. Так и сделали Wabi.

Скриншоты взял у этого чела в x
1
Попробовал ещё погенерить в Wabi:

1) Давно хотел попробовать сделать календарь состоящий из эмодзи. В один промпт он сделал не совсем как мне хотелось, но тем не менее очень достойно. Апп

2) Игра в точки из школьного детства. Всё рабоатет, но бот не очень умный, возможно это можно починить, но я просто закинул промпт сненереный в ChatGPT. Игра

3) Попробовал сделать Гереов. В один промпт не вышло.

Есть 5 инвайтов, пишите в комменты +, отправлю в личку, кому нужно)
2
Forwarded from Denis Sexy IT 🤖
В выходные чуть обновил свой тул для редактирования видео – сделал нормальный интерфейс, добавил модный нынче твиттер-эффект с паутиной из чисел поверх видео, а для мемоделов появился новый пресет который накладывает поверх аудио в стиле Core-Core (песню Aphex twin qkthr) или удаляет из видео все куски, где был звук, оставляя только тихие (но с длинными видео долго работает) – короче, без понятия зачем я его обновил, но я так отдыхаю, видимо

Как водится, все работает у вас в браузере и видео никуда не загружается:
https://shir-man.com/convert-video
Media is too big
VIEW IN TELEGRAM
Kling выпустил видеоредактор O1

Работает как Nano Banana, но с видео. Генерирует по референсам, меняет стиль, угол съемки, объекты и всё остальное по текстовым промптам.

Можно попробовать бесплатно тут: https://app.klingai.com/global/omni/new
Обновление DeepSeek

Новые DeepSeek-V3.2 и V3.2-Speciale — открытые модели ну уровне GPT 5.1 и Gemini 3.0.

Если точнее, то вот такое уравнение у меня поулчлиось:

Opus 4.5 ≈ GPT-5.1-Codex-Max ≥ GPT-5.1 Thinking ≈ DeepSeek-V3.2-Speciale ≥ DeepSeek-V3.2

Почему это важно — то что две недели назад было новым топом, уже догнали и выложили похожее в общий доступ.

DeepSeek-V3.2
• Новый основной флагман DeepSeek, преемник V3.2-Exp.
• Открытая модель с сильным упором на reasoning + агенты (планирование, tool-use, multi-step задачи).
• Интегрирует «thinking-режим» прямо в вызов инструментов (API умеет думать и параллельно дергать тулзы).
• По независимым обзорам, по ряду бенчмарков догоняет/местами обгоняет GPT-5 и Gemini 3 Pro, особенно в математике и коде, при этом дешевле по токену.

DeepSeek-V3.2-Speciale
• Специальная «максимально навороченная» версия V3.2, заточенная под глубокое рассуждение и соревнования (IMO, ICPC, IOI и т.п.).
• Доступна через API и как open-weights на Hugging Face; работает только в thinking-режиме.
• На конкурсных и reasoning-бенчах показывает gold-level результаты и считается одной из самых сильных открытых моделей для сложной математики, алгоритмов и агентостроения.
Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
Runway Gen-4.5

Whisper Thunder на арене оказался новой моделькой от Runway, она побила Veo 3 на 20 ELO. Доступ раскатают на всех подписчиков в течении пары дней. Как вам качество?

Блогпост

@ai_newz
🤯2🤔1
Forwarded from e/acc
Для тех кому интересно как сделать что-то такого же уровня за обеденный перерыв и бесплатно, даю подробную инструкцию:

1. Заходите на https://aistudio.google.com/ и регистрируйтесь
2. Добавляете любую карту (ничего платить не нужно) и получаете $300 кредитов (вас приложение спросит разрешение списывать больше когда закончатся кредиты)
3. Заходите в Build и пишете промт
4. Для 3D графики, Gemini лучше всего работает с three js. Для этого пишете промт что-то типа «make me a 3D voxel based game where the player can rob COROVANS»
5. В большинстве случаев с первой попытки вы получите что-то играбельное, Gemini сам исправит все баги в процессе разработки. Дальше только ваша фантазия.
6. Как только игра готова, жмете справа вверху Deploy (нужно иметь бесплатный аккаунт GCP) — и все, ваше приложение доступно всему миру. Дальше в GCP дешборде можно привязать любой домен.

Protip: вы можете попросить Gemini использовать ИИ в приложении и он очень классно это делает. Например, «сделай так чтобы управление было через голос, а арты для игры каждый раз генерировались через Nano Banana, а для каждого пользователя была персонализированная видео-заставка созданная в Veo». Может, потребуется 2-3 промта, но абсолютно рабочая история которая не требует воообще никаких технических действий.
Wabi запустили «мультиплеер»

Пока OpenAI гоняется с Google, а Mistral с DeepSeek, Wabi продолжает делать продукты из всех этих технологий.

Теперь все мини-аппы созданные в Wabi можно использоваться разными людьми одновременно — если, конечно, вы их туда пригласите. Например, можно сделать приложеине списка покупок или календаря и всей семьёй его заполнять. Или можно сделать свой инстаграм для друзей.

Это что-то новое и мощное, ещё одна сложная плоскость разработки становится доступнее. Тем временем я — несколько вечеров прикручивал к iOS навайбкоженому приложению iCloud Family синхронизацию 😒

Продуктовая суть чуть подробнее:
Что теперь можно строить
• Коллаборативные утилиты: списки, трекеры, календари, планировщики поездок и т.п., где несколько людей правят один и тот же инстанс.
• «Настоящие» социальные и мультиплеерные аппы с профилями, аватарками, онлайном, ролями и т.д., которые платформа даёт «из коробки».

Термины
• Publishing — выложить шаблон в Explore, чтобы другие могли запускать свои отдельные экземпляры.
• Sharing — приватно дать кому‑то шаблон, чтобы он создал свой отдельный инстанс с собственными данными.
• Inviting — новая штука: позвать людей в один и тот же инстанс приложения, разделяя общее состояние в реальном времени (и это и есть мультиплеер).


Источинк сильно длинее, там есть чуть про то, как это технически устроено: X
Please open Telegram to view this post
VIEW IN TELEGRAM
Глава интерфейсного дизайна Apple Алан Дай уходит из компании и 31 декабря станет Chief Design Officer в Meta, где возглавит новый дизайн‑центр и будет отвечать за аппаратный и софтверный дизайн устройств с фокусом на гарнитурах, очках и AI‑функциях. Дай пришел в Apple в 2006 году, работал над iOS 7, возглавлял Human Interface Design, курировал дизайн iOS, iPadOS, macOS, watchOS и visionOS, а также стоял за свежим Liquid Glass‑редизайном iOS 26 и macOS 26.

Его место в Apple займет Стивен Леме — один из самых опытных дизайнеров интерфейсов компании, работающий там более 25 лет и участвовавший практически во всех ключевых UI Apple с 1999 года, от ранних версий OS X до iPhone, iPad, Apple Watch и современных систем. Тим Кук подчеркивает, что Леме задает «очень высокую планку качества» и хорошо воплощает культуру совместной работы и креатива внутри Apple, так что переход выглядит как смена поколений в Human Interface при сохранении курса на визуальный перезапуск платформ.
This media is not supported in your browser
VIEW IN TELEGRAM
Self driving машинки Avride, компании Аркадия Воложа, поехали в Далласе в Uber.
🔥6