Пупырка AI – Telegram
Пупырка AI
117 subscribers
733 photos
372 videos
1 file
705 links
AI, дизайн, продукт и слухи. Канал репостов, цитат и жвачки. Основной канал — @logicIntermission
Download Telegram
OpenAI выпустила Realtime API и новую голосовую модель

Realtime API теперь доступен для всех разработчиков. С его помощью делать голосовых агентов. API поддерживает MCP, загрузку изображений и звонки по протоколу SIP. Еще в Realtime API появилось два новых голоса.

Также вышла gpt-realtime — самая продвинутая модель OpenAI для распознавания речи. В компании говорят, что она лучше следует командам разработчиков и выполняет сложные инструкции.

Попробовать gpt-realtime можно тут, если у вас добавлен способ оплаты https://platform.openai.com/audio/realtime
Забавно, у меня что-то сломалось вероятно и ChatGPT показал, что он в реальности отправил как промпт перефразировав и додумав за меня
Изометрическая моя собака, генерация с фото. Голосуйте реакциями за лучший результат, позже напишу какая модель что сделала
This media is not supported in your browser
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
6
This media is not supported in your browser
VIEW IN TELEGRAM
4
Forwarded from эйай ньюз
This media is not supported in your browser
VIEW IN TELEGRAM
Krea real-time video

Img2video? Video2video? Что это вообще?

Krea показали риалтайм-генератор, который можно конролировать, рисуя геометрические примитивы. В итоге получился real-time img2img, но с временной согласованностью и консистентностью. Выгляди так, что они учитывают предыдующие генерации для согласованности.

Эффект вышел уникальный, хоть по сути и не является video2video. Но главная фишка — это реалтайм (12 fps).

Не знаю, насколько это будет полезно на практике, но для концептуальных и/или музыкальных роликов точно подойдёт. Интересно будет поиграться.

Больше примеров в комментах.

Вейтлист

@ai_newz
Пупырка AI
Изометрическая моя собака, генерация с фото. Голосуйте реакциями за лучший результат, позже напишу какая модель что сделала
Вот оригинал фото с которого рисовали изомтеиии. А вот кто есть кто:
1) Gemini — очень качественный результат и сохранены детали
2-3) ChatGPT — с запроса и доутчнений в промпт так и не попали, хотя получилось забавно
This media is not supported in your browser
VIEW IN TELEGRAM
New in Xcode 26 Beta 7: Users can now log into their Claude account from Xcode.

Generate code and documentation, automatically fix errors, and create inline playgrounds using coding intelligence features in Xcode, powered by Claude Sonnet 4
Forwarded from Denis Sexy IT 🤖
Сделал мини-апп на nano-banana:
1) Скармливаете ей карту местности (любой)
2) Выбираете направление камеры и нажимаете Generate
3) Она пытается сделать вам вид в стиле Google Street View

Так и путешествуете по любимым мирам или историческим картам

Работает бесплатно, играться тут (нужен обычный доступ в Google AI Studio)
Forwarded from Denis Sexy IT 🤖
А еще я немного доработал мини-апп на nano-banana этого автора

Вставляете из буфера обмена картинку с объектом и он сразу конвертируется в изометрию, чтобы вы могли собрать свой SimCity мечты

Ну и еще добавил ресайз и всякие мелочи:

🌎 https://ai.studio/apps/drive/1xxdOG6VnJzfz8CmO5k6TWFosjoA8Xr63
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Forwarded from Сиолошная
Сегодня (для кого-то вчера) кстати день пробуждения Скайнета

Эх жаль GPT-5 вышла разочарованием, так бы могло быть правдой 😀😀
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Denis Sexy IT 🤖
Сделал еще один nano-banana апп, загружаете фото и получаете 3 новых вида с камеры:

🌎 Апп тут, бесплатно
Please open Telegram to view this post
VIEW IN TELEGRAM
Hermes 4 превосходит модели OpenAI в тестах и почти не имеет цензуры

Малоизвестный стартап Nous Research выпустил Hermes 4 — новое семейство open-source моделей, которое по производительности сравнимо с аналогами от ведущих конкурентов, но не имеет жёстких ограничений по контенту.

Hermes 4 позволяет пользователю переключаться между быстрым или глубоким режимом рассуждения, при этом «мыслительный процесс» модели полностью прозрачен.

В математических тестах Hermes 4 405B показала топовые результаты: 96.3% на MATH-500 и 81.9% в AIME’24. В отличие от Claude и ChatGPT, модель не отказывается отвечать на сложные или провокационные вопросы: там, где конкуренты часто уходят в «извините, я не могу», Hermes 4 отвечает в два-три раза чаще. Уровень цензуры разработчики могут задать самостоятельно при настройке модели.

Код Hermes 4 лежит тут: https://huggingface.co/collections/NousResearch/hermes-4-collection-68a731bfd452e20816725728
Tencent выпустил передовую модель для перевода текста Hunyuan-MT

Hunyuan-MT-7B демонстрирует лучшие в отрасли показатели производительности среди моделей сопоставимого масштаба

В компании говорят, что Hunyuan-MT — единственная open-source модель для перевода, использующая ансамблевую архитектуру. Благодаря этому несколько вариантов перевода объединяются в один высококачественный текст.

Hunyuan-MT поддерживает 33 языка, среди которых есть русский.

Скачать можно тут: https://github.com/Tencent-Hunyuan/Hunyuan-MT

Демо пока только на китайском: https://hunyuan.tencent.com/chat/HunyuanDefault