This media is not supported in your browser
VIEW IN TELEGRAM
🎙️ ElevenLabs только что выпустили Scribe v2 Realtime — самую точную нейронку для преобразования речи в текст.
• Выдаёт транскрипцию речи в реальном времени, пока вы говорите.
• Автоматически распознаёт и маркирует все голоса без ошибок.
• Превосходит Gemini 2.5 Flash, GPT 4o MiniTranscribe и Deepgram Nova 3.
• Поддерживает 90+ языков, включая русский.
• API подключается всего за три строчки кода.
Пользуемся — тут.
@notboring_tech
• Выдаёт транскрипцию речи в реальном времени, пока вы говорите.
• Автоматически распознаёт и маркирует все голоса без ошибок.
• Превосходит Gemini 2.5 Flash, GPT 4o MiniTranscribe и Deepgram Nova 3.
• Поддерживает 90+ языков, включая русский.
• API подключается всего за три строчки кода.
Пользуемся — тут.
@notboring_tech
🔥29❤🔥6🎉4👍3🤩2
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 World Labs открыли доступ к лучшему генератору 3D-миров для всех — Marble создаёт ультра-реалистичные локации из изображения, видео, текстового запроса, 3D-макета или всего сразу.
Юзкейсы, которые я придумал за пять минут:
• Самое полезное: генерировать полноценные 3D-локации для игр.
• Гулять внутри картин, шедевров искусства и старых воспоминаний.
• Посмотреть, как выглядит ремонт мечты в вашей квартире.
• Снимать фильмы: загрузить себя в мир, анимировать и добавить липсинк через сторонние нейронки.
• Запустить мир в VR-гарнитуре и гулять по нему от первого лица!
Можно редактировать, расширять, объединять и экспортировать миры в один клик. Бесплатно дают 7000 кредитов — хватит на генерацию 4 миров.
Тестируем — тут.
@notboring_tech
Юзкейсы, которые я придумал за пять минут:
• Самое полезное: генерировать полноценные 3D-локации для игр.
• Гулять внутри картин, шедевров искусства и старых воспоминаний.
• Посмотреть, как выглядит ремонт мечты в вашей квартире.
• Снимать фильмы: загрузить себя в мир, анимировать и добавить липсинк через сторонние нейронки.
• Запустить мир в VR-гарнитуре и гулять по нему от первого лица!
Можно редактировать, расширять, объединять и экспортировать миры в один клик. Бесплатно дают 7000 кредитов — хватит на генерацию 4 миров.
Тестируем — тут.
@notboring_tech
🔥22👍15🤯6🎉2
🔖 OpenAI выпустили официальный гайд по промптингу GPT-5.1 — новейшая модель стала умнее, быстрее и приятнее в общении.
Внутри — лучшие лайфхаки, рекомендации и примеры запросов, которые максимизируют эффективность нейронки в разных задачах.
Сохраняйте, чтобы не потерять — тут.
@notboring_tech
Внутри — лучшие лайфхаки, рекомендации и примеры запросов, которые максимизируют эффективность нейронки в разных задачах.
Сохраняйте, чтобы не потерять — тут.
@notboring_tech
🔥18👍13👏5
This media is not supported in your browser
VIEW IN TELEGRAM
🍯 NotebookLM запустил Deep Research — теперь сервис умеет изучать сотни сайтов и делать глубокие исследования на любую тему в один клик.
Самое крутое — полученный отчёт можно импортировать в блокнот и дальше на его основе сгенерировать аудио-подкаст, квиз, майнд-мап и даже видео-презентацию.
Пробуем — тут.
@notboring_tech
Самое крутое — полученный отчёт можно импортировать в блокнот и дальше на его основе сгенерировать аудио-подкаст, квиз, майнд-мап и даже видео-презентацию.
Пробуем — тут.
@notboring_tech
❤🔥28🔥16👍14🤯5
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ Революция — вышла нейронка MeshCoder, которая превращает любые 3D-объекты в редактируемый код! Она преобразует облака точек в Python-скрипты для Blender.
Теперь 3D-моделями можно полностью управлять через код: менять форму, анимировать, генерировать кучу вариаций за раз и автоматизировать создание 3D-объектов.
Прорыв доступен всем — тут.
@notboring_tech
Теперь 3D-моделями можно полностью управлять через код: менять форму, анимировать, генерировать кучу вариаций за раз и автоматизировать создание 3D-объектов.
Прорыв доступен всем — тут.
@notboring_tech
🔥46👍17😱11
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ElevenLabs запустили ультимативную платформу для генерации видео, аудио и изображений — в одном месте собрали все лучшие модели.
• Видео-генераторы: Veo 3.1, Sora 2, Kling 2.5, Wan 2.5 и Seedance 1 Pro.
• Генераторы картинок: Nano Banana, Flux Kontext, Wan и Seedream.
• Апскейлеры: Topaz для улучшения качества до 4К.
• Экспорт в Studio: генерация аудио, музыки и звуковых эффектов.
• Там же можно монтировать от начала до конца: обрезать видео, добавлять субтитры и накладывать липсинк.
Теперь в ElevenLabs доступно вообще всё — тут.
@notboring_tech
• Видео-генераторы: Veo 3.1, Sora 2, Kling 2.5, Wan 2.5 и Seedance 1 Pro.
• Генераторы картинок: Nano Banana, Flux Kontext, Wan и Seedream.
• Апскейлеры: Topaz для улучшения качества до 4К.
• Экспорт в Studio: генерация аудио, музыки и звуковых эффектов.
• Там же можно монтировать от начала до конца: обрезать видео, добавлять субтитры и накладывать липсинк.
Теперь в ElevenLabs доступно вообще всё — тут.
@notboring_tech
🔥27🤯16❤🔥6😁2
This media is not supported in your browser
VIEW IN TELEGRAM
💥 Colab наконец-то интегрировали с VS Code — теперь можно подключить локальные ноутбуки из IDE к мощным вычислительным ресурсам GPU/TPU Colab.
Как подключить:
1. Заходим в магазин расширений VS Code и устанавливаем Google Colab.
2. Создаём и открываем файл .ipynb.
3. Выбираем Colab в Select Kernel и нужную вычислительную среду.
4. Логинимся в аккаунт Google и всё готово!
Сохраняйте для ваших проектов.
@notboring_tech
Как подключить:
1. Заходим в магазин расширений VS Code и устанавливаем Google Colab.
2. Создаём и открываем файл .ipynb.
3. Выбираем Colab в Select Kernel и нужную вычислительную среду.
4. Логинимся в аккаунт Google и всё готово!
Сохраняйте для ваших проектов.
@notboring_tech
👍25🎉4🔥3👏3
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 В Replit завезли мощного ИИ-дизайнера на базе новой Gemini 3 Pro — он генерирует профессиональные дизайны, лендинги, презентации и портфолио всего из пары слов.
Самое важное — Design Mode проектирует разнообразные визуалы без дефолтного ИИ-дизайна, который легко распознать. Теперь он использует уникальные шрифты, анимации и макеты.
Генерируем красивейшие UI/UX — тут.
@notboring_tech
Самое важное — Design Mode проектирует разнообразные визуалы без дефолтного ИИ-дизайна, который легко распознать. Теперь он использует уникальные шрифты, анимации и макеты.
Генерируем красивейшие UI/UX — тут.
@notboring_tech
👏18🤯11🔥6👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🔎 Наткнулся на лучший ИИ-парсер всего интернета — Thunderbit выгружает все данные из любых сайтов, PDF, фоток и документов. Достаточно загрузить ссылку и написать, что нужно извлечь.
Если на сайте много страниц — нейронка вытащит инфу из каждой! Она буквально в два клика выдаёт гигантскую таблицу с нужными столбцами, ячейками, фильтрами и данными.
Забираем мастхев — тут.
@notboring_tech
Если на сайте много страниц — нейронка вытащит инфу из каждой! Она буквально в два клика выдаёт гигантскую таблицу с нужными столбцами, ячейками, фильтрами и данными.
Забираем мастхев — тут.
@notboring_tech
🔥46👏11🤯7❤🔥2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
Kandinsky 5.0 — новая линейка визуальных моделей в open source
⚡️ Сбер опубликовал в открытом доступе всю линейку Kandinsky 5.0: Video Pro, Video Lite, Image Lite и токенизаторы K-VAE 1.0. Полный open source: код, веса, лицензия MIT.
🔘 Video Pro (Text-to-Video / Image-to-Video)
Флагман, генерирующий HD-видео до 10 секунд с гибким управлением движением камеры. Обучалась на 520 млн изображений и 250 млн видео и затем, на финальном этапе, доучивалась на датасете сверх-качественных видеороликов, тщательно отобранных профессиональными художниками и дизайнерами.
Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Лучшая открытая модель в мире, превосходит Wan 2.2-A14B в Text-to-Video [SBS 59:41] и Image-to-Video [SBS 53:47], а также достигает паритета с Veo 3 по визуальному качеству и динамике [SBS 54:46].
🔘 Video Lite (Text-to-Video / Image-to-Video)
Компактные модели генерации видео, оптимизированные для запуска на GPU от 12 ГБ VRAM. Обучалась на 520 млн изображений и 120 млн видео, хорошая консистентность и качество динамики. Лучшая среди небольших и быстрых моделей, значительно превосходит в 7 раз большую по количеству параметров Wan 2.1-14B как в Text-to-Video [SBS 67:33], так и Image-to-Video [SBS 64:36].
🔘 Image Lite (Text-to-Image / Image Editing)
HD-генерация и редактирование изображений. Претрейн Text-to-Image модели был сделан на 520 млн изображений, включая датасет русского культурного кода ~1 млн изображений. Image Editing был дополнительно дообучен на 150 млн пар. Для достижения финального качества был проведено SFT дообучение на 150 тыс изображений, а также на 20 тыс. пар – для Editing.
Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Значительно превосходит FLUX.1 [dev] по Text-to-Image [SBS 63:37] и находится в паритете по качеству с FLUX.1 Kontext [dev] по Image Editing [SBS 54:46].
🔘 K-VAE 1.0 (2D / 3D)
Вариационные автоэнкодеры для диффузионных моделей, сжимающие входные данные в формате 8x8 (изображения) и 4x8x8 (видео). Сравнение на открытых датасетах показывает, что модели более качественно восстанавливают исходный сигнал (+0.5dB PSNR), чем лучшие open-source альтернативы (Flux, Wan, Hunyaun), обладающие той же степенью сжатия.
Все модели линейки доступны на GitHub, Gitverse и HuggingFace.
Читайте подробнее в техническом репорте.
#реклама
Флагман, генерирующий HD-видео до 10 секунд с гибким управлением движением камеры. Обучалась на 520 млн изображений и 250 млн видео и затем, на финальном этапе, доучивалась на датасете сверх-качественных видеороликов, тщательно отобранных профессиональными художниками и дизайнерами.
Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Лучшая открытая модель в мире, превосходит Wan 2.2-A14B в Text-to-Video [SBS 59:41] и Image-to-Video [SBS 53:47], а также достигает паритета с Veo 3 по визуальному качеству и динамике [SBS 54:46].
Компактные модели генерации видео, оптимизированные для запуска на GPU от 12 ГБ VRAM. Обучалась на 520 млн изображений и 120 млн видео, хорошая консистентность и качество динамики. Лучшая среди небольших и быстрых моделей, значительно превосходит в 7 раз большую по количеству параметров Wan 2.1-14B как в Text-to-Video [SBS 67:33], так и Image-to-Video [SBS 64:36].
HD-генерация и редактирование изображений. Претрейн Text-to-Image модели был сделан на 520 млн изображений, включая датасет русского культурного кода ~1 млн изображений. Image Editing был дополнительно дообучен на 150 млн пар. Для достижения финального качества был проведено SFT дообучение на 150 тыс изображений, а также на 20 тыс. пар – для Editing.
Нативно понимает русские и английские промпты, генерирует надписи на латинице и кириллице. Значительно превосходит FLUX.1 [dev] по Text-to-Image [SBS 63:37] и находится в паритете по качеству с FLUX.1 Kontext [dev] по Image Editing [SBS 54:46].
Вариационные автоэнкодеры для диффузионных моделей, сжимающие входные данные в формате 8x8 (изображения) и 4x8x8 (видео). Сравнение на открытых датасетах показывает, что модели более качественно восстанавливают исходный сигнал (+0.5dB PSNR), чем лучшие open-source альтернативы (Flux, Wan, Hunyaun), обладающие той же степенью сжатия.
Все модели линейки доступны на GitHub, Gitverse и HuggingFace.
Читайте подробнее в техническом репорте.
#реклама
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥19👍9🤯6😁5❤🔥3
🎓 Бомба для учёбы: вышла Nano Banana Pro и её сразу добавили в NotebookLM. Теперь сервис научился генерировать самые наглядные инфографики и презентации!
Качество выросло в разы — иллюстрации, надписи и повествование на высоте. Можно выбрать любую ЦА, уровень, стиль и язык. Фичи уже раскатали для Pro-юзеров, скоро раздадут бесплатным.
Годнота для студентов — тут.
@notboring_tech
Качество выросло в разы — иллюстрации, надписи и повествование на высоте. Можно выбрать любую ЦА, уровень, стиль и язык. Фичи уже раскатали для Pro-юзеров, скоро раздадут бесплатным.
Годнота для студентов — тут.
@notboring_tech
🔥42❤🔥19👍11😁1🤩1
ГигаЧат выпустил модель для синтеза речи GigaTTS
Она звучит почти как реальный человек. И нравится слушателям в 2-4 раза чаще, чем старая версия. Под капотом — GigaChat 3b, токенизатор, адаптер к LLM и 30 тысяч часов данных.
GigaTTS использует уникальные голоса телефонных операторов и инструктивный синтез разных эмоций. Она умеет клонировать голоса, а также озвучивать тексты любой длины в multi-turn режиме.
Новый синтез речи можно оценить в голосовом общении с ГигаЧат. А узнать больше новостей от команды разработки — в канале @gigadev_channel. Подписывайтесь!
#реклама
Она звучит почти как реальный человек. И нравится слушателям в 2-4 раза чаще, чем старая версия. Под капотом — GigaChat 3b, токенизатор, адаптер к LLM и 30 тысяч часов данных.
GigaTTS использует уникальные голоса телефонных операторов и инструктивный синтез разных эмоций. Она умеет клонировать голоса, а также озвучивать тексты любой длины в multi-turn режиме.
Новый синтез речи можно оценить в голосовом общении с ГигаЧат. А узнать больше новостей от команды разработки — в канале @gigadev_channel. Подписывайтесь!
#реклама
😁17👍14❤🔥4👏4
📊 Вышел самый мощный ИИ-агент для глубоких исследований — MiroThinker лидирует на многих бенчмарках и догоняет GPT-5.
• Для одной задачи агент вызывает инструменты более 600 раз — это рекорд.
• Работает по парадигме «подумать-действовать-наблюдать» — модель анализирует задачу, вызывает нужный инструмент и повторяет так до идеала.
• Проводит глубокие исследования на любую тему в интернете, файловой системе и терминале.
• Контекст — 256К токенов, анализирует примерно до 300 вкладок за раз.
• Весь код в открытом доступе и модели от 8B до 72B можно ставить локально.
GitHub — тут, HF — тут, а бесплатная онлайн-демка — здесь.
@notboring_tech
• Для одной задачи агент вызывает инструменты более 600 раз — это рекорд.
• Работает по парадигме «подумать-действовать-наблюдать» — модель анализирует задачу, вызывает нужный инструмент и повторяет так до идеала.
• Проводит глубокие исследования на любую тему в интернете, файловой системе и терминале.
• Контекст — 256К токенов, анализирует примерно до 300 вкладок за раз.
• Весь код в открытом доступе и модели от 8B до 72B можно ставить локально.
GitHub — тут, HF — тут, а бесплатная онлайн-демка — здесь.
@notboring_tech
🔥22🤯11👍6😱4😁1
🤯 Со-основатель OpenAI Андрей Карпаты выложил симулятор целого совета нейронок — LLM Council запускает сразу несколько LLM, назначает им роли и они выполняют сложнейшие задачи вместе, как команда.
Можно наблюдать, как топовые нейросети (GPT 5.1, Gemini 3.0 Pro, Claude Sonnet 4.5, Grok 4 и тд) предлагают разные решения, а бот-председатель совета LLM анализирует их и выдаёт финальный ответ на ваш вопрос.
Целый консилиум нейронок у вас на компе — тут.
@notboring_tech
Можно наблюдать, как топовые нейросети (GPT 5.1, Gemini 3.0 Pro, Claude Sonnet 4.5, Grok 4 и тд) предлагают разные решения, а бот-председатель совета LLM анализирует их и выдаёт финальный ответ на ваш вопрос.
Целый консилиум нейронок у вас на компе — тут.
@notboring_tech
🔥51👍14👏5😁4😱2
This media is not supported in your browser
VIEW IN TELEGRAM
🔬 На базе нового Claude Opus 4.5 запустили полноценную команду ИИ-учёных — мульти-агентская система автономно проводит научные исследования. Достаточно ввести любую тему ресёрча.
Агенты параллельно назначают эксперименты, запускают песочницы, собирают результаты, сравнивают их и выдают финальный документ — готовую научную работу с ключевыми выводами.
Будущее наступило — тут.
@notboring_tech
Агенты параллельно назначают эксперименты, запускают песочницы, собирают результаты, сравнивают их и выдают финальный документ — готовую научную работу с ключевыми выводами.
Будущее наступило — тут.
@notboring_tech
🔥14🤯14😁5😱4
🔖 Google выложил официальный гайд для Nano Banana Pro — он научит выжимать из генератора картинок максимум пользы с помощью реальных примеров запросов.
Внутри — как эффективно структурировать промпты (композиция, сюжет, действие, локация, стиль), использовать креативные техники, переводить надписи и фотошопить результаты с ИИ.
В закладки — тут.
@notboring_tech
Внутри — как эффективно структурировать промпты (композиция, сюжет, действие, локация, стиль), использовать креативные техники, переводить надписи и фотошопить результаты с ИИ.
В закладки — тут.
@notboring_tech
👍15👏13🔥6
🎤 Вышел самый реалистичный генератор речи — Dia2 озвучивает любой текст, дубляж и диалоги в реальном времени быстрее всех.
• Эксклюзивная фича: генерирует речь в реалтайме с первых слов, не требуя полного ввода текста!
• Можно переносить разные голоса ИИ-спикерам и синтезировать с ними реалистичные диалоги.
• Длительность генерации — до 2 минут, но нейронка запоминает интонации из предыдущего диалога.
• Умеет добавлять эмоции, паузы, запинки и любые особенности произношения.
• Пока поддерживает только английский, но скоро могут добавить другие языки.
Главное — в отличие от большинства аналогов, доступна с открытым кодом, разрешена для коммерции и легко запускается локально без цензуры.
HuggingFace — тут, GitHub — тут, а онлайн-демка — здесь.
@notboring_tech
• Эксклюзивная фича: генерирует речь в реалтайме с первых слов, не требуя полного ввода текста!
• Можно переносить разные голоса ИИ-спикерам и синтезировать с ними реалистичные диалоги.
• Длительность генерации — до 2 минут, но нейронка запоминает интонации из предыдущего диалога.
• Умеет добавлять эмоции, паузы, запинки и любые особенности произношения.
• Пока поддерживает только английский, но скоро могут добавить другие языки.
Главное — в отличие от большинства аналогов, доступна с открытым кодом, разрешена для коммерции и легко запускается локально без цензуры.
HuggingFace — тут, GitHub — тут, а онлайн-демка — здесь.
@notboring_tech
🔥27❤🔥7🤯5👏2😁1
🧪 В Беркли и Стэнфорде создали Deep Research для научных статей — DeepScholar изучает сотни исследований за раз, отвечает на любые вопросы и выдаёт удобные конспекты.
Нейронка специально заточена на поиск по статьям и во всём превосходит Deep Research от OpenAI — эффективнее, мощнее, в два раза быстрее и с открытым кодом.
Теперь изучать науку не сложнее, чем читать этот пост — тут.
@notboring_tech
Нейронка специально заточена на поиск по статьям и во всём превосходит Deep Research от OpenAI — эффективнее, мощнее, в два раза быстрее и с открытым кодом.
Теперь изучать науку не сложнее, чем читать этот пост — тут.
@notboring_tech
🔥19👍15🎉4😱1