Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Intent: Next-Gen AI Messenger

ИИ-мессенджер с встроенными фичами для которых вы обычно переключаетесь в эти ваши разные ИИшки

Записаться в вейтлист

#assistant #messenger #news
👍6👎2👀1
Гугл тизерит релиз Nano-banana (в Gemini app?) на этой неделе

Спасибо @tripl3wave

#news
14👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Turntable in Illustrator (beta)

Adobe включили в иллюстраторе в бета-режиме инструмент Turntable, позволяюший вращать 2D векторный арт в 3D пространстве

#news #design
👍7🤯3
This media is not supported in your browser
VIEW IN TELEGRAM
VibeVoice: A Frontier Open-Source Text-to-Speech Model

Голосовая модель от Microsoft для выразительных диалогов и подкастов.

Может синтезировать речь продолжительностью до 90 минут.

Поддерживает работу с 4 разными голосами в одной генерации, это на 2-3 голоса больше чем в ведущих моделях.

Есть китайский и английский. Надеемся на дообучение

На примере женский голос норм, мужской эмоционально пустой. Послушайте примеры на сайте для общей картины

Код
HF - модель на 1.5 млрд. параметров + токенизатор Обещают 7B и 0.5B
Демо

#podcast #voicecloning #tts #text2speech #text2podcast
👍92🤔1
Wan-S2V: Audio-Driven Cinematic Video Generation

Релиз обещанного видеогенератора, который принимает на вход картинку и звук

Архитектурно - совет экспертов ( #MoE )

Как видим, умеет работать с диалогами и пением

Гитхаб
HF
Демо
Офсайт - пока не вижу его там, ждем

До появления компактных версий и обновок от Kijai 5... 4... 3...

Спасибо @iNevestenko

#image2video #audio2video #referencing #wan22
🔥15👍21😁1
Nano-banana только что релизнули в Gemini 2.5 Flash

Доступно для граждан правильной страны в gemini app и Google AI Studio

Бежим творить у кого есть доступ. Притворитесь что вы в США и ломитесь в студию

Спасибо @iNevestenko

#imageediting #sota
🔥12👍21
Нейронавт | Нейросети в творчестве
WAN тизерит WAN2.2-S2V - кинематографичный генератор видео по звуку Спасибо @iNevestenko #news
Nano-banana еще днем появился в списке моделей редактирования в Krea.ai

На бесплатном тарифе недоступен

В Fal.ai тоже есть

#news
👍4
InternVL3.5: Advancing Open-Source Multimodal Models in Versatility, Reasoning, and Efficiency

Обновилась линейка мультимодальных моделей InternVL от OpenGVlab

От 1.1B до 241B параметров

— разделяет обработку визуальной и языковой информации для оптимизации нагрузки

— ускоряет вывод в 4,05 раза и улучшает рассуждения на 16 % по сравнению с предыдущей версией

— поддерживает взаимодействие с GUI и воплощённое агентство (применение в роботах?)

— конкурирует с коммерческими моделями вроде GPT-5

Веса
Гитхаб
Попробовать в чате

#vlm #agent
👍81
lipsync-2-pro: studio-grade lipsync in minutes

Новая версия говорилки с липсинком от sync.so

Умеет клонировать голос, делает липсинк видео

В режиме Pro есть таймлиния

Бесплатного тарифа нет, но дают попробовать

Спасибо @m_franz

#lipsync #tts #text2speech #voicecloning
👍10
Обновки в #ComfyUI

Nano-banana via ComfyUI API Nodes!

Поддержка нанобанана через API nodes
———————————

Day-1 Support of Qwen-Image InstantX ControlNet

Речь о поддержке Qwen-Image-ControlNet-Union вышедшем на прошлой неделе

воркфлоу

Обновляем комфи и пользуемся

#imageediting #text2image #controlnet #workflow
4👍4