Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Simulon

Воу, воу, конкурент Wonder Studio!
Это работает в смартфоне в дополненной реальности в реальном времени!

Записаться в бетатест для iOS

твиттер

#characteranimation #compositing #lighting #AR
👍13
Делюсь результатами эксперимента которым я занимался последнее время.
Это не совсем обычный апскейл и реставрация. Не видел чтобы кто-то использовал такой подход и решил попробовать.

Если наберется несколько заинтересованных комментариев, сделаю туториал.

Рад буду вашей поддержке комментариями и лайками на ютубе

https://youtu.be/swN85-ceRMg?si=5zLfRCxHg3MWyZFY

#neuronaut_art #upscale
👍141😁1
https://youtu.be/qM4X02HRRf0

Опробовал SeamlessM4T на мастер-классе Курта Воннегута.
Использовал демоспейс, в котором, как я понял, крутится самая старшая модель SeamlessM4T-Large. То есть, лучше не будет.

Первые впечатления

- забывает перевести значительные части аудиофайла. Закидываешь в него минуту (это максимум на демоспейсе) - переводит только первые 12 секунд. Это самый большой недостаток

- русский голос звучит довольно живо, в отличие от, например, нейродублера видео в Яндекс браузере

- при этом дубляж на русский звучит как косноязычный переводчик, не знающий как ставить ударения в самых обычных словах. Иногда добавляет лишние слоги в слова, иногда теряет

- судя по построению фраз есть ощущение что перевод осуществляется не напрямую с английской речи в русскую речь, а через текст. Хотя, конечно, не через текст, а через токены.

- если хочется поправить что-то в речи, можно сначала перегнать в текст, а потом текст в речь. В демоспейсе все это есть.

Вердикт. Надеюсь, что хотя бы часть недостатков можно списать на ограничения демоспейса. Если в колабе будет так же, то для дубляжа на русский эта модель бесполезна. Быстрее перевести и озвучить вручную

#dubbing #multimodal #nauronaut_art #llm #speech2speech
Ideogram

Новый генератор картинок по тексту от Google.
Из сильных сторон - умеет генерировать текст на картинках, но не русский.

записаться в вейтлист (сейчас доступ дают сразу)

#text2image
👍5🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Code Llama
Новый ассистент программиста от Meta AI, на базе Llama 2. По тестам бьет всех известных конкурентов.

Code Llama выпустили в трех версиях: основная, для Python и с акцентом на исполнение инструкций.

Гитхаб
Блог (у меня открывается только через VPN)
Колаб

#coding #llm
🔥4👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Ученые сделали нейропротез для расшифровки речи парализованного человека с анартрией.
Считанный с мозга пациента сигнал отправляется на вход цифрового аватара, который генерирует речь.

Nature
Ютуб (5 минут)

#brain2speech #mindreading
🔥131
This media is not supported in your browser
VIEW IN TELEGRAM
WavJourney: Compositional Audio Creation withLarge Language Models

Еще один интересный генератор звука, который я почему-то забыл запостить на прошлой неделе.

Интересен он тем что генерирует полную звуковую последовательность по сценарию. Скармиливаете ему сценарий с таймкодами (можно и без них) - на выходе получаете полноценную радиопрограмму или подкаст. Сценарий, кстати, тоже можете не писать, в демо реализован генератор сценария по текстовому запросу.

На видео генерация по запросу Марсианские новости о запуске зонда к Альфа Центавра

Код
Демо

#text2audio
👍6
Forwarded from Код Дурова
This media is not supported in your browser
VIEW IN TELEGRAM
⛵️ Живой шедевр //

Яндекс запустил возможность генерировать короткие видео с помощью ИИ в Шедевруме. За генерацию отвечает фирменная нейросеть на основе каскадной диффузии.

Для генерации достаточно ввести текстовый запрос, затем выбрать первый кадр видео из предложенных вариантов. Нейросеть возьмёт за основу изображение и делает из него 4-х секундное видео по заданному шаблону. Сейчас их 7 — зум, таймлапс, полёт, панорама, вращение, подъём и морфинг.

@d_code
👍6🔥1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
Vispunk

Новый ИИ-редактор изображений.
Под капотом, видимо, Stable Diffusion.
Есть онлайн версия, только мне не удалось получить от нее результата. Генерит не то что пишешь а то что и было чуть в другой вариации

Онлайн-редактор
Код обещают выложить
Сабреддит проекта, там пачка туториалов


#text2image #image2image #tools
This media is not supported in your browser
VIEW IN TELEGRAM
VALL-E X: Multilingual Text-to-Speech Synthesis and Voice Cloning

Мультиязычный генератор речи по тексту и клонировщик голоса. Английский, Японский, Китайский. Для клонирования голоса достаточно 3-7 секунд образца. Контроль акцента, эмоций, акустики.

Примеры
Код
Демо
Колаб

#text2speech #tts #voicecloning
This media is not supported in your browser
VIEW IN TELEGRAM
MagicEdit:High-Fidelity Temporally Coherent Video Editing

Редактирование видео: стилизация, локальное редактирование, смешивание разных видео, аутпейнтинг

Код будет позже

#video2video
🔥6