Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.73K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab

Говорят, превосходит Whisper

- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка

Демо
Колаб

#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.

Код
Примеры
Демо (надеюсь, починят)
Колаб

#text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
PhysGaussian: Physics-Integrated 3D Gaussians for Generative Dynamics

А вот в гауссианы завезли физику. В нерфы уже завозили, но пока не видел кейсов использования. Надеюсь, с гауссианами взлетит.

Пишут что можно управлять динамикой через свойства материалов

Код обещают выложить

#dynamics #gaussian #imageto3D
👍1
Можете затестить майкрософтовскую языковую модель Orca2 13B

Демо

#LLM #chatbot
👍5🔥1
Media is too big
VIEW IN TELEGRAM
runway.tv

Это о**енно!

Помните в Рик и Морти было ТВ из других миров? Вот спасибо Runway, у нас теперь есть: runway.tv

Просто бесконечный стрим коротких #text2video фильмов. Сами по себе отдельные ролики нас уже не впечатлят. Но все это в видео ТВ - новый уровень и другие ощущения

Новость подсмотрел у Дениса

#streaming #tv #news
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Google Bard научился смотреть видео на YouTube и пересказывать их. Можно попросить его показать подборку видео на тему, обсудить содержимое видео. Ну и другие расширения у Bard тоже есть. Для россиян через VPN

Говорят, что видео он не понимает, тупо читает титры

#assistant #chatbot #VLM #multimodal
А вы заметили что уже есть сопособы затестить Stable Video Diffusion онлайн?
Ссылки прилагаю внизу поста.

Я затестил и уже сделал несколько выводов.
Самое главное:

он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video
😁2👍1
И наконец примеры где он справился получше