Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from GigaChat
🟢Готовы примерить на себя роль режиссёра, сценариста и монтажёра? Камера, мотор промпт, начали! Представляем первую в России нейросеть для генерации полноценного видео!

Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:

🤖 плавный видеоряд с частотой 30 кадров в секунду и возможностью делать видео с хронометражем до 8 секунд

🤖 два ключевых блока, которые работают вместе. Один отвечает за создание ключевых кадров структуры сюжета, а второй — за плавность движений

🤖 формат видео представляет собой непрерывную сцену с движением как объекта, так и фона

🤖 в основе нейросети — новая модель синтеза изображений по текстовым описаниям.

Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥41👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab

Говорят, превосходит Whisper

- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка

Демо
Колаб

#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.

Код
Примеры
Демо (надеюсь, починят)
Колаб

#text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
PhysGaussian: Physics-Integrated 3D Gaussians for Generative Dynamics

А вот в гауссианы завезли физику. В нерфы уже завозили, но пока не видел кейсов использования. Надеюсь, с гауссианами взлетит.

Пишут что можно управлять динамикой через свойства материалов

Код обещают выложить

#dynamics #gaussian #imageto3D
👍1
Можете затестить майкрософтовскую языковую модель Orca2 13B

Демо

#LLM #chatbot
👍5🔥1
Media is too big
VIEW IN TELEGRAM
runway.tv

Это о**енно!

Помните в Рик и Морти было ТВ из других миров? Вот спасибо Runway, у нас теперь есть: runway.tv

Просто бесконечный стрим коротких #text2video фильмов. Сами по себе отдельные ролики нас уже не впечатлят. Но все это в видео ТВ - новый уровень и другие ощущения

Новость подсмотрел у Дениса

#streaming #tv #news
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Google Bard научился смотреть видео на YouTube и пересказывать их. Можно попросить его показать подборку видео на тему, обсудить содержимое видео. Ну и другие расширения у Bard тоже есть. Для россиян через VPN

Говорят, что видео он не понимает, тупо читает титры

#assistant #chatbot #VLM #multimodal
А вы заметили что уже есть сопособы затестить Stable Video Diffusion онлайн?
Ссылки прилагаю внизу поста.

Я затестил и уже сделал несколько выводов.
Самое главное:

он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video
😁2👍1