Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Make Pixels Dance: High-Dynamic Video Generation

Новый крутой генератор видео. Может делать видео из изображения. Есть Magic Mode - видео из двух изображений, смешивая их по текстовому промту.

Кода и демо нет. Но можно попросить авторов выполнить ваш запрос здесь

#text2video #image2video
👍3🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Пока ChatGPT прилег, Anthropic презентовали Claude 2.1

- Окно контекста теперь 200 тыс токенов. Это примерно 500 страниц текста, или 150 тыс английских слов.
- Уменьшена частота галлюцинаций в два раза
- На длинных контекстах уменьшена ошибка: на ~30% при максимальной длине контекста
- Возможность использовать внешние инстурменты по API
- Цена на новую модель такая же, как и на Claude 2

#chatbot #assistant #LLM
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Stable Video Diffusion

Stability.AI представили генератор видео по изображению. Работает на базе SD v2.1.

Есть две версии
- SDV генерит 14 кадров 576x1024
- SDV-XT дообученный вариант SDV, 25 кадров

Модель может быть легко адаптирована к различным задачам, включая синтез новых ракурсов из одного изображения (см на сайте)

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video
👍3
Наша команда трудилась-трудилась и выкатила две крупные (во всех смыслах) модели в релиз! 😧

➡️➡️➡️ Kandinsky 3.0 для генерации изображений и Kandinsky Video для генерации видео

Познакомиться и найти все ссылки можно в статьях на Хабре. Здесь про Kandinsky 3.0, а здесь про Kandinsky Video.

Ставим лайки, делаем репосты, а админ этого канала запасается ящиком энергетиков без сахара на следующий релиз. Как говорится, stay tuned. 🦔
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6
начеррипиканные примеры - ну такое
Forwarded from GigaChat
🟢Готовы примерить на себя роль режиссёра, сценариста и монтажёра? Камера, мотор промпт, начали! Представляем первую в России нейросеть для генерации полноценного видео!

Kandinsky Video прокачался на датасете из 300 000 пар «текст — видео» для воплощения ваших идей:

🤖 плавный видеоряд с частотой 30 кадров в секунду и возможностью делать видео с хронометражем до 8 секунд

🤖 два ключевых блока, которые работают вместе. Один отвечает за создание ключевых кадров структуры сюжета, а второй — за плавность движений

🤖 формат видео представляет собой непрерывную сцену с движением как объекта, так и фона

🤖 в основе нейросети — новая модель синтеза изображений по текстовым описаниям.

Оценить Kandinsky Video можно на платформе fusionbrain.ai и в Telegram-боте — оставляйте заявку на доступ!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁6🔥41👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
OWSM v3: An Open Whisper-style Speech Model from CMU WAVLab

Говорят, превосходит Whisper

- Распознавание речи для 151 языка
- Перевод речи с любого на любой язык
- Предсказание временных меток
- Транскрипция в длинной форме
- Идентификация языка

Демо
Колаб

#speech2text #translation #speech2speech #voice2text
🔥4👍1
Media is too big
VIEW IN TELEGRAM
StyleTTS 2: Towards Human-Level Text-to-Speech through Style Diffusion and Adversarial Training with Large Speech Language Models

А вот движок генерации речи по тексту с заявленным человекоподобием. Масса возможностей.

Код
Примеры
Демо (надеюсь, починят)
Колаб

#text2speech
This media is not supported in your browser
VIEW IN TELEGRAM
PhysGaussian: Physics-Integrated 3D Gaussians for Generative Dynamics

А вот в гауссианы завезли физику. В нерфы уже завозили, но пока не видел кейсов использования. Надеюсь, с гауссианами взлетит.

Пишут что можно управлять динамикой через свойства материалов

Код обещают выложить

#dynamics #gaussian #imageto3D
👍1
Можете затестить майкрософтовскую языковую модель Orca2 13B

Демо

#LLM #chatbot
👍5🔥1
Media is too big
VIEW IN TELEGRAM
runway.tv

Это о**енно!

Помните в Рик и Морти было ТВ из других миров? Вот спасибо Runway, у нас теперь есть: runway.tv

Просто бесконечный стрим коротких #text2video фильмов. Сами по себе отдельные ролики нас уже не впечатлят. Но все это в видео ТВ - новый уровень и другие ощущения

Новость подсмотрел у Дениса

#streaming #tv #news
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Google Bard научился смотреть видео на YouTube и пересказывать их. Можно попросить его показать подборку видео на тему, обсудить содержимое видео. Ну и другие расширения у Bard тоже есть. Для россиян через VPN

Говорят, что видео он не понимает, тупо читает титры

#assistant #chatbot #VLM #multimodal
А вы заметили что уже есть сопособы затестить Stable Video Diffusion онлайн?
Ссылки прилагаю внизу поста.

Я затестил и уже сделал несколько выводов.
Самое главное:

он невероятно ленивый!
Не помню ни одного генератора видео который бы так часто вместо какого-то органического движения отдельных объектов отдавал мне просто панорамирование плоской картинки на отъе**сь

Демо
Демо2
Колаб fp16
Колаб img2vid. Понимает только *.PNG

#image2video
😁2👍1