NEW BOT Телеграм, страница

This media is not supported in your browser

ToonCrafter: Аниматоры напряглись, аниме-любители радуются

Пока мы ждем сору, вот вам ToonCrafter — прикольная модель для тех, кто делает двигающиеся картинки в стиле аниме.

Я уже вижу, как китайские аниме-студии сразу сокращают количество кадров. Собственно для этого она и создавалась в соавторах Tencent AI Lab.

Есть три режима:

- межкадровая интерполяция. Модель дорисует кадры между двумя key frames. Причем не просто линейным поступательным движением, как это сделано в других работах по интерполяции видео, а полноценная анимация.

- интерполяция, но на башне скетчей. Когда цвета нет.

- окрашивание. Перед тем как анимешку сделают цветной, сначала делают полноценный анимированный эскиз в чб. Вот его теперь будут красить автоматически.

Непонятно, насколько мощный черипик в примерах. Выглядит ну как-то уж слишком хорошо. Хоть здесь и используются для каких-то более сложных вещей эскизы как референсы.

У них, оказывается, уже есть демо. Сгенерил простенькую кошечку — работает офигенно, хоть и две секунды и разрешение шакальное.

Как этого достигли?
1. Хитро зафайнтюнили DynamiCrafter на аниме видосах. Там есть своя специфика, ведь в мультиках много регионов без текстур, и нет motion блура, как в реальных видео.
2. Натренировали специальный 3D декодер, который берет на вход кроме latent векторов фреймов, ещё и дополнительно исходные первый и последний кадры, чтобы сохранить точную информацию о внешности объектов.

Project Page с примерами. Рекомендую глянуть.
Пейпер
Код на гитхабе
Демо на обнимающем лице

@ai_newz

❤16🔥8👍2🤩1😎1

4.94K views17:00

Derp Learning

Возлежание машин!

😁64

5.46K views07:53

Derp Learning

Forwarded from BOGDANISSSIMO

Мечтает ли GPT-4o о сегментации картинок...?

Рассказал на Habr найденный способ как заставить GPT-4o работать с детекцией объектов на картинке и выдавать координаты (bounding boxes), с которыми можно работать.

Внутри много деталей о том, с какими препятствиями и нюансами мы сталкиваемся в Vibe AI при парсинге сообщений со скриншотов переписки.

Приятного прочтения, буду благодарен вашей обратной связи, лайкам, репостам

❤️

Please open Telegram to view this post

VIEW IN TELEGRAM

Хабр

Мечтает ли GPT-4o о сегментации картинок...?

Всем привет, Меня зовут Богдан Печёнкин. Многие Меня знают как соавтора Симулятора DS на Karpov.Courses. Сейчас Я фаундер стартапа Vibe AI – это AI Dating Copilot для парней и девушек, который...

❤10🔥7👍4⚡3

4.63K views19:21

Derp Learning

Forwarded from Dev Meme / devmeme

Your "totally not wrong" versions are very welcome !

😁66🎉3❤1🔥1😢1

5.02K views22:21

Derp Learning

Forwarded from ProteinChauvinist Channel

😁104💯7🔥4❤2

5.42K views07:34

Derp Learning

https://youtu.be/lOfZLb33uCg?si=E6l58CtlMrkxFhgE

A clip literally made by Al

(Al yankovich)

YouTube

"Weird" Al Yankovic - Amish Paradise (Parody of "Gangsta's Paradise" - Official Video)

😁21👍7🔥2

4.99K views12:03

Derp Learning

Forwarded from Labrats

🫡64😁43💯2👀1

4.31K views17:20

Derp Learning

Elon Musk founding OpenAI be like

😁65🤣7

4.39K views15:35

Derp Learning

xит

😁66🤣8🤩3⚡1

4.56K views19:29

Derp Learning

Forwarded from Dankest Memes // Данкест Мемс

0:59

This media is not supported in your browser

VIEW IN TELEGRAM

😁61🔥9❤2👍2😢1💯1

4.31K views05:40

Derp Learning

This media is not supported in your browser

VIEW IN TELEGRAM

Выкатили Whisper WebGPU
- распознавание голоса и перевод на девайсах

Работает локально в браузере, данные никуда не идут

🤗 demo
tweet
git

🔥47👍3❤1

5.44K viewsedited 07:46

Derp Learning

Forwarded from эйай ньюз

🔥

Веса SD-3 Medium уже доступны!

Как и обещали, Stability релизнули Stable Diffusion 3 Medium с двумя миллиардами параметров. Она бесплатна для некоммерческого пользования. За коммерческое использование придётся платить: $20 в месяц для индивидуальных пользователей и небольших бизнесов, для бизнесов побольше - энтерпрайз лицензия.

Поддержка модели уже есть в ComfyUI, для автоматика придётся подождать.

Судя по публичным заявлениям сотрудников Stability, 8B модель ещё тренируется. Но непонятно почему не релизнули 800m "Small" версии.

Блогпост
Веса

@ai_newz

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥13👍5❤1

3.37K views15:38

Derp Learning

Forwarded from Denis Sexy IT 🤖

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

txt2video стал еще доступнее, Luma Labs выкатили свой и дают создать 30 видео в месяц бесплатно. Качество на уровне SORA

Положить сервис можно тут:
https://lumalabs.ai/dream-machine/creations

🔥14👍2

3.81K views18:17

Derp Learning

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 поразительный скачок!

В последние пару недель много чего понавыходило, но больше всего шума от видеогенераторов.

На видео сравнительный тест, который даст вам понять без лишних слов, на что обратить внимание. Runway, Pika, Lumalabs — к последнему, как вы поняли, стоит присмотреться. Кроме того, у вас будет 30 бесплатных, возобновляемых генераций в месяц.

Из элементов управления пока мы имеем только текст, что означает, что мы всё ещё в начале пути. Но на скачкообразное повышение качества невозможно не обращать внимания.

Видео открывайте на полный экран.

Пробовать тут.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥34❤9👍3😱1

4.34K views03:44

Derp Learning

Forwarded from эйай ньюз

0:45

This media is not supported in your browser

VIEW IN TELEGRAM

0:15

This media is not supported in your browser

VIEW IN TELEGRAM

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

Follow-Your-Emoji:Fine-Controllable and Expressive Freestyle Portrait Animation

Тут завезли нормальный липсинк. Follow Your Emoji берет на вход видео с вашими кривляньями, переводит их в последовательность фреймов с лендмарками, а затем использует их чтобы драйвить входное фото. Это controlnet для лица на стеройдах, который очень хорошо сохраняет личность на входном фото. Все на базе SD.

Вышло настолько хорошо, что методу под силу не просто рот во время открывать, но и глаза косить, смеяться (и чихать, я думаю, тоже) см. примеры, авторы там знатно поиздевались над своим творением.

Код вроде как должны выложить, на project page уже есть ссылка, но пока в никуда.
Еще есть бумага.

@ai_newz

🔥14❤2

4.43K views18:22

About

Blog

Apps

Platform