Диман, че опять – Telegram
Диман, че опять
445 subscribers
278 photos
60 videos
2 files
44 links
Al Enthusiast |
GenAl Evangelist |
Influencer | Inspirer |
Chief Visionary | Coach |
Startup Advisor | Mentor |
Prompt Engineer | Project
Manager | Cx0 |
Linkedin Top voice (according to me) |
Speaker | ChatGPT Expert |
9 x AWS Certifications

@dpetrov3
Download Telegram
Актерская игра достойна российских сериалов.
😁8🔥4💯2
у меня короче не получается драматургию чисто на действии держать.
я думаю надо сделать что-то гибридное и оставить закадровый голос в стиле рилсов "Этот парень показал..."
Невероятные технологии чтобы вуши точно расставлять
😎1
Пацаны, такую имбищу нашел
qwen tts voice design
Можно взять и нагенерить кучу крутых уникальных голосов за 5 мин чтобы потом использовать в
VibeVoice
🔥6👍2
Если что - делаю свою лану дубайскую, кто знает тот знает.
This media is not supported in your browser
VIEW IN TELEGRAM
И еще из полезного.
Я много времени убил на то, чтобы заставить ltxv-2 работать на 3090
Перепробовал кучу готовых workflow - у меня ничего нормально не завелось.
Потом нашел WanGP, заработало все с первого раза.
🤣72👏1👌1
Сразу говорю, танца пока не будет, потому что договоренность была 1М на одном видосе.
Но все равно красиво.
👍22
Media is too big
VIEW IN TELEGRAM
Ребят, зацените, теперь новый формат.
Мне кажется, если на фоне сделать плакаты СССР и одеть ее в пионерскую форму мои подписчики пенсионеры очень кайфанут.
6.5 минут на генерацию и все полностью локально.
Голос tts чутка рваный, мне было лень переделывать.
Из минусов - есть ощущение зловещей долины.
🔥12
This media is not supported in your browser
VIEW IN TELEGRAM
Новый гиперфокус
надо пайплайн с альтухами довести до идеала
🔥12👀21👍1😁1
Жесть какой claude 4.6 быстрый. оч нравится
Разница чувствуется
👀5
This media is not supported in your browser
VIEW IN TELEGRAM
https://research.nvidia.com/labs/toronto-ai/chronoedit/

Я не знаю на сколько это свежая штука, но меня безумно впечатлила.

Это i2i модель вроде бананы, которая для правок под капотам делает мини видео с трансформацией из оригинального изображения в целевое.
За счет этого, она в теории должна делать максимально логичные и физически корректные правки.
Это некоторая альтернатива ризонингу у текстовых LLM.

Там на сайте есть демки с визуализацией того, как она размышляет по hover на картинке.

Я смотрю на них и вижу в них отличный слоп потенциал.
🔥4
Она сырая и больше похожа на прототип.
Но смотрите в чем замут.
промпт: they jump
Первая картинка это банана, она действует как фотошоп.
А вторая - chrono. Она поняла что это за действие и челы прыгнули. Правда вся остальная картинка попорчена из-за wan vae.

banana pro это лечит текстовым ризонингом, но это костыль.
🔥2
Это что это он делает с моим кодом 🤨
👀3🤣1