NEW BOT Телеграм, страница

Derp Learning

Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

Вот вам пример видеогенерации, от которого у меня немного закипел мозг.

Мы тут извращаемся в промптах, пытаясь заставить двигаться камеру или персонажа.
Но.
Оказывается, можно попросить ИИ добавить на видео гринскрин (этим я вас не удивлю) и, внимание, маркеры для трекинга камеры (а вот этим удивлю). Для того, чтобы потом оттрекать камеру в AE или Нюке, восстановить движение объектов в 3Д, убрать фон и навалить сверху нормальной графики или футажа.
В общем все, как на съемках с парой супервазеров, мешком маркеров, тейпов, рулеток, далее по списку. Только промптом!

И судя по этому примеру у Veo2 (пока крайней мере у него, но думаю и у остальных) в голове есть реальная модель 3Д мира и вполне себе эвклидово пространство, ибо это работает и условная фотограмметрия не ломается.

Я в шоке. А вы не поленитесь, почитайте нехилый такой промпт, где написано про маркеры, гринскрин и прочую супервайзерскую требуху (тут есть момент, чтобы писать такой промпт, надо как бы быть в супервайзерской теме, но об этом в другой раз).

Я уж не знаю, на чему учили Veo2, но то, что это вообще работает, приводит меня в восторг.

Подробности тут.

Кто совсем ничего не понял: здесь только девушка (см. промпт). Среднее видео демонстрирует добавление созданной человеком модели (андроид, G) в сцену, созданную ИИ, а нижнее - объединение созданного ИИ персонажа (девушки) в созданную человеком сцену (сакура и небесное пространство). В обоих случаях необходимы данные с камеры, полученные в результате работы ИИ.

Попробуйте в Клинге что ли...

@cgevent

👍21🔥13👀2

4.5K views13:40

Derp Learning

3:06

This media is not supported in your browser

VIEW IN TELEGRAM

Пожалуй, хватит интернета на сегодня

@derplearning

😁54🤣10🗿9❤5🔥5😱3

7.18K viewsedited 14:12

Derp Learning

MicroDiT; Stretching Each Dollar: Diffusion Training from Scratch on a Micro-Budget Внезапно, Sony Research выкатили фреймворк для обучения 1.16b DiT до уровня StableDiffusion 1.5 за 2k$ с нуля. Если мне не изменяет память, sd1.x обошелся в 130000$ :D В…

Забавно, в этом пейпере указали стоимость обучения 1890$ (2.6 8xH100 дней), т.е. 3.7$/gpu/час
Сейчас несложно найти 8xH100 за 2.99$/gpu/час
Т.е. с момента обучения до выхода статьи процесс подешевел до 1492$, почти на 20%!
Пишем новый пейпер "waiting for a few months is all you need"

😁32👍9

4.67K views21:34

Good Things Go (Official Audio Visualizer) - Linkin Park
Внезапно, На правах замедления ютуба
сорс

❤14👍3🗿3

4.5K views01:57

Derp Learning

Forwarded from Denis Sexy IT 🤖

0:24

This media is not supported in your browser

VIEW IN TELEGRAM

Как выглядит интерфейс DDOS-атаки на сервер в 2025 году

👏

Please open Telegram to view this post

VIEW IN TELEGRAM

👀28😁21🔥13🤡3👍1

2.92K views07:59

Derp Learning

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

В Suno появилась функция audio input, теперь можно записать свои звуки, речь, и собрать из этого композицию.

Я когда спотифай слушаю, каждый раз ловлю себя на мысли сколько сгенерированных треков я уже послушал не подозревая этого.

На сколько просто теперь стало делать музыку, все еще удивляюсь.

🔥30❤3

3.72K views06:06

Derp Learning

Forwarded from Love. Death. Transformers.

TREAD: Token Routing for Efficient Architecture-agnostic Diffusion Training - Этот простой трюк ускорит претрен вашего DIT в 25 раз!

Идея такая: не все токены одинаково полезны на всех слоях, не все слои одинаково полезны для всех токенов. Давайте дадим модели самой выбирать на какие слои передавать токены, а на какие слои нет.

авторы получают х25 ускорение претрена и модель лучшую по метрикам чем классический DIT.

paper

❤10🔥6👍1

3.77K views08:45

Derp Learning

Look how the turntables!

Source

😁60👍3😢1

4.56K views16:09

Derp Learning

Forwarded from gonzo-обзоры ML статей

Дожили! Теперь можно заниматься машинным обучением в футбольном клубе!

🔥22🤣4

4.13K views22:47

Derp Learning

Here we go

😱34🗿10🤬3

4.34K views18:52

Derp Learning

Forwarded from Love. Death. Transformers.

😁62🔥3👍2😢2❤1🗿1

3.29K views10:39

Derp Learning

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

Значит, смотрите, все как учил вас в 2025!

Сначала отстреливаем каждую из семи щупалец. После того как он перестанет вас хватать, целимся в светящийся оранжевый треугольник, между сенсорами. Как убьете, не подходите сразу для сбора дропа — после смерти они, как правило, взрываются!

😁52😱20🫡5🔥3

3.46K views09:08

Derp Learning

Forwarded from gonzo-обзоры ML статей

В продолжение темы, Jay Alammar, у которого были прекрасные визуальные объяснения про работу трансформера, в сто раз лучшие оригинальной статьи, выпустил только что иллюстрированный DeepSeek-R1

https://newsletter.languagemodels.co/p/the-illustrated-deepseek-r1

newsletter.languagemodels.co

The Illustrated DeepSeek-R1

A recipe for reasoning LLMs

👍8❤3

2.87K views22:23

Derp Learning

Forwarded from Stolen memes (al)

🔥44😁28🌚10❤2

3.63K views23:18

Derp Learning

Forwarded from AbstractDL

This media is not supported in your browser

VIEW IN TELEGRAM

One-Prompt-One-Story: SVD и длинный промпт для генерации связанных изображений

Чтобы сгенерировать при помощи диффузии набор связанных консистентных изображений с единым персонажем, существует много методов, основанных на обучении (DreamBooth, IP-Adapter, Textual Inversion и т. п.). Но на самом деле можно обойтись и без обучения — например, StoryDiffusion делает это через расширение attention на референсную картинку.

В новой статье описывают ещё более простой метод генерации таких «историй» с единым героем — «One-Prompt-One-Story». Оказалось, что достаточно взять один длинный промпт с описанием каждого кадра и аккуратно, по очереди «выключать» нерелевантные части, сохраняя random seed. Для этого авторы используют SVD на текстовых эмбеддингах: усиливают нужные токены и ослабляют все лишние. Плюс небольшой трюк с cross-attention, чтобы персонаж не «расползался». Всё делается на лету, без дообучения и без референсных снимков.

Несмотря на простоту, метод по метрикам сильно обходит StoryDiffusion, и даже иногда обходит IP-adapter.

Статья, GitHub

❤11👍5🎉5🔥2

3.62K views06:08

About

Blog

Apps

Platform