Метаверсище и ИИще – Telegram
Метаверсище и ИИще
46.7K subscribers
5.93K photos
4.34K videos
45 files
6.82K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Forwarded from Data Secrets
⚡️ Вышла Llama-4 с огромным контекстом

Релизнули в трех весах: Llama 4 Scout на 109B, Llama 4 Maverick на 400B и Llama 4 Behemoth на 2T (да-да, в триллионах).

– Llama 4 Scout. Контекст 10M токенов (вау!), MoE на 16 экспертов, 17B активных параметров. Запускается на одной GPU. Уровень Gemini 2.0 Flash Lite.

Llama 4 Maverick. Контекст поменьше, 1M. 128 экспертов по 17B активных параметров. Примерно на уровне GPT-4o.

Обе модели выше мультимодальные (на вход принимают до 5 изображений) и поддерживают много языков. Знания – по август 2024. Веса

Llama 4 Behemoth. Модель невероятных размеров. 16 экспертов по 288B активных параметров. Уровень GPT-4.5 и Claude Sonnet 3.7. Весов пока нет, модель в превью и все еще обучается.

Блог | Попробовать
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
2👍65😱18🔥134👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Понять за 60 секунд.

Вот нашел в фейсбучеке ролик, практически сгенерированный с помощью ИИ, по крайней мере спотыкающаяся озвучка, намекает. Но речь не про качество ролика. А, как ни странно, про содержание.

Вот я тут ною, что пока все эти ИИ-трейлеры режут глаз ацкими нестыковками по монтажу и принципом "слепила из того, что было".

Но похоже люди с такой насмотренностью будут потихоньку вымирать, ибо кто сейчас еще ходит в кино и может посмотреть два часа контента, не умерев от усилий по удержанию фокуса.

Новым нормальным тиктокерам уже 20-минутные эпизоды сериалов даются с трудом.

Поэтому появляются 60-секундные сериалы.

И вот тут-то ИИ развернется во всю мощь. Какие монтажные переходы, какой внутрикадровый монтаж? Новый нормальный контент компрессирует всё в щель внимания потребителя интернетика, которая сжимается все сильнее.

И вот тут-то появятся, наконец, кнопки "Сделай быстро".

Кроме того, если если подучить сетки сразу на этих самих 60-секундных сериалах и скриптах к ним, то все сведется к серверам, генерящим такой контент непрерывно.

@cgevent
1😱68👍32😁12🔥117
Рунвейцы, налетаем.

Выкатили Runway GEN-4 Turbo.

Как бы в пять раз быстрее, при этом в два раза дороже.

Позиционируется как "быстрые итерации" отличного качества.

Раскатывают на все тарифы.

@cgevent
1🔥525😁5👍4
This media is not supported in your browser
VIEW IN TELEGRAM
One-Minute Video Generation with Test-Time Training

Ого, вот это уже интересно.

По крайней мере тема с 60-секундными сериалами закрыта.

Когда вы смотрите все эти "нейросетьсделалахарипотера", вам наливают нарезку по 5 секунд из несовместимых движений камеры. Пока только видео-2-видео и говорящие головы могут генерить контент больше минуты.

А тут вот авторе взялись порешать задачу длинных видосов. По сравнению Mamba 2, Gated DeltaNet и слоями со скользящим окном внимания, слои Test-Time Training генерируют гораздо более целостные видео, рассказывающие сложные истории.

Срочно шуруйте вот сюда и смотрите, что они сотворили с Том и Джерри:
https://test-time-training.github.io/video-dit/

Там внутри CogVideoX 5B model. Авторы говорят, что можно генерить и более длинные видео, а артефакты в будущем можно пофиксить взяв более тяжелые модели.

Ну и обратите внимание на промпты, они величиной с Юпитер. Но вы же понимаете, кто будет их писать...
В оригинале 21 параграф:
An underwater scene stretches across the entire screen. Amidst the colorful reef, a small, rolled-up parchment map lays on the sea floor. Jerry, the brown mouse, swims calmly into the scene from the left, his large eyes wide with curiosity, carefully looking around while his tiny paws propel him forward gently. A small, rolled-up parchment map is laying on the sea floor. The map has a single small red x on it.

An underwater scene stretches across the entire screen. Jerry, the brown mouse, pauses, his attention drawn to a small, rolled-up parchment map laying on the sea floor. With gentle care, Jerry grasps the delicate parchment with both paws and slowly unrolls it, examining its smooth surface intently. The map has a single small red x on it.<end_scene>

<start_scene>A coral-covered underwater area stretches across the screen, rich with delicate coral formations in pastel hues gently moving with the rhythm of the ocean. Jerry, the brown mouse, swims thoughtfully toward a gently glowing sea anemone, its soft tentacles subtly pulsing with luminescence. Jerry's expression is curious and determined, his tiny paws methodically propelling him through the water. As he swims, he turns his head left and right, eyes carefully scanning for something important. The camera smoothly pans along with Jerry's steady forward swimming, highlighting his thoughtful and attentive demeanor as he continues his careful exploration of the vibrant underwater environment.<end_scene>

<start_scene>Underwater, a close-up reveals Tom, the blue-gray cat, with a hungry and predatory expression, his sharp eyes narrowed as he keenly scans the surroundings. Tom turns his head methodically from left to right, squinting his eyes carefully as he searches for something, a cunning gleam evident in his gaze. Small bubbles of air gently rise behind him, highlighting his location beneath the ocean surface. In the softly swaying background, a green coral plant moves rhythmically with the water's flow. Tom is depicted naturally, free of any clothing, his sleek fur softly illuminated by the refracted sunlight filtering down from above.<end_scene>

<start_scene>Underwater, a large purple coral sways gently and rhythmically from side to side in the mild ocean current. From behind the broad coral branches, Tom, the blue-gray cat, peers mischievously with a sly and calculating smile, his eyes following Jerry intently. Jerry, the brown mouse, swims slowly and obliviously past Tom, calmly navigating the serene underwater landscape without sensing any threat. The camera smoothly pans horizontally, tracking Jerry's leisurely movement across the scene, emphasizing Tom's stealthy observation, his sly grin deepening as he patiently waits for the ideal moment to act upon his mischievous intentions toward Jerry.




Кстати, код есть
https://github.com/test-time-training/ttt-video-dit

Ну и прежде чем писать о том, какая же отстойная анимация, представьте, что все это смотрят двухлетки, которым все равно на принципы диснея, а траффик, как известно не пахнет.

@cgevent
3👍57🔥20😱125
Огненный Китайский Липсинк и не только.

Я уже писал про Дримину, как китайскую ответочку Креа и Фрипик. И единственное место, где можно попробовать тот самый Omni Human.

Оказывается, если зайти туда штатовским ВПНом, то кнопка с липсинком становится доступна! Бесплатно!

В общем, это больше похоже на китайскую Хедру - загружаешь портрет, аудио или текст, и жмешь Сгенерить.

И надо сказать, генеративная Марго Робби получилаcь отлично. С первого раза.

Дальше я, конечно, попытался это сломать. Присунув ей двух анимэ персонажей с широко открытыми ртами в одном кадре (T-поза для липсинка - слегка открытый рот).

Ну что сказать, получилось. Но все равно она выкрутилась. Смешно наблюдать как вход один, а рта - два. Синк на лицо\лице.

Там, кстати, цензура на звук. Отрывок из Laid Back: If you wonna be rich, you gotta be a bitch не пропустила из-за последнего слова.

Пробуем тут, я логигился капкатовским аккаунтом, а в капкате логинился гуглом. Без смс и оргий.

https://dreamina.capcut.com/ai-tool/video/lip-sync/generate

Штатовский впн.

@cgevent
7👍4212👎5🔥2
В Pikaframes можно загрузить до пяти кадров и получить 20 секунд анимации\видео, "проходящей" через эти кадры.

Больше, наверное, ни у кого нет.

Но если посмотреть на 3-4 ролика, то начинаешь точно угадывать момент, в который будет стык.

Во-первых, у них на движение камеры стоит easy-in easy-out и камера притормаживает к концу плана автоматически.
Во-вторых, там типичная ошибка с дублирующимся кадром, его надо ручками выкидывать, похоже. Иначе паузы.
В-третьих, переходы с движущейся камерой получаются одинаковые, некий спотыкач.

А вот на статике может быть поинтереснее. С морфингом неплохо, и очень забавный пример со скетчем. Теперь спид-пайнт можно симулировать задав пять (и еще пять) промежуточных скетчей.

В общем Пика верна себе. Больше вирусности и ваушности.

Но движение в cторону раскадровок хорошее.

@cgevent
🔥30👍169😱3👎1