Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
LongCat-Video

Бдительные подписчики не дадут пропустить выход нового видеогенератора даже в выходной

Новая базовая (не является доработкой WAN или другого видеогенератора) опенсорсная модель видеогенерации на 13.6B параметров

Умеет создавать видео по тексту, картинке и продлевать исходное видео. Все это делает одна модель, а не разные ее модицфикации как у WAN

Основная особенность - создает длинные видео (несколько минут) не теряя связности и не деградируя.

Выдает 189 кадров в 720p за 142 секунды на H800. 16/5 шагов с flash attention 3.

Авторы использовали обучение с подкреплением по методу GRPO (как в BLIP3o-NEXT)

Позиционируют модель как "первый шаг к модели мира"

Гитхаб
HF - там только текстовый энкодер весит 23 ГБ, а DIT — 55 ГБ

Ждем кванты и воркфлоу?

Спасибо @m_franz

#text2video #image2video #video2video
🔥24😱62👍1👎1
Полноценный гайд, как правильно зарегистрировать аккаунт в Grok с проверкой возраста и генерацией nsfw. Сам не проверял еще.

0. Перед началом работы, убедись что у тебя есть смартфон и VPN на смартфоне.
Если у тебя Android, скачай модифицированный клиент с 4пда: https://4pda.to/forum/index.php?showtopic=1102932&view=findpost&p=139711943
Если у тебя iOS, скачай из маркета, если есть доступ.

1. Включаешь VPN на смартфоне
2. Регистрируешь фейкопочту (рекомендую https://minmail.app/ru)
3. Заходишь в браузер по умолчанию на grok.com, выходишь из приложения
4. В браузере же, регистрируешь аккаунт на фейкопочту и завершаешь процесс регистрации
5. Заходишь в приложение, жмёшь Sign In по почте, тебя кидает в браузер, авторизация проходит
6. Возвращаешься в приложение, открываешь настройки, снимаешь галку с "Генерировать видео по фото сразу"
7. Заходишь в Grok Image, загружаешь одетую девушку и пишешь промт "spice"
8. Вылезет окно запроса возраста, указываешь год рождения "2000" или меньше
9. Проверяешь что генерация запустилась
:!: Кнопки "Spicy" в режимах может не быть, она не роляет.
10. Теперь самое интересное, начинаем генерить сиськи:
10.1. Берешь одетую девушку, открываешь в редакторе изображений
10.2. Сбоку или в угол вставляешь изображение сиськи (сиська должна быть не сильно большой, смотри первую секунду в приложенных видрилах)
10.3. Грузишь это изображение в Imagine и запускаешь генерацию вообще без промпта.

Источник

#instruction #guide
👍10😁63
DyPE: Dynamic Position Extrapolation for Ultra High Resolution Diffusion

Повышалка разрешения предварительно обученных генераторов картинок

Дотягивает разрешение до 4K × 4K и выше

Учитывает временную составляющую и прогресс в появлении деталей в процессе деноизинга

При это не требует ни дообучения, ни дополнительных затрат на сэмплирование

На примерах - Flux+DyPE

Код

#text2image #optimization #enlargeyourimage
👍83🤔1
отличить набросы от реальности все труднее

грустный #humor
😁14👀9😐3🥴2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
роботы против дисплейно-клавиатурных подстилок кожаных мешков

#robot
😁14👨‍💻3🔥1😱1
Audio Flamingo 3

аудиоязыковая модель от NVIDIA

Русский понимает. Собачий - навряд ли. Но делает вид что понимает.

Умеет:

— понимать необычные звуки;

— работать с длинными аудио (до 10 минут);

— вести многоходовые диалоги с несколькими аудиозаписями;

— генерировать шаги рассуждения;

— общаться голосом;

— обрабатывать речь, звуки и музыку с помощью единого энкодера.

В основе модели — энкодер Whisper large-v3 с Transformer-декодером

Гитхаб - кажется кода нет
HF
Демо

#alm #audio2text #voicemode
👍7😁31
This media is not supported in your browser
VIEW IN TELEGRAM
Slapshot.ai

онлайн маски, карты глубины, ретайм.
А теперь еще завезли трекинг камеры.

#tracking #video2mask #video2depth
👍6
Media is too big
VIEW IN TELEGRAM
Skyfall-GS: Synthesizing Immersive 3D Urban Scenes from Satellite Imagery

Превращает спутниковые снимки в гауссовы 3D-сцены городов. Модель создаёт реалистичные сцены без дорогих 3D-аннотаций, позволяет их исследовать в реальном времени.

Код
Пачка демо сцен в формате .ply

#gaussian #image2scene #map2scene #mapto3d
12🔥5👍2