Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation

Сегментатор 3D моделей от VAST

Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)

Код ждем

#segmentation #3d
👍4🔥2
Media is too big
VIEW IN TELEGRAM
HunyuanWorld-Voyager

Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды

Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.

Опенсорс
При создании видео в 540p расходует 60Гб VRAM

Mirage, есть чем ответить?

Гитхаб
Попробовать - не совсем понятно новая тут демка или старая

#world #text2world #imageto3d #text2video #text2scene
1👍10😱32
FastVLM: Efficient Vision Encoding for Vision Language Models

Семейство быстрых и легких #VLM от Apple
0.5B, 1.5B и 7B параметров
Способна работать на смартфоне

Гитхаб
HF

#assistant #realtime #mobile
10👍4
DeepSeek ввел новые правила, согласно которым весь генерируемый их платформой контент должен маркироваться видимыми метками с указанием на искусственное происхождение.

Кроме того, в материал встраиваются скрытые технические маркеры с метаданными для обеспечения отслеживаемости контента.

Удалять или изменять метки запрещено, предусмотрена защита от удаления. А за нарушение — юридическая ответственность

Ну и похоже, так будет везде

#news
😱6💯52👍1🔥1
Будь ты проклят Шуфутинский.
Не надо было переворачивать!

У кого еще такое?
😁17🔥2👍1
Нейронавт | Нейросети в творчестве
Higgsfield Records Higgsfield представил ИИ-рекорд лейбл. И ИИ-идола - Kion Хвастаются многомиллионными контрактами и предлагают раскрутить вас #news
Пришло письмо от Higgsfield Records что меня взяли в поп-идолы 🤩

Идем по ссылке из письма - а там просто пачка новых видеоэффектов.
Бери, мол, эффектуйся, лутай лайки.

Сам что ли? А вы зачем? 👀

#news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁102👍1
Руководство по промптингу Nano-Banana от Google AI Studio

С фокусом на создании изображений по тексту.

Основной принцип: описывать сцену обычным человеческим языком, а не перечислять ключевые слова.

#prompting #tutorial #manual #text2image
🔥11
This media is not supported in your browser
VIEW IN TELEGRAM
PractiLight: Practical Light Control Using Foundational Diffusion Models

Релайтинг изображений на диффузных моделях

Суть метода в обучении легкой LoRA для создания карты прямого облучения изображения

Код

#relighting
🔥12👍4🤔2
Stable Diffusion WebUI Forge - Neo

счастье привалило комфи-хейтерам !

Это Forge (среда для работы с генераторами картинок и видео) с добавленными функциями:

- Wan 2.2 (txt2img, img2img, txt2vid, img2vid)

- Nunchaku (flux-dev, flux-krea, flux-kontext, T5)

- Flux-Kontext (img2img, inpaint)

- и другими (модели, ускоряторы, фичи)

Оригинальный Forge остается без изменений с прошлого года.

#gui #tools #text2image #text2video #optimization
🔥15👍5
Wan 2.2 First/Last Frame Video Fast

Демоспейс #wan22 с генерацией от первого к последнему кадру.
На бесплатном аккаунте сработал

#image2video
😁13👍61
Hermes-4-14B

Появилась 14B модель Hermes и чатик с ней в демоспейсе

Демо

#assistant #chat
👍51
VibeVoice-Large-pt-gguf

Кванты голосовой модели от Microsoft
———————————
VibeVoice7b-low-vram

4- и 8-битные версии под 8 и 12ГБ VRAM
———————————

Тем временем официальный репозиторий с404-лся как и HF
Microsoft жаба задушила?

Зато есть клонированный гитхаб
И Демо
Оригинальные модели все еще доступны на Modelscope

VibeVoice ComfyUI Nodes обновился и теперь не требует внешнего VibeVoice

#gguf #podcast #voicecloning #tts #text2speech #text2podcast
👍8😭2
DeepFaceLive RTX 5XXX

Инструмент для дипфейка допилили под видеокарты Nvidia 5XXX (Blackwell). 4XXX и 3XXX тоже работают, остальные не тестировались.

Похоже что эта модификация не от автора оригинальногол DFL - в его репозитории последний релиз от 2023 года. Так что, пользуйтесь на свой страх и риск

mega.nz
Видео

#deepfake #faceswap #realtime
👍52
PromptHMR: Promptable Human Mesh Recovery

Реконструкция позы и формы человека (HPS) с пространственными, текстовыми или семантическими подсказками.
Хорошо справляется с взаимодействующими людьми.

Код

#HMR #HPS #video2pose #videoto3d #humanreconstruction
🔥11👍2