Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Зананабанану

В отличие от Флюкса или Reve у нее внутри еще и мультимодальная LLM, которая знает про наш мир довольно много.

У нее в голове есть концепции и модели мира, которые и не снились диффузионным генераторам прошлых поколений (забавно писать это про реве, который вышел в этом году).

Поэтому Банана знает немного физики, хорошо знает географию, сечет за историю, она вообще понимает за мир.

Поэтому можно просить делать ее вот такие штуки.

Я люблю промпты, куда можно делать подстановки внутри [], это открывает путь к конкретным объектам (в чем Банана итак хороша).

Итак промпт:

"Make an isometric model of the [object] only."


На примерах object - это house или room

Прикол еще в том, что можно попросить ея сделать разные ракурсы этой изометрии, а потом присунуть это в Клинга (или еще кудато, кто умеет First Frame Last Frame) и полетать над вытащенным из картинки объектом.

А еще можно попробовать набросить на него wireframe сетку, как будто он полигональный объект.

@cgevent
👍11🔥51
Droplet3D: Commonsense Priors from Videos Facilitate 3D Generation

Генератор 3D по тексту и изображению.
Фишка в том что обучен на видеоданных, что дало ему понимание пространственной связности


Авторы использовали наработки CogVideoX, FLUX.1-Kontext-dev и своей же DropletVideo

Гитхаб

#textto3d #IMAGETO3D
👍10👎1
This media is not supported in your browser
VIEW IN TELEGRAM
PHD: Personalized 3D Human Body Fitting with Point Diffusion

Реконструкция позы и телесной формы человека по видео от запрещенной Meta

Код ждем наверно

#video2pose #humanreconstruction #video2mesh #HMR #poseestimation
👍61
Media is too big
VIEW IN TELEGRAM
GeoSAM2: Unleashing the Power of SAM2 for 3D Part Segmentation

Сегментатор 3D моделей от VAST

Детальный контроль над сегментацией частей без необходимости использования текстовых подсказок - принимает простые 2D подсказки (клики или рамки)

Код ждем

#segmentation #3d
👍4🔥2
Media is too big
VIEW IN TELEGRAM
HunyuanWorld-Voyager

Генерация видео, совмещенная с 3D реконструкцией.
Контроль камеры при генерации
Экспорт 3D моделей
Контроль стиля-освещения-погоды

Со всеми вытекающими - умеет создавать 3D модели по картинке, делать карту глубины и т п.

Опенсорс
При создании видео в 540p расходует 60Гб VRAM

Mirage, есть чем ответить?

Гитхаб
Попробовать - не совсем понятно новая тут демка или старая

#world #text2world #imageto3d #text2video #text2scene
1👍10😱32
FastVLM: Efficient Vision Encoding for Vision Language Models

Семейство быстрых и легких #VLM от Apple
0.5B, 1.5B и 7B параметров
Способна работать на смартфоне

Гитхаб
HF

#assistant #realtime #mobile
10👍4
DeepSeek ввел новые правила, согласно которым весь генерируемый их платформой контент должен маркироваться видимыми метками с указанием на искусственное происхождение.

Кроме того, в материал встраиваются скрытые технические маркеры с метаданными для обеспечения отслеживаемости контента.

Удалять или изменять метки запрещено, предусмотрена защита от удаления. А за нарушение — юридическая ответственность

Ну и похоже, так будет везде

#news
😱6💯52👍1🔥1
Будь ты проклят Шуфутинский.
Не надо было переворачивать!

У кого еще такое?
😁17🔥2👍1
Нейронавт | Нейросети в творчестве
Higgsfield Records Higgsfield представил ИИ-рекорд лейбл. И ИИ-идола - Kion Хвастаются многомиллионными контрактами и предлагают раскрутить вас #news
Пришло письмо от Higgsfield Records что меня взяли в поп-идолы 🤩

Идем по ссылке из письма - а там просто пачка новых видеоэффектов.
Бери, мол, эффектуйся, лутай лайки.

Сам что ли? А вы зачем? 👀

#news
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
😁102👍1