Sparse Voxels Rasterization: Real-time High-fidelity Radiance Field Rendering
Очередная работа Nvidia в направлении реконструкции/рендера/растеризации объемных сцен.
Выглядит как, ответ Radiant Foam
SVRaster стремится объединить скорость рендеринга гауссиан с преимуществами воксельных сеток без нейросетей и гауссиан (я правильно прочитал?)
Принцип как в nerf и 3DGS - на вход подаем ограниченный набор ракурсов сцены, на выходе вид с любого ракурса.
Код
#gaussian #rendering #novelview #image2scene #video2scene #realtime
Очередная работа Nvidia в направлении реконструкции/рендера/растеризации объемных сцен.
Выглядит как, ответ Radiant Foam
SVRaster стремится объединить скорость рендеринга гауссиан с преимуществами воксельных сеток без нейросетей и гауссиан (я правильно прочитал?)
Принцип как в nerf и 3DGS - на вход подаем ограниченный набор ракурсов сцены, на выходе вид с любого ракурса.
Код
#gaussian #rendering #novelview #image2scene #video2scene #realtime
🔥10
Image-01
Генератор изображений от Hailuo
Ежедневно насыпают 100 кредитов бесплатно, 1 картинка стоит 1 кредит
Попробовать - выбираем вкладку Create Image
#text2image
Генератор изображений от Hailuo
Ежедневно насыпают 100 кредитов бесплатно, 1 картинка стоит 1 кредит
Попробовать - выбираем вкладку Create Image
#text2image
1👍7
KV-Edit: Training-Free Image Editing for Precise Background Preservation
Редактирование изображений по маске и промпту, с упором на сохранение фона неизменным.
Код
Демо
ComfyUI
#imageediting #inpainting
Редактирование изображений по маске и промпту, с упором на сохранение фона неизменным.
Код
Демо
ComfyUI
#imageediting #inpainting
👍9❤1💩1
😁11💩5❤1
Ernie 4.5 / X1
Новая мультимодальная языковая модель от Baidu уровня GPT-4.5 за 1% от ее цены.
В двух версиях
Ernie 4.5 - нерассуждающая, с анализом картинок / документов / аудио
В чате работает бесплатно
Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M
Ernie X1 - рассуждающая, конкурент DeepSeek R1 за полцены. Скоро в чате
Input $0.28 / 1M, output $1.1 / 1M.
Чат
#assistant #reasoning
Новая мультимодальная языковая модель от Baidu уровня GPT-4.5 за 1% от ее цены.
В двух версиях
Ernie 4.5 - нерассуждающая, с анализом картинок / документов / аудио
В чате работает бесплатно
Цены OpenAI: Input $75 / 1M, Output $150 / 1M
Цены Baidu: Input $0.55 / 1M, Output $2.20 / 1M
Ernie X1 - рассуждающая, конкурент DeepSeek R1 за полцены. Скоро в чате
Input $0.28 / 1M, output $1.1 / 1M.
Чат
#assistant #reasoning
❤7🔥6👍3
4D LangSplat: 4D Language Gaussian Splatting via Multimodal Large Language Models
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
Слыхали про 4D-языковые поля? Я не слыхал, а они есть.
Служат, по видимому, для сегментации объектов на видео
Код
#video2mask #segmentation #gaussian
👍7❤1
Дайджест интересного о чем не успел написать отдельным постом
Free AI background remover: бесплатное удаление фона онлайн от Adobe #backgroundremoval
MANUS: хайповый автономный агент (записаться в вейтлист) для выполнения задач на компе, собранный из 29 инструментов. Есть расширения Chrome и Edge, аппки Android / IOS и приложения для ПК но бесплатно они мало что могут #agent
ANUS: MANUS клонировал сам себя в опенсорс #agent
OpenManus: ANUS, но рабочий. спасибо @Qwinty
Mirage от Captions: генератор видеоблогеров. За ваши $199 генерит и шевелит поясной портрет, а не только голову
Pika: добавили эффекты для превращения в ребёнка, героя, принцессу, или музейный экспонат. Pikaswaps и Pikadditions теперь генерят в 1080p. #image2video
WAN effects/LoRAs: тем временем подобные же эффекты в опенсорсе #image2video
SkyReels: добавили липсинк к своему генератору видео. Демо. #lipsync
FLARE: получение новых видов сцены или её 3D геометрии из несшитых рандомных фоток. Код / Демо #image2mesh #novelview #imageto3d
CTRL-D: редактирование видео промтом. Код #videoediting #video2video
Ideogram: выпустили Ideogram 2a и версию Turbo, для более быстрой и дешевой генерации картинок. Также улучшились тексты на них. #text2image
Light-a-Video: для релайтера видео появилось ComfyUI #relighting #comfyUI
Tight Inversion SDXL: редактирование картинок промтом. #imageediting
Free AI background remover: бесплатное удаление фона онлайн от Adobe #backgroundremoval
MANUS: хайповый автономный агент (записаться в вейтлист) для выполнения задач на компе, собранный из 29 инструментов. Есть расширения Chrome и Edge, аппки Android / IOS и приложения для ПК но бесплатно они мало что могут #agent
ANUS: MANUS клонировал сам себя в опенсорс #agent
OpenManus: ANUS, но рабочий. спасибо @Qwinty
Mirage от Captions: генератор видеоблогеров. За ваши $199 генерит и шевелит поясной портрет, а не только голову
Pika: добавили эффекты для превращения в ребёнка, героя, принцессу, или музейный экспонат. Pikaswaps и Pikadditions теперь генерят в 1080p. #image2video
WAN effects/LoRAs: тем временем подобные же эффекты в опенсорсе #image2video
SkyReels: добавили липсинк к своему генератору видео. Демо. #lipsync
FLARE: получение новых видов сцены или её 3D геометрии из несшитых рандомных фоток. Код / Демо #image2mesh #novelview #imageto3d
CTRL-D: редактирование видео промтом. Код #videoediting #video2video
Ideogram: выпустили Ideogram 2a и версию Turbo, для более быстрой и дешевой генерации картинок. Также улучшились тексты на них. #text2image
Light-a-Video: для релайтера видео появилось ComfyUI #relighting #comfyUI
Tight Inversion SDXL: редактирование картинок промтом. #imageediting
Adobe
Free AI Background Remover | Adobe Express
Remove backgrounds from your images quickly and easily with the free AI background remover from Adobe Express. Upload your image to the AI background remover and download your new image in seconds.
👍7🔥3❤1
Command A
Наследник Command R+ на 111B параметров, контекстное окно 256k
Ориентирован на агентные, мультиязычные, программистские задачи
Веса
API
#assistant #coding #agent
Наследник Command R+ на 111B параметров, контекстное окно 256k
Ориентирован на агентные, мультиязычные, программистские задачи
Веса
API
#assistant #coding #agent
🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Thera: Aliasing-Free Arbitrary-Scale Super-Resolution with Neural Heat Fields
Новая SOTA в апскейле любого разрешения со встроенным антиалайасингом
Код
Демо (до 600х600 на вход)
#upscale #enhance
Новая SOTA в апскейле любого разрешения со встроенным антиалайасингом
Код
Демо (до 600х600 на вход)
#upscale #enhance
👍5👎1