NEW BOT Телеграм, страница

Differential Diffusion: Giving Each Pixel Its Strength

Контроль количества изменений на сгенерированных изображениях на пиксель или на область изображения.

Интегрируется в существующие генераторы изображений, работает без обучения.

Код
Колаб
Демо

#image2image

🔥9👍3

1.32K views13:12

Forwarded from Сиолошная

Помните я писал про секретный анонс фичи Gemini, который никто не продвигал, был лишь один ролик? Вот тут: https://news.1rj.ru/str/seeallochnaya/911, суть в том, что под каждый запрос LLM генерирует код интерфейса, в котором нужно показывать пользователю ответ, а затем уже его наполняет.

Vercel, компания, предоставляющая облачный сервис для развёртывания сайтов, обновила AI SDK до версии 3.0, добавив туда такую фичу. Формочки на демо не предзапрограммированны, а создаются на лету и могут содержать любой контент в любой форме. Думаю, что через пару лет такая персонализация будет широко распространена — особенно с учётом количества пользователей, на которых можно запускать A/B тесты и оптимизировать интерфейс до мельчайших деталей. ~~И главное программисты, перекрашивающие годами две кнопки, будут не нужны!~~

🔥2🤔1

1.01K views13:33

Anthropic релизнули Claude 3, в трех вариантах - Opus, Sonnet и Haiku. Opus и Sonnet доступны уже сейчас, а Haiku - в ближайшие недели. Для россиян все еще по VPN

По цифрам на приборах обходит GPT-4.
Теперь ему можно скармливать картинки.
Контекст 200k токенов

Попробовать Claude 3 Sonnet (включайте VPN)

#news #assistant #vlm

👍11

1.35K views14:38

Stability.ai опубликовали пейпер Stable Diffusion 3

Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту

Блог
Пейпер

#news #SD

🔥9👍1😁1

1.39K views08:08

Auto 1111 SDK: Stable Diffusion Python library

В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.

Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта

Колаб

#tools #coding

👍7

1.34K viewsedited 08:22

TripoSR: Fast 3D Object Generation from Single Images

Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai

Генерация меньше чем за секунду. Работает даже без GPU. Революция?

Код/веса
Демо

#textto3D

🔥8

2.7K viewsedited 08:51

1.31K views08:51

ComfyUI-Flowty-TripoSR

А вот и нода для ComfyUI.
Говорят, видеопамяти жрет 1.6 GB

#textto3D

🔥12😁6

1.38K views12:32

ResAdapter : Domain Consistent Resolution Adapter for Diffusion Models

Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA

Код

#text2image

👍13

1.42K views06:54

Trajectory Consistency Distillation

Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.

Ускорение инференса при высоком качестве и детальности.

Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma

Код
Демо

#text2image

🔥6

1.47K views07:26

0:09

3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos

На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)

Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду

Код ожидается в июне 2024, но это неточно

#novelveiw #rendering #stabilization #video2video #video2scene #FVV

👍2👏2

1.3K views07:49

0:53