Forwarded from Сиолошная
This media is not supported in your browser
VIEW IN TELEGRAM
Помните я писал про секретный анонс фичи Gemini, который никто не продвигал, был лишь один ролик? Вот тут: https://news.1rj.ru/str/seeallochnaya/911, суть в том, что под каждый запрос LLM генерирует код интерфейса, в котором нужно показывать пользователю ответ, а затем уже его наполняет.
Vercel, компания, предоставляющая облачный сервис для развёртывания сайтов, обновила AI SDK до версии 3.0, добавив туда такую фичу. Формочки на демо не предзапрограммированны, а создаются на лету и могут содержать любой контент в любой форме. Думаю, что через пару лет такая персонализация будет широко распространена — особенно с учётом количества пользователей, на которых можно запускать A/B тесты и оптимизировать интерфейс до мельчайших деталей.И главное программисты, перекрашивающие годами две кнопки, будут не нужны!
Vercel, компания, предоставляющая облачный сервис для развёртывания сайтов, обновила AI SDK до версии 3.0, добавив туда такую фичу. Формочки на демо не предзапрограммированны, а создаются на лету и могут содержать любой контент в любой форме. Думаю, что через пару лет такая персонализация будет широко распространена — особенно с учётом количества пользователей, на которых можно запускать A/B тесты и оптимизировать интерфейс до мельчайших деталей.
🔥2🤔1
Anthropic релизнули Claude 3, в трех вариантах - Opus, Sonnet и Haiku. Opus и Sonnet доступны уже сейчас, а Haiku - в ближайшие недели. Для россиян все еще по VPN
По цифрам на приборах обходит GPT-4.
Теперь ему можно скармливать картинки.
Контекст 200k токенов
Попробовать Claude 3 Sonnet (включайте VPN)
#news #assistant #vlm
По цифрам на приборах обходит GPT-4.
Теперь ему можно скармливать картинки.
Контекст 200k токенов
Попробовать Claude 3 Sonnet (включайте VPN)
#news #assistant #vlm
👍11
Stability.ai опубликовали пейпер Stable Diffusion 3
Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту
Блог
Пейпер
#news #SD
Заявлено превосходство над Dalle3, Midjourney v6, ideogram v1 по части генерации текста и следования промпту
Блог
Пейпер
#news #SD
🔥9👍1😁1
Auto 1111 SDK: Stable Diffusion Python library
В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.
Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта
Колаб
#tools #coding
В этой легкой библиотеке на питоне реализован основной функционал Automatic1111 web-ui. Сегодня добавили поддержку ControlNet.
Полагаю, теперь вам проще будет кодить #SD бэкенды для вашего любимого софта
Колаб
#tools #coding
👍7
TripoSR: Fast 3D Object Generation from Single Images
Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai
Генерация меньше чем за секунду. Работает даже без GPU. Революция?
Код/веса
Демо
#textto3D
Быстрый легкий и качественный генератор 3D по одному изображению от Stability.ai и Tripo ai
Генерация меньше чем за секунду. Работает даже без GPU. Революция?
Код/веса
Демо
#textto3D
🔥8
ResAdapter : Domain Consistent Resolution Adapter for Diffusion Models
Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA
Код
#text2image
Адаптер для генерации изображений любого неродного для модели разрешения. Позволяет генерировать так, будто модель обучена на заданном разрешении.
Совместим с ControlNet, IP-Adapter and LCM-LoRA
Код
#text2image
👍13
Trajectory Consistency Distillation
Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.
Ускорение инференса при высоком качестве и детальности.
Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma
Код
Демо
#text2image
Кажется что количество усовершенствований, которые можно придумать для диффузных генераторов изображений бесконечно. Вот еще одно.
Ускорение инференса при высоком качестве и детальности.
Превосходит LCM в том и другом. Работает с IPadapter, LoRa, Controlnet
Для уровня детализации есть специальный гиперпараметр gamma
Код
Демо
#text2image
🔥6
3DGStream: On-the-Fly Training of 3D Gaussians for Efficient Streaming of Photo-Realistic Free-Viewpoint Videos
На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)
Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду
Код ожидается в июне 2024, но это неточно
#novelveiw #rendering #stabilization #video2video #video2scene #FVV
На входе мультикамерное видео, на выходе - видео с любого ракурса. Конкурент HyperReel и 4D Gaussian Splatting for Real-Time Dynamic Scene Rendering в создании Free-Viewpoint Videos (FVV)
Обучается (для одного кадра?...) за 12 секунд. Рендерит 200 кадров в секунду
Код ожидается в июне 2024, но это неточно
#novelveiw #rendering #stabilization #video2video #video2scene #FVV
👍2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
AtomoVideo:High Fidelity Image-to-Video Generation
Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет
#image2video
Генератор видео по картинке с претензией на высокое качество. По начеррипиканным сравнениям движение лучше чем у конкурентов. С Sora они себя, естественно, не сравнивают. О доступе ничего неизвестно. Кода нет
#image2video
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
ViewDiff: 3D-Consistent Image Generation with Text-to-Image Models
Консистентная генерация изображения с разных ракурсов
Код
#text2image #consistency #multiview
Консистентная генерация изображения с разных ракурсов
Код
#text2image #consistency #multiview
👍5
SMPLer-X: Scaling Up Expressive Human Pose and Shape Estimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
Определение 3D позы по одному ракурсу
Код
Демо
#image2pose #video2pose #poseestimation
🔥4👍2
Media is too big
VIEW IN TELEGRAM
VastGaussian: Vast 3D Gaussians for Large Scene Reconstruction
Реконструкция больших сцен гауссианами. Бьет всех конкурентов, с которыми решил померяться . Рендерит в реальном времени. Под капотом дробление сцены на ячейки.
Код ждем
#gaussian #rendering #nivelview #realtime
Реконструкция больших сцен гауссианами. Бьет всех конкурентов
Код ждем
#gaussian #rendering #nivelview #realtime
👍9🔥5😱1
This media is not supported in your browser
VIEW IN TELEGRAM
ComfyUI_NetDist
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
Запуск ComfyUI на нескольких локальных видеокартах/сетевых машинах.
У кого-то праздник сегодня.
#tools #SD
👏13🔥10👍1