HAHA: Highly Articulated Gaussian Human Avatars with Textured Mesh Prior
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
Легкие рилтаймовые фотореалистичные аватары все ближе. Вот еще один проект управляемых аватаров на гауссианах. Вернее, тут гибрид гауссиан и текстурированной геометрии. Обучается на одноракукрсном видео
Код
#humanavatar #gaussiuan
❤7🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MuseV
Анимация картинок, аватары.
Совместим с LoRa, ControlNet, другими адаптерами
Демо
Гитхаб
#image2video #video2video #personalization
Анимация картинок, аватары.
Совместим с LoRa, ControlNet, другими адаптерами
Демо
Гитхаб
#image2video #video2video #personalization
👍7❤4
This media is not supported in your browser
VIEW IN TELEGRAM
C4AI Command R+
Мощная языковая модель на 104B параметров. Умеет в рассуждения, суммаризацию, ответы на вопросы и другое
Демо
Код/веса
#llm #assistant #chatbot #summary
Мощная языковая модель на 104B параметров. Умеет в рассуждения, суммаризацию, ответы на вопросы и другое
Демо
Код/веса
#llm #assistant #chatbot #summary
🔥5
SSR-Encoder: Encoding Selective Subject Representation for Subject-Driven Generation
Генерация изоюражения по образцу, в том числе нескольких разных объектов. Применимо также и к видео.
Код
#conditioning #text2image #image2image #personalization
Генерация изоюражения по образцу, в том числе нескольких разных объектов. Применимо также и к видео.
Код
#conditioning #text2image #image2image #personalization
🔥3👌1
This media is not supported in your browser
VIEW IN TELEGRAM
Face-to-All
Генерация портретов по образцу персонажа. Персонализация, иначе говоря. Вдохновлено face-to-many
#personalization @image2image #text2image #stylization
Генерация портретов по образцу персонажа. Персонализация, иначе говоря. Вдохновлено face-to-many
#personalization @image2image #text2image #stylization
🔥4👎1
StreamingT2V:Consistent, Dynamic, and Extendable Long Video Generation from Text
Плагин к видеогенераторам для генерации ооочень длинных видео (80, 240, 600, 1200 кадров и больше) с плавными переходами.
Код
Демо
#adapter #text2video
Плагин к видеогенераторам для генерации ооочень длинных видео (80, 240, 600, 1200 кадров и больше) с плавными переходами.
Код
Демо
#adapter #text2video
👍5👎1
VAR: Image Generation via Next-Scale Prediction
Новый пошаговый метод генерации изображений от Bytedance при помощи GPT. В отличие от медленной диффузии, тут на каждом шаге предсказывается увеличение масштаба изображения, получается шустро.
Гитхаб
Веса
Демо
#next2image
Новый пошаговый метод генерации изображений от Bytedance при помощи GPT. В отличие от медленной диффузии, тут на каждом шаге предсказывается увеличение масштаба изображения, получается шустро.
Гитхаб
Веса
Демо
#next2image
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
FeatUp: A Model-Agnostic Framework for Features at Any Resolution
Метод повышения разрешения визуальных моделей. Например, сегментаторов, генераторов технических карт (глубины, нормалей). Не подходит для генераторов изображений по тексту.
Еще раз поясню, это не апскейлер, а расширение, позволяющее моделям #image2image выдавать результат бОльшего разрешения
Код
Демо
Колаб
#enhance #plugin
Метод повышения разрешения визуальных моделей. Например, сегментаторов, генераторов технических карт (глубины, нормалей). Не подходит для генераторов изображений по тексту.
Еще раз поясню, это не апскейлер, а расширение, позволяющее моделям #image2image выдавать результат бОльшего разрешения
Код
Демо
Колаб
#enhance #plugin
❤3👍1
Нейронавт | Нейросети в творчестве
Open-Sora:Sora Replication Solution with 46% Cost Reduction, Sequence Expansion to Nearly a Million Помните когда появилась Dall-E 2, были попытки воспроизвести ее в опенсорсе? Настало время опенсорсной Sora. Веса частично основаны на PixArt-α. 724M параметров.…
This media is not supported in your browser
VIEW IN TELEGRAM
Open-Sora-Plan v1.0.0
Еще одна халявная Sora. До 1024*1024, до 10 секунд, 24 fps
Гитхаб
Демо
Демо2
Демо3
Колаб
#text2video
Еще одна халявная Sora. До 1024*1024, до 10 секунд, 24 fps
Гитхаб
Демо
Демо2
Демо3
Колаб
#text2video
👌7👍2❤1
Euler Smea Dyn Sampler
Сэмплер для корректной генерации рук, в том числе и на больших разрешениях
Гитхаб
ComfyUI
#text2image
Сэмплер для корректной генерации рук, в том числе и на больших разрешениях
Гитхаб
ComfyUI
#text2image
👍5❤1
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following
Точное следование промпту при генерации изображения по тексту. Достигается через семантическую панель. Разработка Alibaba.
Код
#plugin #text2image
Точное следование промпту при генерации изображения по тексту. Достигается через семантическую панель. Разработка Alibaba.
Код
#plugin #text2image
👍7❤2
This media is not supported in your browser
VIEW IN TELEGRAM
У Krea.ai обновка - мультикартиночный промт. Можно смешивать до трех картинок, да еще и в реальном времени
Попробовать
#realtime #image2image #conditioning
Попробовать
#realtime #image2image #conditioning
🔥8🤯3
Opera Software представила функцию в Opera One, позволяющую загружать и использовать большие языковые модели (LLM) локально.
Чтобы получить доступ к фиче, установите последнюю версию Opera One ( windows | mac ) и выполните следующее:
1️⃣ Откройте боковую панель Aria Chat (понадобится аккаунт Opera)
В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
2️⃣ Нажмите “Перейти к настройкам”
Здесь вы можете выполнить поиск и выбрать, какие модели вы хотите загрузить. Загрузите, например, GEMMA: 2B-INSTRUCT-Q4_K_M, одну из небольших и быстрых моделей, нажав на кнопку загрузки справа
3️⃣ После завершения загрузки нажмите кнопку меню в левом верхнем углу и запустите новый чат
4️⃣ В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
5️⃣ Выберите модель, которую вы только что загрузили
6️⃣ Вуаля, пользуйтесь
#news #LLM #tools
Чтобы получить доступ к фиче, установите последнюю версию Opera One ( windows | mac ) и выполните следующее:
В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
Здесь вы можете выполнить поиск и выбрать, какие модели вы хотите загрузить. Загрузите, например, GEMMA: 2B-INSTRUCT-Q4_K_M, одну из небольших и быстрых моделей, нажав на кнопку загрузки справа
#news #LLM #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Google научил Gemini 1.5 Pro понимать аудио.
• Распознает слова, тон, эмоции и т д
• Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео
• Выжимка подкастов, лекций и т д
• До 11 часов аудио за раз
• Добавили режим JSON и открыли API без листа ожидания
Попробовать (включайте VPN)
#audio2text #speech2text #assistant
• Распознает слова, тон, эмоции и т д
• Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео
• Выжимка подкастов, лекций и т д
• До 11 часов аудио за раз
• Добавили режим JSON и открыли API без листа ожидания
Попробовать (включайте VPN)
#audio2text #speech2text #assistant
👍11🤯2🔥1