This media is not supported in your browser
VIEW IN TELEGRAM
FeatUp: A Model-Agnostic Framework for Features at Any Resolution
Метод повышения разрешения визуальных моделей. Например, сегментаторов, генераторов технических карт (глубины, нормалей). Не подходит для генераторов изображений по тексту.
Еще раз поясню, это не апскейлер, а расширение, позволяющее моделям #image2image выдавать результат бОльшего разрешения
Код
Демо
Колаб
#enhance #plugin
Метод повышения разрешения визуальных моделей. Например, сегментаторов, генераторов технических карт (глубины, нормалей). Не подходит для генераторов изображений по тексту.
Еще раз поясню, это не апскейлер, а расширение, позволяющее моделям #image2image выдавать результат бОльшего разрешения
Код
Демо
Колаб
#enhance #plugin
❤3👍1
Нейронавт | Нейросети в творчестве
Open-Sora:Sora Replication Solution with 46% Cost Reduction, Sequence Expansion to Nearly a Million Помните когда появилась Dall-E 2, были попытки воспроизвести ее в опенсорсе? Настало время опенсорсной Sora. Веса частично основаны на PixArt-α. 724M параметров.…
This media is not supported in your browser
VIEW IN TELEGRAM
Open-Sora-Plan v1.0.0
Еще одна халявная Sora. До 1024*1024, до 10 секунд, 24 fps
Гитхаб
Демо
Демо2
Демо3
Колаб
#text2video
Еще одна халявная Sora. До 1024*1024, до 10 секунд, 24 fps
Гитхаб
Демо
Демо2
Демо3
Колаб
#text2video
👌7👍2❤1
Euler Smea Dyn Sampler
Сэмплер для корректной генерации рук, в том числе и на больших разрешениях
Гитхаб
ComfyUI
#text2image
Сэмплер для корректной генерации рук, в том числе и на больших разрешениях
Гитхаб
ComfyUI
#text2image
👍5❤1
Ranni: Taming Text-to-Image Diffusion for Accurate Instruction Following
Точное следование промпту при генерации изображения по тексту. Достигается через семантическую панель. Разработка Alibaba.
Код
#plugin #text2image
Точное следование промпту при генерации изображения по тексту. Достигается через семантическую панель. Разработка Alibaba.
Код
#plugin #text2image
👍7❤2
This media is not supported in your browser
VIEW IN TELEGRAM
У Krea.ai обновка - мультикартиночный промт. Можно смешивать до трех картинок, да еще и в реальном времени
Попробовать
#realtime #image2image #conditioning
Попробовать
#realtime #image2image #conditioning
🔥8🤯3
Opera Software представила функцию в Opera One, позволяющую загружать и использовать большие языковые модели (LLM) локально.
Чтобы получить доступ к фиче, установите последнюю версию Opera One ( windows | mac ) и выполните следующее:
1️⃣ Откройте боковую панель Aria Chat (понадобится аккаунт Opera)
В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
2️⃣ Нажмите “Перейти к настройкам”
Здесь вы можете выполнить поиск и выбрать, какие модели вы хотите загрузить. Загрузите, например, GEMMA: 2B-INSTRUCT-Q4_K_M, одну из небольших и быстрых моделей, нажав на кнопку загрузки справа
3️⃣ После завершения загрузки нажмите кнопку меню в левом верхнем углу и запустите новый чат
4️⃣ В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
5️⃣ Выберите модель, которую вы только что загрузили
6️⃣ Вуаля, пользуйтесь
#news #LLM #tools
Чтобы получить доступ к фиче, установите последнюю версию Opera One ( windows | mac ) и выполните следующее:
В верхней части чата появится выпадающее меню с надписью “Выбрать локальный режим”.
Здесь вы можете выполнить поиск и выбрать, какие модели вы хотите загрузить. Загрузите, например, GEMMA: 2B-INSTRUCT-Q4_K_M, одну из небольших и быстрых моделей, нажав на кнопку загрузки справа
#news #LLM #tools
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Google научил Gemini 1.5 Pro понимать аудио.
• Распознает слова, тон, эмоции и т д
• Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео
• Выжимка подкастов, лекций и т д
• До 11 часов аудио за раз
• Добавили режим JSON и открыли API без листа ожидания
Попробовать (включайте VPN)
#audio2text #speech2text #assistant
• Распознает слова, тон, эмоции и т д
• Можно скинуть лекцию и получить викторину по содержанию за пару секунд, как на видео
• Выжимка подкастов, лекций и т д
• До 11 часов аудио за раз
• Добавили режим JSON и открыли API без листа ожидания
Попробовать (включайте VPN)
#audio2text #speech2text #assistant
👍11🤯2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
LEGaussians: Language Embedded 3D Gaussians for Open-Vocabulary Scene Understanding
Гауссианы с открытым словарным запасом для понимания сцен
Код
#gaussian #NOVELVIEW #RENDERING
Гауссианы с открытым словарным запасом для понимания сцен
Код
#gaussian #NOVELVIEW #RENDERING
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
CameraCtrl: Enabling Camera Control for Text-to-Video Generation
Контроль камеры на генерации видео
Код
#text2video #conditioning
Контроль камеры на генерации видео
Код
#text2video #conditioning
❤1👍1
AiOS: All-in-One-Stage Expressive Human Pose and Shape Estimation
Реконструкция позы и формы человеков, работает с одним персонажем и с группами.
Код ждем
Демо ждем
#video2pose #videoto3D
Реконструкция позы и формы человеков, работает с одним персонажем и с группами.
Код ждем
Демо ждем
#video2pose #videoto3D
❤8🥴2🔥1
Обновился Resemble AI
Теперь он умеет за 1 минуту клонировать голос по 10-секундному отрывку с сохранением акцента.
Кроме английского есть португальский и французский. Русского нет. Ну и естественно есть библиотека голосов если вам надо озвучить текст.
Бесплатно можно склонировать 1 голос, остальные фичи - 300 секунд в месяц
Попробовать
#text2speech #speech2speech #voicecloning
Теперь он умеет за 1 минуту клонировать голос по 10-секундному отрывку с сохранением акцента.
Кроме английского есть португальский и французский. Русского нет. Ну и естественно есть библиотека голосов если вам надо озвучить текст.
Бесплатно можно склонировать 1 голос, остальные фичи - 300 секунд в месяц
Попробовать
#text2speech #speech2speech #voicecloning
❤3
CosXL
Тихой сапой Stability AI опубликовали экспериментальную SD модель.
CosXL Состоит из двух моделей.
Базовая это SDXL, но с возможностью генерить картинки в полном спектре цветовой гаммы (от полностью чёрного до ярко белого). И дополнительная Edit для смены стиля изображения на основе референсной картинки и текстового промпта.
Huggingface
#text2image
Тихой сапой Stability AI опубликовали экспериментальную SD модель.
CosXL Состоит из двух моделей.
Базовая это SDXL, но с возможностью генерить картинки в полном спектре цветовой гаммы (от полностью чёрного до ярко белого). И дополнительная Edit для смены стиля изображения на основе референсной картинки и текстового промпта.
Huggingface
#text2image
❤14