Наш подписчик каталогизирует генераторы картинок. Если хотите ему помочь пишите в ему в личку
Telegram
@
https://news.1rj.ru/str/Ability_2112
🔥8👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Говорят, в Bard подключили Gemini Pro (конкурент GPT-4) и генератор картинок Imagen.
Теперь поддерживается русский язык среди 40 других. Но доступ для России так и не дали, дав его почти всем остальным.
#text2image #assistant #VLM
Теперь поддерживается русский язык среди 40 других. Но доступ для России так и не дали, дав его почти всем остальным.
#text2image #assistant #VLM
👍2
Media is too big
VIEW IN TELEGRAM
Опубликован код контроллера движения MotionDirector
Код
Демо
Демо2
Колаб
#video2video #video2motion #motion2video
Код
Демо
Демо2
Колаб
#video2video #video2motion #motion2video
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
One-shot Talking Face Generation from Single-speaker Audio-Visual Correlation Learning
Генератор говорящей головы из картинки и аудиофайла
Код
Демо
Колаб
#talkinghead
Генератор говорящей головы из картинки и аудиофайла
Код
Демо
Колаб
#talkinghead
👍7
This media is not supported in your browser
VIEW IN TELEGRAM
На некоммерческом GPU-кластере от camenduru в качестве альфа-теста временно доступен видеогенератор SVD. Рядом такой же бесплатный SD с тремя анимешными чекпойнитами. Пользуйтесь
Сгенерировать изображение в SD
Сгенерировать видео в SVD
#text2image #image2video
Сгенерировать изображение в SD
Сгенерировать видео в SVD
#text2image #image2video
👍4
Find Your Twins
Здесь можете залить свое фото и поискать своего двойника в датасете Face Aging Dataset
#image2image #twin
Здесь можете залить свое фото и поискать своего двойника в датасете Face Aging Dataset
#image2image #twin
👎6👍2
This media is not supported in your browser
VIEW IN TELEGRAM
AnimateLCM: Accelerating the Animation of Personalized Diffusion Models and Adapters with Decoupled Consistency Learning
Ускорение генерации видео, вдохновлённое LCM, за счет сокращения количества шагов
Гитхаб
Модель
Civitai
Демо
Демо2
Колаб
#text2video #image2video
Ускорение генерации видео, вдохновлённое LCM, за счет сокращения количества шагов
Гитхаб
Модель
Civitai
Демо
Демо2
Колаб
#text2video #image2video
🔥2
RPG-DiffusionMaster Extension for Stable Diffusion WebUI
Расширение RPG-DiffusionMaster для A1111.
Го тестить
#text2image #extension
Расширение RPG-DiffusionMaster для A1111.
Го тестить
#text2image #extension
👍4
Auto 1111 SDK: Stable Diffusion Python library
Легкая библиотека на Python для запуска SD.
Может быть полезно тем, у кого нет своей приличной видеокарты. Потому что есть колаб ноутбук. Он без web-ui, поэтому нет опасений что гугл его забанит.
Ноутбук быстрый, первые результаты вы можете получить уже через несколько минут после запуска
В колабе реализовано
- Оригинальные режимы txt2img и img2img
- апскейл
- Outpainting
- Inpainting
Разработчики планируют добавлять поддержку Lora, SDXL, Controlnet и т д
Гитхаб
Колаб
#text2image #image2image #inpainting #outpainting #upscale #stablediffusion
Легкая библиотека на Python для запуска SD.
Может быть полезно тем, у кого нет своей приличной видеокарты. Потому что есть колаб ноутбук. Он без web-ui, поэтому нет опасений что гугл его забанит.
Ноутбук быстрый, первые результаты вы можете получить уже через несколько минут после запуска
В колабе реализовано
- Оригинальные режимы txt2img и img2img
- апскейл
- Outpainting
- Inpainting
Разработчики планируют добавлять поддержку Lora, SDXL, Controlnet и т д
Гитхаб
Колаб
#text2image #image2image #inpainting #outpainting #upscale #stablediffusion
GitHub
GitHub - Auto1111SDK/Auto1111SDK: An SDK/Python library for Automatic 1111 to run state-of-the-art diffusion models
An SDK/Python library for Automatic 1111 to run state-of-the-art diffusion models - Auto1111SDK/Auto1111SDK
👍7❤1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Houdini + Stable Diffusion
Принес годноты для CG-взрослых.
Симуляция в Гудини, нейрорендер в Stable Diffusion (Комфи+КонтролНет).
В Гудини генерятся частицы, маска и глубина, потом все это забирается в Stable Diffusion и кормится в ControlNet и Animatediff.
Вот такой нейрорендер нам нужен!
Более того, держите:
Подробный тутор, где все это расписано.
Канал этого удивительного чувака, который скрещивает 3Д и нейрорендеринг.
И клондайк из разных полезных постов для тех, кто в кино и VFX.
Enjoy CG-Bros.
P.S. Представьте, лукдев теперь это текстовый промпт и выбор чекпойнта (утрирую, конечно).
Принес годноты для CG-взрослых.
Симуляция в Гудини, нейрорендер в Stable Diffusion (Комфи+КонтролНет).
В Гудини генерятся частицы, маска и глубина, потом все это забирается в Stable Diffusion и кормится в ControlNet и Animatediff.
Вот такой нейрорендер нам нужен!
Более того, держите:
Подробный тутор, где все это расписано.
Канал этого удивительного чувака, который скрещивает 3Д и нейрорендеринг.
И клондайк из разных полезных постов для тех, кто в кино и VFX.
Enjoy CG-Bros.
P.S. Представьте, лукдев теперь это текстовый промпт и выбор чекпойнта (утрирую, конечно).
❤21👍7
This media is not supported in your browser
VIEW IN TELEGRAM
Dashtoon Studio
Онлайн студия для генерации комиксов по эксизам с консистентностью персонажей.
Есть туториалы и галерея комиксов. Платных тарифов не вижу, картинки генерятся.
#text2image #sketch2image
Онлайн студия для генерации комиксов по эксизам с консистентностью персонажей.
Есть туториалы и галерея комиксов. Платных тарифов не вижу, картинки генерятся.
#text2image #sketch2image
🔥15❤1
Stable Diffusion WebUI Forge
Облегченный и ускоренный StableDiffusion для слабого железа от автора ControlNet.
Попробую на 1060 6GB
[update] отлично работает, 12 секунд на картинку 512*512, 20 шагов
Гитхаб
cборка для установки в один клик
#tools #stablediffusion
Облегченный и ускоренный StableDiffusion для слабого железа от автора ControlNet.
Попробую на 1060 6GB
[update] отлично работает, 12 секунд на картинку 512*512, 20 шагов
Гитхаб
cборка для установки в один клик
#tools #stablediffusion
👍22👀2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
MGIE: Guiding Instruction-based Image Editing via Multimodal Large Language Models
Что? нет. Или да.
Фоткаем, просим LLM что-нибудь поменять на фото.
Все это на айфоне.
Apple поделились кодом. Объясните кто-нибудь, какой толк на айфоне от кода на питоне?
Код
Демо
#MLLM #VLM #mobile #image2image #inpainting
Что? нет. Или да.
Фоткаем, просим LLM что-нибудь поменять на фото.
Все это на айфоне.
Apple поделились кодом. Объясните кто-нибудь, какой толк на айфоне от кода на питоне?
Код
Демо
#MLLM #VLM #mobile #image2image #inpainting
😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
MetaVoice-1B
Обновлен высококачественный клонировщик голоса
- 1.2B параметров
- Обучен на 100 тысячах часов речи-текста
- Синтез коротких и длинных разговоров
- Генерация эмоциональной речи на английском
- клонирование голоса по 30-секундному образцу
- файнтюнинг под другие языки
- Лицензия Apache 2.0
Гитхаб
Демо
#text2speech #speech2text
Обновлен высококачественный клонировщик голоса
- 1.2B параметров
- Обучен на 100 тысячах часов речи-текста
- Синтез коротких и длинных разговоров
- Генерация эмоциональной речи на английском
- клонирование голоса по 30-секундному образцу
- файнтюнинг под другие языки
- Лицензия Apache 2.0
Гитхаб
Демо
#text2speech #speech2text
👌5🔥3👍1
BRIA-RMBG-1.4
Новый лидер в удалении фона с картинок от bria.ai
Код
Демо
#image2image #backgroundremoval
Новый лидер в удалении фона с картинок от bria.ai
Код
Демо
#image2image #backgroundremoval
👍8👎2
SegMoE: Segmind Mixture of Diffusion Experts
"Совет экспертов" для генерации картинок. По принципу совета экспертов в LLM. На ютубе есть пояснительное видео для тех, кто, как и я, не понял как оно работает.
Код
ComfyUI
#text2image
"Совет экспертов" для генерации картинок. По принципу совета экспертов в LLM. На ютубе есть пояснительное видео для тех, кто, как и я, не понял как оно работает.
Код
ComfyUI
#text2image
👍5🔥3❤1
Forwarded from эйай ньюз
Hardware EM @ Apple ⮕ Head of Hardware @ Midjourney
Давно не обсуждали Midjourney. В твиттере пробежал слух, что мол Midjourney переманила к себе одного из сеньерных чуваков, который возглавлял хардварную команду в Apple, работавшей над Vision Pro.
Я его нашел на линкедине (имя писать не стану), и чел не только работал над Vision Pro, так он еще и у Маска в Neuralink был Member Of Technical Staff по хардвару. То есть парень очень опытный. И вот теперь он стал Head of Hardware в Midjourney.
Интересно, какого рода девайс затевают в Midjourney? Это может быть как что-то вроде VR очков с полностью генерируемым контентом, так и какой-то wearable device, который стримит вам диффузионный контент прямо в мозг🤯 (шутка).
@ai_newz
Давно не обсуждали Midjourney. В твиттере пробежал слух, что мол Midjourney переманила к себе одного из сеньерных чуваков, который возглавлял хардварную команду в Apple, работавшей над Vision Pro.
Я его нашел на линкедине (имя писать не стану), и чел не только работал над Vision Pro, так он еще и у Маска в Neuralink был Member Of Technical Staff по хардвару. То есть парень очень опытный. И вот теперь он стал Head of Hardware в Midjourney.
Интересно, какого рода девайс затевают в Midjourney? Это может быть как что-то вроде VR очков с полностью генерируемым контентом, так и какой-то wearable device, который стримит вам диффузионный контент прямо в мозг
@ai_newz
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4
Forwarded from addmeto (Grigory Bakunov)
А вот вам интересный скандальчик: в Нью-Хемпшире обзванивали людей по телефону и голосом Байдена уговаривали не голосовать. В день обзванивалось от 5 до 25 тысяч человек, делалось это с помощью text-to-speech синтеза от крутых ребят из ElevenLabs. Разумеется, елевенлабз ни при чем, они просто инструмент сделали. Но расследование говорит, что сделано это было небольшой компанией Life Corporation. Ее владельцем является Вальтер Монк, он же является владельцем другой компании, Voice Broadcasting, главная специализация которой — телефонные обзвоны для политиков.
Короче, если не посадят — получилось отличное демо технологии и хорошая реклама компании. И я не понимаю, почему в других странах почти не используют обзвоны перед выборами.
https://edition.cnn.com/2024/02/06/tech/nh-ag-robocall-update
Короче, если не посадят — получилось отличное демо технологии и хорошая реклама компании. И я не понимаю, почему в других странах почти не используют обзвоны перед выборами.
https://edition.cnn.com/2024/02/06/tech/nh-ag-robocall-update
CNN
Fake Biden robocall linked to Texas-based companies, New Hampshire attorney general announces
A robocall that used an AI voice resembling President Joe Biden’s to advise New Hampshire voters against voting in the state’s presidential primary has been linked to a pair of Texas-based telecommunications companies, the state’s attorney general announced…
🤯3👍2