А по этой ссылке дискорд канал Рисуем с Нейросетями с настоящей Midjourney генерацией.
Сколько можно пользоваться бесплатно я еще не понял. Помогают с оплатой подписки.
#text2image #image2image
Сколько можно пользоваться бесплатно я еще не понял. Помогают с оплатой подписки.
#text2image #image2image
Discord
Join the Рисуем с Нейросетями Discord Server!
Check out the Рисуем с Нейросетями community on Discord - hang out with 3263 other members and enjoy free voice and text chat.
Forwarded from НейроПикчи
Художники добились удаления 80 миллионов изображений из обучающих данных Stable Diffusion 3.0
Это примерно 3% от датасета
НейроПикчи / Мемы
Это примерно 3% от датасета
НейроПикчи / Мемы
😁7👎1🤯1
Там придумали ELITE - новый способ дообучения SD по одной фотке меньше чем за секунду.
В репозитории пока пусто, ждем
твит
#stablediffusion #finetuning #text2image #image2image
В репозитории пока пусто, ждем
твит
#stablediffusion #finetuning #text2image #image2image
🔥3
UnClip Image Interpolation
Еще один миксер изображений
Насколько далеко зайдет ваша фантазия в скрещивании картинок?
Ссылок на код не завезли
#image2image
Еще один миксер изображений
Насколько далеко зайдет ваша фантазия в скрещивании картинок?
Ссылок на код не завезли
#image2image
👍1
😭 SadTalker
Генератор говорящей головы по картинке и аудиофайлу.
Авторы планируют сделать генерацию 3D-голов и поделиться интеграцией в automatic1111.
Среди авторов Tencent AI Lab, известная работами в области реставрации фото и прочими разработками.
Код
#audio2video #audio2animation #speech2animation #speech2avatar #image2video #talkinghead #facialanimation
Генератор говорящей головы по картинке и аудиофайлу.
Авторы планируют сделать генерацию 3D-голов и поделиться интеграцией в automatic1111.
Среди авторов Tencent AI Lab, известная работами в области реставрации фото и прочими разработками.
Код
#audio2video #audio2animation #speech2animation #speech2avatar #image2video #talkinghead #facialanimation
🔥2
Forwarded from Технологии | Нейросети | Боты
Израильский стартап D-ID, разработавший ранее технологию Deep Nostalgia, объявил о выходе бета-версии нового веб-приложения chat.D-ID, которое позволяет пользователям общаться с «живым» ИИ.
Продукт совмещает в себе технологию потоковой передачи текста в видео D-ID с чат-ботом ChatGPT от OpenAI, чтобы сделать общение с ИИ более «живым».
Приложение находится в бета тесте, бесплатно, поддерживает только англ язык.
• Попробовать
Продукт совмещает в себе технологию потоковой передачи текста в видео D-ID с чат-ботом ChatGPT от OpenAI, чтобы сделать общение с ИИ более «живым».
Приложение находится в бета тесте, бесплатно, поддерживает только англ язык.
• Попробовать
🔥1
О скором релизе GPT-4
Тут какой-то менеджер в Microsoft Berlin на митапе сказал что на следующей неделе будет анонс модели. Это звучит очень круто и консистентно со слухами. Давайте суммаризируем что мы слышали о модели:
1. Выйдет в феврале (почти)
2. Такой же скачок в числе параметров как и GPT-2 к GPT-3 - trillion is the new billion
3. Sparse, скорее всего MoE (сам не шарю)
4. Такой же скачок в качестве как и GPT-2 к GPT-3
5. Мультимодальность: текст, картинки, аудио
6. На выходе тоже мультимодальность
7. Обучали на 10-20 тысячах A100 в течении нескольких месяцев
8. Длина контекста: 32 тысячи токенов
#nlp #llm
Тут какой-то менеджер в Microsoft Berlin на митапе сказал что на следующей неделе будет анонс модели. Это звучит очень круто и консистентно со слухами. Давайте суммаризируем что мы слышали о модели:
1. Выйдет в феврале (почти)
2. Такой же скачок в числе параметров как и GPT-2 к GPT-3 - trillion is the new billion
3. Sparse, скорее всего MoE (сам не шарю)
4. Такой же скачок в качестве как и GPT-2 к GPT-3
5. Мультимодальность: текст, картинки, аудио
6. На выходе тоже мультимодальность
7. Обучали на 10-20 тысячах A100 в течении нескольких месяцев
8. Длина контекста: 32 тысячи токенов
#nlp #llm
Developer
GPT-4 is coming next week – and it will be multimodal, says Microsoft Germany
The release of GPT-4 is imminent, as Microsoft Germany CTO Andreas Braun mentioned at an AI kickoff event on 9 March 2023.
StableDiffusion теперь можно запустить в браузере на GPU. Никаких танцев с гитхабом и установкой локального сервера (привет автоматик). Хотя, подозреваю, все равно какие-то танцы будут.
Но вроде пока только для Мака.
Но вроде пока только для Мака.
Forwarded from НейроПикчи
Анонсировали 5 версию Midjourney, обещают более высокую детализацию и больше стилей, а как выйдет узнаем уже совсем скоро
Платные подписчики могут оценить результаты
И сейчас в дискорде MJ в канале rating-party люди скидывают, что интересного им попалось
НейроПикчи / Новости
Платные подписчики могут оценить результаты
И сейчас в дискорде MJ в канале rating-party люди скидывают, что интересного им попалось
НейроПикчи / Новости
🔥2
Премьер министр Румынии назначил чат-бота ION своим почетным советником.
Заместитель будет анализировать трафик в соцсетях на предмет выявления наиболее острых тем, которые обсуждают граждане страны, в частности, социальной и политической направленности. Нейросеть будет собирать сведения о настроениях в обществе, проблемах, запросах, потребностях и претензиях.
Заместитель будет анализировать трафик в соцсетях на предмет выявления наиболее острых тем, которые обсуждают граждане страны, в частности, социальной и политической направленности. Нейросеть будет собирать сведения о настроениях в обществе, проблемах, запросах, потребностях и претензиях.
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Video-P2P
Нейросеть для редактирования видео по тексту от Adobe и Гонконгского китайского Университета. Информации мало.
Код обещают позже с намеками на публичный доступ к модели.
[UPDATE]
Код
Демо
#text2video #video2video #videop2p
Нейросеть для редактирования видео по тексту от Adobe и Гонконгского китайского Университета. Информации мало.
Код обещают позже с намеками на публичный доступ к модели.
[UPDATE]
Код
Демо
#text2video #video2video #videop2p
👍1
Media is too big
VIEW IN TELEGRAM
ODISE: Open-vocabulary DIffusion-based panoptic SEgmentation
Сегментатор изображений от NVIDIA и Университета Калифорнии.
Что-то пишут про объединение дискриминаторных и диффузионных генераторов изображений по тексту для неограниченной сегментации. Обычно сегментаторы знают ограниченное количество объектов которые они могут выделить масками на изображении. Судя по всему, ODISE сегментирует все что угодно что попадалось в обучающем датасете генераторов tex2image.
Это похоже на следующий шаг к точной генерации text2image, ведь обычно их обучают на картинках с текстовым описанием, но без сегментных масок. А тут вот скрестили.
Код обещают позже
Зато уже можно потыркать демо
#segmentation #text2image
Сегментатор изображений от NVIDIA и Университета Калифорнии.
Что-то пишут про объединение дискриминаторных и диффузионных генераторов изображений по тексту для неограниченной сегментации. Обычно сегментаторы знают ограниченное количество объектов которые они могут выделить масками на изображении. Судя по всему, ODISE сегментирует все что угодно что попадалось в обучающем датасете генераторов tex2image.
Это похоже на следующий шаг к точной генерации text2image, ведь обычно их обучают на картинках с текстовым описанием, но без сегментных масок. А тут вот скрестили.
Код обещают позже
Зато уже можно потыркать демо
#segmentation #text2image
GigaGAN: Scaling up GANs for Text-to-Image Synthesis
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.
А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный
Кода нет 😢
#gan #text2image #image2image #upscale
GAN'ы возвращаются.
GigaGAN генерирует картинку 512 x 512 за 0.13 секунды, превосходит Stable Diffusion v1.5, DALL·E 2, и Parti-750M по FID (сам не знаю что это). Под капотом миллиард параметров, и работает все это на порядки быстрее авторегрессионных и диффузионных моделей. Ну и конечно, бонусом все прелести непрерывного латентного пространства - красивая анимация без этих всех кипящих фликеров.
А еще волшебный апскейлер!
Смешивание текстовых промптов
Замена грубого стиля на детальный
Кода нет 😢
#gan #text2image #image2image #upscale