Kandinsky 3D
Генерилка текстурированных 3D моделей по тексту от Сбера.
По текстовому описанию выдает 4 варианта модели с разным сидом на выбор
Обещают сделать генерацию по изображению, расширенные настройки генерации, инструменты упрощения и оптимизации 3D-модели.
#тестбендера по текстовому описанию картинки из JoyCaption Beta One провален с первой попытки - нарисовал что-то совсем непохожее. Со второй - на твердую троечку
Сетку оцените сами
Попробовать - нужен Sber ID, но это фигня, при каждом запросе придется писать капчу. Короче, Сбер опять отличился. Но похоже что других ограничений нет.
API
#textto3D
Генерилка текстурированных 3D моделей по тексту от Сбера.
По текстовому описанию выдает 4 варианта модели с разным сидом на выбор
Обещают сделать генерацию по изображению, расширенные настройки генерации, инструменты упрощения и оптимизации 3D-модели.
#тестбендера по текстовому описанию картинки из JoyCaption Beta One провален с первой попытки - нарисовал что-то совсем непохожее. Со второй - на твердую троечку
Сетку оцените сами
Попробовать - нужен Sber ID, но это фигня, при каждом запросе придется писать капчу. Короче, Сбер опять отличился. Но похоже что других ограничений нет.
API
#textto3D
🥴13👍4👎4🤔2😁1
Альтман опять что-то спойлерит, неизвестно что.
Делаем ставки
👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение
#news
Делаем ставки
👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение
#news
👎42🤔4👍3
Установил вчера VACE в Pinokio
Он там лежит в Community Scripts.
Ждал пару часов пока все скачается - засрал 75Гб сразу
Потом ждал пару часов пока обработается
Потом читал мануал, все стало еще непонятнее
Потом потыкал препроцессоры
Потом лег спать
И вот наконец, наутро мне нечего показать
Кто понял что там нажимать чтобы заменить лицо на видео?
Он там лежит в Community Scripts.
Ждал пару часов пока все скачается - засрал 75Гб сразу
Потом ждал пару часов пока обработается
Потом читал мануал, все стало еще непонятнее
Потом потыкал препроцессоры
Потом лег спать
И вот наконец, наутро мне нечего показать
Кто понял что там нажимать чтобы заменить лицо на видео?
😁8👍7🔥2
Stable Scripts UI (SSUI)
Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.
Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать
- Простота использования
- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.
- Управляемость моделями и конфигурациями
- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.
- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.
Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux
#text2image #tools #GUI
Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.
Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать
- Простота использования
- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.
- Управляемость моделями и конфигурациями
- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.
- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.
Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux
#text2image #tools #GUI
👍12🤷♂2
Stable Audio Open Small
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM
До 11 секунд 44.1kHz стерео по тексту локально на мобилках
Веса
Гитхаб
#news #mobile #text2audio
🤔2👍1👏1
Media is too big
VIEW IN TELEGRAM
MoviiGen 1.1
Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.
720P и 1080P
Должно работать с любым родным Wan 2.1 t2v вокрфлоу
есть GGUF
#text2video
Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.
720P и 1080P
Должно работать с любым родным Wan 2.1 t2v вокрфлоу
есть GGUF
#text2video
👍18👏3🔥2❤1
Hunyuan Image 2.0
Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.
Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.
Вообще выглядит впечатляюще
#text2image #realtime #imageediting
Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.
Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.
Вообще выглядит впечатляюще
#text2image #realtime #imageediting
👍10❤7
Нейронавт | Нейросети в творчестве
Hunyuan Image 2.0 Tencent выкатил генератор картинок 2.0 Генерит мгновенно! Высокая реалистичность. Dual-Canvas Studio - редактор с холстом позволяет смешивать слои. Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда…
Короче, надо ткнуть в 1, потом в 2, потом нажать кнопку 3, появится всплывающее окошко и надо успеть ткнуть в нем на кнопку, она почему-то сразу исчезает, тогда появится сообщение что мол ждите приглашение на почту
А мой кот был из старой версии, получается
А мой кот был из старой версии, получается
🔥6😁2👍1👌1
Нейронавт | Нейросети в творчестве
Hunyuan Image 2.0 Tencent выкатил генератор картинок 2.0 Генерит мгновенно! Высокая реалистичность. Dual-Canvas Studio - редактор с холстом позволяет смешивать слои. Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда…
This media is not supported in your browser
VIEW IN TELEGRAM
так видимо выглядит работа с холстом
🔥11👍2
BLIP3-o
Мультимодальная модель от Salesforce. Сочетает в себе авторегрессионную силу рассуждений и инструкций с генеративной силой диффузионных моделей. Есть 4B и 8B параметров
Понимает картинки и умеет отвечать на вопросы как минимум
Демо
Код
Веса
#multimodal #image2text #instruct
Мультимодальная модель от Salesforce. Сочетает в себе авторегрессионную силу рассуждений и инструкций с генеративной силой диффузионных моделей. Есть 4B и 8B параметров
Понимает картинки и умеет отвечать на вопросы как минимум
Демо
Код
Веса
#multimodal #image2text #instruct
🔥7❤1
This media is not supported in your browser
VIEW IN TELEGRAM
LightLab: Controlling Light Sources in Images with Diffusion Models
Гугл в соавторстве создали модель для управления видимыми источниками света на изображениях. Увы кода нет. На сайте проекта можно интерактивно потыкать картинки
#relighting
Гугл в соавторстве создали модель для управления видимыми источниками света на изображениях. Увы кода нет. На сайте проекта можно интерактивно потыкать картинки
#relighting
👍11❤1🔥1