Нейронавт | Нейросети в творчестве
Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer Генератор картинок по тексту от Nvidia и компании. Может эффективно генерировать изображения с разрешением до 4096 × 4096. Из фишек - скорость даже на GPU ноутбука, четкое…
У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
И демка которая возможно проживет несколько дней
F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5
Гитхаб
Демо спасибо за наводку @p0lygon
#news #text2image
😁8
Arch-Guard
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
От взлома языковых моделей защищаются всерьез.
Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.
Война технологий продолжается
#news #jailbreak
huggingface.co
katanemo/Arch-Guard · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
😁3👀3
This media is not supported in your browser
VIEW IN TELEGRAM
Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе
#humor #news
#humor #news
😁42🎃4😭3
Нейронавт | Нейросети в творчестве
У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой. И демка которая возможно проживет несколько дней F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 Гитхаб Демо спасибо за наводку @p0lygon #news #text2image
Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения
#news
#news
❤13
Stable Diffusion 3.5
Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.
Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября
Уже поддерживается в ComfyUI
Модель HF
Гитхаб
Демо HF
API
Replicate
#text2image #news
Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.
Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября
Уже поддерживается в ComfyUI
Модель HF
Гитхаб
Демо HF
API
Replicate
#text2image #news
🔥12👀1
Итак, кастомизация SD3.5
Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM
Официальный гайд
готовые лоры:
раз
два
три
———————————
Примеры ComfyUI
———————————
SD3.5-fp8 (пожатая модель)
Спионерил у @SergeyTsyptsyn
#lora #text2image #comfyui #finetuning
Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM
Официальный гайд
готовые лоры:
раз
два
три
———————————
Примеры ComfyUI
———————————
SD3.5-fp8 (пожатая модель)
Спионерил у @SergeyTsyptsyn
#lora #text2image #comfyui #finetuning
🔥5👍2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
Mochi 1
Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)
Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)
#text2video
Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)
Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)
#text2video
👍16😱3❤1👏1🤡1
JoyCaption Alpha 2 - Batch Script
Скрипт для пакетной обработки картинок в JoyCaption.
Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии
Реддит
#image2text #captioning
Скрипт для пакетной обработки картинок в JoyCaption.
Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии
Реддит
#image2text #captioning
👍3❤1
OmniGen: Unified Image Generation
Новый генератор изображений. По тексту не выдает ничего интересного. Но главная его суперсила - он принимает на вход и картинки тоже. Картинки с описанием что с ними нужно сделать.
И вот тут можно развернуться, и он может сделать красиво. Мне выпал счастливый билет, второй день не могу получить из демо ни одной картинки, так что примеры с гитхаба
Для 1024*1024 жрет порядка 24Гб VRAM. Это не предел, если что. Ну и на скорость не рассчитывайте.
Код
Демо
#text2image #image2image #personalization #multimodal2image
Новый генератор изображений. По тексту не выдает ничего интересного. Но главная его суперсила - он принимает на вход и картинки тоже. Картинки с описанием что с ними нужно сделать.
И вот тут можно развернуться, и он может сделать красиво. Мне выпал счастливый билет, второй день не могу получить из демо ни одной картинки, так что примеры с гитхаба
Для 1024*1024 жрет порядка 24Гб VRAM. Это не предел, если что. Ну и на скорость не рассчитывайте.
Код
Демо
#text2image #image2image #personalization #multimodal2image
👍4❤1
Motion Inversion for Video Customization
Генерация видео с движением, заданным другим видео. Качество картинки не впечатляет. В демо на выбор несколько разных чекпойнтов под разные движения камеры. Это мне что, под каждое движение камеры нужен будет отдельный чекпойнт? неудобно
Код
Демо
#text2video #motion2video
Генерация видео с движением, заданным другим видео. Качество картинки не впечатляет. В демо на выбор несколько разных чекпойнтов под разные движения камеры. Это мне что, под каждое движение камеры нужен будет отдельный чекпойнт? неудобно
Код
Демо
#text2video #motion2video
👍5❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Moonshine
Распознаватор речи, бьет Whisper по нескольким параметрам.
Уже прикрутили в коммерческий переводчик Torre, там только английский и испанский.
Рейтинг и конкурентов кстати можно посмотреть в Open ASR Leaderboard - лидерборде распознаваторов речи
Гитхаб
#leaderboard #ASR #speech2text #stt
Распознаватор речи, бьет Whisper по нескольким параметрам.
Уже прикрутили в коммерческий переводчик Torre, там только английский и испанский.
Рейтинг и конкурентов кстати можно посмотреть в Open ASR Leaderboard - лидерборде распознаваторов речи
Гитхаб
#leaderboard #ASR #speech2text #stt
👍10
This media is not supported in your browser
VIEW IN TELEGRAM
VidToMe: Video Token Merging for Zero-Shot Video Editing
Манипуляции с видео: стилизация, замена фона/объекта.
Под капотом, похоже, SD2+controlnet
Код
#video2video #stylization
Манипуляции с видео: стилизация, замена фона/объекта.
Под капотом, похоже, SD2+controlnet
Код
#video2video #stylization
👍8🥴1
IntraPaint
Редактор картинок на базе Forge/A1111 (запускать с ключом --api). В будущем - и на ComfyUI
Гитхаб
Видео
#tools #imageediting #text2image #image2image #inpainting
Редактор картинок на базе Forge/A1111 (запускать с ключом --api). В будущем - и на ComfyUI
Гитхаб
Видео
#tools #imageediting #text2image #image2image #inpainting
🔥5🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree
Улучшенный SAM2 для сегментации длинных видео
Код
#segmentation #video2mask
Улучшенный SAM2 для сегментации длинных видео
Код
#segmentation #video2mask
🔥5
Flux.1 Lite alfa
альфа-версия Flux.1 Lite от Freepik с 8B параметров, дистилированной из FLUX.1-dev (а dev, напоминаю - дистилированная из pro). Эта версия использует на 7 ГБ меньше оперативной памяти и работает на 23% быстрее при сохранении той же точности (bfloat16), что и оригинальная модель.
Репозиторий на HF
#flux #text2image
альфа-версия Flux.1 Lite от Freepik с 8B параметров, дистилированной из FLUX.1-dev (а dev, напоминаю - дистилированная из pro). Эта версия использует на 7 ГБ меньше оперативной памяти и работает на 23% быстрее при сохранении той же точности (bfloat16), что и оригинальная модель.
Репозиторий на HF
#flux #text2image
❤7🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
VistaDream: Sampling multiview consistent images for single-view scene reconstruction
Дерзко. Создает 3D сцену на гауссианах из одной картинки
Код
Галерея
#gaussian #image2scene #imageto3d #image2gaussian
Дерзко. Создает 3D сцену на гауссианах из одной картинки
Код
Галерея
#gaussian #image2scene #imageto3d #image2gaussian
🔥14🤔1