NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer Генератор картинок по тексту от Nvidia и компании. Может эффективно генерировать изображения с разрешением до 4096 × 4096. Из фишек - скорость даже на GPU ноутбука, четкое…

У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.

И демка которая возможно проживет несколько дней

F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5

Гитхаб
Демо спасибо за наводку @p0lygon

#news #text2image

😁8

1.51K viewsedited 07:47

Нейронавт | Нейросети в творчестве

Arch-Guard

От взлома языковых моделей защищаются всерьез.

Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.

Война технологий продолжается

#news #jailbreak

huggingface.co

katanemo/Arch-Guard · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

😁3👀3

1.59K views08:39

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе

#humor #news

😁42🎃4😭3

2.24K views08:55

Нейронавт | Нейросети в творчестве

У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой. И демка которая возможно проживет несколько дней F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 Гитхаб Демо спасибо за наводку @p0lygon #news #text2image

Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения

#news

❤13

1.6K viewsedited 11:33

Нейронавт | Нейросети в творчестве

Stable Diffusion 3.5

Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.

Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября

Уже поддерживается в ComfyUI

Модель HF
Гитхаб

Демо HF
API
Replicate

#text2image #news

🔥12👀1

1.84K views14:28

Нейронавт | Нейросети в творчестве

Итак, кастомизация SD3.5

Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM

Официальный гайд

готовые лоры:
раз
два
три
———————————
Примеры ComfyUI

———————————
SD3.5-fp8 (пожатая модель)

Спионерил у @SergeyTsyptsyn

#lora #text2image #comfyui #finetuning

🔥5👍2❤1

1.85K viewsedited 15:54

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Mochi 1

Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)

Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)

#text2video

👍16😱3❤1👏1🤡1

2.11K views19:02

Нейронавт | Нейросети в творчестве

JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning

👍3❤1

1.76K views05:03

Нейронавт | Нейросети в творчестве

OmniGen: Unified Image Generation

Новый генератор изображений. По тексту не выдает ничего интересного. Но главная его суперсила - он принимает на вход и картинки тоже. Картинки с описанием что с ними нужно сделать.

И вот тут можно развернуться, и он может сделать красиво. Мне выпал счастливый билет, второй день не могу получить из демо ни одной картинки, так что примеры с гитхаба

Для 1024*1024 жрет порядка 24Гб VRAM. Это не предел, если что. Ну и на скорость не рассчитывайте.

Код
Демо

#text2image #image2image #personalization #multimodal2image

👍4❤1

1.56K viewsedited 07:18

Нейронавт | Нейросети в творчестве

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

Motion Inversion for Video Customization

Генерация видео с движением, заданным другим видео. Качество картинки не впечатляет. В демо на выбор несколько разных чекпойнтов под разные движения камеры. Это мне что, под каждое движение камеры нужен будет отдельный чекпойнт? неудобно

Код
Демо

#text2video #motion2video

👍5❤1🔥1

1.41K views07:47

Нейронавт | Нейросети в творчестве

SD 3.5 прикрутили в tost.ai

#text2image #sd35

👍4

1.58K views08:08

Нейронавт | Нейросети в творчестве

0:20

This media is not supported in your browser

VIEW IN TELEGRAM

Moonshine

Распознаватор речи, бьет Whisper по нескольким параметрам.

Уже прикрутили в коммерческий переводчик Torre, там только английский и испанский.

Рейтинг и конкурентов кстати можно посмотреть в Open ASR Leaderboard - лидерборде распознаваторов речи

Гитхаб

#leaderboard #ASR #speech2text #stt

👍10

1.85K viewsedited 08:12

Нейронавт | Нейросети в творчестве

0:26

This media is not supported in your browser

VIEW IN TELEGRAM

VidToMe: Video Token Merging for Zero-Shot Video Editing

Манипуляции с видео: стилизация, замена фона/объекта.
Под капотом, похоже, SD2+controlnet

Код

#video2video #stylization

👍8🥴1

1.65K views08:35

Нейронавт | Нейросети в творчестве

IntraPaint

Редактор картинок на базе Forge/A1111 (запускать с ключом --api). В будущем - и на ComfyUI

Гитхаб
Видео

#tools #imageediting #text2image #image2image #inpainting

🔥5🌚1

1.41K views12:27

Нейронавт | Нейросети в творчестве

1:07

This media is not supported in your browser

VIEW IN TELEGRAM

SAM2Long: Enhancing SAM 2 for Long Video Segmentation with a Training-Free Memory Tree

Улучшенный SAM2 для сегментации длинных видео

Код

#segmentation #video2mask

🔥5

1.54K views12:46

Нейронавт | Нейросети в творчестве

Flux.1 Lite alfa

альфа-версия Flux.1 Lite от Freepik с 8B параметров, дистилированной из FLUX.1-dev (а dev, напоминаю - дистилированная из pro). Эта версия использует на 7 ГБ меньше оперативной памяти и работает на 23% быстрее при сохранении той же точности (bfloat16), что и оригинальная модель.

Репозиторий на HF

#flux #text2image

❤7🔥3

2.85K views13:01

Нейронавт | Нейросети в творчестве

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

VistaDream: Sampling multiview consistent images for single-view scene reconstruction

Дерзко. Создает 3D сцену на гауссианах из одной картинки

Код
Галерея

#gaussian #image2scene #imageto3d #image2gaussian

🔥14🤔1

1.81K views13:08

About

Blog

Apps

Platform