NEW BOT Телеграм, страница

Qwen 3 Coder

Еще один релиз Qwen, на этот раз для программизма.
Кодит на уровне Sonnet 4 ю

Архитектура #MoE
480B параметров, 35В активных.
Контекст – 256к, скейлится до 1 миллиона токенов.

Бонусом выпустили инструмент командной строки для агентного кодинга Qwen Code - форк Gemini Code

Попробовать

#coding #agent

🔥7👍3😱1

1.66K views07:11

Нейронавт | Нейросети в творчестве

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

ObjectClear: Complete Object Removal via Object-Effect Attention

Удаляет объекты с изображения вместе с тенью и отражением.
В основе адаптированная для фотореалистичной ретуши модель SDXL-Inpainting, которая в оригинале не учитывала эффекты объекта такие как тени, отражения и т д.

Указать объект на удаление можно кистью или кликом (за это отвечает SAM)

Отражение Форреста в мокрой плитке удалил - молодец. Тень скамейки тоже чуть удалил и зарисовал не очень чисто - 4/5 учитывая что это с первой же попытки.

Код
Демо

#inpainting #objectremoval

👍22❤1😁1

2.53K views08:11

Нейронавт | Нейросети в творчестве

Опубликован код / веса сегментного 3D генератора PartCrafter Демо ждем Код Веса Колаб / Jupiter #imageto3d #3d

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

А вот и демо PartCrafter подъехало

Демо

#imageto3d #3d

👍4❤1

2.19K views09:51

Нейронавт | Нейросети в творчестве

1:24

This media is not supported in your browser

VIEW IN TELEGRAM

Клонирование голоса в Mega TTS3.

Для контекста: некоторое время назад ByteDance выпустила MegaTTS 3 (с исключительными возможностями клонирования голоса), но по разным причинам решила не выпускать кодер WavVAE, необходимый для работы клонирования голоса.

Недавно, кодер WavVAE, совместимый с MegaTTS 3, был выпущен ACoderPassBy на китайской платформе ModelScope с весьма многообещающими результатами.

Некто mrfakename прикрутил этот кодер к байтдэнсовской TTS и оно довольно неплохо работает. В самой Mega TTS нет поддержки русского вроде как, но она работает с моделями от F5 TTS (не подтверждено). При этом если в демке скормить образец голоса на русском и озвучить английский текст, получается очень близкий голос с прикольным русским акцентом.

Демку можно потестить в спейсе на HF.

Спасибо @asleephidden

MegaTTS 3 - сайт проекта

Модель знает английский и китайский

Код
Оригинальный демоспейс - вроде есть клонирование голоса. Видимо подсуетились уже

#tts #text2speech #voicecloning

👍7❤3👎2

1.93K views13:16

Нейронавт | Нейросети в творчестве

Minimax Voice Design завезли на fal.ai

Если есть кредиты, использовать здесь

#voicecloning #tts #text2speech #voicedesign #text2audio #text2music

👍2

1.94K views18:09

Нейронавт | Нейросети в творчестве

3:46

Media is too big

VIEW IN TELEGRAM

SeC: Advancing Complex Video Object Segmentation via Progressive Concept Construction

Сегментатор объектов на видео. Под капотом визуально-языковая модель #vlm

На показанных примерах Точно узнает объект который исчез и снова появился, тогда как SAM 2 теряет его и ошибочно цепляется за другой.

Код
Веса ~15Гб

#segmentation #video2mask

👍13😱1

2.02K views08:12

Нейронавт | Нейросети в творчестве

ObjectClear ComfyUI от подписчика!

Заходим в директорию ComfyUI\custom_nodes
Открываем PowerShell и клонируем туда оригинальный репозиторий:
git clone https://github.com/zjx0101/ObjectClear.git
После успешного клонирования там появится папка ObjectClear
Закидываем в нее файлы __init__.py и object_clear_nodes.py

В воркфлоу ноду TranslateNodeBeta можно заменить на стандартную Prompt

Проверял - работает

Благодарим @GorillaFrame

#workflow #ComfyUI #inpainting #objectremoval #imageediting

👍12❤1

2.38K viewsedited 08:43

Нейронавт | Нейросети в творчестве

__init__.py

146 B

object_clear_nodes.py

27.2 KB

workflow (7).png

2.4 MB

❤8

2.24K views08:44

Нейронавт | Нейросети в творчестве

0:41

This media is not supported in your browser

VIEW IN TELEGRAM

TokensGen: Harnessing Condensed Tokens for Long Video Generation

Метод создания длинных видео, который использует "сжатые токены" для улучшения качества и согласованности видео. Короткие фрагменты плавно соединяются в одно длинное и логичное видео без потери качества и с сохранением общей темы.

Умеет "редактировать" видео. Правда, это выглядит не как отредактированное, а как что-то похожее на испорченное исходное видео

Код ждем

#text2video #video2video #videoediting

👍5

1.65K views09:12

Нейронавт | Нейросети в творчестве

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

1:42

This media is not supported in your browser

Higgsfield Steal

Steal позволяет пользователям воссоздавать любое изображение из интернета с помощью ИИ. Пользователь просто выбирает понравившуюся картинку, а система мгновенно переносит ее эстетику (одежду, позу, освещение и атмосферу) на другое изображение.

Работает это все через браузерное расширение

Нейминг ироничный, нравится. Помните волну протестов на артстейшн с перечеркнутым "AI"? Типа пофиг, называйте воровством если хотите.

Спасибо @asleephidden

#referencing #image2video #image2image

👍17👎5❤1

11.4K views09:42

Нейронавт | Нейросети в творчестве

2:30

Media is too big

VIEW IN TELEGRAM

Hedra Live Avatars

Аватары в реальном времени от Hedra
За болтовню на том конце отвечают Gemini, ElevenLabs или OpenAI

Попробовать если у вас есть кредиты

#avatar #realtime #voicemode #image2avatar

👍3❤1👎1🤔1

1.72K views10:13

Нейронавт | Нейросети в творчестве

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

ObjectClear можно попробовать запустить в колабе если Comfy для вас не вариант

Jupiter / Colab

#inpainting #objectremoval #imageediting

👍4

1.8K views10:43

Нейронавт | Нейросети в творчестве

kontext-make-person-real

Лора под #Kontext для нормальной непластиковой кожи

Промпт для активации: make this person look real
Настройки: 30 steps, CFG 2.5

#lora #image2image

🔥17😁6👍2

2.58K views12:16

Нейронавт | Нейросети в творчестве

Neta_Lumina_Flash_PV.webm

17.9 MB

Neta-Lumina

Генератор анимешных картинок от neta.art
На основе Lumina-Image-2.0

Хорошее следование промпту.
Большое покрытие стилей и персонажей.
Поддерживает теги danbooru, но естественный язык хорошо понимает

Веса
Реддит

#text2image

👍6

1.76K viewsedited 06:43

About

Blog

Apps

Platform