NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Pixel Reasoner: Incentivizing Pixel-Space Reasoning with Curiosity-Driven Reinforcement Learning

Модель анализирует изображения на уровне пикселей, улавливает мелкие детали и сложные визуальные отношения, которые трудно выразить текстом

Демо
Код - пока только обучение, без инференса, ждем
Веса

#reasoning #assistant #image2text

🔥7👍3😁1

1.78K views08:03

Нейронавт | Нейросети в творчестве

Fireworks AI BrowserUse

Агент, вдохновленный OpenManus

→ Ходит в интернет
→ Нажимает кнопки, заполняет формы
→ Извлекает динамический контент
→ Работает с авторизацией модальностями (что это?) и капчами

Код

#agent

❤1🤔1

2K views08:36

Нейронавт | Нейросети в творчестве

В прототипизатор программ Memex добавили поддержку Claude Sonnet 4, Gemini 2.5 Pro и три шаблона MCP

Пробуем

#vibecoding #coding #mcp #mac

👍3

1.97K views10:12

Нейронавт | Нейросети в творчестве

UltraSharpV2

Новая версия модели апскейла UltraSharp, которую многие юзали еще с SD1.5

#upscale

Ko-fi

UltraSharpV2 - Kim2091's Ko-fi Shop

🚀Please support my work by donating!! It ensures I have more time to work on models and future releases

The successor to the most popular Stable Dif...

🔥9❤2

1.81K views13:00

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

1.64K views13:00

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

1.65K views13:00

Нейронавт | Нейросети в творчестве

gen2seg: Generative Models Enable Generalizable Instance Segmentation

Stable Diffusion 2 научили сегментировать объекты на картинках

Код
Веса
Демо
Колаб

#segmentation #iamge2mask

👍8🔥1

1.87K views13:36

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini Speech

генератор речи от Гугла доступен в AI Studio

Звучит живо.
Огромная библиотека голосов, поддерживает русский язык.
Для диалога/подкаста можно выбрать несколько спикеров.
Можно в тексте прописывать промпты на смех или кашель и т п

Включаем ВПН, в AI Studio выбираем Generate Media, а затем Gemini Speech Generation - пробуем

#tts #text2speech

👍16👏2

2.04K viewsedited 06:10

Нейронавт | Нейросети в творчестве

ViewComfy

Создаем веб-приложения с #ComfyUI под капотом. Для одиночек есть план с оплатой только за фактически использованные вычислительне мощности сервиса. Ну а можно и развести у себя дома, код есть.

Обещают сделать поддержку инпейнтинга

Код
Туториал
Оф канал на ютубе

#comfy2web #webapp

❤4👍1

2.02K views06:41

Нейронавт | Нейросети в творчестве

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

Remade AI Video Canvas

Remade AI сделали холст для работы с видео

Есть бесплатный тариф с 400 кредитов в неделю и вотермарком. Цены на генерацию на скрине

Бонус: забирайте новые лоры спасибо @Vvicca1

#text2video #image2video #lora

👍3❤1

2.07K views07:11

Нейронавт | Нейросети в творчестве

QuickVideo

Ускорение понимания визуально-языковыми моделями длинных видео за счёт параллельного декодирования видео, эффективного предварительного заполнения памяти и совмещения декодирования с анализом, что позволяет добиться рилтайма

Код

#VLM #optimization #video2text #realtime

👍5

1.9K views07:41

Нейронавт | Нейросети в творчестве

Форк персонализатора-кастомизатора DreamO с поддержкой лор и квантизацией

petermg DreamO

#personalization #referenceing #tex2image #lora

Нейронавт | Нейросети в творчестве

DreamO: A Unified Framework for Image Customization

Персонализатор-кастомизатор изображений от ByteDance на базе Flux

Kод
Демо
HF

#personalization #referenceing #tex2image

👍7❤2

1.83K views08:41

Нейронавт | Нейросети в творчестве

На HF появились две дистиллированные модели генератора длинных видео MAGI-1

4.5B_distill и
4.5B_distill_quant

Говорят, что даже на убунту с трудом заводится. А на Windows и подавно

Веса
Ветка на Реддит

#text2video #image2video

Magi | Magi-1

Magi | Magi-1 | AI Video Generator | AI VIDEO Extender

Unleash limitless creativity with Magi by Sand AI! Generate high-quality AI videos with infinite storytelling and real-time speed. Start creating today!

👍6

1.78K views09:13

Нейронавт | Нейросети в творчестве

0:16

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

HunyuanPortrait

Аниматор-оживлятор портретов от Tencent.

Переносит на портрет мимику и движения головы с референсного видео

Авторы пишут, что необходима NVIDIA 3090 + CUDA, тестировали на 24Гб VRAM

Код
Веса

#portrainanimation #lipsync #characteranimation #motion2video

👍7😁2🤔2❤1

2.38K views14:04

About

Blog

Apps

Platform