NEW BOT Телеграм, страница

ComfyUI Wan2.2 Fun Native Support

Нативная поддержка Wan2.2-Fun (контролнет для видео) в #ComfyUI

+ поддержка Wan2.2 Fun InP - генерация видео от начального к конечному кадру

+поддержка LightX2V 4-Step LoRA

Ссылки на воркфлоу в статье

#controlnet #text2video #image2video #flf

🔥11👍4

2.16K views15:03

Нейронавт | Нейросети в творчестве

GPT-OSS-120B on AMD MI300X

Не знаю зачем вам это, но вдруг кому-то нужно
Демоспейс GPT-OSS-120B от AMD

#assistant #chat

👍7😁7

1.62K views16:19

Нейронавт | Нейросети в творчестве

Wan2.2-Fun-A14B-Control-GGUF

#gguf от QuantStack

Спасибо неизвестному подписчику

#wan22 #text2video #image2video

❤4👍3😁1

1.78K viewsedited 06:09

Нейронавт | Нейросети в творчестве

0:40

Media is too big

VIEW IN TELEGRAM

Hunyuan-GameCraft

"Игровой движок", о котором все писали в июне, вышел в опенсорс

Построен на базе на Hunyuan Video, в квантизированном виде запустится на 4090, но рилтайма на ней не ждите.

Гитхаб
HF
Демо ждем

#text2world #text2game

👍3

2.15K views07:11

Нейронавт | Нейросети в творчестве

nunchaku в дискорде пообещали поддержку нового WAN

#news

🔥12👍4

1.86K views08:42

Нейронавт | Нейросети в творчестве

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

VyvoTTS-LFM2-350M-Jenny

Новая голосовая модель. 350М параметров.

Говорит на английском. Но для дообучения на новый язык или на новый голос достаточно 6Gb VRAM. А для работы всего 2Gb

Авторы планируют выпустить еще несколько моделей, и на HF уже не только Jenny. Работают над поддержкой vLLM и другими фичами прежде чем полностью выпустить проект в опенсорс

#text2speech #tts #voicecloning

1👍16🔥2

1.85K viewsedited 09:12

Нейронавт | Нейросети в творчестве

0:47

This media is not supported in your browser

VIEW IN TELEGRAM

Higgsfield Draw-to-Video

У Higgsfield очередная обновка. Задаем промпт не текстом, а визуальными пометками на первом (и не только) кадре.

Работает с MiniMax, Veo 3 & Seedance Pro. За ваши деньги, разумеется.

#sketch2video #image2video #online

👍16

1.88K viewsedited 10:13

Нейронавт | Нейросети в творчестве

Marco-Voice: A Unified Framework for Expressive Speech Synthesis with Voice Cloning

Кросс-лингвальный генератор речи с эмоциями и клонированием голоса от Alibaba.
Модель научили разделять идентичность говорящего и эмоциональную составляющую в отдельные потоки обработки.

Говорит по английски и китайски.

Гитхаб - послушать примеры можно там

#text2speech #tts #voicecloning

👍7❤2

1.78K viewsedited 17:07

Нейронавт | Нейросети в творчестве

Nano Banana

Новый генератор/редактор картинок, предположительно от Google.
Почему предположительно - потому что нет никакого релиза. Модель есть на https://lmarena.ai/ в разделе Battle - Image. А в лидерборде отсутствует...

Даем задание, можно просто по тексту, можно с исходной картинкой. Выбираем лучший результат из двух и видим название моделей.

Делает инпейнтинг, замену, генерацию по нескольким референсам. В общем, все то же что Flux Kontext но якобы лучше. На арене приходится кидать несколько запросов чтобы выпал банан, но вроде и правда лучше

Спасибо @iNevestenko

#text2image #image2image #imageediting

👍6🔥3

2.16K views06:47

Нейронавт | Нейросети в творчестве

Skywork-UniPic

И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки

UniPic-1 - авторегрессионная модель с нуля
UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M-Kontext и MetaQuery

Умеет:

- генерация изображений по тексту

- редактирование изображений (бесшовная дорисовка, удаление объектов, манипуляция объектами);

- понимание изображений (устойчивые возможности восприятия для решения различных визуальных задач)

Явно уступает nano-banana по редактированию, но там опенсорсом не пахнет пока

Гитхаб

Демо UniPic-1
Демо UniPic-2

#vlm #imageediting #text2image #image2image

👍3👎3

1.84K views07:38

Нейронавт | Нейросети в творчестве

Miromind

Полностью опенсорсный фреймворк для deepresearch, по приборам побивающий Opean AI

MiroThinker - набор моделей deepresearch

MiroTrain / MiroRL - микроструктура для обучения MiroThinker

MiroFlow - #sota агент умеющий пользоваться инструментами.

Я дал ему задание найти средний рост мужчин за последние 1000 лет. Выдал подробный результат за 1 минуту, см картинку

Попробовать

#deepresearch #assistant

👍9

1.63K views08:21

Нейронавт | Нейросети в творчестве

2:41

Media is too big

VIEW IN TELEGRAM

Раздача студенческих промокодов на ElevenLabs, Vercel, Bolt, Lovable, HeyGen, Hedra, Higgsfield и другие сервисы

В основном скидки. Но на сам ElevenLabs - целая подписка на 3 месяца. Но понадобится карточка Visa/Mastercard

1. Регаем временную студенческую почту здесь. Указываем домен imail.edu.vn.
2. На странице раздачи указываем эту почту, свой номер телефона. Мой обычный российский прокатил
3. Вводим пришедшие коды подтверждения телефона и почты

Промокодов ограниченное количество, может уже разобрали

Ну там еще и игра есть

#giveaway

👍8🔥2🥴1

1.62K views08:51

Нейронавт | Нейросети в творчестве

Skywork-UniPic И еще один генератор-редактор. Но этот еще и пониматор картинок. Модель в количестве две штуки UniPic-1 - авторегрессионная модель с нуля UniPic-2 - основана эффективных архитектурах с диффузионным постобучением. Включает варианты SD3.5M…

А тут и Гигачат подтянулся с редактированием картинок. Ну и чего тянуть, я его затестил. Все что он смог - надеть на Форреста шлем. Скафандр - нивкакую. И лягушонка Пепе не знает

Но это бесплатно, быстро и прямо в телеграме

Пользуйтесь @gigachat_bot

#imageediting #bot

👎10👍4😐2🤷‍♂1🌚1

1.52K views10:37

About

Blog

Apps

Platform