NEW BOT Телеграм, страница

InstantSplat прокачался, качественно реконструирует поверхность по нескольким ракурсам за секунды

Код
Демо

#gaussian #imageto3d #image2scene

❤5👍1

1.88K views07:07

Нейронавт | Нейросети в творчестве

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Kokoro TTS

Передовая качественная голосовая модель, основанная на архитектуре StyleTTS. Опенсорс
Всего 82М параметров, 327Мб
Звучит живо

А теперь о минусах: русского пока нет

Демо
Дискорд

Бонус: арена голосовых моделей TTS Arena

#tts #text2speech #leaderboard

👍13👎1

2.02K views07:43

Нейронавт | Нейросети в творчестве

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

Sa2VA: Marrying SAM2 with LLaVA for Dense Grounded Understanding of Images and Videos

Поженили SAM2 с Llava
Модель сегметрирует картинки и видео по текстовому запросу

Код
Демо

#segmentation #image2mask #video2mask

👍10

1.9K views08:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Codestral 25.01

Обновка ИИ-программиста от Mistral в топе на LMsys Copilot Arena

Попробовать можно через плагин continue.dev в VS Code и JetBrains (выберите выберите Codestral 25.01)

Нужно зайти на https://console.mistral.ai/codestral, зарегатся и получить бесплатный API key. В настройках continue.dev (https://github.com/continuedev/continue) в VS Code ставишь codestral. И работаешь бесплатно.

спасибо @A_Nikolaeff

#coding

👍6🤯1

2.44K viewsedited 13:33

Нейронавт | Нейросети в творчестве

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

Run ComfyUI workflows for free with Gradio on Hugging Face Spaces

Теперь из #CoimfyUI воркфлоу можно сделать приложение на gradio и запустить в демоспейсе на HuggingFace

#tutorial #news

👍7❤4🔥3

2.24K views16:48

Нейронавт | Нейросети в творчестве

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

Ludus AI - Unreal Engine AI toolkit

К Unreal Engine 5 прикрутили Anthropic и немножко на подхвате Deepseek. Предлагают попробовать бесплатно.

Доступ к ИИ очевидно, по API, за который, вероятно, все равно придется заплатить

Кто попробует - опишитесь что там как

#coding #assistant

👍5🤡2

2.19K viewsedited 17:05

Нейронавт | Нейросети в творчестве

Deepseek ios

Приложение доступно в российском appstore

Кажется, доступ в интернет работает плохо или у меня кривые руки

#mobile #iOS #assistant

👍8⚡2❤1👎1🤯1

1.8K views17:36

Нейронавт | Нейросети в творчестве

MiniMax-01

Hailuo AI выпустили языковую модель MiniMax-01 с контекстом 4 миллиона токенов. Это ооочень много

MiniMax-VL-01 - визуально-языковая
MiniMax-Text-01 - гибридная архитектура Lightning Attention / Softmax Attention / Mixture-of-Experts (MoE) на 456B параметров

PS. Мертвых с косами тоже приписал Цою и Есенину, как и Deepseek. Это заговор

Попробовать можно на офсайте - там же генерируем видео и речь, есть изолятор голоса на аудио
Или тут (API) - там у них и генератор речи есть speech-01 и генератор музыки music-01

Гитхаб

Демо MiniMax-VL-01
Демо MiniMax-Text-01

#vlm #llm #assistant #text2speech #tts #voiceisolation

👍4❤2

2.18K views20:41

Нейронавт | Нейросети в творчестве

3:05

Media is too big

VIEW IN TELEGRAM

Seaweed APT: Diffusion Adversarial Post-Training for One-Step Video Generation

Генерация видео и изображений за один шаг от ByteDance

Модель генерирует 2 секунды видео с разрешением 1280х720 @24 fps в режиме реального времени

Кода нет, есть восхищение

#text2video #text2image #realtime

❤12😁5👍3

2.98K views08:45

Нейронавт | Нейросети в творчестве

2:38

This media is not supported in your browser

VIEW IN TELEGRAM

JASCO: Joint Audio And Symbolic Conditioning for Temporally Controlled Text-To-Music Generation

Генератор музыки от запрещенной Meta AI на базе audiocraft - опубликован код и веса

На вход принимает текст / аккорды / мелодию / ноты / отдельные партии, например ударные

Есть API, генерирует 10-секундные куски

Обучен на 16000 часов лицензионной музыки

Код
Модель
Jupiter notebook

#music #text2music #conditioning #music2music

❤6👍4

2.28K viewsedited 14:46

Нейронавт | Нейросети в творчестве

2:15

This media is not supported in your browser

VIEW IN TELEGRAM

MangaNinja: Line Art Colorization with Precise Reference Following

Раскрашивание линейного рисунка точно по референсу

Код

#lineart2color #colorize

🔥18❤2

2.24K views08:08

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

FramePainter: Endowing Interactive Image Editing with Video Diffusion Priors

Редактирование изображений через интуитивные эскизы

На основе ControlNeXt

Код ждем

#imageediting #sketch2image #image2image

👍21

1.87K viewsedited 08:43

Нейронавт | Нейросети в творчестве

2:36

This media is not supported in your browser

VIEW IN TELEGRAM

XMusic: Towards a Generalized and Controllable Symbolic Music Generation Framework

Управляемая генерация midi-музыки от Tencent

- по тексту
- по заданной эмоции
- в заданном жанре
- по изображению
- по видео
- по образцу пения/мычания

На звучание не обращайте внимания, это midi

Кода нет
Галерея

#music #text2midi #midi #iamge2music #video2music #audio2music

👍8❤1🔥1💩1

1.61K views09:13

Нейронавт | Нейросети в творчестве

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

Kinetix | Character Motion Control for Video Generation Models

Превращает видео в 3d мультик

Записаться в вейтлист

#video2cartoon #video2video #video2animation #stylize

🔥10👍4❤1

1.83K views09:42

Нейронавт | Нейросети в творчестве

1:41

This media is not supported in your browser

VIEW IN TELEGRAM

Omni-RGPT: Unifying Image and Video Region-level Understanding via Token Marks

Мультимодальная модель от NVIDIA для понимания изображений и видео на уровне отдельных объектов и областей

Код ждем

#mllm #vlm

👍9🥴1

1.51K views10:13

About

Blog

Apps

Platform