Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс оживлятора персонажей OmniAvatar.
Сейчас ему плохо, можно чекнуть чуть позже

Демо

#portraitanimation #characteranimation #lipsync
1👍10
This media is not supported in your browser
VIEW IN TELEGRAM
3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

Базовая визуально-языковая модель понимания 3D сцен/
Умеет описывать сцены, отвечать на вопросы о них, планировать действия в виртуальном пространстве

Код
Веса

#vlm #3d #3dvlm #assistant #captioning
🔥8👍1
Flux Krea Realism LoRA

активация: in the style of R34L <your prompt>

настройки:

CFG: 5
LORA SCALE: 0.7-0.8

#fluxkrea #LoRa
👍8🤔1🌚1
Genie 3: A new frontier for world models

Новое поколение модели от Googleб #SOTA в создании игровых миров с навигацией по ним

Я тут перечислял что он умеет но тг сожрал текст и сказал что ничего не было.
Да и пофиг, потому что попробовать все равно не дают а только хвастаются

#text2world #research #text2game
👍4🔥4😁4
Media is too big
VIEW IN TELEGRAM
Eleven Music

У Elevenlabs свой генератор музыки с блэкджеком и ш который может полностью контролировать жанр, стиль и структуру композиций. Знает разные языки. Можно редактировать звук и текст отдельных секций или всей песни.

Работает на бесплатном тарифе. Чтобы задать ему слова песни, в конце промпта пишем lyrics: и дальше свой текст

#text2music #musicediting #music
6👍9👎21
Forwarded from Сиолошная
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров.

Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high.

Ссылки:
https://openai.com/open-models/
https://openai.com/index/gpt-oss-model-card/
https://cookbook.openai.com/articles/openai-harmony
https://gpt-oss.com/ - тут можно поиграть с моделью

Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель.

И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений.
1🔥92👍1
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31
Claude Opus 4.1

Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей

#news #assistant
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Kitten TTS

#sota маленьких голосовых моделей.
Работает без GPU, всего 15М параметров. Оптимизирована для рилтайма

По языкам нет информации. Должна завестись даже на Raspberry Pi

Младшая весит всего 25 мегабайт.
За две недели сделали - огонь!

Код
Веса

#tts #text2speech #realtime
🔥12😱2🤔1
MiDashengLM

Модель понимания аудио от Xiaomi, #sota
Распознает тембр голоса, музыкальные инструменты, прочие звуки, отвечает на вопросы

Код
Демо
Веса ~50Гб

#audio2text #alm #assistant
🔥5👍2🤔1👀1