Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
LeVo: High-Quality Song Generation with Multi-Preference Alignment

Генератор музыки к тексту (по музыкальному и текстовому промптам) от Tencent

Поет только на англйском и китайском. Но эй, можно и инструментал делать, в том числе по аудиопромпту

Гитхаб
ComfyUI
Pinokio
Демо
Веса

Спасибо @Dmitriy_Ru6ts0v

#music #text2music
1🔥13👍3👨‍💻2
qwen-image-gguf-test

а вот и #GGUF под Qwen-Image

Для работы в #ComfyUI обновите его и отредактируйте файл ComfyUI/custom_nodes/ComfyUI-GGUF/loader.py - см карточку модели по ссылке

реддит

#text2image
🔥5👍21🍾1
This media is not supported in your browser
VIEW IN TELEGRAM
Появился демоспейс оживлятора персонажей OmniAvatar.
Сейчас ему плохо, можно чекнуть чуть позже

Демо

#portraitanimation #characteranimation #lipsync
1👍10
This media is not supported in your browser
VIEW IN TELEGRAM
3D-R1: Enhancing Reasoning in 3D VLMs for Unified Scene Understanding

Базовая визуально-языковая модель понимания 3D сцен/
Умеет описывать сцены, отвечать на вопросы о них, планировать действия в виртуальном пространстве

Код
Веса

#vlm #3d #3dvlm #assistant #captioning
🔥8👍1
Flux Krea Realism LoRA

активация: in the style of R34L <your prompt>

настройки:

CFG: 5
LORA SCALE: 0.7-0.8

#fluxkrea #LoRa
👍8🤔1🌚1
Genie 3: A new frontier for world models

Новое поколение модели от Googleб #SOTA в создании игровых миров с навигацией по ним

Я тут перечислял что он умеет но тг сожрал текст и сказал что ничего не было.
Да и пофиг, потому что попробовать все равно не дают а только хвастаются

#text2world #research #text2game
👍4🔥4😁4
Media is too big
VIEW IN TELEGRAM
Eleven Music

У Elevenlabs свой генератор музыки с блэкджеком и ш который может полностью контролировать жанр, стиль и структуру композиций. Знает разные языки. Можно редактировать звук и текст отдельных секций или всей песни.

Работает на бесплатном тарифе. Чтобы задать ему слова песни, в конце промпта пишем lyrics: и дальше свой текст

#text2music #musicediting #music
6👍9👎21
Forwarded from Сиолошная
OpenAI разродились двумя опенсурсными моделями, на 120b и 20b параметров.

Модели рассуждающие, поддерживают 3 типа длины рассуждений: low, medium, high.

Ссылки:
https://openai.com/open-models/
https://openai.com/index/gpt-oss-model-card/
https://cookbook.openai.com/articles/openai-harmony
https://gpt-oss.com/ - тут можно поиграть с моделью

Судя по лендингу, модели уже сегодня будут доступны на Groq и Cerebas, предлагая очень быструю генерацию. И почти все инференс-движки уже поддерживают модель.

И самое крутое — как и o3, модели поддерживают вызов инструментов (поиск, Python, etc) в цепочке рассуждений.
1🔥92👍1
Wan2.2 Image | Krea

Все, генерацию картинок силами #WAN22 завезли на Krea.ai

Бесплатных кредитов хватило на две генерации

#text2image #image2image #neuronaut_art
👍4😁31
Claude Opus 4.1

Ну, да, выпустили. Модель улучшена в области решения агентских задач, реального кодирования и логического мышления. доступна для платных пользователей

#news #assistant
👍4