Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Spline Path Control v2

Контроль движения сплайнами без лишнего промпинга.

Полученное движение предлагают использовать как управляющее видео для VACE

Народное творчество, сделано в DeepSeek + Google Gemini, пользуйтесь пока не сломалось и пока автор не разорился

Код
Попробовать онлайн
воркфлоу

#workflow #motioncontrol #image2video
🔥121
Media is too big
VIEW IN TELEGRAM
Virtual Community: An Open World for Humans, Robots, and Society

Cоздание интерактивных и масштабируемых симуляций открытых миров, где используются реальные географические данные и компьютерные модели для имитации жизни людей и роботов.

Давайте думать, подсказывайте как сделать-то по красоте это можно использовать?

Код

#world #robot #simulation #interacton #HRI
👍4🤔2
MultiTalk: Let Them Talk: Audio-Driven Multi-Person Conversational Video Generation

Новый липсинк. Модель для создания видео с диалогами на основе аудиозаписей.

- несколько говорящих
- до 15 секунд в 480p и 720p
- контроль персонажей текстом
- генерация мультфильмов и видео с пением и другими типами речи

Код
Веса 10 Гб
ComfyUI Kijai перед отпуском сделал
Колаб на A100

#Lipsync #potraitanimation #speech2video #comfyUI #humananimation
👍93😁2💩1
This media is not supported in your browser
VIEW IN TELEGRAM
Google Magenta RT

модель создания музыки в реальном времени.

Впервые Google представили Magenta еще в 2016 году. С тех пор появился плагин к Ableton кроме всего прочего. И вот новая рилтаймовая модель

Генерирует музыку на ходу по текстовым запросам и/или аудиосэмплам

Модель основана на архитектуре MusicLM и использует блок-авторегрессию для генерации непрерывного потока музыки

Оперирует двухсекундными отрывками, поэтому из сэмпла может забрать только 2 секунды для образца стиля. Задержка 2 секунды - можно уменьшить для большей реактивности.

Собственный контекст - всего 10 секунд, поэтому не рассчитывайте на длинные музыкальные структуры.

Не умеет создавать песни, ибо на лирике не обучался.

Обещают добавить локальный запуск и кастомизацию

Код
HF
Колаб

#text2music #music2music #audio2music #musicediting #realtime #dj
6👍3👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Rodin add-on for Blender

отвлечемся от потока хайлуовщины.
Deemos выпустили полноценный плагин для Блендера. Создать модель по картинке в один клик, панель ассетов, 3D контролнет, все дела

скачать - впишите в окошко цены 0 или другую сумму которую хотите заплатить

#blender #imageto3d
👍14🔥2
Media is too big
VIEW IN TELEGRAM
OmniGen2: Exploration to Advanced Multimodal Generation

Новая версия редактора-генератора-персонализатора изображений

Создает картинки по описанию, редактирует их по инструкциям, переносит объекты из одной картинки в другую.

Есть режим с рефлексией: модель понимает, что изображено на картинке, и может улучшать свои результаты, анализируя их

Код

Демоспейсы, большинство из них скоро умрет:
https://huggingface.co/spaces/OmniGen2/OmniGen2
https://8f10329141d53b6884.gradio.live/
https://110863cb06c6c44bd2.gradio.live/
https://981758b17b4197aea7.gradio.live/
https://981758b17b4197aea7.gradio.live/

С чатом:
https://9315447fc78ef638e3.gradio.live/
https://abe054be89543e4cef.gradio.live/
https://4aa913765db00bbe51.gradio.live/
https://f28a8718565627d2cb.gradio.live/

#personalization #imageediting #text2image #image2image #referencing
4👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
11ai

Персональный голосовой ассистент от Elevenlabs с поддержкой #MCP

Интегрируется с perplexity, linear, SlackHQ и др

У меня ссылка не открывается, я же гражданин неправильной страны 😡

#assistant #voicemode
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔4👍3👀1
Media is too big
VIEW IN TELEGRAM
SongBloom

Генератор полных музыкальных композиций с согласованной структурой и гармоничными инструментальными и вокальными элементами.

Модель использует комбинированный подход, объединяющий авторегрессионное моделирование и диффузионные процессы для создания музыки. Возможности модели:

- Постепенное расширение музыкального эскиза от короткого к длинному.

- Уточнение деталей от общих до более тонких.

- Интеграция семантического и акустического контекста для управления процессом генерации.

Код
Веса

#text2music #music #musicediting
🔥121👍1
FluxZayn: FLUX LayerDiffuse Extension for Stable Diffusion WebUI Forge

Народная версия layerdiffusion с Flux под капотом вместо SD. Создает картинки с альфа-каналом (прозрачностью)

расширение для Forge
LayerDiffuse-Flux - оригинальный код

Для #ComfyUI есть ComfyUI_FluxLayerDiffuse

#extension #forge #text2image #flux #RGBA
🔥15👍31