Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.71K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
У генератора музыки Riffusion обновки и весьма интересные

- Можно загрузить свой трек для препарирования и переделки

- Swap Sound - заменяем инструментальные партии/жанры, вокал остается

- Swap Vocal - заменяем вокал, оставляя инструменты

- Get Stems - делим композицию на партии и скачиваем

- Trim - обрезаем, оставляя нужный кусок, и работаем от него

- Ghostwriter - пишет тексты

#text2music #music2music #audio2music
👍13
G-Assist

Игровой помощник Nvidia уже доступен в NVIDIA App.

Анализирует игры, подсказывает настройки, билды для боссов и героев, помогает с итембилдами, переключает громкость в Spotify. Поддерживает локальную модель без интернета и API Gemini. Понимает текст и голос

Обновляем NVIDIA App, открываем в приложении главную страницу, пролистываем до "Интересное" ("Discover"), ищем там Project G-Assist, устанавливаем

#gaming #news #assistant
😁831👍1
Gemini 2.5 Pro

Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.

Сегодня гугл всех побил. Надолго ли?

Пробовать в AI Studio

#assistant #reasoning #coding
👍10🤯6
4o Image Generation

Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.

Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею

Видео

#imageediting
🤯8👍1😈1
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
🤔11👎5😈1
Aether: Geometric-Aware Unified World Modeling

Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:

- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели

Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.

Код ждем
Демо ждем

#video2video #novelview #cameracontrol #motioncontrol
👍12
Новости автоматизации

Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно

image-gen MCP

ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111

————————————
AbletonMCP
MCP к музыкальной станции Ableton

————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко

————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP

————————————
Галереи MCP серверов

https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers

————————————
https://modelcontextprotocol.io/introduction
Введение в MCP

#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍113
Ideogram 3.0

Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.

стабильно превосходит другие модели преобразования текста в изображение


Попробовать
iOS

#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V

Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает

Попробовать
Веса

#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing

Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей

Код ждем

#text2image
👍62
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement

Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов

А я думал, Клод с MCP уже намного больше может

Кода нет

#mlm #assistant #3d
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Immersity 4.0

Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой

Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:

3D Motion
3D Image
3D Video Simple

#image2depth #image2video #monoculardepth #parallax
👍4