Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Gemini 2.5 Pro

Мультимодальная рассуждалка. Но пока без генерации картинок.
По нескольким бенчам всех превзошел, взлетел наверх арены.
Контекст миллион токенов, обещают два.

Сегодня гугл всех побил. Надолго ли?

Пробовать в AI Studio

#assistant #reasoning #coding
👍10🤯6
4o Image Generation

Говорят, GPT-4o теперь подобно Gemini и Grok умеет редактировать картинки и даже генерить видео через Sora, подписка не нужна. Дают 3 видео в сутки.

Мне сначала сказал вот, готово, а картинку не отдал. Теперь совсем отказывается, говорит не умею

Видео

#imageediting
🤯8👍1😈1
Языковые модели подминают под себя задачи с обработкой изображений. Скоро флюкс и МЖ станут не нужны. Чем ответят авторы картиночных нейросеток?
🤔11👎5😈1
Aether: Geometric-Aware Unified World Modeling

Видеогенератор с пониманием пространственной геометрии с тремя ключевыми способностями:

- Динамическая реконструкция в формате 4D
- Прогнозирование видео на основе действия
- Визуальное планирование на основе цели

Умеет восстанавливать динамические облака точек по видео, оценивая глубину и ракурс.

Код ждем
Демо ждем

#video2video #novelview #cameracontrol #motioncontrol
👍12
Новости автоматизации

Имейте ввиду, что устанавливать MCP из непроверенных источников небезопасно

image-gen MCP

ИИ прикручивают к ИИ. На сей раз агента прикрутили к интерфейсу генерации картинок Forge / AUTOMATIC-1111

————————————
AbletonMCP
MCP к музыкальной станции Ableton

————————————
Народ массово сооружает свои MCP к Cursor просто потому что это легко

————————————
https://mcpify.ai
Онлайн сервис для создания своего MCP

————————————
Галереи MCP серверов

https://github.com/punkpeye/awesome-mcp-servers/
https://portkey.ai/mcp-servers
https://mcp.so
https://mcp.composio.dev
https://glama.ai/mcp/servers

————————————
https://modelcontextprotocol.io/introduction
Введение в MCP

#agent #text2music #text2image #imageediting #musicediting #mcp #coding #text2agent
1👍113
Ideogram 3.0

Обновка за обновкой.
3 версия генератора картинок Ideogram хвастается модными Canvas, remix, удержанием стиля, заменой фона, реализмом, точностью генерации текста, пакетной генерацией и т д.

стабильно превосходит другие модели преобразования текста в изображение


Попробовать
iOS

#text2image
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Step-Video-TI2V

Открыт доступ к генератору видео по картинке/тексту от Stepfun, в том числе онлайн на сайте. Авторизация по российскому номеру телефона НЕ работает

Попробовать
Веса

#image2video
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
Inference-Time Scaling for Flow Models via Stochastic Generation and Rollover Budget Forcing

Решает проблему генерации заданного количества объектов и их расположения в кадре для Flux и подобных моделей

Код ждем

#text2image
👍62
This media is not supported in your browser
VIEW IN TELEGRAM
FirePlace: Geometric Refinements of LLM Common Sense Reasoning for 3D Object Placement

Разработка DeepMind. Осмысленное размещение языковыми моделями объектов в 3D сцене с учётом геометрии и констрейнов

А я думал, Клод с MCP уже намного больше может

Кода нет

#mlm #assistant #3d
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
Immersity 4.0

Leia Inc выпустили обновку.
Immersity это онлайн сервис, где можно немного подвигать картинку натянув карту глубины, бывший Leiapix. Так вот, теперь оно работает лучше. Но на бесплатном тарифе вам не отдадут карту глубины. А что отдадут будет с вотермаркой

Еще умеет делать из обычного видео 3D видео для XR девайсов, опять же через карту глубины. На бесплатном тарифе:

3D Motion
3D Image
3D Video Simple

#image2depth #image2video #monoculardepth #parallax
👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Self-Supervised Learning of Motion Concepts by Optimizing Counterfactuals

Ура, новый трекер группы точек от Стэнфорда.

Несмотря на то что все они неточные, они мне уже пригождались там где все планарные и точечные трекеры оказывались бессильны

Код
Колаб

#tracking #opticalflow
🔥5👍3
LLM Arena: Бенчмарк LLM моделей на русском языке

Арена русскоязычных моделей.
А вот на днях еще и запустили приложение в тг

#arena #leaderboard #llm
👍5🥴4👎2
This media is not supported in your browser
VIEW IN TELEGRAM
Qwen2.5 Omni голос / видео

Мультимодальная обновка китайского ассистента. Теперь умеет общаться в голосовом режиме и в режиме видеочата

Поддерживает английский и китайский

Одновременно и думает и поддерживает разговор


7B параметров. Обещают выпустить и другие версии.

Попробовать
Гитхаб
HF

#assistant #voicemode #videochat
👍7🔥1