Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Media is too big
VIEW IN TELEGRAM
Magic Animator

Анимирует дизайны Figma

Можно редактировать результат.

Экспортируется в MP4, GIF или JSON.

Обещают интеграцию с Canva и Adobe Express.

Вроде пока бесплатно

#design #animation
👍8🔥2
Media is too big
VIEW IN TELEGRAM
А давайте откроем рубрику куда будем скидывать понравившиеся работы. Меня вот это зацепило, интересно смотреть. pika + midjourney + Suno

Накидывайте в коменты

И давайте придумаем тег?
🔥155👍5
Kimi K2

Новая версия китайской мультимодалки.

Пишут что убийца cHatGPT и DeepSeek, но как всегда преувеличивают

Архитертура #MoE, Триллион параметров, из них 32B активных. Заточена на агентные и программерские задачи. Есть две версии:

Kimi-K2-Base: Базовая модель, с которой можно начинать работу исследователям и разработчикам, которым нужен полный контроль для точной настройки и создания пользовательских решений.

Kimi-K2-Instruct: модель после обучения, которая лучше всего подходит для работы с клиентами, общения в чате общего назначения и взаимодействия с агентами. Это модель рефлекторного уровня, о которой не нужно долго думать.

- Обрабатывает 100 тысяч строк данных за раз - Строит визуализации
- Создаёт игры в вебе, на создание клона Minecraft у Kimi K2 ушла одна попытка
- Планирует путешествия через 17 инструментов
- Токены в 5 раз дешевле чем у конкурентов

Уже на Perplexity
Хотя какая разница если можно пользоваться прямо на офсайте и в мобильном приложении

Мультимодальные функции пока не работают

Гитхаб
Веса - вам точно это надо?
Попробовать на офсайте - в левом нижнем углу переключаем на английский

На мобиле не факт что K2 уже есть, не проверял
AppStore
Android

#assistant #mllm #mlm #reasoning #mobile #ios
6👍1
Tensor.Art пошел по пути Civitai

Запрещают наготу и лица селебрити

Реддит

#news
🤯12👍5😭4😱2👎1
WAN Image

Оказалось что WAN отлично генерит картинки, даже
лучше чем Flux и HiDream

Цитата потому что я таких выводов не делал

какой-то воркфлоу

какой-то воркфлоу WAN 2.1FusionX_14B_Image Generator

Smartphone Snapshot Photo Reality - можно использовать лору

вокрфлоу с лорой

wan2.1 controlnets - можно и контролнеты

Видео от AItrepreneur

Спасибо за наводку @edyukov

#lora #text2image #workflow
👍17🔥21
PyVision: Agentic Vision with Dynamic Tooling

Так, агенты добрались и до визуального понимания.

PyVision — это новая система, которая позволяет моделям машинного обучения работать с изображениями и придумывать собственные инструменты для решения задач. Модель может анализировать картинки, находить на них нужные объекты, измерять их. По сути, учится «видеть» и понимать мир как человек, но с помощью кода и алгоритмов.

Например, создает код на питоне для решения задачи

Работает через API OpenAI, поэтому для работы нужен API ключ OpenAI

Код
Демо

#vlm #agent #image2text
👍7
PromptTea: Let Prompts Tell TeaCache the Optimal Threshold

Новый метод ускорения видеогенерации

Модель анализирует промпты и на основе их сложности автоматически настраивает процесс генерации видео.

Для простых видео модель работает быстрее, а для сложных — более внимательно, сохраняя высокое качество

Ускорение генерации в 2,79 раз при минимальной потере качества.

Поддерживает CogVideoX1.5, HunyuanVideo и Wan2.1

Код

#optimization
👍13
This media is not supported in your browser
VIEW IN TELEGRAM
SpatialTrackerV2: 3D Point Tracking Made Easy

Ура, новый трекер. Создан при участии ByteDance

Определяет движение камеры, геометрию сцены и траектории точек в пространстве. Работает в режиме реального времени

Код
Демо

#tracking #realtime
🔥11👍1
Media is too big
VIEW IN TELEGRAM
LangSplatV2: High-dimensional 3D Language Gaussian Splatting with 450+ FPS

Модель умеет быстро обрабатывать и понимать изображения в трёхмерном пространстве, используя язык. Находит объекты на картинках и определяет их местоположение с высокой точностью.

Был похожий проект

Код

#video2mask #segmentation #gaussian
👍10🔥1