Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Textoon: Generating Vivid 2D Cartoon Characters from Text Denoscriptions

Генератор 2D мультяшных персонажей по текстовому описанию, в формате Live2D (послойный файл фотошоп)

Live2D - метод анимации статичных изображений, обычно применяется для анимации аниме-персонажей

Код ждем
👍123
DeepSeek выпустили в опенсорс рассуждающую модель R1

Чат
Веса не знаю у кого есть столько ресурсов, но пусть будет

DeepSeek-R1 Coder уже доступен в AnyChat

#assistant #reasoning #coding
1
Kimi k1.5

Еще одна китайская рассуждалка, мультимодальная

Чат - непонятно какая тут версия, все на китайском, русский понимает, по ссылкам ходит

Гитхаб - здесь только технический отчет

#assistant #mllm #mlm #reasoning
👍5🔥2
Демоспейс Flex.1-alpha потыркать не скачивая

Демо

#finetuning #text2image
👍9
Gigapixel AI Recover & Enhance

Мобильное приложение от Topaz Labs для апскейла и реставрации фото доступно в AppStore

При первом запуске приложение скачивает 1.4 Гб моделей локально. Но это какой-то ограниченный функционал, только обработка лиц. Для полного функционала потребуется обработка в облаке

Халявная ли локальная обработка - непонятно 🤷

Обработка в облаке за кредиты. На старте дают 100 кредитов, на обработку одного фото у меня ушло 3 кредита

#upscale #mobile #iOS #deblur #imagerestoration #enhance #facerestoration
👍4👎2
Hunyuan3D 2.0

Генератор текстурированных 3D моделей от Tencent

Hunyuan3D-DiT отвечает за меш

Hunyuan3D-Paint - за текстуры

Hunyuan3D-Studio - удобная платформа для создания 3D ассетов

Код
Демо
Сайт - вход через китайский телефон/wechat
ComfyUI

#textto3d #imageto3d #ComfyUI
👍53🔥2
Media is too big
VIEW IN TELEGRAM
GameFactory

по текстовому описанию создает генеративные миры на видео, с управлением действиями в игре (движения персонажа, использование предметов) с помощью клавиатуры и мыши

Код

#text2world #game
👍6
This media is not supported in your browser
VIEW IN TELEGRAM
audio input

В Suno v4 появилась функция превращающая ваш голос в трек

#voice2music #audio2music
👍9💩1
UI-TARS

Агент взаимодействия с графическими интерфейсами (GUI) от ByteDance

В отличие от других подобных моделей, UI-TARS не нуждается в сложных дополнительных программах или подсказках, визуально-языковая модель и взаимодействие с интерфейсом объединены в одну модель.

умеет находить информацию, выполнять действия в приложениях и веб-сайтах

UI-TARS Desktop

#agent #gui #vlm
👍9🔥3
Media is too big
VIEW IN TELEGRAM
CameraHMR: Aligning People with Perspective

Реконструкция 3D позы и формы человека по одному изображению или видео с учетом перспективы камеры

Есть 4 ключевых фактора, которые делают его точным и надежным:

1. Чтобы получить точную 3D-форму и позу, а также хорошее соответствие особенностям изображения, вам необходимо знать фокусное расстояние камеры. Чтобы решить эту проблему, мы обучаем HumanFOV вычислять поле зрения.

2. Мы вводим CameraHMR, который интегрирует HumanFOV в HMR2.0 для использования расчетного фокусного расстояния.

3. Чтобы получить точные обучающие данные pseudo ground truth (pGT), мы вычисляем фокусное расстояние для изображений в наборе данных 4DHumans и модифицируем SMPLify, чтобы учесть это.

4. Но SMPLify использует только разреженные 2D-ключевые точки, которые не отражают форму тела. Итак, мы тренируем детектор ключевых точек плотной поверхности, DenseKP, на BEDLAM и запускаем его на 4DHumans, что приводит к улучшению формы тела. Результирующий метод - CamSMPLify.

Мы повторяем обучение CameraHMR и запускаем CamSMPLify на обучающем наборе, инициализированном CameraHMR . Это приводит к значительному улучшению pGT для 4DHumans и методу HMR с одним изображением SOTA.


Код

#poseestimation #video2pose #image2pose #videoto3d #video2mesh #humanreconstruction
👍8🔥1💩1