Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
DepthLab: From Partial to Complete

инпейнт карт глубины на основе диффузионных моделей.

Пригодно для заполнения недостающих данных, инпейнтинга 3D сцен, генерации оных по набору некалиброваных изображений или по тексту.

Код
Веса

#inpainting #image2depth
🔥5👍21
Новости сегодня уже бесполезно постить))

Этот год был определенно годом видеогенераторов и языковых моделей. Не согласны? Возразите мне в комментах))

Делайте ставки что бустанет в следующем году?

Спасибо всем кто помогал другу другу в комментах, спасибо за ваши репосты и реакции, вы лучшие. Поддержите канал бустами, своим ИИ-творчеством или чем хотите, велком а комментарии

Счастья вам, здоровья и быстрого инференса 🥂
Please open Telegram to view this post
VIEW IN TELEGRAM
🍾214🤡1
Расскажите что у вас хорошего произошло в этом году?
8🔥5
#humor

Какие-то безумцы релизят свои нейросети даже 1 января. Не дают спокойно посидеть без новостей. Так что выхожу из сумрака
😁209🤡2
TangoFlux: Super Fast and Faithful Text to Audio Generation with Flow Matching and Clap-Ranked Preference Optimization

Генератор звуковых эффектов. Речь и музыку не вывозит, проверил.

Зато выдает 44 КГц, до 30 секунд. На А40 на это уходит всего 3 секунды

Код
Демо

#text2audio #text2sfx #foley
👍51🔥1
PERSE: Personalized 3D Generative Avatars from A Single Portrait

По одному входному портрету PERSE создает анимируемый персонализированный 3D-аватар на гауссианах с независимым редактированием различных атрибутов лица

Код ждем

#humanavatar #portraitanimation #gaussian #facialanimation
17
This media is not supported in your browser
VIEW IN TELEGRAM
ebook2audiobook v2.0.0 Beta

Конвертер электронных книг в аудиокниги обновился. Поддерживает разные форматы, клонирование голоса, 1124 языка, в том числе русский.

Но мне не понравилась голосовая модель, попозже покажу лучший вариант

Демо

#text2speech #ebook2audiobook #voicecloning
👀6🎃41
This media is not supported in your browser
VIEW IN TELEGRAM
SynCamMaster: Synchronizing Multi-Camera Video Generation from Diverse Viewpoints

Метод генерации видео одновременно с нескольких ракурсов. Демонстрационные видео сделаны в CogvideoX

Код

PS Акелла промахнулся. я про него уже писал

#text2video #multiview #cameracontrol
🔥121
Media is too big
VIEW IN TELEGRAM
MoGe: Unlocking Accurate Monocular Geometry Estimation for Open-Domain Images with Optimal Training Supervision

Подгон от Microsoft. Преобразует изображение в меш через карту глубины.

На сравнении выглядит лучше конкурентов, в том числе Depth Anything 2

Код
Демо

#image2depth #video2depth #image2mesh #video2mesh
🔥131
Media is too big
VIEW IN TELEGRAM
Gaussian Frosting: Editable Complex Radiance Fields with Real-Time Rendering

Новый метод представления поверхностей с помощью сетки, покрытой слоем гауссиан разной толщины.

Этот слой, называемый "Frosting", позволяет захватывать как сложные объемные эффекты, создаваемые материалами вроде волос или травы, так и плоские поверхности. Модель создается только из RGB-изображений и может быть визуализирована в реальном времени, а также анимирована с использованием традиционных инструментов анимации

🍒Ну и вишенка: есть аддон для блендера

Код
Blender

#blender #gaussian #rendering #realtime
🔥101
This media is not supported in your browser
VIEW IN TELEGRAM
Arnis: Generate any location from the real world in Minecraft

Подгон любителям Майнкрафта. Быстрое автоматическое воссоздание любого реального города в Майнкрафте

#tools #game #mapto3d
🤯14🔥5😱2👍1
superbolt.geospy.ai

Сервис определяет локацию где сделано фото.
Работает для всех только по Сан-Франциско (проверил -для SF работает)
Для остальных локаций - записаться в вейтлист

Есть API c примерами

#image2geolocation #map #location #geolocation
👍2👀21
This media is not supported in your browser
VIEW IN TELEGRAM
Browser-Use WebUI

Надстройка к оригинальному Browser-Use для удобного пользования.
Проект дает доступ LLM-агентам к браузеру.
Что-то вроде Computer Use, но агент имеет доступ только к браузеру

Поддерживает Gemini, OpenAI, Azure OpenAI, Anthropic, DeepSeek, Ollama и др.

[UPDATE]
Этот код теперь в официальном Browser-Use

#assistant #agent #tools
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
trellis-stable-projectorz

Сборка 3D-генератора Trellis с пониженными требованиями к памяти.

От 8 ГБ VRAM, не требует cuda toolkit, powershell, VisualStudio, админские права. Все что нужно - уже внутри.

Однокликовый установщик

#textto3d #imageto3d #3dediting #3dto3d
17