Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.44K photos
3.71K videos
41 files
4.75K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Увидел что тут не хватает мема про ИИ или роботов - прояви гражданскую мемную позицию в комментариях

#humor
😁15👍3🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
Код RayGauss тоже недавно выложили
Готовьте 24ГБ VRAM для качества как у авторов

Код

#gaussian #rendering #novelview
👍5🔥1🤯1
Athene-V2-Agent

Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах

Дообучен из Qwen-2.5-72B-Intruct

#assistant #agent
👍6🔥2
MinerU

Инструмент для преобразования PDF документов в машинно-читаемые форматы (markdown, JSON и т п)

Гитхаб
Демо

#tools #pdf
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Понимание и генерация 3D сеток языковой моделью.

В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.

Налетаем, пробуем.

Код
Веса
Демо

#textto3d #3dtotext #assistant
🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit
👍7🔥2
Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial
👍9
Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music
9😭3🔥2💩1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant
7👍1
Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm
👍61