Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit
👍7🔥2
Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial
👍9
Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music
9😭3🔥2💩1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant
7👍1
Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
GeneX: Generative World Explorer

Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения

#news #worldunderstanding
👍51
Обновлен бесплатный тариф видеогенератора Kling

Теперь дают 366 кредитов в месяц и ограниченный доступ к платным функциям - 5 генераций с платными функциями в месяц.

Ну и еще они готовят видеоредактор

#news #text2video #image2video
122
Обновка GPT-4o

Креативнее тексты, улучшена читабельность и релевантность, улучшено понимание файлов

#news #assistant
👍2
R1-Lite

Способная к рассуждениям #LLM от DeepSeek, конкурент o1, ждем в опенсорсе

По бенчмаркам лучше o1-preview в кодинге и математике, в остальном послабее

Попробовать можно на их сайте, включив «Deep Think». Дают 50 сообщений в день бесплатно

Попробовать

#assistant
👍5🎃1
FLUX.1 Tools

BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools

Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры

FLUX.1 Fill: современные модели #inpainting и #outpainting, позволяющие редактировать и расширять реальные и сгенерированные изображения с текстовым описанием и бинарной маской.

FLUX.1 Depth: Модели, обученные для обеспечения структурного руководства на основе карты глубины, извлеченной из входного изображения и текстовой подсказки.

FLUX.1 Canny: модели, обученные для обеспечения структурного руководства на основе тонких контуров, извлеченных из входного изображения и текстовой подсказки.

FLUX.1 Redux: адаптер, позволяющий смешивать и воссоздавать входные изображения и текстовые подсказки.

Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров

fal.ai
Replicate
Together.ai
Freepik
krea.ai

Гитхаб
Веса на HF

ComfyUI

#controlnet #conditioning #image2image #text2image #news #flux
🔥20
Stylecodes: Encoding Stylistic Information For Image Generation

Аналог миджорниевского sref для #SD, позволяет закодировать стиль в короткую последовательность из 20 символов.

Реализовано для SD 1.5

Код
Демо

#styletransfer #styleshare
👍6🤷‍♂2🔥1