Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.43K photos
3.7K videos
41 files
4.74K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Athene-V2-Agent

Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах

Дообучен из Qwen-2.5-72B-Intruct

#assistant #agent
👍6🔥2
MinerU

Инструмент для преобразования PDF документов в машинно-читаемые форматы (markdown, JSON и т п)

Гитхаб
Демо

#tools #pdf
🔥7
This media is not supported in your browser
VIEW IN TELEGRAM
LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Понимание и генерация 3D сеток языковой моделью.

В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.

Налетаем, пробуем.

Код
Веса
Демо

#textto3d #3dtotext #assistant
🔥14
This media is not supported in your browser
VIEW IN TELEGRAM
SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit
👍7🔥2
Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial
👍9
Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online
🔥18👍4👎1
Media is too big
VIEW IN TELEGRAM
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music
9😭3🔥2💩1🎃1
This media is not supported in your browser
VIEW IN TELEGRAM
Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant
7👍1
Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
GeneX: Generative World Explorer

Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения

#news #worldunderstanding
👍51
Обновлен бесплатный тариф видеогенератора Kling

Теперь дают 366 кредитов в месяц и ограниченный доступ к платным функциям - 5 генераций с платными функциями в месяц.

Ну и еще они готовят видеоредактор

#news #text2video #image2video
122
Обновка GPT-4o

Креативнее тексты, улучшена читабельность и релевантность, улучшено понимание файлов

#news #assistant
👍2
R1-Lite

Способная к рассуждениям #LLM от DeepSeek, конкурент o1, ждем в опенсорсе

По бенчмаркам лучше o1-preview в кодинге и математике, в остальном послабее

Попробовать можно на их сайте, включив «Deep Think». Дают 50 сообщений в день бесплатно

Попробовать

#assistant
👍5🎃1
FLUX.1 Tools

BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools

Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры

FLUX.1 Fill: современные модели #inpainting и #outpainting, позволяющие редактировать и расширять реальные и сгенерированные изображения с текстовым описанием и бинарной маской.

FLUX.1 Depth: Модели, обученные для обеспечения структурного руководства на основе карты глубины, извлеченной из входного изображения и текстовой подсказки.

FLUX.1 Canny: модели, обученные для обеспечения структурного руководства на основе тонких контуров, извлеченных из входного изображения и текстовой подсказки.

FLUX.1 Redux: адаптер, позволяющий смешивать и воссоздавать входные изображения и текстовые подсказки.

Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров

fal.ai
Replicate
Together.ai
Freepik
krea.ai

Гитхаб
Веса на HF

ComfyUI

#controlnet #conditioning #image2image #text2image #news #flux
🔥20