NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Athene-V2-Agent

Опенсорсный LLM-агент 72B параметров. Превосходит (по бенчам) GPT-4o на агентских задачах

Дообучен из Qwen-2.5-72B-Intruct

#assistant #agent

👍6🔥2

1.81K views07:33

Нейронавт | Нейросети в творчестве

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

MinerU

Инструмент для преобразования PDF документов в машинно-читаемые форматы (markdown, JSON и т п)

Гитхаб
Демо

#tools #pdf

🔥7

1.72K views07:52

Нейронавт | Нейросети в творчестве

1:44

This media is not supported in your browser

VIEW IN TELEGRAM

MagicQuill: An Intelligent Interactive Image Editing System

Редактор картинок с GUI, под капотом #SD 1.5 и мультимодальная LLM

Код
Демо

#imageediting

👍13⚡1🎃1

1.76K viewsedited 08:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

LLaMA-Mesh: Unifying 3D Mesh Generation with Language Models

Понимание и генерация 3D сеток языковой моделью.

В очередной раз выяснилось что языковые модели могут работать с нетексовыми данными, записанными в текстовом формате. Например, 3D объекты можно описывать координатами вершин и прочими циферками. Именно так и устроены некоторые форматы 3d файлов.

Налетаем, пробуем.

Код
Веса
Демо

#textto3d #3dtotext #assistant

🔥14

1.78K viewsedited 08:28

Нейронавт | Нейросети в творчестве

0:33

This media is not supported in your browser

VIEW IN TELEGRAM

SuperSplat 1.9.0

Опенсорсный редактор 3D сцен на гауссианах

Умеет выделять группы сплатов, двигать, масштабировать, крутить, удалять.

Код
Попробовать онлайн

#gaussian #3Dedit

👍7🔥2

1.83K viewsedited 07:53

Нейронавт | Нейросети в творчестве

Говорят, можно обучить лору #flux на нескольких персонажей. Сам не пробовал

Вообще считается что при попытке запихнуть в одну лору несколько объектов они смешиваются

Видео
Реддит

#lora #tutorial

YouTube

Multiple Consistent Characters in One Single Flux Lora!

Multiple Consistent Characters in One Single Flux Lora!

This video will show you how to set up training to set up a Lora that contains different multiple characters.

It is not the best when working with multiple people but it works great with objects, settings…

👍9

2.12K views08:20

Нейронавт | Нейросети в творчестве

Ultravox

Голосовая разговорная LLM на базе Llama3.1-70B-Instruct и whisper-large-v3-turbo, опенсорс.
Голосовые данные для нее являются родными, как и текст.
Работает в реальном времени.
Поболтал с ней пару минут - задержка вообще незаметна. Прекрасно говорит по-русски!

Умеет клонировать голос, в демо этого нет
Есть онлайн сервис с API

Гитхаб
Веса
Демо

#voiceassistant #assiatant #voicecloning #translation #LLM #realtime #online

🔥18👍4👎1

4K viewsedited 10:10

Нейронавт | Нейросети в творчестве

1:07

Media is too big

VIEW IN TELEGRAM

GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation

Скоро будем генерить сцены на гауссианах по тексту, как в этом проекте. Может, сетки вообще станут не нужны?

Код ждем
Демо ждем

#textto3d #text2gaussian #gaussian

🔥5

1.83K views15:39

Нейронавт | Нейросети в творчестве

0:27

This media is not supported in your browser

VIEW IN TELEGRAM

Suno v4

Обновился генератор песен Suno.
Версия 4 доступна для подписчиков Pro и Premier.
Лучше звук, лучше тексты, лучше структура песен

#text2music #music2music

❤9😭3🔥2💩1🎃1

1.89K views17:38

Нейронавт | Нейросети в творчестве

2:09

This media is not supported in your browser

VIEW IN TELEGRAM

Pixtral Large 124B

Mistral AI релизнули зубастую модель и обновили Le Chat. Отличная альтернатива ChatGPT/Claude, да еще и работает без VPN

в чате:

- Веб-поиск

- Canvas - аналог OpenAI Canvas

- Понимание PDF и изображений

- Flux Pro!

Чат

#assistant

❤7👍1

2.11K viewsedited 07:40

Нейронавт | Нейросети в творчестве

Anychat

Неплохой подарочек
В этом демоспейсе есть большинство топовых LLM, даже Pixtral Large уже завезли.

Для коммерческих конечно понадобится токен

#assistant #llm

👍6❤1

2.07K views08:25

Нейронавт | Нейросети в творчестве

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

AnimateAnything: Consistent and Controllable Animation for video generation

Очередная попытка управлять движением при генерации видео

Код ждем

#cameracontrol #motioncontrol #image2video

❤4

1.78K views09:04

Нейронавт | Нейросети в творчестве

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

JoyVASA: Portrait and Animal Image Animation with Diffusion-Based Audio-Driven Facial Dynamics and Head Motion Generation

Портретная анимация по звуку речи для людей и животных

Код

#facialanimation #speech2video #image2video #talkinghead

👍10😁1

2.07K views09:33

Нейронавт | Нейросети в творчестве

2:19

This media is not supported in your browser

VIEW IN TELEGRAM

GeneX: Generative World Explorer

Интересная работа.
Модель обучили ориентироваться в пространстве подобно человеку, учитывая известные объекты вне поля зрения

#news #worldunderstanding

👍5❤1

1.71K views10:01

Нейронавт | Нейросети в творчестве

Обновлен бесплатный тариф видеогенератора Kling

Теперь дают 366 кредитов в месяц и ограниченный доступ к платным функциям - 5 генераций с платными функциями в месяц.

Ну и еще они готовят видеоредактор

#news #text2video #image2video

❤12⚡2

2.09K viewsedited 13:50

Нейронавт | Нейросети в творчестве

Обновка GPT-4o

Креативнее тексты, улучшена читабельность и релевантность, улучшено понимание файлов

#news #assistant

👍2

1.86K views20:19

Нейронавт | Нейросети в творчестве

Опубликован код Sana - генератора картинок от Nvidia

Diffusers, ComfyUI - ждем

Код
Демо 1.6B 1024px - спасибо @m_franz

#text2image

Нейронавт | Нейросети в творчестве

Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer

Генератор картинок по тексту от Nvidia и компании.

Может эффективно генерировать изображения с разрешением до 4096 × 4096.
Из фишек - скорость даже на GPU ноутбука, четкое…

❤6🥴3

1.94K viewsedited 09:12

Нейронавт | Нейросети в творчестве

R1-Lite

Способная к рассуждениям #LLM от DeepSeek, конкурент o1, ждем в опенсорсе

По бенчмаркам лучше o1-preview в кодинге и математике, в остальном послабее

Попробовать можно на их сайте, включив «Deep Think». Дают 50 сообщений в день бесплатно

Попробовать

#assistant

👍5🎃1

1.86K viewsedited 11:24

Нейронавт | Нейросети в творчестве

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

FLUX.1 Tools

BlackForest Labs выпустили пачку контролнетов для FLUX.1 под названием FLUX.1 Tools

Вернее, это полноценные модели по 24Гб со встроенным функционалом контролнета. Depth и Canny есть также в виде лоры

FLUX.1 Fill: современные модели #inpainting и #outpainting, позволяющие редактировать и расширять реальные и сгенерированные изображения с текстовым описанием и бинарной маской.

FLUX.1 Depth: Модели, обученные для обеспечения структурного руководства на основе карты глубины, извлеченной из входного изображения и текстовой подсказки.

FLUX.1 Canny: модели, обученные для обеспечения структурного руководства на основе тонких контуров, извлеченных из входного изображения и текстовой подсказки.

FLUX.1 Redux: адаптер, позволяющий смешивать и воссоздавать входные изображения и текстовые подсказки.

Доступно по API для [pro] и в опенсорсе для [dev]
А также на сайтах партнеров

fal.ai
Replicate
Together.ai
Freepik
krea.ai

Гитхаб
Веса на HF

ComfyUI

#controlnet #conditioning #image2image #text2image #news #flux

🔥20

2.43K views15:55

About

Blog

Apps

Platform