NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Humor Arena

Арена/лидерборд языковых моделей по придумыванию шуток.
Видимо, все на английском.
Есть топ лучших шуток, можете глянуть. Все однотипные имхо

Хостится не на HF, не теряйте

#leaderboard

👍3

1.62K views20:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation

Генератор 3D сцены по картинке.

Получив входное изображение сцены, мы сегментируем его на несколько частей и используем многоэкземплярную диффузную модель, основанную на этих изображениях, для создания композиционных 3D-экземпляров сцены. Эти 3D-экземпляры могут быть непосредственно объединены в сцену. Общее время обработки составляет всего 40 секунд.

Код ждем

#imageto3d

👍8🔥3

1.74K views07:22

Нейронавт | Нейросети в творчестве

Pleias

Семейство небольших языковых моделей, обученных только на открытых данных.

350M, 1.2B и 3B параметров

- мультиязычные, несколько европейских языков (каких?)
- безопасные, самые низкие результаты в тесте токсичности
- эффективны при выполнении ключевых задач, таких как поиск знаний.
- способны эффективно работать на локальном железе потребительского уровня (CPU, без квантизации)

веса

#news #llm

👍4❤1

1.61K views07:45

Нейронавт | Нейросети в творчестве

xAI Aurora

Генератор картинок в Grok
Недиффузный, что интересно, а авторегрессионный.

Диффузные генераторы проявляют изображение из шума постепенно за несколько шагов. Авторегрессия сразу создает патчи (кусочки) готового изображения

Aurora умеет не только создавать, но изменять картинки. Архитектура позволяет легко принимать на вход и текст, и изображение

Доступ - через Grok, видимо, на подписке

#news #text2image #image2image

👍8❤1

1.52K views10:53

Нейронавт | Нейросети в творчестве

2:15

Media is too big

VIEW IN TELEGRAM

MEMO: Memory-Guided Diffusion for Expressive Talking Video Generation

Говорящая голова, оживление портрета по звуку речи.
Работает с разными языками, стилями портретов, речи, поворотами головы

Код
Демо спасибо @p0lygon

#talkinghead #lypsync #speech2video

🔥12

1.88K viewsedited 11:34

Нейронавт | Нейросети в творчестве

Negative Token Merging: Image-based Adversarial Feature Guidance

NegToMe увеличивает вариативность сгенерированных картинок.
Прикручивали к флюксу

Код
Демо (Flux)

#text2image #flux

👍8🔥1

1.71K views11:58

Нейронавт | Нейросети в творчестве

Florence-VL: Enhancing Vision-Language Models with Generative Vision Encoder and Depth-Breadth Fusion

Визуально-языковая модель для понимания изображений на основе Florence-2 от Microsoft

Код/веса
Демо 8B
Демо 3B

#assistant #vlm

👍7❤1

1.69K views05:49

Нейронавт | Нейросети в творчестве

Golden Noise for Diffusion Models: A Learning Framework

Промптинг шумом
Преобразует случайный гауссов шум в золотой шум путем добавления небольшого желаемого возмущения, получаемого из текстовой подсказки, для повышения общего качества и семантической достоверности синтезируемых изображений.

Дружит с SDXL, Hunyan

Код
Демо сейчас не работает
HF

#text2image

❤7👍1

1.58K views07:05

Нейронавт | Нейросети в творчестве

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

InternVL 2.5

Новый чемпион в понимании изображений. Семейство моделей от 1B до 78B параметров

Гитхаб
Чат демо
Демо HF
Веса

#VLM #MLLM #assistant

👍6

1.67K views07:14

Нейронавт | Нейросети в творчестве

0:14

This media is not supported in your browser

VIEW IN TELEGRAM

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Multi-HMR: Multi-Person Whole-Body Human Mesh Recovery in a Single Shot

Реконструкция 3D моделей нескольких людей по одному ракурсу.
Восстанавливает без одежды. Нет, не поэтому

Код
Демо

#poseestimation #video2pose #videoto3d #video2mesh #humanreconstruction

🔥5🤯1

1.54K views07:48

Нейронавт | Нейросети в творчестве

1:20

This media is not supported in your browser

VIEW IN TELEGRAM

SwiftEdit: Lightning Fast Text-guided Image Editing via One-step Diffusion

Редактирование изображений с помощью текстовых команд.
Обучен на SwiftBrush v2 (SBv2) и SD-Turbo

Сохраняет детали и текстуры исходного изображения
Работать быстро, всего за 0,23 секунды на одной видеокарте A100

Код ждем

#imageediting #image2image

👍5

1.59K views08:11

Нейронавт | Нейросети в творчестве

Есть код и демо OneDiffusion - генератора/пониматора картинок

Код
Демо сейчас 404 - ждем
Веса на HF

#text2image #image2image #conditioning #personalization #multiview

Нейронавт | Нейросети в творчестве

OneDiffusion

Единая модель для разных задач, связанных с генерацией и пониманием изображений

- генерация по тексту
- персонализация
- многоракурсная генерация - сразу несколько ракурсов объекта, заданного текстом или референсным изображением
- генерация…

👍4🔥2

1.73K views08:42

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ChatGTP Canvas обновили.
Это инструмент для совместного редактирования вместе с ChatGPT

Теперь он доступен "всем" ну и плюс еще какие-то фишки
- Код на Python можно запускать в браузере;
- ChatGPT -может комментировать и редактировать текст и код
- Поддержка кастомных GPT’s

#coding

👍1🤯1

1.54K views09:45

Нейронавт | Нейросети в творчестве

Youtube auto dubbing

Youtube прикрутил автоматический дубляж видео. Привет @yabrowser

Чтобы видео было продублировано на другой язык, автор должен включить эту опцию

Пример дулбяж с французского на английский

#news #dubbing #speech2speech

👍10🔥4❤1

1.75K views12:26

Нейронавт | Нейросети в творчестве

2:30

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 2.0

Гугл объявил эру агентов.
Мультимодальный ассистент

- в риалтайме понимает одновременно и аудио и видео
- можно стримить ему свой экран
- может общаться голосом
- выполняет сложные задачи
- ищет в интернете

И все это бесплатно. Россиян традиционно не любят. Добро пожаловать с неевропейского IP

Попробовать

#news #agent

👍6💯3

1.89K viewsedited 07:25

About

Blog

Apps

Platform