NEW BOT Телеграм, страница

У Meta AI тоже обновка

ИИ-функции теперь интегрированы в инстаграм, фейсбук, ватсапп (продукты, запрещенной в РФ Мета)

Камерун - да. Россия - нет 🤩

#news

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6👎2

1.72K views13:18

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

HelloMeme: Integrating Spatial Knitting Attentions to Embed High-Level and Fidelity-Rich Conditions in Diffusion Models

Это не генератор мемов, как можно заключить по названию, а очередной опенсорсный инструмент для переноса портретной анимации.

Работает ли оно только на SD1.5 (с лорами, кстати) или с более новыми генераторами картинок тоже - непонятно

Обратите внимание на заявленное превосходство над Liveportrait

Код

#pose2video #facialanimation #portrait2video #personalization

👍5🤔1

2.06K views15:03

Нейронавт | Нейросети в творчестве

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

Суббота. Вы знаете что это значит. Сдаем мемовый оброк на околоИИшные темы

#humor

🔥10😁7👎2👍1🎃1

1.79K views11:45

Нейронавт | Нейросети в творчестве

У меня есть скромное мнение что люди которые работают по выходным и выдают контент так же как и по будням - психи.

А может, я просто завидую.
Вот, успел набрюзжать до того как санитары на прогулку забрали

#оффтоп

💯15😁11🥴1

1.8K views15:40

Нейронавт | Нейросети в творчестве

OneTrainer

В утилите для дообучения генераторов картинок важное обновление для владельцев слабого железа

- Обучение Flux LoRa на 6 ГБ VRAM (с разрешением 512 пикселей)

- Дообучение Flux на 16 ГБ VRAM (или даже меньше) + 64 ГБ оперативной памяти

- Дообучение SD3.5-M на 4 ГБ VRAM (с разрешением 1024 пикселя)

Lля параметра "Gradient checkpointing" устанавливаем значение CPU_OFFLOADED, затем для параметра "Layer offload fraction" - значение от 0 до 1. При более высоких значениях будет использоваться больше системной оперативной памяти вместо видеопамяти.

Использование VRAM неоптимально при обучении Flux или SD3.5-M и Layer offload fraction близком к 0,5

#finetuning #SD35 #flux #tools

GitHub

GitHub - Nerogar/OneTrainer: OneTrainer is a one-stop solution for all your stable diffusion training needs.

OneTrainer is a one-stop solution for all your stable diffusion training needs. - Nerogar/OneTrainer

👍16❤1

1.95K viewsedited 06:16

Нейронавт | Нейросети в творчестве

3:05

This media is not supported in your browser

VIEW IN TELEGRAM

MotionCLR: Motion Generation and Training-free Editing via Understanding Attention Mechanisms

Итеративная ИИ-анимация персонажей по тексту на основе механизма внимания.

Примеры:

Подчёркивание или ослабление движения. Если вы сначала создаёте движение с подсказкой «человек прыгает» и считаете, что высота прыжка выше, чем вам нужно, вы можете уменьшить вес «прыжка», чтобы удовлетворить свой запрос.

Генерация движения на примере. В цикле интерактивной генерации движения вы можете сгенерировать движение «удар ногой». Вы также можете сгенерировать множество движений, похожих на это (с той же текстурой движения). Например, исходное движение может быть ударом левой ногой, а новое движение может включать удар правой ногой.

Замена движения на месте. Предположим, вы хотите создать несколько движений, содержащих разные действия, выполняемые в одном и том же часовом поясе. Сначала вы можете синтезировать одно движение и редактировать текст, изменяя слова напрямую.

Код
Демо
Блог

#humananimation #characteranimation

👍5

1.53K views06:39

Нейронавт | Нейросети в творчестве

InstantIR: Blind Image Restoration with Instant Generative Reference

Семейство моделей для реставрации изображений "с высочайшим качеством и реалистичностью деталей". А для пущего эффекта можно еще и использовать текстовые промпты, вплоть до редактирования содержимого

Код
Веса
Демо ждем

#imagerestoration #BIR #imageediting #image2image #upscale

👍8🔥3🤔1

1.53K views06:55

Нейронавт | Нейросети в творчестве

JEN-1 Новая мощная музыкальная модель. Возможности: - генерация музыки по тексту - инпейнтинг (замена заданного фрагмента) - продолжение заданного фрагмента Хорошо справляется с попаданием в заданный темп, инструмент, настроение, эру (70-е, 80-е, 90-е)…

1:29

This media is not supported in your browser

VIEW IN TELEGRAM

jenmusic.ai

Оказывается, у генератора/редактора музыки JEN-1 уже есть онлайн сервис

На старте дают 300 кредитов, по 3 кредита на генерацию. В генерации два варианта 45-секундного трека. Трек потом можно продлить

Этакий конкурент Suno/Udio на минималках... Хотя почему на минималках. Тут есть убойные фичи:
Сделать трек из вашего аудио. И Превратить ваше аудио в определенный музыкальный инструмент.

Го тестить!

Ссылка на трек из видео

#text2music #online #audio2music #audio2instrument

🔥8🥴1

1.73K viewsedited 07:20

Нейронавт | Нейросети в творчестве

1:13

This media is not supported in your browser

VIEW IN TELEGRAM

1:15

This media is not supported in your browser

VIEW IN TELEGRAM

1:45

This media is not supported in your browser

VIEW IN TELEGRAM

OS-ATLAS: A Foundation Action Model For Generalist GUI Agents

У нас вырисовывается новая гонка - гонка моделей для захвата власти над вашим локальным устройством.

OS-ATLAS - базовая модель агентов для взаимодействия с пользоветльским интерсфейсом. Иначе говоря, для выполнения действий на компе вместо вас, подобно Jarvis, OmniParser, Computer Use

Код
Веса

#assistant #agent #GUIagent

👍3🔥1

1.48K views08:04

Нейронавт | Нейросети в творчестве

Leaderboard Explorer

Надо сравнить нейросетки? Ищем подходящий лидерборд на HuggingFace

#leaderboard

👍1

1.46K views08:50

Нейронавт | Нейросети в творчестве

1:01

This media is not supported in your browser

VIEW IN TELEGRAM

ConsiStory: Training-Free Consistent Text-to-Image Generation

Генерация консистентных изображений без дообучения от Nvidia. Модель тизернули еще летом, код опубликовали вчера.
скорость - 10 секунд на 1 генерацию (какого разрешения?) на H100
Работает на SDXL, в будущем добавят поддержку Flux

Код
Демо

#personalization #text2image

🔥11

7.85K views09:15

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

URAvatar: Universal Relightable Gaussian Codec Avatars

Портретный аватар на гауссианах. На вход достаточно подать "телефонный скан" - что это? фотограмметрия? скан с лидара? видео с разных ракурсов?

Ну и дальше в реальном времени можно управлять анимацией и освещением

Кода нет

#humanavatar #gaussian #facialanimation #headanimation #talkinghead

🔥7

1.48K views13:26

About

Blog

Apps

Platform