NEW BOT Телеграм, страница

Tora: Trajectory-oriented Diffusion Transformer for Video Generation

Генерация видео с движением объекта по заданной траектории. Примеры сгенерированы в CogVIdeoX

Код

#text2video #image2video #motioncontrol

👍8🔥3

1.42K views07:00

Нейронавт | Нейросети в творчестве

0:19

This media is not supported in your browser

VIEW IN TELEGRAM

NotebookLM

Сервис гугла для превращения PDF в подкаст получил новую фичу.

Теперь можно перед созданием проинструктировать подкастеров сосредоточить внимание на конкретных темах или задать уровень экспертизы.

#text2voice #pdf2voice

🔥9

1.59K views07:39

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Stencil Brush From Sd ControlNet

Плагин к Блендеру для текстурирования на базе SD

#blender #plugin #texturing

😁7👍2

1.54K viewsedited 08:07

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

0:09

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

GStex: Per-Primitive Texturing of 2D Gaussian Splatting for Decoupled Appearance and Geometry Modeling

А теперь про качество текстур для сцен на гауссианах.
GStex прорабатывает текстуры на уровне примитивов.

Код

#gaussian

🔥7

1.48K views09:38

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

А вот и демоспейс, где можно потестить генератор глубины для видео Depth Any Video

Демо HF
Демо replicate

#video2depth

👍15

1.48K views10:02

Нейронавт | Нейросети в творчестве

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

Interactive Character Control with Auto-Regressive Motion Diffusion Models

Диффузная генерация персонажной 3D анимации. Каждая генерация - уникальная анимация.
А еще оно работает в рилтайме.
Ну что, ждем в играх?

Код
Видео от 2-минутного доктора

#humananimation #characteranimation #animatoin #realtime

👍7🔥6

1.96K views11:54

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

ComfyUI Desktop V1

Отдельное человеческое приложение, не в браузере.
Поддерживаются Windows, macOS, Linux

Будет новый UI, библа моделей, ComfyUI Manager из коробки, прочие плюшки.

Почему будет? Потому что это анонс релиза, а не релиз. Но можно попроситься в бету.

Forge, A1111 - ваш ход?

Записаться в вейтлист

#news #comfyUI

🔥24🥴2👍1

1.65K views13:54

Нейронавт | Нейросети в творчестве

BiGR: Harnessing Binary Latent Codes for Image Generation and Improved Visual Representation Capabilities

Новый гибкий кондиционный генератор картинок.
Кроме генерации умеет распознавать, редактировать.
Инпейнтинг, аутпейнтинг, интерполяция, обогащение (деталями???)

А где же ~~подвох~~ подлох, спросите вы.
А вот он:
Претрейны есть для 512*512 и 256*256

В колабе генерит долго: на блок из 4 картинок 256*256 ушло минуты 3 (третья картинка).

На вход подаются номера классов. Текстовый промпт не предусмотрен.
Ну ладно, может он редактировать хорошо будет?

Код
Колаб

#news #text2image #image2image #inpainting #outpainting #imageediting #image2text

🤔4❤1👍1

1.75K views15:03

Нейронавт | Нейросети в творчестве

Sana: Efficient High-Resolution Image Synthesis with Linear Diffusion Transformer Генератор картинок по тексту от Nvidia и компании. Может эффективно генерировать изображения с разрешением до 4096 × 4096. Из фишек - скорость даже на GPU ноутбука, четкое…

У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой.

И демка которая возможно проживет несколько дней

F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5

Гитхаб
Демо спасибо за наводку @p0lygon

#news #text2image

😁8

1.51K viewsedited 07:47

Нейронавт | Нейросети в творчестве

Arch-Guard

От взлома языковых моделей защищаются всерьез.

Коллекция Katanemo Arch-Guard — это коллекция самых современных (SOTA) #LLM, специально разработанных для задач обнаружения взлома. Попытки взлома — это вредоносные запросы, предназначенные для изменения предполагаемого поведения базовой модели LLM приложения. Они часто нарушают правила безопасности модели.

Война технологий продолжается

#news #jailbreak

huggingface.co

katanemo/Arch-Guard · Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

😁3👀3

1.59K views08:39

Нейронавт | Нейросети в творчестве

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

Мемная нейроптица с огромными тестикулами залетела к профессору МГУ на РЕН-ТВ. Теперь это редкий мадагаскарский вид, нарушающий законы природы и откладывающий яйца в мешочек на животе

#humor #news

😁42🎃4😭3

2.24K views08:55

Нейронавт | Нейросети в творчестве

У ожидаемого нами генератора картинок от Nvidia Sana появился репозиторий на гитхабе. Пустой. И демка которая возможно проживет несколько дней F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 F5 Гитхаб Демо спасибо за наводку @p0lygon #news #text2image

Короче, код Sana собираются опубликовать. Как стало ясно из комментария на гитхабе, ждут внутреннего одобрения

#news

❤13

1.6K viewsedited 11:33

Нейронавт | Нейросети в творчестве

Stable Diffusion 3.5

Нежданно-негадано. Новое поколение генератора картинок SD. Улучшенное качество изображений, типографика, понимание комплексных промптов и экономия ресурсов. Заявлена легкая кастомизация.

Выкатили Stable Diffusion 3.5 Large (8B параметров) и Stable Diffusion 3.5 Large Turbo (дистиллированная модель на 4 шага). А Medium (2.5B параметров) выкатят 29 октября

Уже поддерживается в ComfyUI

Модель HF
Гитхаб

Демо HF
API
Replicate

#text2image #news

🔥12👀1

1.84K views14:28

Нейронавт | Нейросети в творчестве

Итак, кастомизация SD3.5

Для обучения лоры SD3.5 Large запаситесь 24Gb VRAM

Официальный гайд

готовые лоры:
раз
два
три
———————————
Примеры ComfyUI

———————————
SD3.5-fp8 (пожатая модель)

Спионерил у @SergeyTsyptsyn

#lora #text2image #comfyui #finetuning

🔥5👍2❤1

1.85K viewsedited 15:54

Нейронавт | Нейросети в творчестве

0:31

This media is not supported in your browser

VIEW IN TELEGRAM

Mochi 1

Новый опенсорсный видеогенератор по тексту от Genmo.
Только губу не раскатывайте, на вашем домашнем железе даже его пятка не заведется. Готовьте 4хH100.
А на выходе пока только 480p. HD ждем в этом году.
Любит фотореализм, поэтому с анимацией не дружит (что бы это ни значило)

Гитхаб
Веса на HF, всего 42GB
Playground (попробовать)

#text2video

👍16😱3❤1👏1🤡1

2.11K views19:02

Нейронавт | Нейросети в творчестве

JoyCaption Alpha 2 - Batch Script

Скрипт для пакетной обработки картинок в JoyCaption.

Для Alpha 2 требуется ~ 22 ГБ видеопамяти.
Для режима Low VRAM требуется ~ 10 ГБ видеопамяти.
Режим Low VRAM работает только в pre-alpha версии

Реддит

#image2text #captioning

👍3❤1

1.76K views05:03

About

Blog

Apps

Platform