NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Kandinsky 3D

Генерилка текстурированных 3D моделей по тексту от Сбера.

По текстовому описанию выдает 4 варианта модели с разным сидом на выбор

Обещают сделать генерацию по изображению, расширенные настройки генерации, инструменты упрощения и оптимизации 3D-модели.

#тестбендера по текстовому описанию картинки из JoyCaption Beta One провален с первой попытки - нарисовал что-то совсем непохожее. Со второй - на твердую троечку

Сетку оцените сами

Попробовать - нужен Sber ID, но это фигня, при каждом запросе придется писать капчу. Короче, Сбер опять отличился. Но похоже что других ограничений нет.

API

#textto3D

🥴13👍4👎4🤔2😁1

2.03K views15:15

Нейронавт | Нейросети в творчестве

Альтман опять что-то спойлерит, неизвестно что.
Делаем ставки

👍 - придумают нормальное название продукта
👎 - как всегда, будет бессмысленное цифро-буквенное обозначение

#news

👎42🤔4👍3

1.8K views20:19

Нейронавт | Нейросети в творчестве

Установил вчера VACE в Pinokio
Он там лежит в Community Scripts.

Ждал пару часов пока все скачается - засрал 75Гб сразу
Потом ждал пару часов пока обработается
Потом читал мануал, все стало еще непонятнее
Потом потыкал препроцессоры
Потом лег спать

И вот наконец, наутро мне нечего показать

Кто понял что там нажимать чтобы заменить лицо на видео?

😁8👍7🔥2

1.67K views08:24

Нейронавт | Нейросети в творчестве

Stable Scripts UI (SSUI)

Автор испугался огромных комфи воркфлоу и сделал свой комфи с блэкджеком. Короче среда сборки и запуска воркфлоу с нейросетками, но чтоб не было десятков и сотен непонятных блоков.

Главная идея - простота и воспроизводимость. У всех все должно запускаться одинаково. Что-то вроде Pinokio если бы он был конструктором для непрограммистов. И что-то вроде комфи где не надо разбираться что куда втыкать

- Простота использования

- Воспроизводимость: Скрипты, необходимые для них модули и сам SSUI являются версионными. Скрипты могут запускаться точно в той же среде, что и автор сценария.

- Управляемость моделями и конфигурациями

- Строгая типизированность: Все ресурсы (включая модели) являются строго типизированными, и их невозможно использовать неправильно.

- Настраиваемость: Вы можете настроить скрипты, типы, модели, панели, загрузчики, фреймворк пользовательского интерфейса и многое другое.

Проект на стадии MVP (минимальный функционал), сейчас поддерживает только SD1, SDXL, Flux

#text2image #tools #GUI

👍12🤷‍♂2

1.71K views08:49

Нейронавт | Нейросети в творчестве

ltxv-13b-0.9.7-distilled-GGUF

а вот и ггуфы LTX VIDEO-13B, забираем

Воркфлоу

#workflow #gguf #text2video #image2video

huggingface.co

wsbagnsv1/ltxv-13b-0.9.7-distilled-GGUF at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤2

1.78K views09:37

Нейронавт | Нейросети в творчестве

0:17

This media is not supported in your browser

VIEW IN TELEGRAM

0:43

This media is not supported in your browser

VIEW IN TELEGRAM

Stable Audio Open Small

Спустя пару месяцев Stability AI выпустили мобильный генератор звуков для девайсов ARM

До 11 секунд 44.1kHz стерео по тексту локально на мобилках

Веса
Гитхаб

#news #mobile #text2audio

🤔2👍1👏1

1.65K views11:34

Нейронавт | Нейросети в творчестве

0:41

Media is too big

VIEW IN TELEGRAM

MoviiGen 1.1

Файнтюн Wan 2.1 с заявкой на кинокачество, видео по тексту.

720P и 1080P

Должно работать с любым родным Wan 2.1 t2v вокрфлоу

есть GGUF

#text2video

👍18👏3🔥2❤1

1.72K views12:16

Нейронавт | Нейросети в творчестве

Hunyuan Image 2.0

Tencent выкатил генератор картинок 2.0
Генерит мгновенно!
Высокая реалистичность.
Dual-Canvas Studio - редактор с холстом позволяет смешивать слои.

Как пользоваться - непонятно, все на китайском. Для начала надо войти по имейлу. Вот куда-то ткнул, сделал котика. Первая картинка с котиком - моя, просто по запросу Cat, непонятно новой моделью или старой.

Вообще выглядит впечатляюще

#text2image #realtime #imageediting

👍10❤7

2.07K views12:40

Нейронавт | Нейросети в творчестве

Короче, надо ткнуть в 1, потом в 2, потом нажать кнопку 3, появится всплывающее окошко и надо успеть ткнуть в нем на кнопку, она почему-то сразу исчезает, тогда появится сообщение что мол ждите приглашение на почту

А мой кот был из старой версии, получается

🔥6😁2👍1👌1

1.54K views12:45

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

так видимо выглядит работа с холстом

🔥11👍2

1.5K views12:47

Нейронавт | Нейросети в творчестве

BLIP3-o

Мультимодальная модель от Salesforce. Сочетает в себе авторегрессионную силу рассуждений и инструкций с генеративной силой диффузионных моделей. Есть 4B и 8B параметров

Понимает картинки и умеет отвечать на вопросы как минимум

Демо
Код
Веса

#multimodal #image2text #instruct

🔥7❤1

1.64K views13:16

Нейронавт | Нейросети в творчестве

2:29

This media is not supported in your browser

VIEW IN TELEGRAM

LightLab: Controlling Light Sources in Images with Diffusion Models

Гугл в соавторстве создали модель для управления видимыми источниками света на изображениях. Увы кода нет. На сайте проекта можно интерактивно потыкать картинки

#relighting

👍11❤1🔥1

1.59K views13:47

About

Blog

Apps

Platform