NEW BOT Телеграм, страница

Нейронавт | Нейросети в творчестве

Обучение Chroma (чекпойнт на базе Flux Schnell) завершено, семейство моделей доступно для использования.

Модели можно дообучать под конкретные задачи.

Chroma1-Base (базовая модель 512x512)

Chroma1-HD (модель с высоким разрешением 1024x1024)

Chroma1-Flash (экспериментальная версия для ускорения работы моделей)

Chroma1-Radiance [WIP] (модель, работающая напрямую с пикселями, а не с латентным пространством, что должно устранить некоторые артефакты).

Базовые модели универсальны и дают больше возможностей для дальнейшей настройки, в отличие от моделей, заточенных под определённый стиль.

На примерах черрипики с flash и HD

Реддит
Fictional.ai - говорят, в мобильной аппке есть Chroma. Дают ли попробовать бесплатно не заню

#text2image #mobile #ios #android

👍12

1.99K views07:10

Нейронавт | Нейросети в творчестве

lightx2v Qwen-Image-Edit-Lightning

ускоряющая лора Qwen-Image-Edit
есть 8-шаговая, 4-шаговая, полные веса и bf16

#lora #optimization #qwenimage

huggingface.co

lightx2v/Qwen-Image-Lightning at main

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

🔥5👍4

1.74K views08:11

Нейронавт | Нейросети в творчестве

воу-воу полегче Qwen!
Мы еще с этой версией только начинаем разбираться!

Официальный твиттер Qwen пообещал улучшенную работу с несколькими входными изображениями в следующей версии

#news

👍16

1.71K views08:41

Нейронавт | Нейросети в творчестве

1:02

This media is not supported in your browser

VIEW IN TELEGRAM

1:03

This media is not supported in your browser

VIEW IN TELEGRAM

Waver 1.0

Единая модель от ByteDance для генерации видео и изображений

3 место на T2V leaderboard & I2V leaderboard

— поддерживает создание видео по тексту и изображениям;

— генерирует видео длиной 5 и 10 секунд;

— работает с разрешением 720p и 1080p;

— создаёт видео с реалистичными движениями, особенно в масштабных сценах с людьми и животными;

— позволяет создавать нарративные видео с несколькими последовательными кадрами, сохраняя при этом согласованность сюжета, визуального стиля и атмосферы;

— поддерживает генерацию видео в различных художественных стилях, включая гиперреализм, анимацию, плюшевые игрушки и другие;

— способна отображать сложные и масштабные движения, например, в спортивных сценах;

— может создавать видео с многокамерным повествованием, обеспечивая согласованность основного объекта, визуального стиля и общей атмосферы при переключении кадров.

Гитхаб без кода
Дискорд - попробовать предлагают здесь

#text2image #image2video #text2video

👍9❤1🔥1

9.61K views09:12

Нейронавт | Нейросети в творчестве

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

потестил

Первое - t2v
Prompt: fantasy Fish straight-walking from right to the left out of sea to a human city as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet, in human disguise, masterpiece, wide view, distant view

Второе - i2v
Prompt: fantasy Fish straight-walking in a human city as undercover agent, wearing human suite, wearing a landsuite with a helmet filled with water to breathe, wearing a hat over the helmet. The Fish is walking and turning his head around exploring the human world. masterpiece, wide view, distant view

Третье - t2v, скормил монолог идущего к реке
Prompt: I am so filled with my knowledge that I seem to have been living on trillions and trillions of planets like this Earth for a hundred trillion billion years, this world is absolutely clear to me, and I am looking for only one thing here - peace, peace and this harmony, from merging with the infinitely eternal, from contemplating the great fractal similarity and from this wonderful unity of being, infinitely eternal, wherever you look, though deep - infinitely small, though up - infinitely large

🥴13😁3👍2😐2🔥1

1.73K views09:25

Нейронавт | Нейросети в творчестве

0:10

This media is not supported in your browser

TINKER: Diffusion's Gift to 3D--Multi-View Consistent Editing From Sparse Inputs without Per-Scene Optimization

Редактор 3D сцен на гауссианах текстовыми указаниями

— не требует много исходных данных;

— не нуждается в настройке для каждой сцены;

— может редактировать 3D с одним или несколькими входными данными;

— создаёт согласованные правки с несколькими ракурсами по 1–2 изображениям;

— реконструирует видео по первому кадру и глубине;

— улучшает качество 3DGS

Код ждем, с интеграцией в NerfStudio

#gaussian #3dediting

🔥7👍1

1.94K views10:13

Нейронавт | Нейросети в творчестве

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

0:37

This media is not supported in your browser

VIEW IN TELEGRAM

2:54

This media is not supported in your browser

VIEW IN TELEGRAM

Griffith Voice — AI Voice Cloner & Dubber

Проект соло-разработчика для дубляжа видео с клонированием оригинальных голосов на Whisper / GPT / GPT-SoVITS

На вход нужно только видео. Поддерживает Английский, корейский? японский, китайский.

В разработке: русский!, французский, арабский, немецкий

Работает на 4GB VRAM

#dubbing #voicecloning #translation

👍11🔥2

2K views11:14

About

Blog

Apps

Platform