Нейронавт | Нейросети в творчестве – Telegram
Нейронавт | Нейросети в творчестве
10.6K subscribers
4.45K photos
3.72K videos
41 files
4.76K links
Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111
Download Telegram
Forwarded from эйай ньюз
Вышел убийца Kling! Генерит за 30 секунд!

Ну почти...
Тут чуваки из Zhipu AI (это AI-стартап, китайский аналог Open AI со своим блэкджеком и ChatGPTGLM) выпустили свою Sora. Штука генерит 6-секундные видео за 30 секунд, что ну очень быстро, согласитесь (в Клинге я ждал больше часа, у Лумы 5 сек генерится 2 минуты). Так быстро работает, насколько я понял, из-за их хитрого 3D автоэнкодера, который сжимает представление видео в latent space до 2% от оригинального размера.

Вот промпты для видосиков из примера с голливудской адаптацией на английский язык от Google переводчика:

In a lush forest, some sunlight shines through the gaps between leaves, creating a Tyndall effect, giving the light shape.

When the tsunami roared in like a raging monster, the entire village was instantly swallowed up by the sea, just like a classic scene in a doomsday movie.

In the neon-lit city night scene, a little monkey full of cyber beauty holds high-tech tools and repairs equally flashing, futuristic electronic equipment.

Changing the style of painting, the kitten opened its mouth wide, showing a human-like confused expression, with question marks written all over its face.


Остальные без инструкций, так, для примера.

Качество ну не синематик, видно, что тренили на стоках и каких-то странных китайских видео. Назвали Qingying или Ying. Пока кредиты безлимитные. Я хотел потестить, но похоже, мы снова столкнулись с новым феноменом: paywall по-китайски. Опять нужен китайский номер :( Может, у кого из вас выйдет вот ссылка.

Как же китайцы дрючат!

Источник
Пытаемся вломиться здесь

@ai_newz
👍31🔥1🤔1
#оффтоп
Похоже, ютуб блокнули мне. не смог ни одно видео открыть
😱11😐21👍1
This media is not supported in your browser
VIEW IN TELEGRAM
TAPTR: Tracking Any Point with TRansformers as Detection

Еще один трекер точек на видео. Построен на том что отслеживание точек имеет большое сходство с обнаружением и отслеживанием объектов.

Похоже, он, как и конкуренты, может отслеживать скрытые точки, но авторы не очень стремятся показать это на примерах

Код

Демо (трек области)
Демо (трек точек)

#tracking
👍72
Flux

Новый генератор картинок от Fal.ai и Black Forest Labs (то самое место куда ушли в марте разработчики Stable Diffusion)

В релизе напирают на качество, анатомию, реализм, понимание промпта и скорость

Flux досутпен в трех вариантах:

FLUX.1 [dev]: Базовая модель с открытым исходным кодом и некоммерческой лицензией, которую сообщество может использовать для разработки поверх нее. Попробовать

FLUX.1 [schnell]: усовершенствованная версия базовой модели, которая работает в 10 раз быстрее. Лицензия Apache 2. Попробовать

FLUX.1 [pro]: Версия с закрытым исходным кодом, доступная только через API. Попробовать

Веса dev и schnell - по 24Гб

Гитхаб
HF

#text2image #news
🔥14👍41
SF3D: Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement

Stability AI продолжает подавать признаки жизни.
Сегодня релизнули генератор 3D ассетов по картинке.
Сразу с текстурой, UV разверткой и материалом.
Генерация происходит меньше чем за секунду на H100

Тест Бендера - очень хорошо, меш в комментах

Блог
Код
Демо
API

#imageto3D
👍132👌1
ControlNet ProMax

Обновка ControlNet++ для SDXL.

Обновление ProMaх включает в себя весь существующий набор ControlNet Union, в который добавлены возможности комбинации нескольких типов ControlNet к одному исходному изображению и новые функции Tile Deblur, Tile Superresolution, Tile Variation, Inpaint и Outpaint

Гитхаб
Веса на HF

#controlnet #conditioning #text2image #image2image
🔥18👍1
This media is not supported in your browser
VIEW IN TELEGRAM
VideoLLaMA 2: Advancing Spatial-Temporal Modeling and Audio Understanding in Video-LLMs

Модель понимания видео/аудио. Недавно выложены веса VideoLLaMA2-8x7B-Base и VideoLLaMA2-8x7B

Код
Демо
Веса

#VLM #video2text #assistant
🔥9👍3
🤖Очень полезная коллекция каналов про нейросети, сохраняйте! Это авторские блоги с уникальным контентом, где авторы сами тестируют новые модели и сервисы.

Собрал для вас редкие и полезные каналы про нейронки:

🔘 Tips AI | IT & AIканал про сервисы ИИ, интернет технологии, все тестирует сам, отбирая только лучшие AI инструменты.

🔘НейроProfit - авторский канал про полезные нейрсети для бизнеса, учебы и работы, проверенные лично.

🔘 Миша, давай по новойканал про то, как общаться с нейросетями, придумывать промпты и эффективно использовать их в работе.

🔘 Бурый — коллекционер нейросетей, тестит всё на себе и делится лучшими бесплатными нейронками.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥96👍1😁1
Forwarded from эйай ньюз
Умельцы прикрутили новую Ламу 405B к Comfy UI.

Работает на хостинге Replicate. По сути, это кастомная нода, которая пишет полноценный промпт из простого описания (prompt rewrite), так же как ChatGPT для Dalle-3.

Вообще мне не очень понравился процесс генерации картинок в нашем любимом чатГПТ, потому что у тебя нет контроля над финальным промптом, который идёт в диффузионку. Даже если просишь использовать данный промпт слово в слово, гптишка нет-нет, да меняет там что-нибудь без твоего разрешения. А суть промпт-инжиниринга в том, чтобы итеративно менять промпт и смотреть, что улучшилось, но бот часто берет и всё переписывает. Хотя для новичков это, конечно, топчик. Ну и как отправная точка для профи, тоже хорошо.

Вижу такой пайплайн для генерации короткометражных фильмов:

1) Сценарист выдаёт краткое описание кадров и, может быть, скетч от руки.
2) Нодами генерим промпт для каждого кадра на вход, берём скетчи и раскадровку от сценариста.
3) Художник пишет промпт для стиля. Добавляем его после промпта каждого кадра отдельной нодой. Подбирает модельки, лоры и пр.
4) Запускаем весь батч раз 5-10, берём лучшие кадры.
5) Идем в Luma оживлять картинки.

Кстати, нужны гайды по Комфи? Ставьте 🦄

Гитхаб

@ai_newz
👍16🥴3💯3👀21
Вайб недели.
Сделайте кто-нибудь про SD и FLUX

Ну и просто накидайте свежих мемов

#humor
😁245👍1
Инструкция по установке и применению SAM2 для сегментации видео

#tutorial #segmentation #video2mask
👍5🔥2