NEW BOT Телеграм, страница - 314325207

Нейронавт | Нейросети в творчестве

@GreenNeuralRobots

10.6K subscribers

4.43K photos

3.7K videos

41 files

4.74K links

Канал про нейросети в компьютерной графике, в кино и вообще

В папках не участвую

для связи @Neuronauticus

Заявка на регистрацию в РКН № 6309426111

Download Telegram

About

Blog

Apps

Platform

Нейронавт | Нейросети в творчестве

10.6K subscribers

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Nunchaku v0.1.4

Инференсный движок для запуска 4-битных диффузных моделей по методу SVDQuant (там есть демо, среди авторов MIT, NVIDIA, Pika Labs)
Поддерживает лоры
Сокращает требование по VRAM для FLUX.1 до 4Гб, увеличивая скорость в 2-3 раза.
Протестирован с SDXL, PixArt-∑, FLUX.1б SANA 1.6B

Код
Демо
ComfyUI
https://huggingface.co/mit-han-lab/nunchaku/blob/main/nunchaku-0.1.4%2Btorch2.6-cp312-cp312-win_amd64.whl - может пригодиться для Windows

#text2image #optimization

🔥15❤3

1.95K views09:44

Нейронавт | Нейросети в творчестве

Forwarded from CGIT_Vines (Marvin Heemeyer)

This media is not supported in your browser

VIEW IN TELEGRAM

Пару дней уже маячит этот пост, хочет всё же, чтобы я его вам показал.

По сути, ещё один способ рендерить генеративно для какой-нибудь рекламки или клипов. Меня тут сам процесс возмутил.

1. Build 3D Renders in Claude 3.7.
2. Program camera movements.
3. Screen record render.
4. Upload video to Runway Gen-3.
5. Extract 1st frame.
6. Magnific Struct. Ref. 1st frame.
7. Upload in Runway Restyle.
8. Generate.

Прям вот самый первый пункт! Из меня вырывается старый дед с render.ru: "Вы что, и моделить за меня будете?!" Вот в наше время...

На самом деле, насрать, как создаётся, если оно отвечает задачам. У меня скорее вопрос: как долго будут ждать производители софта для моделирования, чтобы встроить подобный генеративный функционал себе? Или они будут рассчитывать на создателей плагинов, как всегда делал Autodesk? 🗡

Мы уже видели это для CAD-систем, Blender тоже не отстаёт, но это всё плагины. Со стороны компаний тоже хочется поддержки, бриджей, чтобы не приходилось танцевать с бубном.

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥7👍5

1.76K views11:26

Нейронавт | Нейросети в творчестве

Media is too big

VIEW IN TELEGRAM

Media is too big

VIEW IN TELEGRAM

Higgsfield AI

Сервис для создания длинных монтажных видеороликов от идеи до финального монтажа.

ИИ-ассистент Copilot проводит вас через

- Написание сценария

- Создание раскадровки. За картинки отвечает #Flux с выбором из нескольких стилей

- Генерация видео по картинке. Тут на выбор Minimax, Kling, Runway Gen-3 и своя модель Higgsfield (насколько своя - не знаю, сомневаюсь что с нуля делали)

- Монтаж. Есть простенький видеоредактор.

- Генерация речи/липсинк от Elevenlabs

Инпейнтинг для Flux обещают прикрутить на следующей неделе. Генератор музыки тоже планируют встроить.

Потренировался на кошках. С остальным звуком кроме речи помогли DiffRhythm, FoleyCrafter, TangoFlux

1 картинка стоит 1 кредит
1 видео MiniMax/Kling - 10 кредитов
1 видео Gen 3 - 5 кредитов

Бесплатных кредитов, увы, не дают. Но есть промокод на 100 кредитов:

HIGGS_DcU7s

#text2movie #noscript2movie #text2image #image2video

👍12🔥6👎2

2.64K views12:58

Нейронавт | Нейросети в творчестве

Kimi k1.5

Похоже, китайская мультимодальная модель чуть обновилась

- Контекстное окно 200 тысяч токенов
- Готова переварить до 50 файлов
- Ищет в интернете. Пишут что на 1000+ сайтов - это подозрительно, что за поиск в интернете по всего 1000 сайтов?
- Поддерживает русский язык

Все пишут что она на уровне Open AI o1, но отчет, похоже, двухмесячной давности

Чат

#assistant #mllm #mlm #reasoning

👍3

2.13K viewsedited 15:39

Нейронавт | Нейросети в творчестве

Опубликован код, веса и демо Diffusion as Shader

Код
Веса
Демо

#motioncontrol #cameracontrol #motiontransfer

Нейронавт | Нейросети в творчестве

Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video Generation Control

Управление генерацией видео через понимание объема.

- управление камерой
- перенос движения с видео на 3D меш
- перенос движения с видео на изображение
- манипуляция объектами…

❤3🔥2

1.99K views16:47

Нейронавт | Нейросети в творчестве

Forwarded from Сиолошная

OpenAI представили на стриме 3 новых инструмента для разработчиков:
— WebSearch Tool (то же, что у ChatGPT под капотом, дообученная GPT-4o / GPT-4o-mini) для поиска информации в интернете и уменьшения галлюцинаций (нечто схожее есть у Google для Gemini)
— FileSearch Tool, чтобы делать поиск по документам (как в Ассистентах). Поддерживает фильтрацию по тэгам, которые вы присваиваете документам.
— Computer Use, или Operator (та же самая модель под капотом), но теперь как у Anthropic: можно запускать с доступом к своему компьютеру (а не только на виртуальном браузере на сервере OpenAI). На второй картинке метрики, ждём, пока сообщество доработает промпты итд и проведёт свои замеры.

Доступны в API вместе с новым SDK (библиотекой для взаимодействия с этими инструментами).

Буду обновлять пост по мере появления информации (в основном, интересны цены).

UPD:
— цены: Computer Use чуть дороже обычной GPT-4o (3 и 12 долларов на вход и выход за миллион токенов; а как уж формировать контекст, какие скриншоты экрана и текст закидывать — это уже на вас). Поиск по файлам $2.5 за 1000 запросов, и $0.1 за гигабайт загруженных файлов.

👍6👎1

1.53K views17:13

Нейронавт | Нейросети в творчестве

🤩

Please open Telegram to view this post

VIEW IN TELEGRAM

7❤18😁7🍾6👏4

1.83K views21:25

Нейронавт | Нейросети в творчестве

Инструкция по портативной установке Nunchaku v0.1.4 на Windows

+ Инструкция по конвертированию лор в формат SVDQuant для Nunchaku на ComfyUI Portable (Windows)

#ComfyUI #lora #text2image

From the StableDiffusion community on Reddit: Nunchaku v0.1.4 (SVDQuant) ComfyUI Portable Instructions for Windows (NO WSL required)

Explore this post and more from the StableDiffusion community

❤8

1.99K views05:37

Нейронавт | Нейросети в творчестве

triton-windows

Библиотека, из-за которой мы не могли запустить многие неКронки на Windows.
Благодаря одному энтузиасту, теперь устанавливается командой

pip install triton-windows

По крайней мере, должна

#news

😱6👍4🔥2

2.06K views06:12

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

PERSE: Personalized 3D Generative Avatars from A Single Portrait

Анимируемый аватар головы на гауссианах по одному входному портрету с независимой настройкой параметров

Код ждем

#gaussian #head #avatar #facialanimation #image2avatar

👍5🎃1

1.75K viewsedited 09:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

PE3R: Perception-Efficient 3D Reconstruction

Реконструкция 3D сцены по нескольким изображениям.
С поиском по сцене: пишем что нужно найти, и нам выделяют цветом заданный объект

Код
Демо

#image2scene #imageto3d

👍3❤2

1.7K views09:48

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

3DEnhancer: Consistent Multi-View Diffusion for 3D Enhancement

А это улучшайзер реконструкций 3D объектов по нескольким изображениям-ракурсам. Улучшение 3D модели происходит за счет предварительного улучшения изображений, поданных на вход.

Код
Демо

#imageto3d #enhance3d #photogrammerty

👍5

1.77K viewsedited 10:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Lipdub Translation Editor

Сервис дубляжа/липсинка Lipdub AI представил функцию корректирования перевода.

Вам дают скорректировать текст который будет звучать в финальном дублированном видео на целевом языке.

Дают попробовать даже на бесплатном тарифе

#lipsync #dubbing #personalization #speechediting #speech2speech

👍6🌚1

1.92K views12:47

Нейронавт | Нейросети в творчестве

Опубликован код и демо генератора 3D сцены по картинке MIDI-3D от Vast AI

Код
Демо

#imageto3d

Нейронавт | Нейросети в творчестве

MIDI: Multi-Instance Diffusion for Single Image to 3D Scene Generation

Генератор 3D сцены по картинке.

Получив входное изображение сцены, мы сегментируем его на несколько частей и используем многоэкземплярную диффузную модель, основанную на этих изображениях…

❤5👍3

1.98K views13:30

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Кому качество кода, кому минимум галлюцинаций.
А Лламе скорость

Llama-3.3-70B-Instruct шпарит со скоростью 2000 токенов в секунду.
Видео не ускорено

Playground - попробовать

#assistant

👍3🔥2

1.8K views05:13

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

AvatarGO: Zero-shot 4D Human-Object Interaction Generation and Animation

Создание анимируемых 4D-сцен взаимодействия человека с объектом (HOI) непосредственно на основе текстовых данных

Код

#HOI #textto3d #textto4d

👍3

1.82K views05:47

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

Gemini 2.0 Flash

В Gemini завезли обещанную еще в прошлом году нативную генерацию картинок самой языковой моделью. Можно не только создавать но и редактировать с попиксельной точностью

Заходим в AI Studio, выбираем Gemini 2.0 Flash Experimental, выбираем в Output format «Image and text»

#assistant #mlm #vlm #imageediting #text2image

👍7🤯2

2.02K views08:47

Нейронавт | Нейросети в творчестве

This media is not supported in your browser

VIEW IN TELEGRAM

VACE: All-in-One Video Creation and Editing

Видеогенератор от Alibaba / Tongyi Lab
Они прикрутили туда максимум ништяков: Move-Anything, Swap-Anything, Reference-Anything, Expand-Anything, Animate-Anything

VACE может пересоздать видео с сохранением содержимого, структуры, объекта съемки, позы и движения и т.д.

Код и модель ждем

#text2video #video2video #personalization #videoediting

🔥11👍2

2.11K views09:55