NEW BOT Телеграм, страница

Magic123: One Image to High-Quality 3D Object Generation Using Both 2D and 3D Diffusion Priors

генератор 3D объекта по одному фото. На фоне конкурентов выглядит хорошо (см на сайте). На первом этапе для грубой геометрии использует NeRF, но на выходе дает текстурированный меш. Ну может с таким уровнем активности в этой области уже в следующем году будем генерить ассеты для игр и кино нейросетями.

[UPDATE]
Код

#imageto3D

👍6

788 viewsedited 08:07

Fabrie Design Roast Я нашел чем вас занять в это воскресенье. ИИ-прожаркой картинок, чем же еще. Прежде чем выложить свой сгенерированный шедевр на всеобщее обозрение, можете скормить его Fabrie Design Roast, и тогда будете готовы к худшей реакции интернета.…

Что, никому не понравилось?

🤔5👍2👎2

672 views13:48

Forwarded from Machinelearning

🏌️ GlOttal-flow LPC Filter (GOLF)

A DDSP-based neural vocoder.

Новый метод синтеза поющего голоса (SVS), использующий физические характеристики человеческого голоса с помощью дифференцируемой цифровой обработки сигнала

🖥

Github: https://github.com/yoyololicon/golf

📕

Paper: https://arxiv.org/abs/2306.17252v1

🔗

Demo: https://yoyololicon.github.io/golf-demo/

ai_machinelearning_big_data

Please open Telegram to view this post

VIEW IN TELEGRAM

593 views06:33

Webapp Factory

Генератор веб-приложений на NodeJS по текстовому запросу.
Под капотом языковая модель WizardCoder-15B.
Тупит, конечно. Простым запросом практически ничего невозможно добиться. Более подробным описанием удается добиться частично работающей аппки. Полагаю, очень подробным описанием можно получить рабочую аппку. Правда из демо ее никуда не сохранить.

Блог с описанием и кодом
Демо

#text2app #coding #text2code

👍1

646 views13:23

Forwarded from тоже моушн

Михаил, автор канала NeuroAE пилит отличный плагин, который позволяет лихо управлять генерацией в Stable Diffusion прямо из афтера - даже при отсутствии мощного железа! маст хэв для уверенных пользователей афтера

а уроки и гайды о том как пользоватья своим детищем Михаил постит в ютубе

скачать плагин - в канале NeuroAE
гайды и уроки на ютуб

на днях еще кое что про связку AE и стейбла будет, не отключайтесь

@тоже_моушн

❤1

479 views14:39

0:23

0:03

Control-A-Video

Другое название Video-ControlNet. На вход подаем видео, но авторы пишут что это #text2video модель, генерирующая видео по тексту. А видео управляет генерацией, из него извекаются карта глубины, Canny и HED, уже знакомые нам по ControlNet.

Качество так себе, хуже чем ZeroScope. Но если вы готовы поковыряться в коде, авторы пишут что чекпойнт можно заменить на любой другой на основе SD v1.5

На втором видео мой эксперимент - Дарт Вейдер танцует с маракасами

Код
Демо выдает максимум 16 кадров, 8fps

#video2video

553 views15:49

0:19

В Нью-Йорке аппарат с ИИ делает предсказания. Вводите дату рождения, выбираете вопрос и делаете снимок — устройство распечатает предсказание

❤2

539 views16:05

0:03

Ну и в редактировании картинок тоже все еще продолжают что-то изобретать.

LEDITS: Real Image Editing with DDPM Inversion and Semantic Guidance
Авторы называют этот метод легковесным рилтаймовым. Правда, в их демке никакого рилтайма нет. Но все же работает довольно быстро. Демка позволяет удалить/добавить объекты, стили, лица или что-то кастомное (сам не знаю что). А я как раз давно никуда не добавлял Бендера

Код
Демо

#image2image #text2image

👍1

591 views16:17

Позабытая рубрика #крипота

реддит

🔥6😁1

579 views16:23

Vectorizer.ai

Делает из растровой картинки векторную. Да, трассировщики-векторизаторы у нас уже есть лет 20-30, так что это не то чтобы фича которую мы ждали. Но сюда завезли ИИ, и здесь есть подгонка целых геометрических фигур, очистка углов, сопоставление касательных, обтекание кривых и многое другое. А еще есть API, и у разработчиков все еще много планов на дальнейшее развитие. И количество настроек при скачивании радует.

Вектризовать фотки неинтресно, а вот посмотрите что он делает со старыми мультиками. Ну а Мунк как будто изначально был векторным 😱

Ах да, чуть не забыл. Если вы генерите логотипы в SD или MJ, то эта штука для вас

#image2vector

👍11

825 views06:49

Подъехал неофициальный код гугловского StyleDrop

Код

#text2image #style2image

Пара новостей от Google

StyleDrop - генерация изображений в любом стиле по тексту и референсу стиля. Но погодите говорить что уже есть фантюн SD. Посмотрите на сравнение, он очень хорош. Умеет в буквы и легко файнтюнится. Разумеется, если у вас есть код.…

👍1

669 views07:54

Segment Anything Meets Point Tracking

Сегментация видео с управляющими точками на базе SAM
Авторы скрестили SAM с классической идеей трекинга точек.

Код

#segmentation #image2mask #video2mask

🔥5

601 viewsedited 08:07

1:58

MAGVIT:Masked Generative Video Transformer

генератор/редактор видео от Google. Первую публикацию я видел еще в декабре 2022, а сейчас они разродились кодом. С тех пор мы видели уже много интересного на эту тему. Может потому кодом и поделились что устарело. Тем не менее, MAGVIT умеет то чего не умеют ни Gen-2, ни Zeroscope. Список фич:

- предсказание кадров
- интерполяция кадров
- видео инпейнтинг
- видео аутпейнтинг

За счет этого может выполнять разные интересные задачи, см на сайте

Код
Колаб

#text2video #video2video

❤3

680 views11:18

Forwarded from CGIT_Vines (Marvin Heemeyer)

0:36

Меня как раз недавно спрашивали, можно ли через depth мапу получить сносную геометрию, чтобы использовать в играх.

Вот тут показан процесс на 6 минут пайплайна через карту глубины. Заспойлерю, можно китбашить, прототипировать что-то быстрое, но это в продакшн не годится пока.
Лицо из метахьюманов.

Смотреть пайплайн

👍2👏1

591 views06:28