ᴢɪᴘ ʟᴏɢ – Telegram
ᴢɪᴘ ʟᴏɢ
150 subscribers
97 photos
49 videos
6 files
102 links
IT, AI, Robots
Download Telegram
Генерация и редактивование с помощью Stable Diffusion
🔠🔠🔠🔠 БЕСПЛАТНО и БЕЗ РЕГИСТРАЦИИ! *

Fooocus
- намного более простая, но и более ограниченная версия StableDiffusion. DeepFake в ней не сделать.
Тем не менее, по сравнению с Automatic1111 она очень удобна в использовании, в ней меньше управляющих элементов и они все очень интуитивны. Механика моделей спрятана под капот и можно сразу начинать творить. Достаточно понимать значения некоторых терминов.
Неплохой текстовый тьюториал, видео на ютьюб.

На этот раз детали как раз описывать не буду, потому что они есть в тьюториалах. Вместо этого перечислю возможности и недостатки, которые заметила.
Краткий промтинг (генерация промта через GPT)
Смешение изображений
Отрисовка текста, поданного в виде изображения
Inpainting / Outpainting
Улучшение отрисовки рук, глаз, головы
Control Net на структуру изображения, позу, лицо, границы
Контроль стиля выходного изображения
Нет нормального дипфейка (генерации слабо похожи на оригинал)
Часты внезапные падения программы
Требуется много попыток для достижения качества
Не получается смешать текст с другим изображением, только с промптом
Всё ещё нужно знать некоторые нюансы, чтобы получить нормальный результат

Больше описаний экспериментов в комментариях.
—-
* Требуется видеокарта
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3211
🎄 Decorating Christmas tree on Sunday morning
2
🎶 Программируем микроконтроллеры на позитивные аффирмации к Новому Году

Ноты песни закодила сама, использовала за основу тьюториал, но оставила одну кнопку и изменила подход к расчёту продолжительности и паузы звука. Полный архив решения см. в комментах.

На гитхаб есть библиотека с песнями аж на 418 форков. Она использует схожие принципы, но кодирует и ноту, и длительность в одном массиве, а не в двух.
#define BTN_INPUT 2
#define PITCHER 8
#include "pitches.h" //add Equivalent frequency for musical note
#include "themes.h" //add Note vale and duration

void Play()
{
float tempo = 16; // tempo coefficient
for (int thisNote = 0; thisNote < (sizeof(JingleBells_duration)/sizeof(int)); thisNote++) {
//convert duration to time delay
int noteDuration = 1000 / JingleBells_duration[thisNote];
int pauseBetweenNotes = noteDuration * 1.0;
int duration = noteDuration * (tempo - 1.0);

tone(PITCHER, JingleBells_note[thisNote],noteDuration );
delay(pauseBetweenNotes);
noTone(PITCHER); //stop music on pin 8
}
}

void setup() {
pinMode(BTN_INPUT, INPUT_PULLUP);
}

void loop() {
if (digitalRead(BTN_INPUT)==0)
Play();
}
Please open Telegram to view this post
VIEW IN TELEGRAM
2
KreaAI - онлайн-платформа для создания и редактирования генеративного контента.

Её killer feature - быстрая генерация по эскизу, обеспечивающая системе интерактивный отклик. Два основных сценария:
🔣использовать тестовый промпт для генерации в сочетании с эскизом (см. видео)
🔣использовать видеопоток с камеры для замены лиц (см. видео)

Этот инструмент, безусловно, крайне удобен. Он позволяет мгновенно преобразовывать базовые эскизы и подсказки в потрясающие, детализированные изображения. Это нововведение открывает мир создания высококачественных изображений с помощью искусственного интеллекта для более широкой аудитории, расширяет возможности творчества, позволяетвоплощать своё видение в жизнь на лету.
Отмечу плюсы:
Интерфейс приложения интуитивно понятен. Можно работать как в режиме разделения экрана, так и в режиме наложения
После того, как эскиз готов, его можно мгновенно улучшить, с помощью функции Fast Enhance
К минусам я бы отнесла:
слишком большую изменчивость результата при маленьких изменениях
классические проблемы с анатомией, для исправления которых на платформе нет удобных средств

Сайт предоставляет и другие классические возможности редактирования, такие как:
🔣замена цветов на изображении
🔣замена стиля
🔣увеличение разрешения
В моих тестах эти операции выполняются чрезвычайно медленно. Возможно, за плату скорость обработки будет выше. Я не рекомендую использовать эти средства, лучше сосредоточтесь на интерактивном дизайне.

Кроме того, есть ещё 2 специфических приложения:
🔣превращение логотипа в иллюзию
🔣использование паттерна для генерации
Но по неведомой мне причине они отказались работать, просто зависают на шаге генерации. Возможно, я попробую позже.

В итоге, я бы рекомендовала платформу KreaAI для быстрого прототипирования или для решения разовых пользовательских задач (для развлечения). Для создания выверенных дизайнов инструмент пока не достаточно приспособлен.

По традиции, в комментариях вас ждут несколько примеров генераций.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Media is too big
VIEW IN TELEGRAM
Ура! Пришёл электрик и вкрутил нам лампочку! Теперь всё-всё видно!

Идти спать никак нельзя, не рассказав вам сперва про visualelectric.com
🔠🔠🔠🔠, 🔠🔠🔠🔠🔠🔠!

Удобный интерфейс
Хорошая интерпретация промпта, краткий промтинг
Редактирование выбранной области - Inpaint
Контроль стиля выходного изображения
Загрузка сразу всех файлов в архиве
Удаление фона
Возможность выбора стиля и базового изображения для ремикса
Возможность лёгкой вариации картинки
Не интерактивная скорость, как в KreaAI
Нельзя смешивать изображения, как в Fooocus
Нет дипфейков, как в Automatic1111
Повышение разрешения за отдельную плату

В итоге - если вам нужно сделать Stable Diffusion генерацию для иллюстрации к чему-либо, без изысков, то это самый удобный вариант.

Крайне извиняюсь, что скринкаст - объединение двух примеров, но все функции я записала.
В комментариях вас ждут изображения.
Please open Telegram to view this post
VIEW IN TELEGRAM
2111
О деталях обучения ходящего гуманоида на основе трансформеров
Исходный пост в Сиолошной

Детали обучения
🔣 Обучение состоит из двух этапов:
1️⃣сначала мы предполагаем, что окружающая среда полностью наблюдаема и учим полиси учителя
2️⃣тренируем ученика, используя сочетание подражания и подкрепления - учитель используется как регуляризатор на функцию.
🔣На базе Isaac Gym распараллеливаем обучение (4xA100, тысячи случайных сред). Мы рандомизируем различные элементы моделирования, включая динамические свойства робота, параметры управления и физику окружающей среды, а также добавляем шум и задержку наблюдений. Затем валидируем на симуляторе производителя роботов. Наконец, переносим его на настоящего робота без дообучений.
🔣В итоге агент - причинный преобразователь, т.е. модель, обученная методом авторегрессионного прогнозирования следующего действия на основе истории наблюдений и действия.
Возможности робота:
🔣может надежно передвигаться без падений
🔣устойчив к внешним воздействиям, может преодолевать различные ландшафты и нести полезную нагрузку
различной массы
🔣естественное высокоскоростное передвижение, включая колебательное движение руки
🔣адаптивно изменять поведение в зависимости от контекста, включая постепенное изменение походки в зависимости от медленно меняющейся местности и быструю адаптацию к внезапным препятствиям
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
Alibaba представил новыую модель для анимации людей Animate Anyone. На текущий момент реализация не выложена. Статья доступна к прочтению.

Это метод для анимации персонажа с контролем позы (в отличие от известных Аnimatediff и Gen-2, не обеспечивающих контроль позы).

По сравнению с аналогами (DreamPose, BDMM, Disco и т.д.) алгоритм обеспечивает большую плавность и меньшее количество артефактов. Подход позволяет анимировать персонажей из любого домена (как реальных людей, так и аниме-персонажей). Оценка производилась на датасете танцев TikTok и датасете для модных показов (UBC fashion video dataset).

Также команда работает над виртуальной примерочной и анимацией головы (VividTalk).

Пройдёт несколько недель, и качественная анимация фотографии будет доступна каждому!

Потенциальные приложения:
- онлайн-продажи,
- развлечения,
- художественные эксперименты,
- создание виртуальных персонажей.
—-
Техническое описание работы смотри в комментариях.
211
This media is not supported in your browser
VIEW IN TELEGRAM
Пока многие обсуждают горячие новости робототехники, типа нового Оптимуса, я покажу вам нечто, что лично я нашла интересным. Речь о разработке in-progress в области робототехники - робомыши с гибким позвоночником по имени NerMo, имитирующей морфологию биологических мышей и их систему приведения в действие мышц и сухожилий.

Гибкий позвоночник имеет решающее значение для двигательной способности четвероногих животных. Роботы, полагающиеся исключительно на свои ноги, демонстрируют жесткость, снижающую эффективность передвижения. Боковое сгибание позвоночника позволяет:
значительно повысить его статическую устойчивость в изначально нестабильной конфигурации, регулируя его осанку,
эффективно увеличить длину шага при ходьбе и, следовательно, улучшить скорость ходьбы NerMo,
увеличить маневренность, требующую как небольшого радиуса поворота, так и высокой скорости ходьбы.

Кто знает, возможно следующим апгрейдом в области шагающих гуманоидных роботов станет именно гибкий позвоночник. Как говорится, в начале потренируемся на мышках!
Please open Telegram to view this post
VIEW IN TELEGRAM
221
Новый тренд от Юдковского. Определяем свою меру окружающей нормальности с помощью Dalle-3.

Какое изображение лично Вы сочли бы нормальным? Попробуйте выяснить в паре с ИИ.
1
This media is not supported in your browser
VIEW IN TELEGRAM
Анна Ахматова, 1921
А ты думал — я тоже такая,
Что можно забыть меня,
И что брошусь, моля и рыдая,
Под копыта гнедого коня.
Или стану просить у знахарок
В наговорной воде корешок
И пришлю тебе странный подарок —
Мой заветный душистый платок.
Будь же проклят. Ни стоном, ни взглядом
Окаянной души не коснусь,
Но клянусь тебе ангельским садом,
Чудотворной иконой клянусь,
И ночей наших пламенным чадом —
Я к тебе никогда не вернусь.

Перевод - @kzipa (@grey_mouse_lyrics),
Мелодия Stay With Me,
Исполняет - синтетический голос Chloe.

Сделано с помощью voicemod.net
111
Мастерим аватарку
Вот как меня охарактеризовал visualelectric.com изначально. Любит он мне льстить!
Portrait of a woman in a luxurious baroque-style robe indoors, serene expression, subtle lighting.

1️⃣Меняем одежду, фон, причёску в visualelectric.com
2️⃣Генерируем макияж в app.perfect365.com

👁 Я не сижу в Телеграме, вовсе нет. Каждую пятницу я блистаю в обществе!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3211
Обновление в @fabula_ai_bot - дипфейк-видео
Играем в шпионов🥸
Теперь, когда все налюбовались непревзойдённым качеством доступных каждому алгоритмов генерации дипфейков, предлагаю подписчикам небольшую игру.
Если вы такой же молодящийся олд-скульщик, как и я, вам понравится!

В комментарии к этому посту прикреплён файл фотографии в несжатом виде. В этой фотографии скрыто тайное сообщение 🤫, знакомое каждому юному или просто современному телезрителю.

Для того, чтобы расшифровать его:
1. скачайте файл 🔗
2. перейдите на сайт 🖥
3. загрузите файл в поле "Изображение хоста" (самое нижнее)
4. выставите галочку "Вместо этого расшифруйте это изображение"
5. нажмите кнопку Steganogra-fy! ➡️
👀

Если сделали, ставье ✔️
Please open Telegram to view this post
VIEW IN TELEGRAM
3