Derp Learning – Telegram
Derp Learning
13.1K subscribers
3.18K photos
916 videos
9 files
1.32K links
Используем ИИ строго не по назначению.
Заметки про ИИ, IT, компьютерные игры, и всякие инженерные интересности.
Download Telegram
Итак, встречайте: Обновленный строгий стиль!
Сразу делает портрет (одного из лиц, если их несколько) + полное фото.
Гораздо менее требователен к качеству исходного фото.
До конца недели можно тестить, отдельные ограничения на полное фото временно сняты. Го, я создал - @face2comicsbot

На каждом фото слева - старый стиль, справа - новый

Lo and behold: the new enhanced dark style is live!
It's now making both a portrait and a full photo at the same time, also being much less dependent on image quality.
The rate limit for full photos has been lifted until next week, so there's no better time to give it a try! @face2comicsbot

left - before (old), right - after (new)
👍1
https://www.youtube.com/watch?v=tF4DML7FIWk&t=44s&ab_channel=BostonDynamics
Ну что, кожаные мешки, напрягаемся?
Роботы Atlas успешно прошли паркур-полосу препятствий.
Немного отдает зловещей долиной, когда смотришь на плавность их движений, интересно, насколько это все заскриптовано, а что считается в риалтайме.
Media is too big
VIEW IN TELEGRAM
Немного машинок вам в ленту.)
Media is too big
VIEW IN TELEGRAM
Всем онеме и ОБЧР, посоны!
Forwarded from CGIT_Vines (Marvin Heemeyer)
This media is not supported in your browser
VIEW IN TELEGRAM
Вот немного инноваций с Олимпийских Игр в Токио.

Rhizomatiks совместно с Dentsu Lab Tokyo разрабатывает основную технологию «Система отслеживания и визуализации фехтования», т.к. человеческий глаз уже давно не может уследить за тем, что происходит во время фехтования. Давным давно были придуманы системы маркеров на концах шпаг, но сейчас появляются новые инструменты типа высокоскоростных камер, Deep Learning и Motion Capture, а результат потом накладывают поверх трансляции по средствам AR/

А по линку вся история разработки за 9 лет, аж с 12го года.
Media is too big
VIEW IN TELEGRAM
Решил затестить старый добрый
Few Shot Patch Based Training (сверху)

Если кратко, это стайл трансфер алгоритм для видео. Обучаете на нескольких парах ключевых кадров до-после, а затем процессите полное видео.

Результат довольно неплох. Для чистоты эксперимента я специально ограничил обучение до времени, затраченного основным face2comics алгоритмом на обработку полного видео.

В данном видосе я брал каждые 10 кадров. В перспективе для однородных сцен можно брать еще меньше кадров, что может кратно увеличить скорость обработки видео, при этом объективно снизив мерцание и прочие артефакты.

github: https://github.com/OndrejTexler/Few-Shot-Patch-Based-Training
Forwarded from Технологии | Нейросети | NanoBanana
This media is not supported in your browser
VIEW IN TELEGRAM
Голос Вэла Килмера воссоздали с помощью ИИ и старых аудиозаписей — актёр потерял возможность говорить из-за рака гортани.

61-летний актёр, известный по «Бэтмену навсегда», «Громовому сердцу» и «Лучшему стрелку», потерял свой голос в 2014 году в результате лечения рака гортани. Килмер больше не может разговаривать так, чтобы его узнавали окружающие, а есть ему приходится через трубочку.

Чтобы разработать реалистичную модель голоса актёра, Sonantic воспользовалась старыми аудиозаписями, которые сперва «очистили» от постороннего шума, а затем пропустили через проприетарную программу компании под названием Voice Engine.
Подробнее
Media is too big
VIEW IN TELEGRAM
Штош, теперь можно и в fullhd делать, и при этом в 4 раза быстрее, чем раньше.
Кек из трансляции Тинька – в superGLUE человеческий бенчмарк опустился на 4 место, первые три занимают трансформеры 🤡
Там выложили базу из блюд американских ресторанов. Наименование, стоимость, КБЖУ, вот это вот все.

Любопытен датасет тем, что он на Dolt. (бд, обновляемая через гит) Т.е. все данные заносились через пулл реквесты, а доступ есть через SQL.
Качество данных под вопросом, так как записей, где заполнены поля с ценой и КБЖУ, всего 83 из 6 479 347 блюд :D
А вот блюд с указанной ценой уже больше - 6 312 564 (97.4%)
(при этом уникальных блюд всего около 2 млн)

Источник: https://www.dolthub.com/blog/2021-08-20-menus-bounty-retrospective/
БД: https://www.dolthub.com/repositories/dolthub/menus/query/master

Бонус: USDA Nutrition database онлайн через SQL там же - https://www.dolthub.com/repositories/dolthub/usda-all-foods
👾🎨 Denis Sexy IT 🤖+ Мишин Лернинг🤖🎓= Text2PixelArt + Zero-Shot PixelArt Style Transfer

◾️ Пару дней назад я выложил колаб по Text2PixelArt Мишин Лернинг 🤖🎓 Resolution Mod, который расширял функционал: давал возможность выбирать разрешение + улучшал качество картинки.

◾️ Сегодня Denis Sexy IT 🤖 собрал крутой колаб, основная идея которого: Zero-Shot PixelArt Style Transfer. Просто представьте, Style Transfer для которого не нужно ни одного примера (0-shot)! Этот мод дает возможность выбирать изображение, с которого начнется оптимизация. Такой подход дает невероятные возможности! Не зря говорят: Good Init Is All You Need!

Встречайте симбиоз этих двух лучших версий!

p.s.: Дополнительные благодарности: mlart, ViktorAlm, dribnet

🔮Text2PixelArt + Zero-Shot PixelArt Style Transfer = Mishin Learning + Denis Sexy IT
Forwarded from Neural Shit
Media is too big
VIEW IN TELEGRAM
Притащил позалипать.

Так выглядят кошмары по версии VQGAN+CLIP.

оригинал
Нейросеть Codex от OpenAI: увольняйте ваших Data Scientist’ов

Будущее наступило! Нейросеть Codex (gpt 3 для генерации кода) позволяет решать data science задачи на естественном языке!

https://youtu.be/Ru5fQZ714x8