Личинка программиста – Telegram
Личинка программиста
126 subscribers
17 photos
27 videos
5 files
24 links
База кринжа.
Download Telegram
Какое-то время назад я, вдохновившись проектом Saiga, пытался сделать свою модель, более лучшую (спойлер ничего не вышло). Я полагал, чтобы улучшить ее, необходимо собрать больше разнообразных датасетов. Из этого родился данный датасет verbalist.

В большей мере это просто сборник инструкционных датасетов со всего huggingface, с небольшой предобработкой. Однако среди них есть и те которые я собирал вручную, например:

dim/logic_tasks_ru - набор задач по логике для детей взят с веб-сайта.

dim/openreview_prompts_65 - Датасет рецензий на реальные научные статьи с сайта openreview. Вышло на самом деле не так много, так как многие статьи не выложенны на arxiv или просто не имеют рецензий. Плюс я собрал только малую часть данного сайта, а не все что там было.

dim/kinomania_noscripts - Небольшой датасет, который содержит в себе сценарии фильмов целиком и их краткое содержание

dim/bugurt_thread_prompts - Небольшой набор размеченных бугуртов вместе с моим другом, для того чтобы модель научилась писать бугурты на конкретную ситуацию. Собраны из телеграм паблика БУГУРТ ТРЕД(https://news.1rj.ru/str/bugurtthread)

dim/russian_lyrics_prompts - Небольшой датасет промптов собранный мною из различных учебников по стихосложению, чтобы модель научилась писать стихи, используя необходимый литературный прием на конкретную тему.

dim/azbyka_logic_ru - Небольшой набор детских логических и православных задач, взятых с сайта. Обычно у них почти нет развернутого решения, только ответ. Я пытался расписать решение некоторых задач, но меня хватило только на 35, если кто-то займется подобным буду рад .

dim/what_where_when_ru - полная выгрузка данных с https://db.chgk.info, примерно 228k пар вопросов ответов.

dim/bugurt_completion_prompts - Обрезанные бугурты, где в качестве промпта используется строка вида - продолжи бугурт: первая строчка бугурта

dim/forum_uristov_rf_prompts - Вопросы-ответы с российского юридического форума.

dim/huggingartists_prompts - Промпты, которые просят продолжить песню в стиле определенного исполнителя. В данном наборе содержатся почти все исполнители, которых вы можете найти в этой организации https://huggingface.co/huggingartists

Описание остальных датасетов и их предобработки можно найти в основной репе.

Ощущаю себя сизифом 🪨🚶 💬
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9👍2
Топ моих любимых плагинов для obsidian.md

Сколько не пытался пользоваться онлайн заметками все время приходил к выводу, что я им не доверяю. Поэтому последнее время пользуюсь исключительно obsidian. Однако в его дефолтной версии не хватает удобных фич для работы с картинками или автоматическим сохранением. Поэтому решил поделиться следующим списком:

Autocomplete - помогает быстрее писать часто повторяющиеся слова или термины, типа Т9
Git - автоматически сохраняет заметки в гит. У меня pro на гитхабе, поэтому я могу создавать приватные репозитории. Думаю можно совершенно без проблем прикрутить к любому другому провайдеру или self-hosted.
Clear Unused Images - так как это локальный редактор, то при вставке изображения она просто сохраняется в папку и потом вставляется ее путь. Если я удалю из редактора путь, сама картинка никуда не денется. Для этого создано данное расширение, если картинка не появляется ни в одном документе, то она удаляется по нажатию на одну кнопку. Очень удобно.
Image Toolkit - просмотр изображений в дефолтном obsidian реализован очень неудобно. Данное расширение помогает смотреть изображения при нажатии на них, с возможностью увеличивать и открывать на полный экран.
Mousewheel Image zoom - мне часто при конспектировании различных лекций приходится вставлять скриншоты. При вставке они бывают либо слишком большими, либо слишком маленькими. Раньше приходилось руками подбирать размер, чтобы картинки не мешали. Данное расширение помогает очень быстро адаптировать размер изображения, при этом все остается в рамках стандартного markdown без добавления css.
Paste URL into selection - обожаю коллекционировать полезные ссылки. Чтобы вставить ссылку с подписью в markdown нужно написать конструкцию вида [текст](ссылка) это очень долго, если речь идет о конспектировании. Данный плагин позволяет формировать гиперссылку для выделенного текста при помощи обычного ctrl+V
Scroll To Top - позволяет моментально скролить вверх или вниз страницы.
👍82
Разбор Speculative decoding, почему он работает неправильно?

Мне выпала честь поработать со speculative decoding, поэтому я написал на него подробный разбор с примерами кода. Я понимаю что никто не просил, но держите ссылки.

- почитать в markdown
- почитать в jupyter

Отвечая на вопрос почему же, я хз.
🔥5
2 недели назад великий алгоритм ютуба подсунул мне это видео. В нем были показаны фрагменты как люди при помощи новой нейросети RUNWAY преобразуют популярные игры до фотореализма. Да, в некоторых местах они меняют геометрию, меняют стили, но работа со светом, текстурами, действительно впечатляет. Для меня это было сродни первым видео из киберпанка с модами, когда чел прорывается сквозь пиксели на мотоцикле, а я с прищуренными глазами пытаюсь понять не видеозапись ли это.

Не долго думая я пошел гуглить как я могу сделать это в реалтайме с моими любимыми играми. В целом реалтайм диффузионки уже есть, однако качество оставляет желать лучшего, но так как у нас видеоигра, мы можем нагенерить, нааугментировать бесконечное количество высококачественных изображений оффлайн, а затем дистиллировать этот пайплайн в реалтаймовые нейронки.

Поэтому на данный момент я создал вот такую репу с отчетами о прогрессе https://github.com/dmitrymailk/auto_remaster

В обработке изображений я мало чего понимаю, но насколько я смог осознать за эти 2 недели, так это то что всем заправляет controlnet. А для него нужны специальные чернобелые изображения с линиями, которые могли бы направить генеративку. Если делать данные линии при помощи других моделей, они всегда будут делать ошибки, лучше просто сразу получать линии из координат 3д фигур.

Но я не знаю как одновременно получать оригинальную картинку игры и картинку примененного шейдера.

Если кто-то, знает или у него есть идеи как можно улучшить картинку пожалуйста напишите мне. Прикладываю картинки в комментах. А тут картинки склееные в видео https://youtu.be/AX1ZpzI6wcQ?si=0jLfNGcH7WknHkWm
4👍1
Я попробовал Mochi 1 и VEnhancer для стабилизации видео из картинок.

На мой взгляд Venhancer справляется намного лучше чем mochi, хотя в обеих моделях я недостаточно экспериментировал над промптами и гиперпараметрами. Картинка стала намного стабильнее, больше нет раздражающей ряби, однако потерялся изначальный стиль и вайб картинок. Я думаю это можно будет решить обычной лорой.Также мне кажется что на основе Venhancer сделать некий refiner, чтобы картинка стала более интересной. Нам мой взгляд теперь стоит сосредоточиться на стабилизации картинки для Сontrol Net(кое-кто мне подсказал что типа можно как-то брать данные изображения из буфера, но еще бы я знал что это такое).

Видео в оригинальном качестве лежат в репе

https://github.com/dmitrymailk/auto_remaster
👍3
Моя гипотеза о том что canny фильтр из шейдера стабилизирует картинку оказалась верна. Пришлось заменить некоторые control nets и добавить несколько лор, чтобы сделать картинку более интересной, но теперь объекты в далеке расплываются гораздо меньше. В основном от этого страдают машины, наверное если написать шейдер который будет делать больший акцент на них, то всё решится. Также в моем пайплайне нет лор заточенных на автомобили, что могло бы(возможно) сделать их очертания более адекватными.

Проблема записи видео совместно с шейдером остается актуальной. На данный момент я написал тупой скрипт, который очень часто делает скриншоты через Reshade, однако даже на моем самом мощном ПК это выдает 10-12 фпс в лучшем случае. Как повысить производительность? Я думаю это можно сделать, например, через форк от Reshade и дописать функцию для записи видео, вот тут делается скрин.

Однако это не решит того что мне не нужно применять шейдер для игрока, только взять результат вычисления.

Наверное пойду терроризировать форумы reshade 😁

(отдельные картинки в комментах и на гитхабе)

https://github.com/dmitrymailk/auto_remaster/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👍1
Разделил экран на 4 части при помощи шейдера и применил только для одного из них canny shader. Конечно от этого немного пострадала точность, но картинка не слишком ухудшилась. Также попробовал применить flux upscaler, картинка местами превратилась тупо в кино. Также попробовал поиграть с гиперпараметрами Venhancer, убрал промпт, понизил количество шагов, по итогу картинка перестала сильно изменяться, а ждать эту обработку не полтора часа как раньше, а всего 2 минуты. Вот с таким пайплайном уже можно говорить об оффлайн рендеринге для дистилляции. Также попробовал заменить SDXL на FLUX, не получается. Картинка все время становится намного хуже, хоть и не разлетается в стороны как с SDXL, наверное отложу это на потом.

Получилось завести PyHook для Reshade. Оказывается, какой-то чел дропнул бинарь для внедрения нейронок, да и вообще любого кода в пайплайн любых игр. Увидел 10 фпс в постобработке, расстроился и пропал, я так и не нашел никакой инфы где он. Какое счастье что у меня 4090 и на дворе век победившего torch.compile. Однако пока я пробовал лишь на своей 3050ti, и это расширение дает падение фпс с 44 до 24, при работе простого Sobel фильтра на GPU c pytorch.

Хотя не думаю что это большая проблема, главное что я теперь могу в реалтайме обрабатывать картинки из игры на pytorch и передавать их дальше. Скорость уже не так важна. Главное теперь воткнуть любую нейронку чтобы она выдавала 30фпс, а потом уже плотно заняться стабилизацией изображения.

https://github.com/dmitrymailk/auto_remaster
🔥2
Попробовал исправить деформацию автомобилей путем вырезки их из оригинального изображения и вставки в уже стилизованную. А потом чтобы сгладить углы я использовал FLUX на низких параметрах денойзинга с controlnet. Ссылка. Не сказал бы что результат стал лучше. Также после этого сгладил картинку при помощи Venhanver, и убрал мыло с нижней части картинки используя ReFocus-V3, чтобы создать иллюзию плохого зрения(ну типа машина и объекты вблизи четкие, а дальше уже мыло).

Конечным результатом не доволен, считаю что нужно лучше дождаться нормальных controlnets для cogvideoX или mochi-gen1, потому что как заниматься покадровой анимацией занятие тупиковое, насколько я понял смотря форумы этой тематики последние 3 недели.

Что ж сфокусируюсь на разработке удобного интерфейса, для того чтобы было максимально эффективно и удобно доставать и менять кадры из игры при помощи python\c++.
🔥5🤡2
Случайно узнал что шейдеры глубины не работают с reshade, если включено сглаживание в игре. Отключил, заработало. Написал по этому поводу canny шейдер, который берет за основу normal map, это позволило получить очень четкие грани на 3D объектах. Потом применил control nets для canny фильтров на основе обычной картинки из игры, картинки canny с normal map и сам normal map. В результате автомобили больше не появляются из неоткуда случайно, их очертания уже видны из далека. И в целом это наконец подходит стилистике фото, снятых на айфон первых версий или старую камеру из 2000-2004.

Скорее всего деревья не получится сделать более детальными, иначе тогда они будут отличаться от кадра к кадру и не будут учитывать движение игрока, в целом как и все остальные объекты. Максимум что можно улучшить это тектуру асфальта и автомобиля, которым мы управляем. Для остального уже будут нужны видео-модели.

https://github.com/dmitrymailk/auto_remaster
🔥6🤡1
Ни дня без минорных апдейтов 😌

Понизил уровень шума в VEnhancer до 5 и увеличил параметр s_cond до 2. Сделал fps на выходе и входе равными, это дало мне возможность сохранить пареллельные с SDXL изображения. Затем попробовал смешать асфальт из выхода SDXL с VEnhancer, с этим очень сильно помог компонент "Mask Gaussian Region", он сделал смешение картинок очень плавным(понятия не имею откуда он, считаю что мне просто повезло что я его нашел). Еще попробовал применить фильтр смешения через цвет для растительности, на отдельных кадрах удалось вернуть цвет из SDXL, но на видео как по мне это добавило больше ряби, но зато убрало желтизну. На мой взгляд 1 видео лучше.

А теперь пора бы уже вернуться к моменту написания аддона для reshade. PyHook конечно хорошо, но надо попробовать сделать быстрее и проще.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1🤡1