Личинка программиста – Telegram
Личинка программиста
126 subscribers
17 photos
27 videos
5 files
24 links
База кринжа.
Download Telegram
Я умер и переродился в том же самом теле в то же самое время и месте. Жизнь перерождённого программиста в том же самом мире. Получение профессии и становление выше среднего.

Я понял что я больше не паблик по программированию. Теперь я иссекай ниже среднего про человека который хочет стать программистом.

Также я вполне понимаю что не все смогут понять это с первого раза поэтому я повторюсь.

Я понял что я больше не паблик по програм....

Итак, как подобает любому исекаяю - все случилось внезапно и возникло из ниоткуда. Низкий голос из пространства гласил: "Выучи это всё если хочешь найти работу". Я не стал спорить. Взгляд мой упал на свиток

Probability and Statistics
- pyro - Pyro is a flexible, scalable deep probabilistic programming library built on PyTorch.
- Statistical Rethinking - statistical-rethinking-pyMC
- Probabilistic Machine Learning — Philipp Hennig, 2021
- [Probability and Statistics for Engineers and Scientists 9th]
- [Modern Mathematical Statistics with Applications, 3rd edition [2021] Devore, Berk, Carlton]
- Bayesian Statistics: Techniques and Models University of California, Santa Cruz
- Bayesian Statistics: From Concept to Data Analysis
- Bayes Rules! An Introduction to Applied Bayesian Modeling

Algorithms
- [Data Structures and Algorithms in C++ Adam Drozdek 4th]
- AlgorithmsSpecialization - Tim Roughgarden
- https://leetcode.com/
- https://codeforces.com/
- advance algorithms - MIT

Patterns
- [Швец А. Погружение в паттерны проектирования (2018)]
- python-patterns
- Refactoring.Guru

Linear algebra
- matrix algebra for engineers
- Vector Calculus for Engineers
- Numerical Methods for Engineers
- [Introduction to Linear Algebra 5th Edition [2016] Gilbert Strang]
- Linear Algebra Done Right
- [Matrix Algebra James E. Gentle Theory, Computations and Applications in Statistics]

Deep learning
- [Zhiyuan Liu Yankai Lin Maosong Sun Representation Learning for Natural Language Processing]
- [Introduction to Graph Neural Networks (Zhiyuan Liu, Jie Zhou)]

Я не понимал откуда, но мне был абсолютно понятен смысл следующих фраз и манускриптов. Так получилось что мне хватило мудрости осознать их настоящую глубину и практическую значимость. Было сразу понятно, что составитель был нацелен на результат и терпеть не мог тратить время читателей.

Не долго думая я бросился изучать загадочный артефакт под названием pyro. Документация гласила что это framework для вероятностного программирования. Ого это что-то крутое подумал сначала, а что это вообще значит подумал я потом.

Pyro — это framework который использует для инференса stochastic variational inference, который преобразует абстрактные вероятностные вычисления в конкретные задачи оптимизации, решаемые с помощью стохастического градиентного спуска в PyTorch.

Ого это что-то крутое подум... так погодите ка

Дальнейшие попытки разобраться в этой технологии доказывали что я искал медь, а нашел золото, только было не понятно как же добыть это золото.
👍1🔥1🥴1
Оказалось что вводный пример этого фрейма является адаптированной главой из не менее очешуительной книги под названием Statistical Rethinking. Только вот не задача данный пример был из 7 главы книги... После этого стало сразу понятно почему же ничего не понятно.

Поэтому я начал читать Statistical Rethinking. Это оказалось тем что я так долго желал от статистики - работа с данными и распределениями. Автор максимально понятным и в тоже время строгим языком рассказывает про то как на основе условных данных о подбрасывании монетки составить его постериальное распределение или другими словами как создать функцию распределения из имеющегося набора данных.

Причем он с первой же главы начинает прям жестить(в хорошем смысле) и показывает как можно получить приблеженное распределение при помощи 3 методов: grid approximation, quadratic approximation и markov chain Monte Carlo (MCMC). И самое офигенное что он показывает все эти алгоритмы в коде, а не вываливает на тебя кучу формул говоря Ну ЭтО Жи АчИвИдНААА.

На данный момент я прочитал до 3 главы(в 3 главе осталось сделать упражнения, которые тоже нужно решить в коде). Не скажу что я понимаю на данный момент прямо все что там написано, но я прямо чувствую как начинаю понимать как приложить даже эту простую теорию в том же самом NLP или CV.

Также из этого списка я начал проходить matrix algebra for engineers. По первой неделе могу сказать что это очень хороший курс по введению в линал, так как уже после первой недели некоторые концепции сильно помогли мне при написании Sentence-Transformera. А также я имею довольно болезненный опыт ее изучения. Ранее я пытался проходить Introduction to Linear Algebra 5th Edition [2016] Gilbert Strang, я смог дочитать ее и проделать задания только до 135 страницы, благодаря этой книге например можно понять почему dot product нормированных векторов дает угол между ними. Но хочу отметить что matrix algebra for engineers также дает самое понятное представление о том почему же матрица поворота работает.

Напоследок приведу общую статистику сколько времени я на данный момент потратил за неделю на изучение данных штук
pyro - 90 min
matrix algebra for engineers - 225 min
statistical-rethinking - 385 min

Если остались выжившие до этого момента хочу пригласить вас в паблик в телеграм, я наконец решился. Вк дико неудобный для этого, кто знает может я полностью перееду туда
🥴1
Я тут обнаружил что моя любимая электронная библиотечка прикрылась. FBI так сказать постарались.

Поэтому сейчас получить к ней доступ можно только через tor браузер, хотя у меня предчувствие что это надолго(если не навсегда).

Поэтому качаем tor браузер по этой ссылке https://www.torproject.org/
Переходим по этой ссылке https://ru.singlelogin.me/ и находим там onion ссылку для tor браузера. на данный момент она такая http://bookszlibb74ugqojhzhg2a63w5i2atv5bqarulgczawnbmsb6s6qead.onion/
23–24 ноября прошла крупнейшая международная конференция по ИИ AI Journey.

Ну прошла и прошла, мне то что? А вот что😏! Так вышло что я каким-то образом смог поучаствовать в постерной сессии🙈, которая шла параллельно с этой конференции. Мой опыт подобного участия(по ощущениям максимально бесполезный), так и не понял зачем и для кого я делал этот постер.

Кстати можете найти его по ссылке называется Utilize knowledge and persona for dialogue response generation

В целом за этот проект я понял что разработка DL ПО сильно отличается от обычного. Хотя если меня спросят какая концепция мне больше всего помогла в построении DL моделей, я скажу Абстрактная фабрика и TypedDict из модуля typing 👹👹👹

Тот код который вы найдете по QR этой статьи очень плохой, в сравнении с тем проектом, который я пишу сейчас. Хотя я все еще в поисках методологии написании кода для экспериментов(да я пробовал смотреть специализацию по MLOps от Ына, она гавно). Скорее тут поможет курс по дизайну экспериментов(очень интересный) и обычные паттерны проектирования приложений.

Также хочу отметить что идея логгировать результаты генерации модели и метрики в postgresql была лучшей за последнее время. Я конечно понимаю что есть скажем wandb, но он СУПЕР кривой и тормознутый. А какой-нибудь там MLFlow уродливый, да и неудобный тоже...

Вот мой стек:
- база данных через docker-compose из шаблона (мой шаблон на postgresql )
- peewee это удобная ORM для управления моделями, но голая ORM бесполезна без следующего модуля
- peewee_migrations - автомиграции для ваших моделей, как в django3
- dbeaver - надо же как-то писать свои запросы и дебажить, подходит вообще для любой БД

Хотя в целом может есть и готовое решение, но мне о нем точно неизвестно, да и вряд ли я бы смог его прикрутить как именно МНЕ надо к моему коду.

Все еще чувствую себя ебучим импостером(ну он и есть) на своей второй работе (deeppavlov) там все такие все дохуя из себя мфтишники, мгушники и тд (умные то есть), а я такой модельки сделали бррр хыыыы, метрики выросли ыыыы 😓
👍2
Всем привет, хотел поделиться ресурсом.
Список лекций по количественному экономическому моделированию, разработанный и написанный Томасом Дж. Сарджентом и Джоном Стачурски. У каждой лекции есть подробная практическая часть на numpy, scipy, pymc

Сайт проекта
Github проекта

Особенно понравилась статья про Maximum Likelihood Estimation. Кому не сложно накидайте звезд на гитхабе, хотелось бы чтобы таких проектов было намного больше.
🔥4
Всем привет, на связи ноулайфер.

Я написал туториал о настройке ssh соединения для linux и windows машин, а также настройке VS code.
Моя жизнь улучшилась многократно после того как я узнал, что в VS code можно настраивать соединение по приватному ключу, ведь раньше я каждый раз вводил пароль(это было довольно утомительно). Зато теперь моя жизнь эникейщика стала намного проще.

Сам туториал я решил написать на github, потому как я смогу его дополнять если что, или фиксить ошибки.
ССЫЛКА НА ТУТОРИАЛ

Также в следующий раз мне хотелось бы рассказать про такую замечательную технологию как dev container. Я считаю что это простая и в тоже время очень важная технология, которая позволит повысить воспроизводимость в DL многократно. Потому как сейчас все что я вижу это лютый кринж.

Один лайк и я расскажу как настроить CI\CD на gitlab, с kubernetes на bare metal на примере django 4 и vue 3. С настройкой домена, конфигурированием сервера и бекапом базы данных в S3.
👍8🔥1