NEW BOT Телеграм, страница

Forwarded from Teamlead Good Reads – ежедневные советы про менеджмент людей и команд (Egor Tolstoy)

STAR-метод – очень популярный подход к рассказыванию примеров из своего опыта. Он очень полезен, например, на интервью, когда вас просят рассказать про проект, которым вы больше всего гордитесь. Суть подхода в том, что вы раскладываете весь рассказ на четыре части.

1️⃣S – Situation
Контекст истории. Почему решаемая задача была важной, почему за ее решение взялись именно вы, какие дополнительные внешние факторы играли роль.

2️⃣T – Task
В чем именно состояла ваша задача. Максимально конкретное описание.

3️⃣A – Actions
Что конкретно вы сделали для того, чтобы задача решилась. Здесь важно отделять свой вклад от остальной команды, и показать связь предпринятых действий с задачей.

4️⃣R – Results
Какие результаты получились после выполнения задачи. Как вы поняли, что все стало хорошо.

Дополнительно рассказ можно усилить, ответив еще на пару вопросов:
*️⃣Что можно было сделать лучше?
*️⃣Как можно было бы достигнуть таких же результатов с вдвое меньшим бюджетом?

🔗Дополнительные ссылки
Пример ответа по STAR от Uber SRE
Пример ответа по STAR от Stripe Engineer
Твиттер-тред по теме

Google Docs

STAR: Uber SRE

This is using the Template: STAR Scenario. “Tell me about when you had to change your org structure to solve an important problem.” / Uber SRE Name & Role Will Larson, Sr Eng Mgr at Uber LinkedIn / Resume https://www.linkedin.com/in/will-larson-a44b543/…

15 views10:38

Интересное что-то

#ml #petproject

11 views21:23

Интересное что-то

Forwarded from Блог о Data Science 💻

Вот и небольшая притча о том как делать пет проекты. А сейчас я бы хотел рассказать, что вообще стоит исследовать и с чего начинать.
Безусловно первое что мы делаем - ищем проблему которую нужно решить, почему проблему? Потому что спрос рождает предложение, а предложение не рождает спрос. Если вы сделаете что-то полезное, то можно будет даже продать это или сделать свой маленький стартап и вообще последующее развитие всегда лучше прокрастинации.
Допустим проблему мы определили - нам нужно собрать или взять данные, я вам рекомендую делать непрерывные парсинг данный, это будет несколько сложнее, придется заморочиться с системой мониторинга, но это круче чем ничего не делать и CI/CD опять же подключить можно. Второй вариант это просто скачать откуда то, тоже можно, почему нет, а можно скачать откуда то, а еще и парсить.
Наш следующий шаг правильно создать окружение тут нужны следующие инструменты на мой взгял: docker, git, github/gitlab, poetry + pyenv. И прописать установку окружения и в нем уже создавать свои контейнеры, которые можно запускать. Тот же парсер.
Теперь - рисерч. Допустим мы быстренько написали парсер уже у нас достаточные данные. Нам нужно почистить данные, проверсти тесты и убедиться что мы можем что-то прогназироватью. Сделайте презентацию какую то или дашборд по данным, что бы потом внедрить в мониторинг систему, я думаю это круто и в дальнейшем вам будет что показать.
И так после ричерча мы поняли, что данные очень волатильны и вообще непонятно что происходит с дисперсией, мы хотим использовать деревья для этого они нам дают прекрасный результат, они непараметрические и шумов у нас не так много в данных. Теперь мы будем строить пайплайн.
Что для этого нужно, помимо либ, которые вы используете в обучение: Соотвественно все перевести в скрипты, где каждый файл отдельный миниалгоритм pytest, pydantic для верификации данных и скриптов. Хотим мониторить обучение моделей и данных - WandB. Хотим что бы после изменения данных, пайплайн сам запускался - DVC.
Отлично, давайте посмотрим, что у нас есть:
docker и gitlab проект, так же у нас парсер, который сейчас все сохраняет в csv, какой то скрипт, который создает датасет. У нас есть скрипт по созданию дополнительных данных и чистке. У нас есть скрипт по обучению модели. Получение различных метрик и репортов. И какой то аля сохранение дашбордов в png.
Это, конечно, замечательно. Но как то хочется что бы оно само работало, да и вообще мы устали все вручную запускать через main.py так еще и забываем иногда парсер запускать.
Для этого нам нужно изучить CI/CD, GitLab CI, CLI и разобраться как пользоваться серверами. Допустим на Yandex Cloud.
Тут уже многое зависит от вас, как вы хотите все это сделать. Но что я могу посоветовать: MLOps у ODS и курс Yandex Practicum по Облокам

И так у в итоге кое как получилось создать сервер, теперь у нас парсинг запускается каждые 2 часа, после этого обучаются модели и мы получаем какие то output по метрикам и какие то png дашборды. Как то неправильно, мы хотим что бы вообще все работало автономно.
Теперь начинается наверное самое сложное - backend/ frontend.
И так во первых - нужно создать отдельно папку frontend/backend/database все они будут запускать 3 различных контейнера (в идеале):
Нам нужно знать REST API, gunicorn - что бы связать фронт и бек. А еще как то обращаться к БД. Я бы использовал FastApi для backend и react для фронта.
Теперь у нас есть фронтенд, который должен отсылать запрос к бекенду, бекенд отсылал бы ответ и реакт бы рендерил то что хочет пользователь, например наши дашборды. Они уже не PNG, а какая то динамично изменяющаяся картиночка.

А самое главное, даже если у нас ляжет сервер, так как мы использовали gitlab ci и gitops, мы сможем развернуть наш сервер без проблем на другом.

Возможно я упустил какие то точности и не претендую на лучшего эксперта фронтенда и бекенда.

16 views21:23

Интересное что-то

#ml #interview

Многие начинающие задаются вопросами про интервью и кажется есть одна книга, которая может ответить на 99% вопросов. я только сейчас на нее наткнулась, не знаю рекламировали ее тут или нет. Рассматриваются кажется почти все аспекты: большая компания или стартап, какие роли в мире МЛ и что они означают. Всякие tips & tricks. Ресеч или продакшн. Софт скилы. В целом про то как обычно проходят интервью и… И самое главное примеры вопросов по теории, но очень практико ориентированные. Читается наверное за вечер. А потом наверное можно использовать как справочник)

https://huyenchip.com/ml-interviews-book/

15 views16:50

Интересное что-то

#cv #resume #interview

Хороший гайд по составлению резюме для FAANG. Он универсален, несмотря на то, что писался для стажировок.
https://www.notion.so/Check-list-0675cf104ed2431f9cfd451b1d742e4d

omti on Notion

Check-list для твоего резюме | Notion

Ищешь себе стажировку, но никак не можешь ее получить?

17 views17:00

Интересное что-то

#ml #linear

Дядька мефистофиес рассказывает про линейную регрессию
https://habr.com/ru/company/ods/blog/322076/

Хабр

Базовые принципы машинного обучения на примере линейной регрессии

Здравствуйте, коллеги! Это блог открытой русскоговорящей дата саентологической ложи . Нас уже легион, точнее 2500+ человек в слаке. За полтора года мы нагенерили 800к+ сообщений (ради этого слак...

17 views17:04

Интересное что-то

#ml #linear
Линейная регрессия в учебнике ШАД
https://ml-handbook.ru/chapters/linear_models/intro

13 views17:06

Интересное что-то

#ml #math

14 views11:19

Интересное что-то

Forwarded from Start Career in DS

Подборка ресурсов по математике для Data Science:

Уровни:
⭐️ - закончил универ сто лет назад, ничего не помню
⭐️⭐️ - знаю и помню базу (матан, линал, тервер, матстат)
⭐️⭐️⭐️ - хорошо разбираюсь в высшей математике, хочу поднатаскать специфические для DS темы

⭐️Наглядный разбор теории в серии «X для чайников»: что такое вектор, как считать производную, матричные уравнения и т.д.
⭐️Материалы с лекций и семинаров ВМК МГУ от «Ёжика в матане»: VK, YouTube. Тут можете спокойно начинать с лекций и семинаров Никитина по математическому анализу, их читают в самом начале

⭐️⭐️ Хорошие задачки с подробным разбором решений на Матбюро: линейная алгебра, теория вероятностей, математическая статистика.
⭐️⭐️Курс Райгородского «Основы теории вероятностей». Тут наглядно и на пальцах объясняются базовые аспекты
⭐️⭐️ [Eng] Курс «Matrix Methods in Data Analysis, Signal Processing, and Machine Learning», в нём есть вся ключевая математика для DS

⭐️⭐️⭐️[Eng] Сборник задач и теории по базовой математике (линейная алгебра, оптимизация, графы) и машинному обучению:
Pen and Paper Exercises in Machine Learning
⭐️⭐️⭐️[Eng] Книга «Математика для Data Science»: https://mml-book.github.io/

16 views11:19

Интересное что-то

#ml #competitions
Интересное соревнование от Agoda:

https://codegoda.io/

Старт 5-го августа в конце дня!

Codegoda

Codegoda 2023 | Global Coding Competition by Agoda

Codegoda 2023 is Agoda's largest online coding competition. Compete with coders around the world to win $10,000 in prizes.

11 viewsedited 17:16

Интересное что-то

#interpretable #ml #book

Попалась хорошая книжка начального уровня про эту нашу интерпретируемость
Practical Explainable AI Using Python от Pradeepta Mishra https://www.amazon.com/Practical-Explainable-Using-Python-Intelligence/dp/1484271572
Сравнительно с книгой Мольнара - поверхностно, но у книги другая аудитория.
Пока дошел до середины. Как введение в тему для разработчиков на питоне самое оно. Тема NLP толком не раскрыта, но про это есть отдельная хорошая книга. Главы:
Chapter 1: Model Explainability and Interpretability
Chapter 2: AI Ethics, Biasness, and Reliability
Chapter 3: Explainability for Linear Models
Chapter 4: Explainability for Non-Linear Models
Chapter 5: Explainability for Ensemble Models
Chapter 6: Explainability for Time Series Models
Chapter 7: Explainability for NLP
Chapter 8: AI Model Fairness Using a What-If Scenario
Chapter 9: Explainability for Deep Learning Models
Chapter 10: Counterfactual Explanations for XAI Models
Chapter 11: Contrastive Explanations for Machine Learning
Chapter 12: Model-Agnostic Explanations by Identifying
Chapter 13: Model Explainability for Rule-Based Expert Systems
Chapter 14: Model Explainability for Computer Vision

15 views23:06

Интересное что-то

#dl #courses

11 views20:56

Интересное что-то

Forwarded from gonzo-обзоры ML статей

Не могу не поделиться ссылкой на такой классный курс!

MIT 6.S192: Deep Learning for Art, Aesthetics, and Creativity

https://ali-design.github.io/deepcreativity

Лекции на ютубе:
https://www.youtube.com/watch?v=MABLFo7IV3I&list=PLCpMvp7ftsnIbNwRnQJbDNRqO6qiN3EyH

12 views20:56

Интересное что-то

#tg

12 views19:00

Интересное что-то

Forwarded from Базы данных & SQL

Как продавать шкуры и ловить троллей в Telegram с помощью Kafka, Kubernetes, PostgreSQL и Redis

Читать статью

Хабр

Как продавать шкуры и ловить троллей в Telegram с помощью Kafka, Kubernetes, PostgreSQL и Redis

С чего все началось Работаю в IT больше 15 лет. Чем только не занимался, но всегда следовал правилу - каждые майские праздники я пытаюсь применить на практике что-то новое. В этом году я прочитал...

16 views19:00

Интересное что-то

#interview #behavioral
Интересный мануал от Амазон для подготовки к Behavioral

14 views14:09

Интересное что-то

Forwarded from Anton Eryomin

https://igotanoffer.com/blogs/tech/amazon-behavioral-interview#questions

IGotAnOffer

Amazon Behavioral Interview Questions (+ answers, method)

Everything you need to know about Amazon behavioral interviews and leadership principles. Learn what to expect and how to answer, with insights from ex-Amazon interviewers. Practice with over 60 example questions, see example answers and find links to high…

16 views14:09

Интересное что-то

#interview #behavioral
Те самые материалы для подготовки к поведенческому интервью

16 views08:17

Интересное что-то

Forwarded from Fless (Victor Rogulenko | fless.pro)

Scarletink

The Amazon Leadership Principles - A Complete Interview Guide

A summary on how to pass the Amazon leadership principles behavioral interviews, and get a job at Amazon.

25 views08:17

Интересное что-то

#interview #ab
Материал по подготовке к A/B тестированиям

23 views19:19

Интересное что-то

Forwarded from Поступашки - ШАД, Стажировки и Магистратура

#How_to_заботать

How to заботать собес в Тиньку на аналитика?

Гут Шабес. Выражаю огромную благодарность, кто продолжает отправлять контесты: спасибо, что делаете прогнившую корпоративную культуру хоть чуточку ярче🥰🥰

Тем временем уже стартуют первые собесы на стажёров от Тинькофф Старт. Вспоминаем, как готовиться на проадкт-аналтика (+материалы). Времени не так много, поэтому в честь праздника подгон по каждому акту АВ теста, чтобы получить хоть какое-то представление об этой науке.

Если кратенько, то процесс АБ теста следующий: есть новое предложение, как улучшить метрики и его нужно протестить; берём репрезентативную выборку из генеральной совокупности, разбиваем ее на тест и контроль: на тест воздействуем, на контроль нет. Смотрим на получившиеся метрики, выбираем тест, чтобы проверить стат значимость и затем делаем вывод можем ли мы выкатывать фичу (в совковых учебниках пишут, что если нет стат значимости, то отвергаем альтернативу, но на практике обычно все посложнее).

Начнем с конца:
1. Какой тест выбрать для проверки двух гипотез? Если у нас уже есть разбитая выборка на тест и контроль (А и Б)

{https://youtu.be/oa8j8TOndpE

https://youtu.be/YuC1ZZTqdBA

https://vkteam.medium.com/practitioners-guide-to-statistical-tests-ed2d580ef04f

https://www.youtube.com/watch?v=-zps6hm0nX8&t=190s}

2. Как разбить репрезентативную выборку на тест и контроль (А и Б)?

{https://habr.com/ru/company/avito/blog/571096/}

3. Как определить какой размер репрезентативной выборки нам нужен? Которую мы затем разбиваем

{https://www.youtube.com/watch?v=2nP_gcut7SU}

4. Как из всей генеральной совокупности взять репрезентативную выборку (чтобы ее можно было экстраполировать на всю генеральную совокупность)? И вообще как обрабатывать данные перед тестом

{https://habr.com/ru/company/avito/blog/571094/

https://habr.com/ru/company/avito/blog/571096/

https://habr.com/ru/company/uchi_ru/blog/500918/}

Делимся замечаниями и материалами в комментах. Тетрадки лежат там же😎😎

22 views19:19

About

Blog

Apps

Platform