Chad Protocol - карьера, IT, успех – Telegram
Chad Protocol - карьера, IT, успех
12.4K subscribers
22 photos
7 videos
14 files
95 links
номер завления на регистрацию РКН: № 6904340073

По всем вопросам: @vice22821
Чат: https://news.1rj.ru/str/chad_protocol_chat
Стажировки: https://news.1rj.ru/str/postypashki_old
Ютуб: https://youtube.com/@postypashki
Поступач: https://news.1rj.ru/str/postypashki_mems
Download Telegram
Задания Авито.pdf
5.4 MB
Стажировка в Авито

Прямо сейчас, товарищи, проходит отбор на самую главную стажировку аналитиков сезона. Для участия нужно заполнить анкету до 23 апреля. Специально для вас еще раз пробежимся по всем этапам отбора.

1. Скрининг резюме
Как заполнять анкету смотрим обязательно здесь.

2. Тестовое задание
Немало простых вопросов по матеше, теор веру, мат стату, а также sql, python. Найдете в конце файла.

3. Видео интервью
Раньше на обычные вакансии стажера звонил HR, который просто рассказывал о себе, о процессе отбора, а также уточнял формальные моменты. Похоже для оптимизации процесса это решили проводить в "записи".

4. Техническое собеседование
Задачи в лайве на теор вер и мат стат, которые обсуждаются в ролике. Еще могут попасться банальные задачи на парадокс Симпсона.

Авито есть две реĸламные ĸампании в интернете: на сайте А и на сайте Б. На сайте А ĸонверсия выросла, на сайте Б тоже, могла ли совместная ĸонверсия с обоих сайтов упасть. Пример приводили здесь.

Было проведено исследование, что 90% аварий совершают трезвые водители, а 10% пьяные, может ли это значить, что трезвая езда в 9 раз опаснее пьяной езды. Пример здесь.

Потом ждет кейс: АВ тест с уходами в мат стат и продуктовое понимание. Допустим хотим ввести новые фильтры в строке поиска. Как бы вы дизайнили этот эксперимент? Расскажите про формулы mde, t-теста, что такое p-value и тд, какие методы есть чтобы снизить дисперсию, как рассчитать размер выборки и длину (продолжительность теста). Опиши кратко очень словами, как бы ты написал CUPED функцией на питоне. Если прошли курсы, то проблем точно не возникнет.

Перед этим всем конечно еще раз спросят про опыт, конкретно про опыт работы в аналитике. Кратко накинут вопросы типо: как вы справляетесь со сложными задачами? Использовал ли оконки, какие библиотеки в питоне использовали и для чего?

5. Собеседование на soft skills
Тот самый behaviour из ролика

6. Собеседование с руководителем и командой
Все просто в духе чем занимался, что умеешь и можем ли мы быть тебе интересны.
🔥188👍2
Вот и разбор задач собеседования на аналитика в Авито! Прием заявок до 23 апреля. Обязательно делимся с друзьями. Ждём 5 тыс просмотров на ютуб ролике и разбираем собес Тинькофф.

Смотрим! Смотрим! https://youtu.be/6X2d5aNNF0Y
18🔥3
Вот и долгожданный ролик по стажировкам в Касперовский. Вместе с Максимом разберемся во всех вопросах, связанных со стажировкой. Вышло много инсайдов и лайфхаков. Обязательно делимся с друзьями, ждем 10 тыс просмотров на ролике и выкладываем обзор VK.

Смотрим! Смотрим! https://www.youtube.com/watch?v=Cq2QiFj6y_g&t=1s
🔥114🥰2
До отборочных в ШАД буквально 7 дней, товарищи, поэтому сегодня в ролике делюсь главным секретом, который подготовит вас к экзаменам за пару недель😎😎 Свои силы сможет попробовать каждый.

Смотрим! Смотрим! https://youtu.be/U7TgvUE3yqA
5
Вот и реально собеседование на стажера аналитика в Тинькофф. Во всю присылают приглосы, поэтому мониторим почту, товарищи, и смотрим в ролике, чего ждать от собеса.

Смотрим! Смотрим! https://www.youtube.com/watch?v=73cmSsEg2n8
💊22👍42🔥2
Вот и разбор первого этапа ШАД 2024 года! Обязательно делимся с друзьями, ждем 10 тыс просмотров и разбираем другой вариант. Пока другие варианты можно получить только на наших курсах.

Смотрим! Смотрим! https://www.youtube.com/watch?v=AS4c22KKlgY
7
Вот и разбор первого этапа ШАД 2024 года! Обязательно делимся с друзьями, ждем 6 тыс просмотров и разбираем следующий вариант. Пока другие варианты и разведку по остальным этапам можно получить только на наших курсах.

Смотрим! Смотрим! https://www.youtube.com/watch?v=bR2jza6gpyU
8💊2
Я в шоке! Академия Авито объявила набор... Мне стыдно, товарищи, что советовал поступать в этот содом, простите... Подобно Эдипу мне предстоит выколоть глаза и отправиться в изгнание. Прощайте! Оставляю вас Михаилу Абрамовичу. О том, что случилось в новом ролике..

Смотрим! Смотрим! https://www.youtube.com/watch?v=ZV6HX9AsHp8
🗿40💊7👍4🫡31🏆1🤪1
Сборник из двухсот тестовых заданий

Продолжаем обновлять и расширять наш сайт, сделали раздел Аналитика, вот здесь, где сейчас собраны тестовые задания на аналитика разных грейдов в такие топовые компании как Авито, Тинькофф, Ozon, VK group, Сбер, МТС и много других.

Данные размечены не только названием компании, но и грейдом, и навыками: SQL, Excel, Кейс, A/B тест, Дашборд и т. д. В архивав zip по ссылке из таблицы вы найдете не только текст заданий, но и оригинальные датасеты, а какие-то датасеты пришлось восстанавливать вручную, все для вас!

То есть сборник буквально становиться классическим задачником, он отлично подготовит вас к интервью! Только не хватает решений и указаний, теоретической справки. Мы с учениками активно прорешиваем этот сборник на нашем курсе по аналитике, делимся подробными решениями.

Но мне кажется мне нужна ваша помощь, товарищи, чтобы довести сборник до ума! Если у вас есть решение или другие тестовые задания на любую позицию (аналитика, разработка, ml, de), то прошу прислать их мне в лс @vice22821, готов к обмену или могу расплатиться натурой, в общем договоримся: вы мне, я вам!

Также уверен, что тестовые задания вдохновят на пет проекты. Про самые популярные рассказал в конце задачника, тоже обратите внимание.

Как всегда, все для вас, товарищи, сохраняйте, пользуйтесь на здоровье и обязательно делитесь с друзьями такой годнотой!
👍10🔥8🤯3🙈2🤪21
Сборник из пятидесяти тестовых заданий ML

Товарищи, с вашей помощью продолжаем обновлять и расширять наш сайт, сделали раздел Машинное обучение, вот здесь, где сейчас собраны тестовые задания на DS, ML разных грейдов в такие топовые компании как Uber, Сбер, МТС, Шаурму Х@чу и много других.

К каждому названию компании прилагается ссылка на архивав zip, в нем вы найдете не только текст заданий, но и оригинальные датасеты, а какие-то датасеты пришлось восстанавливать вручную, все для вас!

То есть сборник буквально становиться классическим задачником, он отлично подготовит вас к интервью! Только не хватает решений и указаний, теоретической справки. Мы с учениками активно прорешиваем этот сборник на нашем курсе по ML, делимся подробными решениями, какие-то из них вы уже найдете в zip архивах.

Но мне кажется мне нужна ваша помощь, товарищи, чтобы довести сборник до ума! Если у вас есть решение или другие тестовые задания на любую позицию (аналитика, разработка, ml, de), то прошу прислать их мне в лс @vice22821, готов к обмену или могу расплатиться натурой, в общем договоримся: вы мне, я вам!

Еще раз спасибо, товарищи, за столько тестовых заданий! Также не забываем про сборник тестовых заданий на аналитика.

Как всегда, все для вас, товарищи, сохраняйте, пользуйтесь на здоровье и обязательно делитесь с друзьями такой годнотой!
🔥153👍3
Вот и разбор алгоритмов на стажировку в Яндекс! Обязательно делимся с друзьями. Ждём 5 тыс просмотров на ютуб ролике и выкладываем аналитику.

Смотрим! Смотрим! https://youtu.be/AdfjZ4u8GLg
9🔥3👍1🎉1
Эти пет проекты должен сделать каждый ML специалист

Устроиться можно попасть и без проектов, но если у вас их нет, то мл кейсы будут решаться неуверенно и на финалах будете выглядеть слабее других. Никто не ждет гениального проекта с инфраструктурой— реализовать какие-то бейзлайны и понимать специфику задач уже достаточно для стажера и джуна.
Уже делали подобную подборку для аналитиков здесь, советую присмотреться.

1. Кредитный скоринг
Стоит ли давать кредит— довольно популярная задача и отличный выбор для новчиков, чтобы самостоятельно проделать все этапы. Сначала берем любой датасет на kaggle по запросу Credit Scoring. Проводим EDA, генерируем гипотезы, фичи, готовим данные для модели и делаем бейзлайн: логистическая регрессия. Затем уже можно попробовать случайный лес, градиентный бустинг, KNN или еще что по вкусу— сравниваем метрики. И на последок не забываем проанализировать результаты и культурно презентовать. Можно провести АВ тест на смой первой модели.
Все варианты решения и реализации можно найти в интернетах: GitHub, Хабр. Очень полезным будет посмотреть всякие выступления на конференциях по этой теме для вдохновения, да и это очень поможет на мл кейсах.

2. Наивный Байесовский классификатор (НБК)
Для конкретики будем классифицировать письма на спам. Опять же обработаем данные: удаляем числа, знаки препинания, стоп-слова, стемминги, лемматизацию.
Объединяем все методы предварительной обработки и создаём словарь слов и счётчик каждого слова в наборе данных для обучения:
1. Вычисляем вероятность для каждого слова в тексте и отфильтровываем слова со значением вероятности меньше порогового. Такие слова будут нерелевантными.
2. Для каждого слова в словаре создаём вероятность, что это слово окажется в спаме. Определяем условную вероятность для использования её в НБК.
3. Вычисляем прогнозируемый результат с помощью условных вероятностей.
НБК реализовать не сложно. Куда интересней погрузиться во всю теорию, которая за этим стоит, в вероятностные модели. К тому же, кейс фильтрации спама и подобного часто встречается на собесах.

3. MLOps
Можно наладить какой-то минимальный прод для проектов: например телеграм бот или FastAPI. Можно еще автоматизировать пайплайн с помощь AirFlow и попробовать запустить инфраструктуру не только локально, но и облаке. Конечно нужно будет поизучать Docker, Cuber, Hadoop, Spark, HDFS, Kafka. Но на самом деле ничего трудного— после нашего курса дата инженер будете делать такие вещи по щелчку пальцев.

4. Ранжирование и матчинг
Для начала лучше пробежаться глазами по статье и посмотреть, что пишут в интернетах. Можно выделить три подхода к задаче: поточечный, попарный, списочный. Советую начать с первого как самого простого. Для конкретики будем предсказать оценку релевантности для запросов тестового датасета. Здесь можно кстати поучиться парсить web-страниц и собирать сырые данные, размечать их с помощью какого-нибудь Яндекс-Толока. Делаем регрессию, а затем Random Forest Regressor, XGBoost, lightGBM, CatBoost.
Совсем продвинутые могут попробовать языковые модели в духе FastText, Word2Vec, DSSM и более сложные: BERT, можно даже попробовать архитектуру трансформеров.

5. Рекомендашки
Очень популярный кейс на собесах. Для начала лучше пробежаться глазами по этому разделу и посмотреть, что пишут в интернетах. Затем начинаем реализовывать самое простое как бейзлайн, например, content-based рекомендации, KNN. Дальше можно попробовать факторизации матрицы рейтингов по svd разложению или по более эффективной als архитектуре и функции ошибок bpr. Затем можно попробовать W2V подход, чтобы использовать последовательность взаимодействий пользователя для построения рекомендации следующего предмета.
Для знатоков DL можно попробовать DSSM, SasRec/Bert4Rec, MultVAE, Merlin или графовые нейронки: GCN-подобные архитектуры.
Также стоит попробовать обучение с подкреплением: многоруких бандитов.
Ну и конечно рекомендательные системы можно попробовать рассмотреть как задачу ранжирования.
19👍4👏2💊2🔥1
Вот и разбор аналитики на стажировку в Яндекс! Обязательно делимся с друзьями. Ждём 5 тыс просмотров на ютуб ролике и выкладываем МЛ. Советую поторопиться: контест вот-вот обновят.

Смотрим! Смотрим! https://www.youtube.com/watch?v=k4C9aWR6YJ4
8
ШОК! Владислав надел платье, туфельки и пошел в офис Т-банка записывать свой тикток...

Распространяем: https://youtube.com/shorts/99VxC8WiaCo
💊329🤓3👍1😍1🗿1
Вот и интервью с настоящей легендой! У нас в гостях ДиМашина, поступивший на физтех со 127 баллами ЕГЭ. Почему именно физтех? Какие учебные лафхаки работают? Почему нравится бить людей? Ну и прямо на ваших экранах, товарищи, Дмитрий поступит в ШАД!

Смотрим! Смотрим! https://youtu.be/5l7O2ToX1_8
💊726👍4🔥2🙏2🍾2
Полный цикл отбора в HFT (компания Teza)

Товарищи, понравилась ваша реакция под прошлым постом, потому специально для вас попросил выпускника наших курсов рассказать про отбор в одну из самых популярных компаний HFT, в которую вполне реально попасть из РФ.
Далее представлен слегка отредактированный текст нашего выпускника.

Три года назад окончил мехмат МГУ. Во время учебы занимался спортивным программированием (но не так успешно). После университета пошел разработчиком. Успел поработать на Python и C++. В какой-то день я решил поменять свою жизнь (расстался с девушкой) и искал то, что будет интересно для меня, и наткнулся на HFT. Чуть-чуть поизучав, я понял, что это то, что нужно. Высокие нагрузки на работе, применение математики, С++, алгоритмов, хорошая зарплата.

Начал копать HFT компании и нашел немало, но, к сожалению, я не проходил скрининг резюме. Позже наткнулся на HR в Linkedin, которая работала в ереванском Teza. Она посмотрела мое резюме и дала пару советов, как улучшить. Так что ребятам, которые планируют в будущем подаваться в HFT компании, да и не только туда, советую поработать над своим CV.

Она предложила мне пройти собеседования на SOFTWARE DEVELOPER в QUANTITATIVE команду. В целом это не то, что я хотел, но решил попробовать раз уж квантом на тот момент пока никуда не взяли.

Пока подавался в компании, я параллельно готовился по линейной алгебре, теории вероятности и по алгоритмам.
По алгоритмам я попросил Тимура подготовить меня, брал у него менторство и три месяца плотно решали много задач.
По математике также готовился по курсам Поступашек (кстати в это воскресение уже стартует теор вер).

Всего было три этапа.

Первый этап
Скинули ссылку hackerrank, в котором были две задачи. Обе задачи были на алгоритмы, и надо было решить на время. У них был свой практоринг.
Задача 1: дается два массива чисел, проверить, правда ли одна является подпоследовательностью другой.
Задача 2: на плоскости даются n городов (просто точки). Дальше даются q запросов. Каждый запрос — это точка (x, y), ваша задача — найти ближайший город к (x, y), но чтобы у них хотя бы одна координата была равна. Кстати, подобные задачи с решениями постоянно выкладываются здесь, товарищи.

Решил эти две задачи и пригласили на следующий этап.

Второй этап
Собеседование в котором была только математика. Ниже я перечислю вопросы, которые помню.
-Чему равен ранг x*x^t где x - вектор столбец.
-Найти все собственные значения для x*x^t
-Какие могут быть характеристические корни у матрицы A, если A^4 = A^2.

-Бросают кубик, посчитать мат ожидания и дисперсию числа выпавших чисел.
-Бросают два n гранных кубика, какова вероятность что суммарно выпадет k очков.
-Были теоретические вопросы по распределениям, много спрашивали про нормальное распределение.

Это не весь список вопросов, так как уточняющие вопросы возникали и в ходе ответа.

Пригласили на третий собес:

Третий этап
Уже по кодингку и хард скилам.
-Начался разговор с баз данных, какие использовал, что делал. Использовал ли Postgres.
-Airflow, Hadoop
-Был ли опыт в ML
-На мое удивление дали задачку на numpy)
-По большей части спрашивали Python и С++.
В целом по языкам программирования вопросы были не сложные, стандартные. Может из-за того, что у меня был опыт работы.
Спрашивали про выделения памяти, про шаблоны, версии С++, ООП на питон и на плюсах. Не было ничего сверхъестественного.
Подчеркиваю, я не собесился на кванта. У квантов достаточно жесткий собес по плюсам.
В целом третий этап собеса будет несложным для человека, который имел опыт работы на С++ и python.

Предложили оффер и релокацию, но к этому моменту меня позвали в другое место с более лучшими условиями. А куда именно узнаете в следующем посте, товарищи. Давайте соберем 700 огоньков, чтобы понимать: тема для вас интересна и ее нужно продолжать.
🔥130👍7👀4🗿32🫡1
Набор на стажировку в VK проходит прямо сейчас, товарищи! Поэтому сегодня специально для вас пообщались с Иваном Нагайко, он пришел в компанию еще стажером, а вырос техлидом😎 Обсудили все секреты и лайфхаки Ивана, получилось очень интересно и полезно!

Смотрим! Смотрим! https://www.youtube.com/watch?v=eNwVeCNfZu0
4🔥3👍2
Кусок собеса на джуна в команду Сбер Devices
(ультра халява)
🕶
🌴 Минимизировать f(x) с помощью GD: f(x) = x^2 (имплементировать алгоритм)
Дано:
iterations - количество итераций для выполнения градиентного спуска (iterations >= 0)
learning rate - скорость обучения(больше 0)
init - точка старта минимизации

Задача вернуть значение x, которое глобально минимизирует эту функцию и ответ округлить до 3 десятичных знаков
+ примеры использования алгоритма в ds, оптимизированные вариации GD и объяснить, как он работает в линейной регрессии

🌴Задача написать класс односвязного списка
class LinkedList:
def init(self):

def get(self, index: int) -> int:

def insertHead(self, val: int) -> None:

def insertTail(self, val: int) -> None:

def remove(self, index: int) -> bool:

def getValues(self) -> List[int]:
инициализировать пустой список
get(int i) вернет значение i-го узла (с индексом 0), а если индекс выходит за пределы- вернуть -1, insertHead(int val) вставит узел с val в начало списка
insertTail(int val) вставит узел со значением val в конец списка
remove(int i) удалит i-й узел (с индексом 0), а если выходит за пределы, возвращает false,иначе- true
getValues() возвращает массив всех значений в связанном списке, упорядоченных от начала до конца


Ответы здесь:
@zadachi_ds
ПоступашкиML
Please open Telegram to view this post
VIEW IN TELEGRAM
🤯216🔥3💊3👍1💋1
Товарищи, сегодня мы обсудим главный вопрос, который волнует всех здравомыслящих и нормальных людей: как минимально напрягаться на работе, но при этом быть на хорошем счету и казаться эффективным и ценным сотрудником (и даже расти в компании)? Лично я работал в двух крупных компаниях на удаленке и при этом я реально что-то делал каждый день ну часа по 4 максимум, а в остальное время смотрел кино и играл в доту, хотя везде был на фуллтайме.

В чем же секрет? На самом деле ничего сложного тут нет, просто держи в голове простой принцип: наш мозг не способен видеть всю картину целиком и для того, чтобы оценить и понять что-то мы фокусируем внимание на ограниченном количестве факторов и если мы сможем четко выделить вот эти лампочки, которые загораются в голове у нашего тимлида, если мы сможем понять на что он обращает внимание в первую очередь, то мы победили. Конечно это вещи индивидуальные, но я постараюсь дать список таких трюков, которые сработают почти всегда:

1. Первое и главное - это личное отношение. Запомни: никто не любит унылых мудаков с кислой рожей, которые вечно всем недовольны и ходят с немытой головой и желтыми зубами. А если ты вызываешь антипатию на личном уровне, то и твои профессиональные достижения оценивают хуже, а требуют от тебя большего. А если ты человеку лично симпатичен, то и твои профессиональные навыки он оценивает лучше. Поэтому тебе нужно быть клевым парнем: побольше нейтральных шуток, не забывайте улыбаться, в личных и неформальных разговорах с коллегами почаще соглашаться с тимлидом и поменьше со всеми спорь.

2. Показывай вовлеченность! Запомни, нужно всегда и оперативно отвечать на все письма: можешь настроить какой-то универсальный автоответ, или может даже запариться с чатом гпт, но отвечать нужно реально быстро. Кстати, это отчасти работает и на первый пункт с личным отношением, ибо никому не нравятся долгие ответы, особенно когда дело срочное. В плане вовлеченности не забывай про свои 5 копеек на общих созвонах: старайся не допускать того, чтобы ты все время молчал, на каждом созвоне нужно сделать хотя бы одну уместную реплику, пусть даже это просто резюмирование или пересказ в духе «Правильно ли я понимаю, что...». Но важно с этим не перебарщивать: сказал там в начале, отметился и начинай катуку в доту.

3. Обращай внимание на срочные и "горящие" задачи. Очень многие не задумываются об этом, но суть в чем: если нужно экстренно справиться с какой-то задачей, то она обычно не очень сложная и длинная, но при этом ее выполнение даст вам большой плюсик к репутации. Содержательные, непростые, но долгие задачи никто не замечает: никто не обращает внимание на медсестру, которая десятилетиями выносит из под больных утки, поэтому за такие задачи мы обходим стороной. Фокусируемся на быстрых и «ярких» задачах, получаем плюсик к репутации.

4. Создавай ощущение загруженности. Пришли с новой задачей? Не забудь сказать, что сейчас у тебя рабочий график загружен, ты еще не доделал прошлое задание, но у тебя обязательно найдется окно и ты все сделаешь. Что-то получилось сделать очень быстро? Не говори об этом! Наоборот сделай акцент на том, что возникли какие-то сложности и обязательно расскажи как ты с ними справился.

Эти штуки работают почти всегда, но конечно помни, что у тебя должен быть свой собственный список коронных приемов! Но при этом помни о главном: ты должен разрешить себе халявить на работе, ибо если ты будешь загоняться из-за этого, если ты каждый раз будешь волноваться как школьница, то тебя очень быстро спалят. Поэтому не напрягайся, будь уверен в себе и у тебя все получится 😎😎😎

Ещё больше полезных постов у нас на канале: @chad_protocol
🎉572612👍4💊4🔥2🤪2
Мой путь вката в Биг Дату

Так как сейчас активно идет набор на стажировки, я решил рассказать вам, как происходил мой путь вкатывания в айти в целом и в дата-инженерию в частности. Откинем курсы и прочее обучение, смотря на реальный опыт

На третьем курсе ВМК я начал задумываться о том, чтобы начать уже получать реальные практические навыки, потому что одним обучением в вузе я вряд ли смогу этим добиться. Я пробовался на различные стажировки: всем известные Тинькофф, Яндекс, Сбер и менее известные компании на самые хайповые направления: аналитика, дата саенс и в целом все, что связано с данными, потому что это мне нравилось и чувствовал, что это мое.
И в один момент прошел на стажировку Spark-разработчика, иначе говоря — Дата Инженера, в одной консалтинговой компании, где вначале шло обучение, а после, в случае успешной сдачи экзамена и дополнительных собеседований — прием в штат.
Конечно же поначалу всё казалось сложным: распределённые вычисления, кластеры, партиции, обучение Scala, Hadoop, Spark с нуля. Но, пройдя все эти этапы, успешно справился со всем, и после этого начал работать на проекте ВТБ, где набрался опыта реальной разработки ETL, занимался сборкой витрин и работой с продуктовыми большими данными.
С тех пор дата-инженерия и биг дата стали моими родными сферами. После этого уже я спокойно переходил на работу непосредственно в банки — тот же ВТБ и Сбер, и ритейлы — Ozon и текущее место работы

Что же я хочу сказать этим постом?
Не всегда стоит начинать с самых известных компаний — очевидно, конкуренция и уровень нагрузки будут запредельными, так что можно рассмотреть те же консалтинги, которые специализируются на том, чтобы активно набирать людей
Не стоит также ограничиваться одним направлением — на начальном этапе ты не знаешь, в чем ты действительно хорош и чем будешь заниматься в реальности. И с опытом смежной профессии перейти в другую будет легче, чем пытаться честно с 0 пройти весь путь, и, как правило, в рамках одной компании это сделать проще.

Если у вас остались вопросы задавайте их в комментариях и ставьте реакции!
Ну а если хочешь получить помощь в подготовке к собеседованиям и обучению, то рекомендую записываться на наши консультации!

@bigdata_postupashki
🔥18👍86🥰2💊2