Итак, начнем с вопросов-фильтров от hr. HR практически всегда задают вопросы джунам, мидлам уже намного реже.
SQL
- отличие where от having?
- в чем отличие UNION от UNION ALL?
- в чем отличие TRUNCATE DROP DELETE?
- каким оператором можно фильтровать значения в агрегирующих функциях?
- вернут ли count(*) и count(столбец) одинаковые результаты? Почему дали такой ответ?
- какой функцией в SQL можно найти предыдущую строчку?
- порядок выполнения запроса
- какие знаете типы соединений? чем они отличаются др от др?
- что такое NULL? чем отличается от 0?
- какие оконные функции знаете?
- выберете верные утверждения:
A) NULL <> 1
B) NULL <> NULL
C) NULL IS NULL
D) NULL = NULL
- Есть две таблицы A1 и A2. В A1 - 3 строчки, в A2 - 4 строчки. Не зная какие
цифры лежат в ID обеих таблиц, необходимо предположить какое количество строк может вернуть запрос:
SELECT *
FROM A1 LEFT JOIN A2
ON A1.ID= A2.ID
SQL
- отличие where от having?
- в чем отличие UNION от UNION ALL?
- в чем отличие TRUNCATE DROP DELETE?
- каким оператором можно фильтровать значения в агрегирующих функциях?
- вернут ли count(*) и count(столбец) одинаковые результаты? Почему дали такой ответ?
- какой функцией в SQL можно найти предыдущую строчку?
- порядок выполнения запроса
- какие знаете типы соединений? чем они отличаются др от др?
- что такое NULL? чем отличается от 0?
- какие оконные функции знаете?
- выберете верные утверждения:
A) NULL <> 1
B) NULL <> NULL
C) NULL IS NULL
D) NULL = NULL
- Есть две таблицы A1 и A2. В A1 - 3 строчки, в A2 - 4 строчки. Не зная какие
цифры лежат в ID обеих таблиц, необходимо предположить какое количество строк может вернуть запрос:
SELECT *
FROM A1 LEFT JOIN A2
ON A1.ID= A2.ID
❤3
Вопросы по питону HR задают редко, часто они про типы данных, могут быть мини задачки
Python
- типы данных в питоне (какие изменяемые, какие нет)
- в чём разница между списком и кортежем?
- есть список a = [1, 2, 3, 4, 5, 6]. Что выведет a[-3:-1]?
- какие типы данных могут использоваться как ключ в dict (Python)?
Python
- типы данных в питоне (какие изменяемые, какие нет)
- в чём разница между списком и кортежем?
- есть список a = [1, 2, 3, 4, 5, 6]. Что выведет a[-3:-1]?
- какие типы данных могут использоваться как ключ в dict (Python)?
❤4
Статистика, теорвер, аб-тесты (вопросы от HR)
- методы оценки статзначимости, которые использовали и почему?
- что такое сплит-тестирование?
- какие виды распределений знаете? распределение Бернулли
- чему равна медиана [4, 1, 2, 3]?
- кидаем 5 раз монетку: какая вероятность, что 3 раза подряд с самого начала выпадет Орел?
- мы провели 1000 А/А-тестов, брали порог значимости в 5%. Сколько раз мы должны увидеть ложные прокрасы?
- что такое ошибка I и II рода? MDE?
- что такое p-value?
- отметьте верные утверждения о p-value.
A) 1 - (Вероятность того, что повторный тест приведёт к тому же решению)
B) Это вероятность при справедливости нулевой гипотезы получить значение
статистики, такое же или ещё более экстремальное
С) Вероятность истинности нулевой гипотезы
D) Вероятность истинности альтернативной гипотезы
- от чего зависит размер выборки, необходимый для эксперимента?
- от чего зависит длительность эксперимента?
- методы оценки статзначимости, которые использовали и почему?
- что такое сплит-тестирование?
- какие виды распределений знаете? распределение Бернулли
- чему равна медиана [4, 1, 2, 3]?
- кидаем 5 раз монетку: какая вероятность, что 3 раза подряд с самого начала выпадет Орел?
- мы провели 1000 А/А-тестов, брали порог значимости в 5%. Сколько раз мы должны увидеть ложные прокрасы?
- что такое ошибка I и II рода? MDE?
- что такое p-value?
- отметьте верные утверждения о p-value.
A) 1 - (Вероятность того, что повторный тест приведёт к тому же решению)
B) Это вероятность при справедливости нулевой гипотезы получить значение
статистики, такое же или ещё более экстремальное
С) Вероятность истинности нулевой гипотезы
D) Вероятность истинности альтернативной гипотезы
- от чего зависит размер выборки, необходимый для эксперимента?
- от чего зависит длительность эксперимента?
❤5
Forwarded from Simulative
Приглашаем на 3 поток бесплатного курса по Pandas 🔥
Вчера мы поделились с вами лайфхаком, который рассказывали на мастер-классе в рамках 2 потока нашего бесплатного курса по Pandas. А сегодня мы стартуем набор на 3 поток!
🔗 Записаться на поток: ссылка
На бесплатном курсе по Pandas вас ждет:
- Подробные видео лекции по Pandas
- Практические задания и бизнес-кейсы (ABC/XYZ-анализ, автоматизация финансовой отчетности и т.д.)
- Закрытый мастер-класс
- Общение в чате со студентами и преподавателями
В общем, будет круто! Новых потоков в ближайшее время не будет, поэтому записывайтесь по ссылке - давайте проведем время с пользой! 🙂
🔗 Записаться на поток: ссылка
Вчера мы поделились с вами лайфхаком, который рассказывали на мастер-классе в рамках 2 потока нашего бесплатного курса по Pandas. А сегодня мы стартуем набор на 3 поток!
🔗 Записаться на поток: ссылка
На бесплатном курсе по Pandas вас ждет:
- Подробные видео лекции по Pandas
- Практические задания и бизнес-кейсы (ABC/XYZ-анализ, автоматизация финансовой отчетности и т.д.)
- Закрытый мастер-класс
- Общение в чате со студентами и преподавателями
В общем, будет круто! Новых потоков в ближайшее время не будет, поэтому записывайтесь по ссылке - давайте проведем время с пользой! 🙂
🔗 Записаться на поток: ссылка
👍1
Задачка с собеседования на вероятность
Два игрока по очереди бросили два кубика (стандартные кубики, от 1 до 6).
Найдите вероятность того, что в результате у них выпала одинаковая сумма очков, равная 5 или 6, на кубиках.
#теорвер #матан_собесы
Два игрока по очереди бросили два кубика (стандартные кубики, от 1 до 6).
Найдите вероятность того, что в результате у них выпала одинаковая сумма очков, равная 5 или 6, на кубиках.
#теорвер #матан_собесы
❤2
Задачки с собесов на python
1. Есть два словаря: рецепт пирога и запасы. Написать функцию, которая будет определять, сколько можно испечь пирогов из имеющихся запасов
recipe = {'bread':1,'sugar':10, 'salt':100, 'milk':50}
storage = {'bread':10,'sugar':1000, 'salt':510, 'milk':270}
2. В переменной
То есть, если x = 2, то нужно вычислить 2 + 20202
3. В переменной m хранится целое положительное число — продолжительность сна в минутах. Если продолжительность сна составит от 7 до 9 часов включительно, то в переменную optimal_sleep_duration сохраните значение True. В противном случае присвойте это переменной значение False.
#python #python_собесы
1. Есть два словаря: рецепт пирога и запасы. Написать функцию, которая будет определять, сколько можно испечь пирогов из имеющихся запасов
recipe = {'bread':1,'sugar':10, 'salt':100, 'milk':50}
storage = {'bread':10,'sugar':1000, 'salt':510, 'milk':270}
2. В переменной
х уже сохранено целое положительное число. Вычислите x + x0x0x. Результат сохраните в переменную result.То есть, если x = 2, то нужно вычислить 2 + 20202
3. В переменной m хранится целое положительное число — продолжительность сна в минутах. Если продолжительность сна составит от 7 до 9 часов включительно, то в переменную optimal_sleep_duration сохраните значение True. В противном случае присвойте это переменной значение False.
#python #python_собесы
❤3
Задачка с собеседования на SQL
#sql #sql_собесы
Мы хотим найти магазины, в которых низкая частотность следующего заказа. Для этого нужно посчитать, сколько времени проходит между заказами в магазине.
Задачка:
Найдите магазин, где среднее время разницы между заказами в часах было наибольшим. Все это нужно проделать для клиентов, которые имели хотя бы 3 заказа в нашем сервисе.
Ожидаемый результат:
id магазина. Если магазинов с таким значением несколько, то нужно вывести все id.
Какие данные использовать:
- Используйте таблицу
- Id заказа -
- Id пользователя –
- Id магазина –
- Дата / время доставки заказа –
#sql #sql_собесы
Мы хотим найти магазины, в которых низкая частотность следующего заказа. Для этого нужно посчитать, сколько времени проходит между заказами в магазине.
Задачка:
Найдите магазин, где среднее время разницы между заказами в часах было наибольшим. Все это нужно проделать для клиентов, которые имели хотя бы 3 заказа в нашем сервисе.
Ожидаемый результат:
id магазина. Если магазинов с таким значением несколько, то нужно вывести все id.
Какие данные использовать:
- Используйте таблицу
orders- Id заказа -
id- Id пользователя –
user_id- Id магазина –
store_id- Дата / время доставки заказа –
shipped_at❤2
Задачка с собеседования на SQL
#sql #sql_собесы
Вывести клиентов, совершивших покупки во всех категориях и их доли трат в каждой категории от общей суммы трат
#sql #sql_собесы
Вывести клиентов, совершивших покупки во всех категориях и их доли трат в каждой категории от общей суммы трат
❤3
Forwarded from AvitoTech
Топ-7 материалов по аналитике здесь и сейчас.
✔️ Apache Spark и PySpark для аналитика. Учимся читать и понимать план запроса в SparkUI
Статья Саши Ледовского о сути и важности планов запроса.
✔️ Анализ пользовательского негатива от CRM коммуникаций
Видеодоклад Ани Москаленко о том, как определять цену отписки от CRM коммуникаций.
✔️ Продуктовому аналитику: 7 методик, чтобы находить кратные точки роста продукта
Статья Дениса Пехтерева о том, где искать новые идеи для продуктов. И бонус: список профессиональных телеграм-каналов.
✔️ Как мы в Авито открыли школу тимлидов аналитики и за 3 месяца подготовили 15 будущих руководителей
Мемуары Стаса Косилова о том, как создавалась образовательная программа для подготовки менеджеров.
✔️ Как нанять или вырастить тимлида: гайд от руководителя аналитики Авито
Инструкция Глеба Белогорцева про то, как определить качества идеального тимлида, а затем найти именно такого.
✔️ Как устроена «Академия Аналитиков Авито»
Рассуждения выпускницы Академии Жени Мурзаевой о процессе обучения и о том, как у ААА получаются настоящие профи.
✔️ Как устроиться аналитиком в «Авито»
Лайфхаки от руководителя Ирины Вовк в формате статьи и видео с подборкой полезных материалов.
P.S. У нас прямо сейчас открыто несколько аналитических вакансий. Читайте, готовьтесь, и ждём на интервью.
#analytics_avitotech
Статья Саши Ледовского о сути и важности планов запроса.
Видеодоклад Ани Москаленко о том, как определять цену отписки от CRM коммуникаций.
Статья Дениса Пехтерева о том, где искать новые идеи для продуктов. И бонус: список профессиональных телеграм-каналов.
Мемуары Стаса Косилова о том, как создавалась образовательная программа для подготовки менеджеров.
Инструкция Глеба Белогорцева про то, как определить качества идеального тимлида, а затем найти именно такого.
Рассуждения выпускницы Академии Жени Мурзаевой о процессе обучения и о том, как у ААА получаются настоящие профи.
Лайфхаки от руководителя Ирины Вовк в формате статьи и видео с подборкой полезных материалов.
P.S. У нас прямо сейчас открыто несколько аналитических вакансий. Читайте, готовьтесь, и ждём на интервью.
#analytics_avitotech
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
Forwarded from Чартомойка (Aleksandr Bogachev)
⚡️Книга продаётся!
Книга начала постепенно развозиться по книжным магазинам. Где-то уже появилась, где-то небольшая поставка, в течение недели постепенно появится во всех крупных магазинах.
Вот тут в Озоне стоит недорого (не знаю много ли там экземпляров):
https://www.ozon.ru/product/grafiki-kotorye-ubezhdayut-vseh-2-e-dopolnennoe-i-pererabotannoe-izdanie-bogachev-1383550700
Не обращайте особого внимания на "переработанное" издание. Оно примерно такое же, только обложка новая 😜
В связи с этой позитивной новостью в канале тоже изменения. По вашим просьбам добавлены многочисленные реакции 😈 и комментарии(!). Велкам!
Пожалуйста, напишите, в комментах, если книга еще где-то продается.
UPD. Проверять цены в разных магазинах можно тут: https://ast.ru/book/grafiki-kotorye-ubezhdayut-vsekh-2-e-dopolnennoe-i-pererabotannoe-izdanie-874030/
Книга начала постепенно развозиться по книжным магазинам. Где-то уже появилась, где-то небольшая поставка, в течение недели постепенно появится во всех крупных магазинах.
Вот тут в Озоне стоит недорого (не знаю много ли там экземпляров):
https://www.ozon.ru/product/grafiki-kotorye-ubezhdayut-vseh-2-e-dopolnennoe-i-pererabotannoe-izdanie-bogachev-1383550700
Не обращайте особого внимания на "переработанное" издание. Оно примерно такое же, только обложка новая 😜
В связи с этой позитивной новостью в канале тоже изменения. По вашим просьбам добавлены многочисленные реакции 😈 и комментарии(!). Велкам!
Пожалуйста, напишите, в комментах, если книга еще где-то продается.
UPD. Проверять цены в разных магазинах можно тут: https://ast.ru/book/grafiki-kotorye-ubezhdayut-vsekh-2-e-dopolnennoe-i-pererabotannoe-izdanie-874030/
❤3
Forwarded from Maksim Simanov
Проект: запуск новых экосистемных страховых продуктов.
• делать дизайн экспериментов для A/B тестов и интерпретировать результаты;
• предоставлять команде понятные дашборды с продуктовыми метриками;
• помогать команде принимать верные бизнес решения на основе данных.
• знание математической статистики и теории вероятностей;
• навыки работы в системах визуализации;
• крепкие знания языков SQL-like;
• опыт проведения и обсчета А/Б-тестов (или хотя бы понимание, как работать с небинарными метриками);
• образование (МГУ мехмат/физфак, МФТИ, ВШЭ экономика/математика, МГТУ им.Баумана);
• будет плюсом опыт программирования на Python.
• из Грузии, к сожалению, не поработать. Гибрид в Москве, через несколько месяцев переезжаем в новый офис на Белорусской;
• из плюшек шведский стол на завтрак и обед, свой зал с тренером, обучение, крутые работяги вокруг, ДМС
Вопросы, резюме и подарки сюда → @jsimonj
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Forwarded from AvitoTech
Дата-сайентистам приготовиться: мы начали набор на оплачиваемые стажировки.
Чтобы подать заявку, жмите прямо на этот текст
Если вы ещё здесь, воспользуемся моментом и добавим: стажировка длится 6 месяцев. Это полгода полной занятости в крутой команде. Точнее — в одной из четырёх крутых команд: Авито Авто, Автоматическая модерация, Репутационная система или Large Language Models.
Стажировка подходит тем, кто:
1️⃣ знает базу по CNN, градиентному бустингу, трансформерам;
2️⃣ умеет работать с PyTorch, Pandas, sklearn, CatBoost;
3️⃣ может написать функцию на Python на 30–40 строк за 20 минут;
4️⃣ будет работать 40 часов в неделю;
5️⃣ готов периодически появляться в нашем офисе в Москве.
Подходит? Нажимайте на текст. Ждём ваши отклики до 31 января.
Удачи на интервью!
#avitostart
Чтобы подать заявку, жмите прямо на этот текст
Если вы ещё здесь, воспользуемся моментом и добавим: стажировка длится 6 месяцев. Это полгода полной занятости в крутой команде. Точнее — в одной из четырёх крутых команд: Авито Авто, Автоматическая модерация, Репутационная система или Large Language Models.
Стажировка подходит тем, кто:
Подходит? Нажимайте на текст. Ждём ваши отклики до 31 января.
Удачи на интервью!
#avitostart
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
🧠 Групповое занятие по "Исследованию данных".
Набираю группу, которая хочет провести часок-другой за исследованием данных)
🖥 Как будет проходить занятие:
1. Заранее пришлю ecomm-датасет и тетрадку с небольшой теорией и набором заданий/вопросов
2. Вы решаете, гуглите, отвечаете на вопросы
3. Собираемся группой из 2-4 учеников и обсуждаем все вопросы и решение. Если будут дополнительные вопросы - готова так же ответить, если останется время
🖥 Уровень:
Начальный. Подойдет, если вам нужно структурировать знания по первичному исследованию и/или у вас есть вопросы по этой теме. Или вы вообще об этом никогда не слышали
🖥 Когда:
28.01.2024 (вск) 15:00 МСК (если наберется хотя бы 2 человека)
04.02.2024 (вск) 20:00 МСК
🖥 Продолжительность:
1-1,5 часа
🤑 Стоимость
• В группе: 2 500 р.
• При личной работе со мной: 3 500 р.
Оплата до старта занятия. Если группа не наберется: верну деньги или предложу апгрейднуть тариф и поработать лично😁
✍️ Пишите @IyaZotova
Набираю группу, которая хочет провести часок-другой за исследованием данных)
1. Заранее пришлю ecomm-датасет и тетрадку с небольшой теорией и набором заданий/вопросов
2. Вы решаете, гуглите, отвечаете на вопросы
3. Собираемся группой из 2-4 учеников и обсуждаем все вопросы и решение. Если будут дополнительные вопросы - готова так же ответить, если останется время
Начальный. Подойдет, если вам нужно структурировать знания по первичному исследованию и/или у вас есть вопросы по этой теме. Или вы вообще об этом никогда не слышали
28.01.2024 (вск) 15:00 МСК (если наберется хотя бы 2 человека)
04.02.2024 (вск) 20:00 МСК
1-1,5 часа
• В группе: 2 500 р.
• При личной работе со мной: 3 500 р.
Оплата до старта занятия. Если группа не наберется: верну деньги или предложу апгрейднуть тариф и поработать лично😁
✍️ Пишите @IyaZotova
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Python, исследование данных и выборы (серия постов для начинающих)
Часть 1
Часть 2
Часть 3
Часть 4
Часть 5
Часть 1
Часть 2
Часть 3
Часть 4
Часть 5
Хабр
Python, исследование данных и выборы: часть 1
Серия из 5 постов для начинающих представляет собой «ремикс» первой главы книги 2015 года под названием «Clojure для исследования данных» (Clojure for Data Science). Автор книги, Генри Гарнер, любезно...
🔥2
Forwarded from Госпожа аналитик 💚 Ия Зотова (Ия Зотова️)
Волею судеб Брунгильду пригласили на собес в Яндекс. Для подготовки к собесу рекрутер скирнул целый гайд с рекомендациями по подготовке и примерами задач (ссылки ниже)
И так вышло, что она никогда не проходила контесты Яндекса (а в одной из статей была речь про него https://contest.yandex.ru/contest/8458/problems/). Поэтому пошла смотреть что это такое и пробовать.
Задачи в контесте были несложными, борьба была в основном с интерфейсом. Освоившись, Брунгильда решила зафиксировать основные моменты:
1. Первой строкой часто может идти количество данных, а не сами данные
2. Потоковое чтение по строке в конце строк содержит \n и выглядит так:
import sys
j = sys.stdin.readline().strip()
а полностью поток можно считать сразу в массив так:
j = sys.stdin.readlines()
Не забудьте, что там тоже будет \n в конце строк
3. Интерпретатор ломается на tab'ах и нужно делать 4 пробела вместо этого (если кто-то знает другой лайфхак - памагите)
4. Не получится промежуточные варианты как-то отладить. Пришлось это делать в соседнем блокноте. В общем-то дисциплинирует сразу писать нормально
5. Желательно не плодить переменных и лишнего не сохранять - инчае может быть переполнение памяти или перелимит времени выполнения
——-
Фух, кажется, все... Ниже ресурсы для подготовки:
• LeetCode — для практики в решении задач на
написание кода (уровень easy/medium);
• Разбор задач на youtube:
https://www.youtube.com/watch?v=0yxjWwoZtLw
https://www.youtube.com/watch?v=zU-LndSG5RE
• Видеолекции курса «Алгоритмы и структуры
данных»
https://www.coursera.org/specializations/data-structures-algorithms/
• Статья «Знай сложности алгоритмов»
https://habr.com/ru/articles/188010/
и про алгоритмические секции
https://habr.com/ru/companies/yandex/articles/449890/
• Задачи по матстату и теории вероятностей от ШАД
https://academy.yandex.ru/dataschool/stepbystep
А еще где-то по перекрестным ссылкам Брунгильда нашла аналог литкода от Яндекса, наслаждайтесь: https://coderun.yandex.ru/catalog
Please open Telegram to view this post
VIEW IN TELEGRAM
contest.yandex.ru
Вход — Подготовка к собеседованию в Яндекс — Яндекс.Контест
Яндекс.Контест это сервис, позволяющий программистам со всего мира соревноваться на предложенных задачах, а преподавателям и авторам задач -- размещать задания и серии заданий и предоставлять доступ пользователям через интернет.
❤3
Forwarded from Simulative
Срочная новость - мы сделали для вас еще один бесплатный курс!
Больше всего за последний год у нас просили сделать именно курс по Основам языка Python. Курс подойдет абсолютным новичкам: мы с самого нуля шаг за шагом разбираем все темы - начиная от переменных и заканчивая работой с интересными модулями (например, для работы с Google Sheets).
Начать можно уже сегодня 👉🏻 https://simulative.ru/free-python
Курс максимально практикоориентированный - 10 глав, 100+ практических заданий, 3 бизнесовых проекта для портфолио. Все как мы любим 🙂
👉🏻 Записаться на бесплатный курс 👈🏻
Больше всего за последний год у нас просили сделать именно курс по Основам языка Python. Курс подойдет абсолютным новичкам: мы с самого нуля шаг за шагом разбираем все темы - начиная от переменных и заканчивая работой с интересными модулями (например, для работы с Google Sheets).
Начать можно уже сегодня 👉🏻 https://simulative.ru/free-python
Курс максимально практикоориентированный - 10 глав, 100+ практических заданий, 3 бизнесовых проекта для портфолио. Все как мы любим 🙂
👉🏻 Записаться на бесплатный курс 👈🏻