Аналитика данных / Data Study – Telegram
Аналитика данных / Data Study
9.25K subscribers
476 photos
48 videos
24 files
375 links
Сайт: https://datastudy.ru/
По всем вопросам: @daniildzheparov

Про аналитику и инженерию данных

Вакансии: https://news.1rj.ru/str/data_vacancy
Книги: https://news.1rj.ru/str/analyst_books
Download Telegram
Вебинар "От отклика до оффера"

Сегодня в 19:00

Соня Петрова, it-рекрутер, расскажет

🔵 Где искать вакансии кроме HH

🔵 Резюме, которое посмотрят

🔵 Как проходит отбор резюме в 2025-2026

🔵 А что говорить на собеседовании?

🔵 Ответы на ваши вопросы


Вопросы в процессе пишите здесь или в чате самой трансляции

Ссылка на трансляцию
Please open Telegram to view this post
VIEW IN TELEGRAM
3🔥3👍2
Мы начинаем через 5 минут!

Ссылка на трансляцию
трансляция началась!
Соня инсайты рассказывает, не пропускаем. Особенно кто имеет сложности с поиском
🔥5
Выпускники курсов кто застрял в поиске работы: делай правильно, неправильно не делай 😄
😁4👀2
вебинар был супер полезным, обсудили и структуру резюме и как себя позиционировать на собеседовании, как говорить про деньги/опыт/навыки и многое другое. отдельно посвятили время ответам на ваши вопросы из чата и вопросы учеников (я заранее попросил их написать кого что волнует и интересует)

Запись и материалы вебинара появятся в группе скорее всего завтра, пойду отдыхать)
10🔥5
Что такое аналитическая витрина данных

Представь, тебя попросили создать аналитический отчет для отслеживания необходимых метрик: количество успешно закрытых сделок отделом продаж и количество новых привлеченных клиентов на каждый день, а также конверсию в продажу.

Результатом может быть дашборд, обновляющаяся Google-таблица или даже ежедневное сообщение от бота с рассчитанными метриками.

Для реализации отчета тебе скорее всего понадобиться создать таблицу, но изначально данные могут быть разрознены и храниться в разных местах, иметь необработанный вид и непроверенное качество.

Ты как аналитик сделал 2 шага

1️⃣ Собрал данные с помощью SQL в одну таблицу. очистил, обогатил, посчитал метрики.
2️⃣ Сделал автоматизацию, чтобы данные в этой таблице обновлялись по нужному для анализа расписанию

Такая таблица для твоей задачи и будет являться витриной данных 👇

Витрина данных (Data Mart) - таблица с достаточным, очищенным, преобразованным набором данных для решения конкретной аналитической задачи или набора подобных задач.


Если хочешь правильно работать с данными и делать качественный и полезный бизнесу анализ - ты это просто обязаны знать. Не зря на всех схемах хранилищ данных указывается слой Data Marts.

Весь процесс построения витрин данных разбираем на курсе "Продвинутый SQL" - от сбора требований до автоматизации с помощью Apache Airflow, Cloud Functions и Git.


Хочу на обучение 17 ноября
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103🔥1
Когда работал в Леруа 5 лет назад вышел на рынок искать новую работу, т.к. на тот момент уже достаточно сильно вырос внутри компании как по навыкам так и по 💰
Получил оффер на интересную позицию + 30% к тому что получал. Оффер принял, пришел сказать руководителю что ухожу через 2 недели. Но меня не отпустили, предложили такие же условия, чтобы удержать. Я не ожидал такого, ведь оффер уже принял, реально собирался уйти.
Принял решение остаться, а чего бы нет, задачи меня на тот момент устраивали, а оплату подняли. Отношение с руководителем кстати при этом не испортились.
Получается как будто смухлевал чтобы получить контр-оффер, хотя цели изначально такой не было)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍227🔥7👀4
👿 Data Dojo 27 ноября: программа встречи

Data Dojo — мероприятие Яндекса для ML-энтузиастов всех уровней. Какие будут лекции:

17:10 Обзор трендов и предварительные итоги года
Сергей Овчаренко, руководитель отдела мультимодального анализа и генерации


17:40 Научить AI не бредить, сдать физику и получить права: как мы готовили задачи ML-квалификации Yandex Cup
Сергей Фиронов, ведущий разработчик службы поведения и предсказания департамента Автономного транспорта


18:10 Кухня, гости, музыка: как мы научили колонку реагировать в реальном хаосе
Дмитрий Солодуха, руководитель команды голосовой активации


Собираемся в 16:00. Фуршет, нетворкинг, мастер-класс, afterparty — будет всё.

Регистрируйся
Please open Telegram to view this post
VIEW IN TELEGRAM
👍41
Я дико извиняюсь, что не успеваю оформить страницу и программу курса по SQL и витринам на сайте. А каждый об этом спрашивает в первую очередь.

Всю программу каждому заинтересованному показываю на созвоне, когда общаемся про опыт и запрос на обучение.

Могу сказать что материалов много, все они описаны в текстовых уроках, время на созвоны и просмотры видео искать не нужно. Засвечу здесь один из самых любимых лично моих модулей - Лайфхаки из практики. Вложил в него свой многосторонний опыт работы над витринами с разных проектов до самых мелочей, которые приобретаются как раз на практике.

Кстати еще не рассказывал про новые уроки в программе, как это делал про основы данных - завтра сделаю анонс

Предзапись в группу на обучение с 17 ноября
🔥7👍32
Большинство инструментов из стека технологий, с которыми я работаю как аналитик-инженер, относятся к open source — технологиям с открытым исходным кодом, в развитие которых вкладывается сообщество контрибьютеров, кому это интересно. Поэтому часто слежу за новыми релизами и новостями по инструментам.

И вот вышла новость, что Андрей Бородин, разработчик из Yandex Cloud, вошел в число главных контрибьюторов PostgreSQL. Статус major contributor — признание вклада в развитие PostgreSQL: ревью патчей, исправление ошибок, менторинг разработчиков и развитие инструментов WAL‑G, Odyssey и SPQR.

Быть в числе главных контрибьютеров такого проекта (половина рынка используют эту базу) означает высокое качество кода и признание со стороны мирового сообщества.

Вот представьте насколько это другой уровень — не просто SELECT запросы писать, а знать как работает ядро базы данных со всеми техническими нюансами.

Команда Андрея разработала SPQR (Stateless Postgres Query Router), систему для горизонтального масштабирования PostgreSQL через шардирование, которая сейчас уже доступна в режиме превью — Managed Service for Sharded PostgreSQL.
🔥13👍54
Мониторинг качества данных

Если мы не доверяем данным - мы не можем доверять анализу и выводам из этих данных. Именно поэтому проверка качества - важный шаг в работе с данными.

И где же нужно это делать? - В процессе сбора аналитической витрины.

Анонс новых модулей на курсе "Продвинутый SQL"

1️⃣ Мониторинг и проверка качества данных в витринах
Речь пойдет про метрики качества, как их проверять с помощью SQL и как эти проверки автоматизировать и встроить в ETL

2️⃣ Clickhouse
Колоночная база данных, широко используемая как для аналитических хранилищ. Будут описаны отличия от PostgreSQL, особенности колоночной базы и почему НЕ ВСЕ можно эффективно делать в Clickhouse

3️⃣ Практический пример реализации полного потока данных
От извлечения из системы источника, загрузки в DWH, до автоматизация аналитической витрины с дашбордом

Старт обучения 17 ноября
👍82
Прикольный сайт по подготовке к собесам https://easyoffer.ru/

Можно выбрать направление/уровень, еще понравилось что есть примеры ответов 👌
👍127
Где искать вакансии

Сайты:
1 HeadHunter
2 Хабр Карьера
3 Superjob
4 Работа ру
5 GeekJob
6 Профи ру
7 Getmatch

Каналы:
1 Data jobs
2 Data Science Jobs
3 Data Вакансии
4 Работа в IT без опыта

Группы:
1 Data Analysis Jobs
2 Machine Learning Jobs
3 Работа для аналитиков

Для удобства собрал все каналы и группы в папку, можете сразу на все подписаться
20🔥8🤝4
Сегодня стартовала 2-я группа обучения курса "Продвинутый SQL" по разработке и автоматизации витрин данных 🎉

Впереди 6 недель практического обучения SQL, Apache Airflow, Git, Cloud Functions и Python для автоматизации.

По опыту сейчас модернизировал подход к практическим заданиям и разбил практику на 4 спринта.

Так
🔹будет удобней держать фокус в процессе обучения на конкретных заданиях
🔹есть четкая цель закрыть задания спринта и потом переходить к следующим заданиям
🔹удобней давать обратную связь по сданным работам в асинхронном режиме спринт за спринтом, чем каждый идет в своем темпе в рамках времени обучения

Планируй обучение на следующий год 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
6👍6
Материалы с вебинара "От отклика до оффера"

В
прошлую среду Соня, it-рекрутер, провела вебинар для вас, где рассказала огромное количество полезной информации. Все можно посмотреть в записи трансляции и в презентации.

▶️ Запись вебинара

🖇 Презентация вебинара

🖇 Шаблон резюме, который можете использовать как корректную структуру и фразы-подсказки

Наверняка кто-то пропустил публикацию в группе вебинаров, дублирую сюда 😉
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥52
Приглашаем в канал AI Inside

Канал для тех, кто смотрит на искусственный интеллект не как на хайп, а как на рабочий инструмент. Здесь нет абстрактных теорий — только прикладные решения.

Что вас ждет:
✔️ Технологии: расскажем, как ИИ решает реальные бизнес-задачи — от автоматизации до аналитики.
✔️ Кейсы: покажем успешные примеры внедрения и использования ИИ-инструментов.
✔️ Экспертиза: объясним сложные технологии простым языком с фокусом на практическую пользу.

Наша цель — дать конкретные идеи и инсайты, которые можно применить уже сегодня.

Присоединяйтесь к сообществу практиков!
👍42🔥1
25 вопросов с собеседований по SQL

Базовый уровень:
1. Что делает команда SELECT и как выбрать все колонки из таблицы?
2. В чем разница между WHERE и HAVING?
3. Что делает GROUP BY и ORDER BY и в каком порядке они выполняются?
4. Как объединить две таблицы? Чем отличаются INNER JOIN, LEFT JOIN, RIGHT JOIN и FULL JOIN?
5. Как выбрать уникальные значения из колонки?

Средний уровень:
6. Что делает агрегатная функция и какие бывают (COUNT, SUM, AVG, MAX, MIN)?
7. Как с помощью подзапроса выбрать сотрудников с зарплатой выше средней?
8. Что такое CASE WHEN и как его использовать для логических условий в запросах?
9. Чем отличаются UNION и UNION ALL? Когда что использовать?
10. Как найти дубликаты записей в таблице и удалить их?

Высокий уровень:
11. Что такое оконная функция и чем она отличается от GROUP BY?
12. Как найти вторую по величине зарплату в таблице без подзапроса?
13. Что делает COALESCE() и зачем он нужен?
14. Как работают индексы и как они влияют на производительность?
15. Что делает EXPLAIN (или EXPLAIN ANALYZE)? Как понять, где узкое место запроса?

Продвинутый уровень:
16. Как реализовать “рекурсивный запрос” с помощью WITH RECURSIVE?
17. Какие есть виды блокировок в базе данных и как это влияет на выполнение запросов?
18. Как соединить таблицу с самой собой (self join) и для чего это может быть нужно?
19. Объясни разницу между INNER JOIN, CROSS JOIN и LATERAL JOIN.
20. Что делает RANK(), DENSE_RANK() и ROW_NUMBER() и в чем между ними разница?
21. Как бы ты посчитал “скользящее среднее” (moving average) по продажам за последние 7 дней?
22. Как посчитать нарастающий итог по сумме продаж?
23. Как найти “дыры” в последовательности (например, пропущенные ID)?
24. Что такое нормализация и денормализация данных, и когда что применять?
25. Как оптимизировать медленный запрос? Назови конкретные приёмы.
👍32🔥139👀3