NEW BOT Телеграм, страница

LEFT JOIN

И немного инсайтов по карточкам выше

Data / Product аналитик:
▪ количество вакансий несколько подросло, если сравнивать с зимой прошлого года и сейчас составляет около 350-450 открытых позиций;
▪ процент удаленных позиций стабилен на уровне 18-20%
▪ в динамике зарплаты с трудом можно увидеть инфляцию, уровень средней зп (это арифметическое среднее) колеблется на отметке 124-130К ₽. При этом распределение зарплат явно не выглядит нормальным, в целом, можно найти зарплату по специальности почти на любой вкус в рамках разумного, но и не в рамках разумного есть выбросы в размере 3% и 250К ₽ "на руки".

Data Scientist:
▪ объем количество вакансий несколько меньше, чем по специальности дата аналитика и составляет 250-280 позиций ежемесячно
▪ процент удаленных вакансий и его динамика крайне похожа на предыдущую специальность
▪ а вот динамика зарплаты выглядит интереснее. Специалисты Data Science явно оцениваются выше и средний уровень ЗП составляет 172К ₽, при этом распределение зарплат явно в более "крупную" сторону и устремлено к 200К ₽. Динамика зарплат колеблется на уровне 165-180К ₽ однако разброс в уровне зарплат достаточно обширный, что отличает данную позицию от предыдущей

3.86K views06:46

LEFT JOIN

Forwarded from DataEng

юмор дата инженеров 😁

3.59K views08:58

LEFT JOIN

Среди каналов по анализу данных, которые я читаю, есть также и каналы по дата журналистике, которые как мне кажется интересны широкой аудитории поскольку умеют представить данные правильно. Авторы канала data.csv как раз собирают такие примеры использования данных — интересную инфографику и захватывающие истории, которые публикуют СМИ.

На канале можно найти работы лучших дата-журналистов со всего мира и самые интересные истории из России.

Подписаться на канал можно по ссылке: https://news.1rj.ru/str/data_csv.

3.13K views09:18

LEFT JOIN

Новинка на гитхабе — библиотека SQLModel для Python, которая упрощает взаимодействие с SQL базами данных.

GitHub

GitHub - fastapi/sqlmodel: SQL databases in Python, designed for simplicity, compatibility, and robustness.

SQL databases in Python, designed for simplicity, compatibility, and robustness. - fastapi/sqlmodel

3.21K views14:00

LEFT JOIN

Интересная статья о том, как Discord (это мессенджер, популярный в игровой индустрии, который недавно был оценен в $15 млрд) менял MongoDB на Cassandra.
В статье — критерии, по которым выбиралась база данных и некоторые впечатления о том, как данные моделируются в Cassandra.

#link

Discord

Discord Blog

Discover the latest news and app updates, stories, company insights, and plenty more about Discord, all in one place.

3.06K views14:17

LEFT JOIN

🎓 Курс MGT-6203 🎓

Честно говоря, данный курс был плохо организован, я был им дико не доволен. Ну, и отзывы на OMSCentral это подтверждают.
В начале курса мы заново проходили линейную регрессию в R (спрашивается для чего, если она уже была в курсе ISYE-6501), затем логистическую регрессию, затем изучали стандартное отклонение и ряд других самых базовых величин из финансовых вычислений (return, compound return), после этого погружались в метрики маркетинга (очень широко и несколько остало от действительности), в конце концов завершили курс управлением очередьми, оптимизацией процессов с использованием статистических критериев.

В курсе три домашних работы с вычислениями на R и два экзамена. Каждый экзамен состоит из теста на время и решения задачек без лимита на время.

Кстати, пока я писал посты про эти два курса начался осенний семестр. И у меня появилась идея о том, чтобы заснять серию видео для Youtube канала (вы же уже подписались?) о поступлении в ВУЗ (какие документы были нужны), о внутренних системах для студента Georgia Tech, о первых трех предметах и о последующих.

Ниже голосование, будет ли интересно вам узнать об этом?

#gatech #omsa

LEFT JOIN

ISYE 6501: Intro to Analytics Modeling

Сегодня расскажу немного о первом вводном курсе ISYE6501. Сначала пойдут мои общие эмоции относительно курса, а затем опишу структура контента.

В целом, курс мне скорее понравился, чем не понравился, но график прохождения…

3.31K views05:15

LEFT JOIN

Записать серию видео для Youtube канала о поступлении в Georgia Tech и о курсах, которые прохожу там?

Anonymous Poll

63%

Да, с удовольствием бы посмотрел и послушал

25%

Возможно, ознакомлюсь

13%

Нет, не интересна эта тема

403 voters3.72K views05:15

LEFT JOIN

Классная статья про использование цепей Маркова для моделирования числа ходов, необходимых для победы в игре 2048.
Там еще и продолжение есть.

#link

4.27K views09:13

LEFT JOIN

Delivery Club образовательный. Аналитики сервиса поделились опытом создания мониторинга и системы “near real-time” оповещений для компаний. Приятный спойлер: супер пригодная фича не только для пользователей, но и для внутренних разрабов. Читаем материал ребят по ссылке и обсуждаем внизу в комментариях.

#реклама

Хабр

Единая система мониторинга и оповещений BI: правда или вымысел?

Привет, Хабр! Мы, Юлия Лузганова HiJulia и Наталия Прудникова balzaant , аналитики в команде Business Intelligence Delivery Club. Наш департамент аналитики стремительно вырос за последние полтора...

3.91K viewsedited 17:29

LEFT JOIN

Про два слеша в http://

В осеннем семестре взял всего лишь один курс CSE6242, поскольку был ошарашен объемом материалов к изучению.
Курс супер-крутой, обязательно и подробно про него расскажу. В нем много про визуализацию данных, отсылок к Тафти и прям полноценное погружение в D3.js.

В рамках курса начал читать книгу Interactive Data Visualization for the Web от O'Reilly (классная!), и в ней обнаружилась интересность. Возможно, вы когда-то задумывались, почему протокол http:// указывается с двумя слешами? Оказывается, этому нет объяснения и создатель веба Тим Бернс Ли сожалеет об этом, поскольку они там совершенно ни для чего не нужны 🤷

O’Reilly Online Learning

Interactive Data Visualization for the Web, 2nd Edition

Create and publish your own interactive data visualization projects on the webâ??even if you have little or no experience with data visualization or web development. Itâ??s inspiring and fun with … - Selection from Interactive Data Visualization for the…

⚡1👍1

3.24K views07:30

LEFT JOIN

Смешное видео про интерпретатор javanoscript 😅

3.11K views08:23

LEFT JOIN

У Димы Аношина промелькнула интересная задачка в канале. В комментариях есть хорошие рабочие ответы, но меня заинтересовало то, что в PostgreSQL отсутствует RESPECT NULLS / IGNORE NULLS.

Как можно решить задачу без игнорирования NULLS?
Очевидно, что с подзапросом.

Предположим, что таблица называется test_case, тогда

SELECT ts, event_name, position, SUM(CASE WHEN position IS NOT NULL THEN 1 END) OVER (ORDER BY ts) as cum_group
FROM test_case

Данный подзапрос (назовем его sub) позволит нам разбить строки на группы, к которым нужно отнести строку с NULL. А если position будет отличная от NULL, мы получим новую группу.

Далее, мы можем просто посчитать первое значение из каждой группы, используя аналитическое выражение FIRST_VALUE.

SELECT ts, event_name, position, FIRST_VALUE(position) OVER (PARTITION BY cum_group) as result
FROM sub

Итого, все вместе:

SELECT ts, event_name, position, FIRST_VALUE(position) OVER (PARTITION BY cum_group) as result
          FROM (SELECT ts, event_name, position,  SUM(CASE WHEN position IS NOT NULL THEN 1 END) OVER (ORDER BY ts)  as cum_group
FROM test_case) sub

Инжиниринг Данных

Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce

4.02K viewsedited 10:11

LEFT JOIN

Настя Кузнецова недавно спрашивала про классные названия библиотек на Python🐍

Вот, например, Pint 🍺 для работы с физическими величинами. Ну, разве не прелестное название? 😋
Так что, не единой пандой 🐼

настенька и графики

Вот дайте мне такое же милое название питоновского пакета какого-нибудь! Ничего кроме pandas на ум не идет🐼
____
прислали отличные варианты:
- Beautiful Soup
- pickle
- shutil
- SymPy

3.58K views18:07

LEFT JOIN

Мне написал подписчик канала, аналитик данных Иван Тория, который поделился гайдом по запуску dbt на GCP в продакшене. Отличная статья, которая может быть полезна, если вы планируете развернуть dbt.

Medium

Step-by-step guide to run dbt in production with Google Cloud Platform

If you’re here, I suppose you already know what dbt is (if not, check the official docs or video introduction) and ask the same question…

👍1

3.86K views15:41

LEFT JOIN

Одной из популярных тем в современном дата-стеке является проблема headless bi или проблема метаданных (организация единого источника правды). К примеру, airbnb решает это для себя через MinervaDB, но она пока не доступна для инженеров данных (закрытый код). А вот разработчики rakam (self-service BI, кстати, сделали ребрендинг) недавно выпустили MetriQL, который в связке с dbt должна решить эту проблему. MetriQL разработан под интересной лицензией: Business Source License.

LEFT JOIN

В статье про Headless BI натыкался на решение Materialize, тогда бегло его изучил, почитав их сайт. Как понятно из названия и сайта, компания решает задачу материализации представлений для стриминга данных.
А вчера ребята рассказали, что сделали коннектор…

4.34K views11:43

LEFT JOIN

3.29K views19:42

LEFT JOIN

Минутка фото-контента: вечерние посиделки с авторитетами BI-рынка РФ в Петербургском Трапписте: @sgromych, @paveldubinin

3.33K views19:43

LEFT JOIN

В сегодняшнем видео цикла гайдов по BI-инструментов говорим про Metabase – open-source инструмент, который умеет самостоятельно описывать датасеты, отправлять уведомления об изменениях в данных, и, конечно, писать запросы к данным и строить на полученных результатах визуализации и дашборды.

Посмотрите на полученный результат в материале блога и ответьте на два небольших вопроса.

Автор дашборда, член команды Valiotti Analytics — Мария Авдеева

YouTube

Как построить дашборд в Metabase | ЛУЧШИЙ Гайд по BI

✔️Получить гайд по BI-системам от команды LEFT JOIN: https://news.1rj.ru/str/leftjoin_helper_bot?start=YouTube-ApacheSuperset

В новом обзоре BI-систем мы посмотрим на Metabase — open-source инструмент для бизнес-аналитики, в котором можно писать запросы к данным нескольких…

4.01K views08:03

About

Blog

Apps

Platform