Инжиниринг Данных – Telegram
Инжиниринг Данных
23.5K subscribers
1.98K photos
56 videos
192 files
3.2K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
12 сценариев для потенциальных проектов Data Science. Где-то даже есть ссылки на датасеты.
У меня завалялось видео про мой сетап, еще в Амазоне, оно короткое, решил загрузить, чтобы не пропало. https://youtu.be/2G9l7tISp7s
Роман Бунин построил еще один замечательный дашборд на базе данных YouTube Data API. Очень хорошо прослеживается эффект синергии (усиливающий эффект взаимодействия двух или более факторов, характеризующийся тем, что совместное действие этих факторов существенно превосходит простую сумму действий каждого из указанных факторов🤗) Data Learn и Reveal the Data. Надо продолжать коллаборация😜
Forwarded from Reveal the Data
Язык R, не смотря на своё узкое назначение, входит в топ 10 наиболее популярных языков программирования согласно различным рейтингам, включая TIOBE. А для анализа данных R является чуть ли не стандартом отрасли наравне с Python.

Хочу порекомендовать канал @R4marketing. Автором которого является Алексей Селезнёв, руководитель отдела аналитики в Netpeak.

Канал посвящён языку R. На данный момент там собрано огромное количество русскоязычных материалов по изучения R:

- Статьи
- Видео уроки
- Вебинары и доклады с конференций
- Заметки по R
- Книги
- Бесплатные онлайн курсы
- Новости и релизы из мира R

В канале опубликовано более 450 ссылок на русскоязычные материалы по R.

Кому интересно - подписывайтесь!

https://news.1rj.ru/str/R4marketing
Из жизни:

-Мы только что внедрили Machine Learning!
-Ваша модель быстрая?
-Нет.
-Ваша модель дешёвая?
-Нет.
-Ну хотя бы она решает бизнес проблему?
-Нет. Но она является произведением инжирингового искусства и построена с помощью самых современных инструментов!

Мне кажется у меня похожий подход про решения data engineering 🤗
This media is not supported in your browser
VIEW IN TELEGRAM
Как создать свою игру и заработать на ней?
Что актуально сегодня и будет востребовано завтра?
Как устроен процесс разработки в мобильном геймдеве?

https://news.1rj.ru/str/product_gamedev

В этом канале рассказывается внутренняя кухня разработки игр. Геймдизайн, аналитика и маркетинг.
Кратко, без воды, только самая суть.
fivetran-2020-essential-guide-digital.pdf
1.1 MB
Whitepaper от облачного ETL Fivetran про маркетинговую аналитику
Forwarded from Я у мамы аналитик (Stas Valuev)
Уже неделю всей редакцией (сам с собой, ага) кайфую с энциклопедической статьи про базы данных. Если бы сейчас кто-то попросил скинуть материалы для погружения в тему - поставил бы на первое место без колебаний.

Тут и схемы, и графики, и топы, и написано по делу (и даже нет привычного срача в комментах).

Немного про статистику и тренды:
- реляционные БД все еще сила, занимают почти 75% рынка;
- open source и тут растет и, кажется, скоро начнет побеждать;
- облачные БД тоже растут, но до победы еще ой как далеко;
- подробнее про популярность различных БД тут.

🔗 Ссылка на статью
1609228817415.pdf
14.2 MB
33 Tableau Tips от Tableau Zen Master Ryan Sleeper (это его книги по табло доступны в русском переводе)
Есть что рассказать про Data Analytics на английском, можете попробовать зарегистрироваться тут https://callfordataspeakers.com/

А если хотите на русском, то welcome в datalearn, проведем вебинар!
Еще один инструмент для ETL, Data pipeline и даже для ML. https://dagster.io/
У Microsoft есть сайт, где можно выбрать бесплатные тренинги и воркшопы онлайн https://events.microsoft.com/
🎉 Друзья всех с Наступающим Новым Годом, а для тех кто будет это читать или смотреть позже, то уже С Новым Годом!

❤️ Команда DataLearn шлет поздравления - всем участникам сообщества и будущим новичкам.

❤️ В поздравлении мы анонсировали часть новинок, которые вас будут ждать, но далеко не все, а анонсы новинок в том числе не представленных в видео, анонсируем в ближайшее время
https://youtu.be/LaV5m7S3KP0
Короткое и интересное видео про работу голосовых помощников, которые собирают наши данные, чтобы делать рекламу умней. Интересный момент, колонки Гугл и Алекса почти задаром, а вот у Яндекса они стоят очень дорого, чтобы собирать данные клиентов. Возможно производство не такое массовое и поэтому дорогое.
Netflix описал как они оптимизировали хранилище данных в Amazon S3. https://netflixtechblog.com/optimizing-data-warehouse-storage-7b94a48fdcbe
В этом посте один товарищ долго и с картинками размышляет про разницу ETL и ELT.
Пример архитектуры для Big Data на AWS/GCP/Azure
Матилион недавно рассказал просто про Lakehouse на BigData London.

Lakehouse = DW + Data Lake. В облаках они хороши вместе уживаются в общую платформу.