Инжиниринг Данных – Telegram
Инжиниринг Данных
23.4K subscribers
1.98K photos
56 videos
192 files
3.2K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
В Майкрософт я подписан на разные издания типа HBR, Information, Financial Times, и иногда появляются интересные новости. Вот например, новость про то, что удаленная работа это плохо, дорого и не эффективно для компаний. Конечно не для всех, но уже явно перестали говорить о том, как это классно и выгодно, когда все на удалёнке.
А вот решение всех проблем в офисе - How Teddy Bears Can Make Your Company More Ethical
Сегодня Microsoft представил Windows 11. А вы какой ОС любите?
Anonymous Poll
33%
Mac OS
46%
Windows
18%
Linux
2%
Другая (а есть ещё?)
Вот это я люблю - коротко и по делу))
Мне всегда нравились заголовки статей в Harvard Business Review(HBR). Но я не мог их читать, было ужасно скучно. Я думал, что это плохой английский у меня. Теперь у меня есть платная подписка, но это какая-то ерунда. Кроме красивых картинок и заголовков, там одна вода🙄 кто нибудь любит HBR?
Ещё один концепт из Амазона, который я часто использую - good intentions don't work, mechanics work. Тоже Безос придумал. Идея в том, что наши хорошие намерения не работает, и невозможно положиться на людей, думая, что они все будут делать так, как будет эффективно для бизнеса. Обычно люди забивают, и делают как им удобно. Поэтому нужно внедрять процессы и механики.
Популярная тема - “metrics standardization”:
1. Achieving metric consistency & standardization — Uber Data
2. Achieving metric consistency at Scale — Airbnb Data

Мой самый любимый пример в этом вопросе, когда несколько департаментов используют единое хранилище данных и считают Revenue (прибыль) и у всех оно разное. В Амазоне я такую картину наблюдал, как отдел маркетинга, финасов и продажников считали доход в разрезе регионов, использую разную логику и получали разные ответы на 5-10% и из года в год, всплывали вопросы почему цифры разные в Weekly Business Review (WBR). (Если вы не знаете, что такое WBR, то я рассказывал в одном из уроков datalearn и писал в канале)
Forwarded from DE or DIE
Чат, а вы знаете что всю смартдату уже выложили и можно смотреть? https://www.youtube.com/playlist?list=PLeN_80lmoMY1ugdDLg2mWht5eQDq6CoNQ

Кстати, пишите какие у вас любимые доклады оттуда!
Модуль 5 сейчас пока остановился на уроке 5.6 про Архитектуру облачных решений, да и вообще про архитектуру - все, что знал, рассказал и показал. Я решил добавить модуль 5.10 - Python в AWS. Так как нам всеравно понадобится питон в модуле 7, то будет самое то получить азы.

У AWS есть замечальный ресурс (free) - LEARN PYTHON ON AWS WORKSHOP. Там подробная инструкция на английском и упражнения. Большое спасибо Сергею (@erfolg5862), который уже оформлял лабы для модуля 5, за то, что он перевел этот workshop на русский, все очень подробно и со скринами. Если есть необходимость и время, можно пройти. И это отличная строчка в резюме для современного рынка.
Продолжая серию постов про транспортные средства (я уже писал про электро велосипед и самокат), я хочу поделиться опытом про доску с веслом - paddle board. Их бывает много и разброс цен большой. Бывают твердые и надувные. Не буду вас грузить подробностями. Так как у нас океан под боком, я решил выбрать модель touring - это длинные доски 12"-14" на которых комфортно плавать при небольших волнах и встречном ветре и можно брать с собой много груза или детей)

В общем я выбрал себе Starboard Touring 14"x30. Доска идет без весла и к ней я выбрал карбоновое весло из 3х частей. Я ждал эту доску в наличие больше года. Другой хороший бренд - Red, у них есть доска Red Voyager. Вчера проплыл не ней 9км с дочкой, мы попали в встречный ветер и волны, но доплыли, макс скорость была 9км\ч и средняя 5 км\ч при встречном ветре и волнах это хорошо. Если вы в Strava то я там посщу тренировки.

И чтобы лучше трекать все, я купил часы Suunto 9 Baro - очень крутые!
Кратко о моих обязанностях из LinkedIn
Заметил интересный момент, вот этот товарищ возглавлял и развивал Azure Databricks и делал это очень успешно. Azure Databricks один из самый пользуемых продуктов в аналитике на Azure Cloud. Недавно я общался с VP Azure и еще рядом менеджером, где мы обсуждали можно ли нам не использовать Azure Synapse, а продолжать использовать Databricks. Azure Synapse это посути замена Databricks но уже от Microsoft. ПОка это не говорят в слух, но выглядит очевидно, что 2 продукта похожих в Azure не очень уживутся. И сейчас я заметил, что товарищ ушел из Microsoft и перешел в другою компанию, интересно как дальше сложится с Azure Databricks и Synapse Analytics.
Новый термин - синтетические данные (synthetic data) применимо к кейсам ML. - Synthetic data is annotated information that computer simulations or algorithms generate as an alternative to real-world data.