Инжиниринг Данных – Telegram
Инжиниринг Данных
23.5K subscribers
1.99K photos
55 videos
193 files
3.21K links
Делюсь новостями из мира аналитики и карьерными советами.

15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG

🛠️ dataengineer.ru | 🏄‍♂️ Surfalytics.com

№5017813306

Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Download Telegram
n=0
while n < 3:
print ("Ho!")
n += 1
print("Merry Christmas!")
Merry Christmas!
Возможно хороший SQL курс, где можно сразу в браузере писать код https://datamovesme.com/2019/12/30/free-sql-for-data-science-course/
Если вы работаете с Power BI, то вы слышали про PowerApps и Flow. Не знаю как у вас, но в Северной Америке это очень сильный тренд и все хотят эту штуку. Я сам еще не разобрался особо, но вот нашел интересный кейс про мгновенные инсайты с помощью Power BI, Power Apps, Flow и Azure ML. Причем чувак, который выступает тоже с Виктории.
А вот еще интересный момент. Все уже наигрались в data science, deep learning. Организации используют решения уже в продакшене, и важно, чтобы модель была масштабируемая (объем данных на входе, вычислительные мощности), важно цикл модели, так же как и с обычным кодом, есть среда разработки, есть тестирование и продакшн. Это все называется MLOps.

Как раз сейчас я себе нашел хобби в Alexa, в свободное от работы время, помогать data scientist задеплоить модель на SageMaker и построить весь цикл и масштабировать модель, так же автоматизация, чтобы предсказать отток Alexa клиентов, заодно и разобраться во всей этой истории. Так же это и про взаимодействие data engineer и data scientist.

А вот и статья на linkedin, которая мне напомнила про все реалии с моделями.
Как часто у вас есть стратегия данных? Я работал во многих компаниях, но практически никогда я не видел документа "Стратегия Данных", который должен оторбражать "Стратегию и Видение бизнеса", чего я то же не часто видел, чаще общие слова и направления. Вот и получает, кто в лес, кто по дрова.

Хорошая статья про Успешную стратегию данных. Как обычно, самое главное это польза бизнесу. Другой интересный момент - "So a serious pitfall I have seen over many years is that implementations or updates are done only for the sake of technology advances, without solving business" - то есть мы просто гонимся за новыми технологиями (cloud? big data?data lake?ml?) и особо не решаем вопросы бизнеса.

Как сказал Джим Рон - "Успех это 20% навыков и 80% стратегия".

В общем в новом году желаю вам фокусироваться не только на своих скилах, но и подумать над стратегией своего роста в длинной перспективе.
Курс на coursera - Cloud Computing Concepts. Это часть специализации. Модуль 4 будет про ML и Big Data
Давно я не видел термин Business Intelligence в заголовках, а тут целая конференция Real BI в MIT Sloan где выступают профессора из Harward, MIT и даже космонавт NASA. Это здорово, что термин BI еще силен, или все новое это хорошо забытое старое))
Вакансия Data Engineer. Можно работать из дома, наверно на западных клиентов. Но в целом по описанию это то, про что в канале много информации, облака, болшие данные. Если есть сертификация по AWS, Azure, GCP помогло бы. Даже грин карту делают, прям чудеса. Если у кого получиться, поделитесь историей успеха.

А вот еще вакансии:
Artificial Intelligence and Data Analytics Scientist
Big Data/Machine Learning Engineer
Machine Learning Developer (AWS)
Data Scientist / Machine Learning Engineer

Интересные компания предлагают вакансии, раньше не слышал про них, но мне можно не знать про них. Если кто чего знает, поделитесь информацией. В целом тренд хороший, вакансии очень современные и есть куда развиваться отечественному рынку специалистов, вместо того, что бы учить hardcore hadoop (псевдо big data специализации), заниматься интерсными задачами и приносить пользу бизнесу.

И конечно Сбербанк, всегда в списке вакансий. Может скучновато, но самое то, чтобы набраться опыта и расти.
Tableau выпустили целый список бэйджей, и тренингов для каждой специализации, многие бесплатно. Если у вас нет опыта с Tableau, но вы работаете с BI, то вам бы отлично было бы подтянуть общие навыки по визуализации данных и созданию аналитических решений. А если вы уже круты с табло, то вам не помещает несколько бейджиков для вашего резюме
Подробная презентация про Power BI для начинающих
Топ 3 тренда аналитики, согласно TDWI:
1) Визуализации не достаточно. В принципе ее всегда недостаточно. Нужны инсайты, рекомендации для бизнеса. Но идея в том, что на помощь приходит AI, или просто BI продукт вам может подсказать, или предоставить инструменты для удобного анализа данных на базе ML алгоритмов, встроенных в софт. Например Microstrategy+DataRobot, AWS Quicksight имеет много ML примочек, Tableau помогает на эффективней работать с данными и тп.

2) Корпорации идут в облако. Несмотря на то, что AWS уже с 2006 года, все все еще собираются в облако, но уже всем понятно преимущества AWS,Azure, GCP и это уже является частью стратегии компании.

3) Embedded аналитика - то есть продукты (бизнес продукты и сервисы) будут иметь встроенные элементы аналитики, отчетности и визуализации. Например, Tableau мне рассказывала еще летом про упор на Embedded решения. То есть, строим дашборд, копируем embedded java noscript, прям как youtube ролик, и встраиваем во frontend. И дальше уже решаем вопросы про авторизацию, аунтефикацию, безопасность и перформанс. Если использовать Tableau, это будет дорого, но можно иopensource, как например D3js
Технологии не стоят на месте, новый кластер редшифта - RA3 инстнас (48 vCPUs, 384 GiB оперативной памяти, 64 TB стораджа для одной ноды, а может быть до 128) (раньше были проще DS2 and DC2), позволяет нам получить нереальную скорость и размер хранилища - до 8Pb. Но очень дорого.
#faketillyoumakeit #jobchange
У меня есть несколько интересных историй, про знакомых и друзей, кому я помог поменять работу или изменить даже жизнь, не знаю к лучшему или худшему. Помогать хорошо для кармы, или просто хорошо, поэтому есть несколько success stories, которые еще актуальны, говорят о том, что все в ваших руках.

История 1.
Я только немного разобрался с моей первой работой BI разработчик в Cetelem, BNP Paribas. Подтянул SAP BusinessObjects и SQL. Я реально зубрил термины на англ, так как хотел найти работу за границей. И провалил свое первое собеседование в Ирландию, но это был хороший знак, значит BI разработчик может найти работу за границей. Я сразу стал искать работу в Италии))

Я познакомился на футболе с Костиком, мы 2м не очень были футболистами и тупили у ворот)) Он работал в отделе безопасности, и все, что делал, это только проверял клиентов, прогонял по базам, зп была не высокая, перспективы тоже так себе.

Как лучше всего выучить новый предмет? Это научить другого. Я рассказал Косте о преимуществах работы с BusinessIntelligence. Мы ему настроили SAP BO, SQL, скачали еще SQL Server и SAP BO сервер на домашний комп и он стал учиться. И заодно ему новое резюме придумали. Не помню всех подробностей, но в итоге он устроился в консалтинг по SAP. ЗП сразу увеличилась в 2,5 раза и ему все нравилось. Сейчас мы с ним уже не общаемся, но лет 5 назад у него все было хорошо, в благодарность он подарил наушники, которые досих пор работают с 2010 года. Смена работы и обучение заняло месяцев 6. Но я понял, что это работает.