Ссылки по analytics.
ML:
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI
What is MLOps? Machine Learning Operations Explained
Building a Successful Enterprise AI Platform
Nested Attributes & Functions Operating on Nested Types in PySpark
Data Scientists, don’t worry about data engineering: Viewflow has your back.
DE:
Capturing Every Change From Shopify’s Sharded Monolith
Scaling Data Culture Is a Marathon, Not a Sprint
Taming the Dependency Hell with dbt
Executing a distributed shuffle without a MapReduce system
Interview:
The New York Times is rolling out a new approach to how we hire data analysts.
ML:
A Chat with Andrew on MLOps: From Model-centric to Data-centric AI
What is MLOps? Machine Learning Operations Explained
Building a Successful Enterprise AI Platform
Nested Attributes & Functions Operating on Nested Types in PySpark
Data Scientists, don’t worry about data engineering: Viewflow has your back.
DE:
Capturing Every Change From Shopify’s Sharded Monolith
Scaling Data Culture Is a Marathon, Not a Sprint
Taming the Dependency Hell with dbt
Executing a distributed shuffle without a MapReduce system
Interview:
The New York Times is rolling out a new approach to how we hire data analysts.
Чувак рассказывает про инструменты инженера данных на Azure и про то, как можно их учить бесплатно.
Кстати я продолжаю общаться с разными студиями Xbox, и если Minecraft и Rare (создатели Sea of Thieves) +/- довольны Databricks, но еще далеки от совершенства, то вот Turn 10 (создатели Forza) решили пойти по пути Azure Synapse. Оказывается, когда вышел Synapse, то они выпустили поддержку Delta Lake и Serverless SQL Engines. Пока еще сыровато, но звучит многообещающе. Я больше всего боюсь, что в один прекрасный день, Databricks уйдет из Azure, и останется мне только Synapse. Я очень хочу попробовать кейсы для DataBricks, чтобы запускать ML модели внутри игры в режиме реального времени, пока не знаю, как это работает, но технологии позволяют так делать. Сейчас основной проект это миграция HDInsight (Azure Hadoop)+Hive на Databricks.
Кстати я продолжаю общаться с разными студиями Xbox, и если Minecraft и Rare (создатели Sea of Thieves) +/- довольны Databricks, но еще далеки от совершенства, то вот Turn 10 (создатели Forza) решили пойти по пути Azure Synapse. Оказывается, когда вышел Synapse, то они выпустили поддержку Delta Lake и Serverless SQL Engines. Пока еще сыровато, но звучит многообещающе. Я больше всего боюсь, что в один прекрасный день, Databricks уйдет из Azure, и останется мне только Synapse. Я очень хочу попробовать кейсы для DataBricks, чтобы запускать ML модели внутри игры в режиме реального времени, пока не знаю, как это работает, но технологии позволяют так делать. Сейчас основной проект это миграция HDInsight (Azure Hadoop)+Hive на Databricks.
YouTube
How to become a Data Engineer in 2021 FOR FREE!!!
I run through free tools and resources so you can become a Data Engineer for free!
LINKS:
https://www.kratosbi.com/
MICROSOFT LEARN
https://docs.microsoft.com/en-us/learn/?source=learn
DATA ENGINEERING
https://docs.microsoft.com/en-us/learn/browse/?roles=data…
LINKS:
https://www.kratosbi.com/
MICROSOFT LEARN
https://docs.microsoft.com/en-us/learn/?source=learn
DATA ENGINEERING
https://docs.microsoft.com/en-us/learn/browse/?roles=data…
Выберите fake сертификаты PART 1
Anonymous Poll
21%
SnowPro Core
13%
AWS BigData
8%
AWS Cloud Practioner
30%
DAMA CDMP
16%
Tableau Desktop
16%
Tableau Server
26%
Splunk Sales Eng
25%
Splunk Sales Rep
31%
IBM Sales Mastery
31%
IBM Teleaf
Выберите fake сертификаты Part 2
Anonymous Poll
36%
Pentaho DI
31%
SAP BO
36%
Teradata SQL
25%
Teradata Professional
Продолжаю про ценность сертификатов. У меня по ним примерно такая история:
- SnowPro Core - я даже не пытался, но у меня был купон на бесплатную сдачу. Это вводный экзамен, просто было жалко времени теорию повторять.
- AWS BigData - я прошел все тренинги и лабы, осталось только зубрить теорию бесполезную. Стало жалко времени.
- AWS Cloud Practitioner - я сдавал честно 2 раза, и какждый раз был сбой в программе онлайн экзаменов. 3й раз я просто забил.
- Pentaho DI - я набрал 73%, а нужно было минимум 75%. Пересдавать это уже дорого.
То есть эти 4 fake. Реально для себя я не ощущаю полезности их наличию. Тренинги к подготовке AWS, очень важны и полезны, а вот учить теорию наоборот. Они весят в LinkedIn и больше служат как приманка для рекрутеров. Это как ловить рыбу и вокруг насыпать приманку, чтобы ее привлечь🤫
DAMA CDMP я сдал без подготовки на конференции EDW. Причем там оплачиваете, только если успешно сдали)) Во время сдачи я очень очень быстро делал CNTR+F (search) в книги по подготовке CDMP. Вообще это сертификат какой-то древний, даже нет картинки в Linkedin.
2xTableau я сдал честно, так как нужно было стать партнером Tableau в British Columbia. К сожалению, каждые 2 года они expired. Но реально пользы в них никакой. Больше я знать не стал. Главные знания из практики.
2xSplunk я сдавал в Москве по той же причине, было требование партнерства. Тренинги были крутые, а вот сертификаты бесполезны. В 2016 году меня не взяли в Splunk в Toronto.
Я еще не указал сертификат по Microstrategy. Я его тоже получил честно, тоже бесполезный.
2xIBM тоже было требование партнерства в Москве. Полная профанация. Мне даже ответы дали из IBM😂
SAP BO сдал честно в центре SAP в Москве, было крутое ощущение. Но пользы не было.
2x Teradata сдавал честно, но готовился по dump ответов. Это было необходимо, так как работал в Терадата.
В общем, сертификаты могут быть нужны в следующих случаях:
1. У вас мало или вообще нет опыта, но вам надо показать обратное -> сдавайте сертификат
2. Вы работаете в консалтинге и вам необходим экзамен, так как это требование партнерства. Если все оплачивают и дают время на подготовку, то почему бы и нет.
3. Ваш работодатель оплачивает вам подготовку, экзамены и очень ценит сертификаты на годовой оценке, тогда конечно нужно получить парочку.
Я бы еще мог к себе добавить сертификатов по Azure и Databricks. Может быть добавлю потом. Никто, никогда не попросил меня прислать proof сертификата. Так что смело добавляйте 2-3 к себе по технологиям, которые вы хорошо знаете!
- SnowPro Core - я даже не пытался, но у меня был купон на бесплатную сдачу. Это вводный экзамен, просто было жалко времени теорию повторять.
- AWS BigData - я прошел все тренинги и лабы, осталось только зубрить теорию бесполезную. Стало жалко времени.
- AWS Cloud Practitioner - я сдавал честно 2 раза, и какждый раз был сбой в программе онлайн экзаменов. 3й раз я просто забил.
- Pentaho DI - я набрал 73%, а нужно было минимум 75%. Пересдавать это уже дорого.
То есть эти 4 fake. Реально для себя я не ощущаю полезности их наличию. Тренинги к подготовке AWS, очень важны и полезны, а вот учить теорию наоборот. Они весят в LinkedIn и больше служат как приманка для рекрутеров. Это как ловить рыбу и вокруг насыпать приманку, чтобы ее привлечь🤫
DAMA CDMP я сдал без подготовки на конференции EDW. Причем там оплачиваете, только если успешно сдали)) Во время сдачи я очень очень быстро делал CNTR+F (search) в книги по подготовке CDMP. Вообще это сертификат какой-то древний, даже нет картинки в Linkedin.
2xTableau я сдал честно, так как нужно было стать партнером Tableau в British Columbia. К сожалению, каждые 2 года они expired. Но реально пользы в них никакой. Больше я знать не стал. Главные знания из практики.
2xSplunk я сдавал в Москве по той же причине, было требование партнерства. Тренинги были крутые, а вот сертификаты бесполезны. В 2016 году меня не взяли в Splunk в Toronto.
Я еще не указал сертификат по Microstrategy. Я его тоже получил честно, тоже бесполезный.
2xIBM тоже было требование партнерства в Москве. Полная профанация. Мне даже ответы дали из IBM😂
SAP BO сдал честно в центре SAP в Москве, было крутое ощущение. Но пользы не было.
2x Teradata сдавал честно, но готовился по dump ответов. Это было необходимо, так как работал в Терадата.
В общем, сертификаты могут быть нужны в следующих случаях:
1. У вас мало или вообще нет опыта, но вам надо показать обратное -> сдавайте сертификат
2. Вы работаете в консалтинге и вам необходим экзамен, так как это требование партнерства. Если все оплачивают и дают время на подготовку, то почему бы и нет.
3. Ваш работодатель оплачивает вам подготовку, экзамены и очень ценит сертификаты на годовой оценке, тогда конечно нужно получить парочку.
Я бы еще мог к себе добавить сертификатов по Azure и Databricks. Может быть добавлю потом. Никто, никогда не попросил меня прислать proof сертификата. Так что смело добавляйте 2-3 к себе по технологиям, которые вы хорошо знаете!
Forwarded from Pasha Finkelshteyn
Чатик, а вы знаете про конфу datalove, которая совсем скоро? https://datalove.konfy.care/
И вы только посомтрите какой там лайнап? Я не видел Холден уже больше года, например!
И вы только посомтрите какой там лайнап? Я не видел Холден уже больше года, например!
Детская книга про data science https://www.dominodatalab.com/childrens-book-florence-the-data-scientist-sweepstakes/ (вроде бесплатная)
Dominodatalab
Florence the Data Scientist and Her Magical Bookmobile: The First-Ever Children’s Book on Data Science | Domino Data Lab
Inspire the next generation of data scientists with this magical story of patterns, predictions, dogs, and dragons. Get the digital e-book or paperback today!
Я потратил 4 месяца на full time изучение Databricks на Azure. Вчера написал письмо пользователям, что вот все готово, переходим с HDInsight/SQL Server на Databricks. А сегодня оказалось, что больше мы не используем Databricks, и теперь Synapse Analytics. У которого тоже есть managed spark, delta lake, но все это еще местами сыровато. Все мои планы про крутые кейсы на databricks, про collaboration и продвижение продукта среди студий Microsoft улетучились. С завтрашнего дня начинаю ковырять Synapse. Чувствую себя примерно, как переходить с Tableau на Power BI, и вам обещают, что все будет так же и даже лучше🤪 Последние 4 месяца я в голове строил планы про архитектуру решения, возможные use cases, общался с другими командами и убеждал их в превосходстве Databricks над другими решениям, и многое другое, а теперь все это стало не актуальным, надо будет разобраться как это сделать на Synapse.
В любом случае опыт хороший получил по Databricks. Принципы Spark, pyspark и delta lake останутся неизменны. Но есть недостатки, например максимальная версия, которая есть у Synapse -> Spark 2.4.
Из хорошего, будет легче в datalearn засунуть Databricks и Synapse Analytics.
В любом случае опыт хороший получил по Databricks. Принципы Spark, pyspark и delta lake останутся неизменны. Но есть недостатки, например максимальная версия, которая есть у Synapse -> Spark 2.4.
Из хорошего, будет легче в datalearn засунуть Databricks и Synapse Analytics.
Forwarded from Alexander ⚛️ Morozov
Куда будет развиваться Google Cloud https://cloudwars.co/google-cloud/google-cloud-ceo-thomas-kurian-where-cloud-needs-to-go/
#datamesh будет мероприятие, может будет интересно, название веселое)) https://www.linkedin.com/events/howthe-ck-heck-doyoubuildadatam6780462587961319424/
Linkedin
How the **ck (heck) do you build a Data Mesh? | LinkedIn
TO REGISTER VISIT: https://app.livestorm.co/cinchy/s2-ep7-data-mesh
Data Mesh - Everyone is talking about it but who is actually making it happen? Once you scratch beneath the surface several big questions emerge.
Join Cinchy CEO, Dan DeMers, and Data…
Data Mesh - Everyone is talking about it but who is actually making it happen? Once you scratch beneath the surface several big questions emerge.
Join Cinchy CEO, Dan DeMers, and Data…