Code Screen из Shopify🧑💻👩💻
# Canadian postal codes are in the form "A1A 1A1", where "A" is an upper case letter
# and "1" is a digit. Here is a subset of provinces and territories along with their
# unique set of postal code prefixes:
# Province Code | Prefixes | Province/Territory Name
# ------------- | ------------- | -----------------------
# ON | K, L, M, N, P | Ontario
# MB | R | Manitoba
# NU | X0A, X0B, X0C | Nunavut
# NT | X0E, X0G, X1A | Northwest Territories
# Using that subset:
# 1) Write a `province_for` method which, given a postal code, returns the
# province code that corresponds, or null if none is found to match
# e.g. province_for("K1P 1K9") => "ON"
# province_for("R3L 0T9") => "MB"
# province_for("Q1Q 1Q1") => null # no postal codes start with "Q"
# province_for("X0C 0E0") => "NU"
# 2) Write a------------ method which, given a postal code and a province code,
# returns true if the postal code is valid for the province, or false otherwise
# e.g. valid_for("M5W 1E6", "ON") => true
# valid_for("Z0M 1G2", "ON") => false # no province matches the postal code
# valid_for("X0E 0T0", "NT") => true
# valid_for("X0A 0H0", "MB") => false # X0A 0H0 is in NU
PS можете свое решение добавлять в комменты.👍8🤔1
Data Team = Product Team - мы уже поднимали этот вопрос не(или ни) один раз. Вот еще одна статья Run Your Data Team Like A Product Team
Locally Optimistic
Run Your Data Team Like A Product Team - Locally Optimistic
Data teams aim to help the people in their organization make better decisions. Many data teams aren’t doing this as well as they could and are missing out on a huge opportunity, both for the organization and the team. This gap is due to teams not being set…
👍9
Apache Flink Chapter 1.pdf
8.6 MB
Первая глава книги Stream Processing with Apache Flink.
Кто работал с Flink, как вы его используете? Какие аналоги? Кейсы?
Кто работал с Flink, как вы его используете? Какие аналоги? Кейсы?
Николай Голов, который рассказал очень просто и понятно про Snowflake и Data Vault (записи на нашем youtube), написал новый блог пост Do we really need data modeling in the world of the modern data stack?
Medium
Do we really need data modeling in the world of the modern data stack?
I have 15 years of experience as a data engineer. In the beginning, I worked with classical OLTP databases, like MS SQL Server, PostgreSQL…
🔥13👍5👏1
Через 30 минут начинаем:
https://youtu.be/6SaRpBoZ5Go
https://youtu.be/6SaRpBoZ5Go
YouTube
ПРОЕКТЫ И ПРОДУКТЫ: ВЗБОЛТАТЬ НО НЕ СМЕШИВАТЬ
«Процессы, проекты, продукты, платформы как предметы деятельности аналитика на основании концептуального подхода»
Спикер - Аноним
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь и проходите курс…
Спикер - Аноним
🔔 Подписывайтесь на канал "Datalearn" чтобы не пропустить остальные части и ставьте лайки!
📕 Записывайтесь и проходите курс…
👍21🔥2
Задачка из epic games interview👩💻🧑💻
# Output all binary strings of length N such that there are no repeating "1"s
# e.g. `generateBinaryStrings(2) -> 00, 01, 10` and `generateBinaryStrings(3)` -> [000, 001, 010, 100, 101]
👍13
Недавно увидел картинку рабочего место в одном из телеграмм каналов, в котором пока всего 100 подписчиков.
Сидя на стуле Herman Miller за 1к$, автоматизированном столе за 1к$, обложен 2мя mac book pro (15" и 16"), ipad Pro, ipad mini, несколько ноутов на Windows, вид на горы и океан за окном, имея доступ ко всем возможным подпискам, курсам, книгам и талантам, у меня нет, того, что есть на этой картинке - целеустремленность, желание учиться и развиваться, и карабкаться на верх к новым победам и вершинам.
Поэтому если вы в такой же ситуации, то я вам даже завидую, потому что у вас еще много сил на достижение поставленных целей. не останавливайтесь и все у вас будет круто!
А мне просто хочется почилить на пляже с банчкой сидра🦧
Сидя на стуле Herman Miller за 1к$, автоматизированном столе за 1к$, обложен 2мя mac book pro (15" и 16"), ipad Pro, ipad mini, несколько ноутов на Windows, вид на горы и океан за окном, имея доступ ко всем возможным подпискам, курсам, книгам и талантам, у меня нет, того, что есть на этой картинке - целеустремленность, желание учиться и развиваться, и карабкаться на верх к новым победам и вершинам.
Поэтому если вы в такой же ситуации, то я вам даже завидую, потому что у вас еще много сил на достижение поставленных целей. не останавливайтесь и все у вас будет круто!
А мне просто хочется почилить на пляже с банчкой сидра🦧
🔥103👍34😁9🤔7❤6🤬1😢1
По моим свежим постам я этого не заметил😛 А вы как считаете, должны быть coding/white boarding?
Мне лично нравятся реальные задачи, например взять BigQury, загрузить данные и визуализировать результат, или еще чего, ближе к реальному опыту, чем задачи про бинарную строку и выведение матрицы по часовой стрелке.
Мне лично нравятся реальные задачи, например взять BigQury, загрузить данные и визуализировать результат, или еще чего, ближе к реальному опыту, чем задачи про бинарную строку и выведение матрицы по часовой стрелке.
🔥32👍12
2 картинки. На 1й кофундер Airbyte (open source EL продукт), публикует обычный маркетинговый продающий пост.
Airbyte хотели (хотят) повторить успех Airflow/dbt в плане создания community, но что-то пошло не по плану и даже VC деньги не помогли. Поэтому им задали очень хороший вопрос на 2й картинке.
Мне лично Airbyte показался перегруженным, и я использую meltano.
Сам пост.
Airbyte хотели (хотят) повторить успех Airflow/dbt в плане создания community, но что-то пошло не по плану и даже VC деньги не помогли. Поэтому им задали очень хороший вопрос на 2й картинке.
Мне лично Airbyte показался перегруженным, и я использую meltano.
Сам пост.
👍5
Товарищ поднял интересную тему - мы часто слышим в компании, что “мы семья” и бла бла бла, а по факту это как рост цены акций или криптовалюты, все классно, пока везде и у всех все хорошо, а чуть, что не так, так сразу “давай, досвидания”.
Поэтому возникает вопрос, почем сотрудниками дают испытательный срок, это сотрудники должны давать испытательный срок компании.
у вас как на работе - “мы семья?”, кофе с печеньками и корпаративчики?
Еще было много постов на тему крутецких пати в западных компаниях с модным мерчем, где-нибудь на Гаваях, а потом давай, досвидания”, так как нечем платить зарплату. Но до уровня Xsolla и их успешного применения анализа Big Data еще даже Tesla не дошла🌚
Поэтому возникает вопрос, почем сотрудниками дают испытательный срок, это сотрудники должны давать испытательный срок компании.
у вас как на работе - “мы семья?”, кофе с печеньками и корпаративчики?
Еще было много постов на тему крутецких пати в западных компаниях с модным мерчем, где-нибудь на Гаваях, а потом давай, досвидания”, так как нечем платить зарплату. Но до уровня Xsolla и их успешного применения анализа Big Data еще даже Tesla не дошла🌚
👍44👏3❤1
Я писал давно про свой неуспешный опыт создания аналитического консалтинга. Всегда интересно читать, как похожая идея у кого-то получилась. Ребята из Монтреаля выросли за 2 года с 4х до 32 консультантов продавая услуги Looker, Snowflake, Dbt, Fivetran с годовым revenue 3mln+, молодцы! Уверен что это было не просто, но они справились, да и сайт у них креативный.
PS А это про неудачный опыт похожей идеи (статья на хабре). Так же был партнером Snowflake, Looker, Matillion, Tableau, но слишком был размыт фокус, пытался объять необъятное.
PS А это про неудачный опыт похожей идеи (статья на хабре). Так же был партнером Snowflake, Looker, Matillion, Tableau, но слишком был размыт фокус, пытался объять необъятное.
Medium
Montreal Analytics, Year 2
Scaling from a Local Team to a Distributed Company
👍43
МОДУЛЬ 7-2 ЧТО ТАКОЕ APACHE SPARK
Apache Spark является самым популярным инструментом среди инженеров данных, аналитиков и инженеров машинного обучения. Его главная задача это обработка данных. С помощью Spark можно подключаться к любому источнику данных, читать большие данные и обрабатывать их в оперативной памяти с использованием распределенного вычисления (distributed computing).
В этом видео:
📌 Узнаем история Apache Spark
📌 Посмотрим примеры архитектур с использованием Spark
📌 Разберемся когда его можно использовать
📌 Узнаем про основные компоненты
📌 Узнаем, обозначает термин Unified Analytics
Apache Spark является самым популярным инструментом среди инженеров данных, аналитиков и инженеров машинного обучения. Его главная задача это обработка данных. С помощью Spark можно подключаться к любому источнику данных, читать большие данные и обрабатывать их в оперативной памяти с использованием распределенного вычисления (distributed computing).
В этом видео:
📌 Узнаем история Apache Spark
📌 Посмотрим примеры архитектур с использованием Spark
📌 Разберемся когда его можно использовать
📌 Узнаем про основные компоненты
📌 Узнаем, обозначает термин Unified Analytics
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 7-2 ЧТО ТАКОЕ APACHE SPARK
Apache Spark является самый популярным инструментом среди инженеров данных, аналитиков и инженеров машинного обучения. Его главная задача это обработка данных. С помощью Spark можно подключаться к любому источнику данных, читать большие данные и обрабатывать…
🔥82👍28❤3👏1🤩1
МОДУЛЬ 7-2-1 САМЫЙ МИНИМУМ PYTHON ДЛЯ SPARK (JUST ENOUGH PYTHON FOR SPARK)
Вдруг вы плохо знаете Python? Тогда для вас есть express course:)
Прежде, чем начать работать с Apache Spark, мы должны иметь необходимый минимум работы хотя бы одного из поддерживаемых языков программирования. Один из самых популярных языков - Python. Поэтому в этом уроке мы посмотрим, какие команды нам необходимо знать на примере Databricks notebooks. У вас будет замечательная возможность попрактиковаться, и если вдруг вы мало используете Python, то самое время попробовать его, так как дальше нам очень понадобится.
В этом видео:
📌 Что такое Databricks
📌 Как запустить Community Edition Databricks и какие есть еще варианты для бесплатного Spark
📌 Переменные и типы данных в Python
📌 Условия и циклы
📌 Методы, функции и библиотеки
📌 Коллекции и классы
Вдруг вы плохо знаете Python? Тогда для вас есть express course:)
Прежде, чем начать работать с Apache Spark, мы должны иметь необходимый минимум работы хотя бы одного из поддерживаемых языков программирования. Один из самых популярных языков - Python. Поэтому в этом уроке мы посмотрим, какие команды нам необходимо знать на примере Databricks notebooks. У вас будет замечательная возможность попрактиковаться, и если вдруг вы мало используете Python, то самое время попробовать его, так как дальше нам очень понадобится.
В этом видео:
📌 Что такое Databricks
📌 Как запустить Community Edition Databricks и какие есть еще варианты для бесплатного Spark
📌 Переменные и типы данных в Python
📌 Условия и циклы
📌 Методы, функции и библиотеки
📌 Коллекции и классы
YouTube
DATALEARN | DE - 101 | МОДУЛЬ 7-2-1 САМЫЙ МИНИМУМ PYTHON ДЛЯ SPARK (JUST ENOUGH PYTHON FOR SPARK)
Прежде, чем начать работать с Apache Spark, мы должны иметь необходимый минимум работы хотя бы одного из поддерживаемых языков программирования. Один из самых популярных языков - Python. Поэтому в этом уроке мы посмотрим, какие команды нам необходимо знать…
👍54🔥30❤3👏1
В видео я упоминал papers про big data:
(я их добавил в git учебник)
Papers
- The Google File System
- MapReduce: Simplified Data Processing on Large Clusters
- Bigtable: A Distributed Storage System for Structured Data
- The Hadoop Distributed File System
- Spark: Cluster Computing with Working Sets
(я их добавил в git учебник)
Papers
- The Google File System
- MapReduce: Simplified Data Processing on Large Clusters
- Bigtable: A Distributed Storage System for Structured Data
- The Hadoop Distributed File System
- Spark: Cluster Computing with Working Sets
👍19👏3
Новая книга с интересным названием - AI-Powered Business Intelligence
Use business intelligence to power corporate growth, increase efficiency, and improve corporate decision making. With this practical book with hands-on examples in Power BI, you'll explore the most relevant AI use cases for BI, including improved forecasting, automated classification, and AI-powered recommendations. And you'll learn how to draw insights from unstructured data sources like text, document, images files.
- Learn how AI can generate business impact in BI environments
- Use AutoML for automated classification and improved forecasting
- Implement recommendation services to support decision-making
- Draw insights from text data at scale with NLP services
- Extract information from documents and images with computer vision services
- Build interactive user frontends for AI-powered dashboard prototypes
- Implement an end-to-end case study for building an AI-powered customer analytics dashboard
Update: Книга вроде как 💩
Use business intelligence to power corporate growth, increase efficiency, and improve corporate decision making. With this practical book with hands-on examples in Power BI, you'll explore the most relevant AI use cases for BI, including improved forecasting, automated classification, and AI-powered recommendations. And you'll learn how to draw insights from unstructured data sources like text, document, images files.
- Learn how AI can generate business impact in BI environments
- Use AutoML for automated classification and improved forecasting
- Implement recommendation services to support decision-making
- Draw insights from text data at scale with NLP services
- Extract information from documents and images with computer vision services
- Build interactive user frontends for AI-powered dashboard prototypes
- Implement an end-to-end case study for building an AI-powered customer analytics dashboard
Update: Книга вроде как 💩
👍9😁4
Иногда вам могут выслать домашнее задание, в котором попросят вас что-нибудь сделать. У вас есть 2 варианта:
1) сделать как есть, кратко и по делу
2) расписать все достаточно подробно и сделать больше чем требуется
Я обычно всегда за 2ой вариант. В целом я не люблю тратить время на такие вещи, потому что они ничего не гарантируют. Но иногда бывает вдохновение и я решил подойти творчески к решению задачи.
Нужно было для epic games:
1) Придумать архитектуру для конкретного кейса - Software Version Tracking
2) Написать код аля leetcode.
Я сделал целый репозиторий в котором написал большой трактат про аналитические решения, архитектуру и пример delta lake подходы с pyspark для ответа на 1й вопрос. Это почти как White paper для игровой индустрии на Spark.
Для 2го я использовал GitHub actions и pytest - то есть идея CI/CD pipeline, когда мы используем аналитическое решение и пишем код.
С epic не срослось, но зато остались "артефакты" - https://github.com/dimoobraznii1986/AssignmentExample
1) сделать как есть, кратко и по делу
2) расписать все достаточно подробно и сделать больше чем требуется
Я обычно всегда за 2ой вариант. В целом я не люблю тратить время на такие вещи, потому что они ничего не гарантируют. Но иногда бывает вдохновение и я решил подойти творчески к решению задачи.
Нужно было для epic games:
1) Придумать архитектуру для конкретного кейса - Software Version Tracking
2) Написать код аля leetcode.
Я сделал целый репозиторий в котором написал большой трактат про аналитические решения, архитектуру и пример delta lake подходы с pyspark для ответа на 1й вопрос. Это почти как White paper для игровой индустрии на Spark.
Для 2го я использовал GitHub actions и pytest - то есть идея CI/CD pipeline, когда мы используем аналитическое решение и пишем код.
С epic не срослось, но зато остались "артефакты" - https://github.com/dimoobraznii1986/AssignmentExample
GitHub
GitHub - dimoobraznii1986/Assignments
Contribute to dimoobraznii1986/Assignments development by creating an account on GitHub.
👍29🔥16❤1🤔1