There is open-source .NET binding for Apache Spark to use with C# and F# in case you are in .NET ecosystem.
https://dotnet.microsoft.com/apps/data/spark
https://dotnet.microsoft.com/apps/data/spark
Microsoft
.NET for Apache Spark™ | Big data analytics
.NET for Apache Spark™ provides C# and F# language bindings for the Apache Spark distributed data analytics engine. Supported on Linux, macOS, and Windows.
I didn't know there was a Star wars version adapted for command line 😀 Just open your favorite terminal and paste
telnet towel.blinkenlights.nlForwarded from Retail Data Engineering Community (Oleg Dobretsov)
Что читать DE в телеге?
Сегодня подборка полезных TG-каналов для дата-инженера:
Если знаете еще полезные каналы - пишите в комментариях!
Сегодня подборка полезных TG-каналов для дата-инженера:
• Инжиниринг данных https://news.1rj.ru/str/rockyourdata Канал Дмитрия Аношина, эксперта по BI. Автор также ведет курс datalearn.ru, где обучает дата-инжиниринг (бесплатно) • Data Eng https://news.1rj.ru/str/dataeng Всё, что вы хотели знать про построение инфраструктуры для хранения, обработки и эффективного анализа гигантского объёма данных. • Moscow Spark https://news.1rj.ru/str/moscowspark Чат московского community Apache Spark. • DE or DIE Chat https://news.1rj.ru/str/deordie_chat Чат сообщества DE or DIE, созданный дата инженерами. Поддерживают ребята из DoDo Engineering. Проводят митапы DE or DIE вместе с NewProLab • Smart Data https://news.1rj.ru/str/smart_data_channel Канал про Data Engineering, аналитику и данные. • Я у мамы Data Engineer! https://news.1rj.ru/str/ohmydataengineer • Data online events & Moscow meetups https://news.1rj.ru/str/data_events Очень полезный канал - все ивенты, связанные с данными • Data jobs feed https://news.1rj.ru/str/datajobschannel Канал с вакансиями в сфере обработки данных (инженеры, аналитики). Полезно для понимания тенденций на рынке и востребованных навыковЕсли знаете еще полезные каналы - пишите в комментариях!
Telegram
Инжиниринг Данных
Делюсь новостями из мира аналитики и карьерными советами.
15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG
🛠️ dataengineer.ru | 🏄♂️ Surfalytics.com
№5017813306
Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
15 лет в Аналитике и Инжиниринге Данных, 10 лет в MAANG
🛠️ dataengineer.ru | 🏄♂️ Surfalytics.com
№5017813306
Реклама:
https://almond-rule-130.notion.site/1199f595f76a8030ba1be1e607c9a8ce
Forwarded from DataEng
В новом выпуске подкаста TalkPython гостем стал ведущий другого подкаста про Data Engineering — Tobias Macey.
Подкаст получился обзорным и интересным — The Data Engineering Landscape in 2021
Подкаст получился обзорным и интересным — The Data Engineering Landscape in 2021
talkpython.fm
The Data Engineering Landscape in 2021
I'm sure you're familiar with data science. But what about data engineering? Are these the same or how are they related?
Top 15 Scala Libraries for Data Science in 2021 | Scalac.io
https://scalac.io/blog/top-15-scala-libraries-for-data-science-in-2021/
https://scalac.io/blog/top-15-scala-libraries-for-data-science-in-2021/
Scalac - Software Development Company - Akka, Kafka, Spark, ZIO
Top 15 Scala Libraries for Data Science in 2023
In this article, we will take a look at what libraries can help us with our first custom ML algorithm.
Forwarded from DataEng
Про data engineering для тех, кто не в теме: https://www.youtube.com/watch?v=qWru-b6m030
Классное вводное видео.
Классное вводное видео.
YouTube
How Data Engineering Works
So, the sole purpose of data engineering is to take data from the source and save it to make it available for analysis. Sounds simple, but it’s the matter of the system that works under the hood.
Watch our video to find out more about data engineering:
00:00…
Watch our video to find out more about data engineering:
00:00…
Cloud Data Warehousing: Understanding Your Options
https://www.datanami.com/2021/04/01/cloud-data-warehousing-understanding-your-options/?utm_source=rss&utm_medium=rss&utm_campaign=cloud-data-warehousing-understanding-your-options
https://www.datanami.com/2021/04/01/cloud-data-warehousing-understanding-your-options/?utm_source=rss&utm_medium=rss&utm_campaign=cloud-data-warehousing-understanding-your-options
Datanami
Cloud Data Warehousing: Understanding Your Options
Cloud data warehouses have emerged as the go-to repositories for amassing huge amounts of data and running advanced analytics and AI upon it. This is
Forwarded from LEFT JOIN
Лучшие практики использования SQL по версии Metabase.
Некоторые советы действительно ценные. Из того, что реально встречалось на практике особенно выделил бы один, так как в свое время удалось существенно оптимизировать время выполнения запроса:
Prefer EXISTS to IN
If you just need to verify the existence of a value in a table, prefer EXISTS to IN, as the EXISTS process exits as soon as it finds the search value, whereas IN will scan the entire table. IN should be used for finding values in lists.
Metabase довольно интересный инструмент, на одном из проектов используем его, надо бы записать видео в продолжение Гайда по BI.
Если у кого-то есть время и интерес поисследовать Metabase, а также записать видео, пишите мне в DM: @valiotti.
Некоторые советы действительно ценные. Из того, что реально встречалось на практике особенно выделил бы один, так как в свое время удалось существенно оптимизировать время выполнения запроса:
Prefer EXISTS to IN
If you just need to verify the existence of a value in a table, prefer EXISTS to IN, as the EXISTS process exits as soon as it finds the search value, whereas IN will scan the entire table. IN should be used for finding values in lists.
Metabase довольно интересный инструмент, на одном из проектов используем его, надо бы записать видео в продолжение Гайда по BI.
Если у кого-то есть время и интерес поисследовать Metabase, а также записать видео, пишите мне в DM: @valiotti.
Metabase | Business Intelligence, Dashboards, and Data Visualization
Best practices for writing SQL queries | Metabase Learn
SQL best practices: a brief guide to writing better SQL queries.
Here are more than 100 free course from Microsoft about #DataEngineering, #DataScience and #DataAnalytics. Many of them are #Azure related but also many focus on general knowledge in mention fields.
https://docs.microsoft.com/en-us/learn/browse/?terms=data&roles=ai-engineer%2Cdata-analyst%2Cdata-engineer%2Cdata-scientist
https://docs.microsoft.com/en-us/learn/browse/?terms=data&roles=ai-engineer%2Cdata-analyst%2Cdata-engineer%2Cdata-scientist
Docs
Browse all - Learn
Learn new skills and discover the power of Microsoft products with step-by-step guidance. Start your journey today by exploring our learning paths and modules.
Interesting long read about databases for website analytics. Besides telling about their experience of choosing right solution, author describes migration process and different options. However, he doesn't mention Druid which I think can be a good fit.
https://usefathom.com/blog/worlds-fastest-analytics
Credits to: https://news.1rj.ru/str/rockyourdata/2448
https://usefathom.com/blog/worlds-fastest-analytics
Credits to: https://news.1rj.ru/str/rockyourdata/2448
Fathom Analytics
Building the world’s fastest website analytics - Fathom Analytics
For over a year, we’d been struggling to keep up with our analytics data growth. Fathom had been growing at the speed of light, with more and more people ditching Google Analytics, our data ingestion was going through the roof.