Practical_Real_time_Data_Processing_and_Analytics_Shilpi_Saxena.pdf
13.4 MB
Practical Real-time Data Processing and Analytics: Distributed Computing and Event Processing using Apache Spark, Flink, Storm, and Kafka
What You Will Learn
▫️Get an introduction to the established real-time stack
▫️Understand the key integration of all the components
▫️Get a thorough understanding of the basic building blocks for real-time solution designing
▫️Garnish the search and visualization aspects for your real-time solution
▫️Get conceptually and practically acquainted with real-time analytics
▫️Be well equipped to apply the knowledge and create your own solutions
What You Will Learn
▫️Get an introduction to the established real-time stack
▫️Understand the key integration of all the components
▫️Get a thorough understanding of the basic building blocks for real-time solution designing
▫️Garnish the search and visualization aspects for your real-time solution
▫️Get conceptually and practically acquainted with real-time analytics
▫️Be well equipped to apply the knowledge and create your own solutions
What is the Parquet File Format and Why You Should Use It
https://www.upsolver.com/blog/apache-parquet-why-use
https://www.upsolver.com/blog/apache-parquet-why-use
Forwarded from Data-comics
Читала отчёт по DevOps Setups benchmarking 2022 от Luca G и humanitec.
В целом, есть интересные моменты про разные типы команд разработчиков, ребята провели большую работу.
Но результаты преподнесли немного дезинформирующе.
Пример - на приложенной картинке.
Что не так? 😁
Ссылка на отчёт тут: https://humanitec.com/whitepapers/2021-devops-setups-benchmarking-report
Файл, кому интересно, приложу в комменты.
В целом, есть интересные моменты про разные типы команд разработчиков, ребята провели большую работу.
Но результаты преподнесли немного дезинформирующе.
Пример - на приложенной картинке.
Что не так? 😁
Ссылка на отчёт тут: https://humanitec.com/whitepapers/2021-devops-setups-benchmarking-report
Файл, кому интересно, приложу в комменты.
Google Data Engineering.pdf
978.9 KB
Google Data Engineering Cheatsheet
Complete Data Engineer’s Vocabulary | by Kovid Rathee | Towards Data Science
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad
https://towardsdatascience.com/complete-data-engineers-vocabulary-87967e374fad
Medium
Complete Data Engineer’s Vocabulary
Concepts that data engineers must know in 10 words or less
Создание современной платформы для работы с данными с помощью Open-Source-решений / Хабр
https://habr.com/ru/company/vk/blog/671642/
https://habr.com/ru/company/vk/blog/671642/
Хабр
Создание современной платформы для работы с данными с помощью Open-Source-решений
Команда VK Cloud Solutions перевела краткий конспект с Open Source Data Stack Conference . Конференция была посвящена созданию платформ для работы с данными на базе Open-Source-решений —докладчики...
Docker Swarm для самых маленьких / Хабр
https://habr.com/ru/post/659813/
https://habr.com/ru/post/659813/
Хабр
Docker Swarm для самых маленьких
Данная статья посвящена настройке и работе с Docker Swarm. Swarm это стандартный оркестратор для docker контейнеров, доступный из «коробки», если у вас установлен сам docker. Что нам потребуется для...
TelegramOperator — apache-airflow-providers-telegram Documentation
Оператор Airflow для отправки уведомлений в Telegram
https://airflow.apache.org/docs/apache-airflow-providers-telegram/stable/operators.html
Оператор Airflow для отправки уведомлений в Telegram
https://airflow.apache.org/docs/apache-airflow-providers-telegram/stable/operators.html
GitHub - TolstikovIgor/ETL: GeekBrains: Построение хранилища данных и основы ETL
https://github.com/TolstikovIgor/ETL
https://github.com/TolstikovIgor/ETL
GitHub
GitHub - TolstikovIgor/ETL: GeekBrains: Построение хранилища данных и основы ETL
GeekBrains: Построение хранилища данных и основы ETL - TolstikovIgor/ETL
Play with Docker
▫️Docker 101 Tutorial - Self-paced tutorials to increase your Docker knowledge.
▫️Lab Environment - Complete a workshop without installing anything using this Docker playground.
▫️Community Training - Free and paid learning materials from Docker Captains.
https://www.docker.com/play-with-docker/
▫️Docker 101 Tutorial - Self-paced tutorials to increase your Docker knowledge.
▫️Lab Environment - Complete a workshop without installing anything using this Docker playground.
▫️Community Training - Free and paid learning materials from Docker Captains.
https://www.docker.com/play-with-docker/
Docker
Play with Docker | Docker
Find self-paced tutorials to increase your Docker knowledge, and join a global community of collaborative developers. Play with Docker today!
👍1
Завтра в 12 трансляция
https://youtu.be/jF3YemOVofQ
https://youtu.be/jF3YemOVofQ
YouTube
Обработка данных на Apache Airflow в Yandex Cloud
Для анализа данных в облаке не достаточно СУБД и средств визуализации — нужен ещё и понятный инструмент, который автоматизирует сбор, подготовку и обработку данных. На вебинаре мы расскали о таком сервисе — Apache Airflow.
Эксперты Yandex Cloud обсудили:…
Эксперты Yandex Cloud обсудили:…