NEW BOT Телеграм, страница

Data Engineering / Инженерия данных / Data Engineer / DWH

Play with Docker

▫️Docker 101 Tutorial - Self-paced tutorials to increase your Docker knowledge.
▫️Lab Environment - Complete a workshop without installing anything using this Docker playground.
▫️Community Training - Free and paid learning materials from Docker Captains.

https://www.docker.com/play-with-docker/

Docker

Play with Docker | Docker

Find self-paced tutorials to increase your Docker knowledge, and join a global community of collaborative developers. Play with Docker today!

👍1

301 views04:41

Data Engineering / Инженерия данных / Data Engineer / DWH

Modern Data Stack - Ranking | OSS Insight
https://ossinsight.io/collections/modern-data-stack/

ossinsight.io

Modern Data Stack - Ranking | OSS Insight

Last 28 days / Monthly ranking of repos in this collection by stars, pull requests, issues. Historical Ranking by Popularity.

1.04K views10:38

Data Engineering / Инженерия данных / Data Engineer / DWH

https://youtu.be/ANj7qUgzNq4

YouTube

CI CD наглядные примеры

В этом ролике мы рассмотрим cicd. Разберем теорию, которая связана с CI CD, а также на реальных примерах рассмотрим CI/CD pipeline. Ролик по cicd особенно будет полезен начинающим разработчикам, которые ранее с этой концепцией не сталкивались.

Мой курс "Продвинутый…

193 views18:42

Data Engineering / Инженерия данных / Data Engineer / DWH

https://www.youtube.com/watch?v=sbVYRf_6Hvg

YouTube

Основы SSH | Хекслет

В видео разберем, что такое SSH, как он работает и как начать использовать его.

🔗 Полезные ссылки:
Клиенты SSH:
Mac:
- iTerm2 http://iterm2.com/
- Cathode http://www.secretgeometry.com/apps/cathode/

Win:
- PuTTY http://www.chiark.greenend.org.uk/~sgtatham/putty/…

186 views08:15

Data Engineering / Инженерия данных / Data Engineer / DWH

https://www.bigdataschool.ru/blog/nifi-with-docker-and-kubernetes-guideline.html

Курсы Big Data,Arenadata,Greenplum, Kafka и Spark

Контейнеризация Apache NiFi: безопасность конвейеров и потоков данных с Docker и Kubernetes

Сегодня рассмотрим, как организовать полностью сохраняемый сервис Apache NiFi с помощью Docker

186 views13:28

Data Engineering / Инженерия данных / Data Engineer / DWH

https://www.youtube.com/watch?v=ArLijmbZUYk

YouTube

Apache NiFi : Docker installation

This video shows you to start NiFi as docker container. It also shows the port customization and volume mounting.

Apache NiFi : https://nifi.apache.org/
Docker hub link : https://hub.docker.com/r/apache/nifi/
Docker Installation : https://github.com/san…

197 views13:29

Data Engineering / Инженерия данных / Data Engineer / DWH

Завтра в 12 трансляция
https://youtu.be/jF3YemOVofQ

YouTube

Обработка данных на Apache Airflow в Yandex Cloud

Для анализа данных в облаке не достаточно СУБД и средств визуализации — нужен ещё и понятный инструмент, который автоматизирует сбор, подготовку и обработку данных. На вебинаре мы расскали о таком сервисе — Apache Airflow.

Эксперты Yandex Cloud обсудили:…

203 views17:23

Data Engineering / Инженерия данных / Data Engineer / DWH

https://harshilp.medium.com/101-guide-on-apache-airflow-operators-f9707d8b86c7

Medium

101 Guide on Apache Airflow Operators

A 101 guide on some of the frequently used Apache Airflow Operators with detailed explanation of setting them up(with code)…

219 views08:31

Data Engineering / Инженерия данных / Data Engineer / DWH

Продвинутая работа с Docker — Docker-compose.
https://1cloud.ru/blog/docker-compose

1cloud.ru

Docker-compose: что это, установка, команды — подробный мануал для начинающих

Развернуто рассказываем о том, что такое Docker-compose и как с ним работать.

202 views14:39

Data Engineering / Инженерия данных / Data Engineer / DWH

https://eternalhost.net/base/vps-vds/docker-compose-yml

211 views08:41

Data Engineering / Инженерия данных / Data Engineer / DWH

Список полезных Linux Commands

@devops_dataops

https://telegra.ph/Linux-Commands-07-27

Telegraph

Linux Commands

https://news.1rj.ru/str/devops_dataops Version # Debian/Ubuntu uname -a lsb_release -a # CentOS/RedHat cat /etc/centos-release cat /etc/redhat-release # This will provide a lot more information cat /etc/os-release System # Restart reboot # Memory free # Disk df -hl…

201 views06:55

Data Engineering / Инженерия данных / Data Engineer / DWH

Как собрать платформу обработки данных «своими руками»?

@devops_dataops

https://habr.com/ru/company/itsumma/blog/679516/

Хабр

Как собрать платформу обработки данных «своими руками»?

Большое количество российских компаний столкнулись с ограничениями в области ПО. Они теперь не имеют возможности использовать многие важные инструменты для работы с данными. Но, как говорится, одна...

820 viewsedited 09:24

Data Engineering / Инженерия данных / Data Engineer / DWH

Nico_Loubser_Software_Engineering_for_Absolute_Beginners_Your_Guide.epub

1.5 MB

Software Engineering for Absolute Beginners - 2021

What You Will Learn
🔹 Explore the concepts that you will encounter in the majority of companies doing software development
🔹 Create readable code that is neat as well as well-designed
🔹 Build code that is source controlled, containerized, and deployable
🔹 Secure your codebase
🔹 Optimize your workspace

4.19K views06:04

Data Engineering / Инженерия данных / Data Engineer / DWH

https://habr.com/ru/company/rostelecom/blog/675554/

Хабр

Контроль качества данных и точка. Как мы строили модуль DQM с нуля

Всем привет! Меня зовут Андрей, я занимаюсь процессами контроля качества данных в DataOffice Ростелекома. В статье поделюсь опытом создания модуля контроля качества данных, с какими трудностями мы...

186 views06:05

Data Engineering / Инженерия данных / Data Engineer / DWH

🔥 Awesome Docker Compose samples

These samples provide a starting point for how to integrate different services using a Compose file and to manage their deployment with Docker Compose.

👉 @devops_dataops

https://github.com/docker/awesome-compose

GitHub

GitHub - docker/awesome-compose: Awesome Docker Compose samples

Awesome Docker Compose samples. Contribute to docker/awesome-compose development by creating an account on GitHub.

1.02K viewsedited 13:02

Data Engineering / Инженерия данных / Data Engineer / DWH

ETL Pipeline with Airflow, Spark, s3, MongoDB and Amazon Redshift

Educational project on how to build an ETL (Extract, Transform, Load) data pipeline, orchestrated with Airflow.

https://github.com/renatootescu/ETL-pipeline

GitHub

GitHub - renatootescu/ETL-pipeline: Educational project on how to build an ETL (Extract, Transform, Load) data pipeline, orchestrated…

Educational project on how to build an ETL (Extract, Transform, Load) data pipeline, orchestrated with Airflow. - renatootescu/ETL-pipeline

325 views13:17

Data Engineering / Инженерия данных / Data Engineer / DWH

GitHub - martandsingh/ApacheSpark: This repository will help you to learn about databricks concept with the help of examples. It will include all the important topics which we need in our real life experience as a data engineer. We will be using pyspark & sparksql for the development. At the end of the course we also cover few case studies.

https://github.com/martandsingh/ApacheSpark

GitHub

GitHub - martandsingh/ApacheSpark: This repository will help you to learn about databricks concept with the help of examples. It…

This repository will help you to learn about databricks concept with the help of examples. It will include all the important topics which we need in our real life experience as a data engineer. We ...

👍1

371 viewsedited 16:31

Data Engineering / Инженерия данных / Data Engineer / DWH

Проектирование ETL-пайплайна в Apache Airflow / Хабр
https://habr.com/ru/company/otus/blog/679402/

Хабр

Проектирование ETL-пайплайна в Apache Airflow

Привет, Хабр! На связи Рустем, IBM Senior DevOps Engineer и сегодня я хотел бы продолжить наше знакомство с инструментом в DataOps инженирии — Apache Airflow. Сегодня мы спроектируем ETL-пайплайн. Не...

280 views05:29

Data Engineering / Инженерия данных / Data Engineer / DWH

Глубокое погружение в Data Quality / Хабр
https://habr.com/ru/company/vk/blog/674876/

272 views07:19

Data Engineering / Инженерия данных / Data Engineer / DWH

Примерчик ETL pipeline на python
https://github.com/iamaziz/etl

GitHub

GitHub - iamaziz/etl: simple ETL example

simple ETL example. Contribute to iamaziz/etl development by creating an account on GitHub.

284 views08:51

Data Engineering / Инженерия данных / Data Engineer / DWH

Mara Pipelines

This package contains a lightweight data transformation framework with a focus on transparency and complexity reduction. It has a number of baked-in assumptions/ principles:
- Data integration pipelines as code: pipelines, tasks and commands are created using declarative Python code.
- PostgreSQL as a data processing engine.
- Extensive web ui. The web browser as the main tool for inspecting, running and debugging pipelines.
- GNU make semantics. Nodes depend on the completion of upstream nodes. No data dependencies or data flows.
- No in-app data processing: command line tools as the main tool for interacting with databases and data.
- Single machine pipeline execution based on Python's multiprocessing. No need for distributed task queues. Easy debugging and output logging.
- Cost based priority queues: nodes with higher cost (based on recorded run times) are run first.

https://github.com/mara/mara-pipelines

GitHub

GitHub - mara/mara-pipelines: A lightweight opinionated ETL framework, halfway between plain noscripts and Apache Airflow

A lightweight opinionated ETL framework, halfway between plain noscripts and Apache Airflow - mara/mara-pipelines

297 views08:56

About

Blog

Apps

Platform