Forwarded from DevBrain
Монументальный труд про построение бэкэнда на Python от Яндекса: https://habr.com/ru/company/yandex/blog/499534/
Хабр
Практическое руководство по разработке бэкенд-сервиса на Python
Привет, меня зовут Александр Васин, я бэкенд-разработчик в Едадиле. Идея этого материала началась с того, что я хотел разобрать вступительное задание ( Я.Диск ) в Школу бэкенд-разработки Яндекса. Я...
Путь Data Platform Engineer в AWS: https://aws.amazon.com/ru/training/learning-paths/machine-learning/data-platform-engineer/
Amazon
Машинное обучение (МО) – онлайн-курсы и аудиторные занятия | AWS
Развивайте навыки по работе с технологиями машинного обучения с помощью онлайн-курсов, аудиторных занятий и программ сертификации, предназначенных для специализированных ролей в области машинного обучения. Подробнее
Ссылка на трансляцию митапа по data engineering, который начнётся через 1 час: https://youtu.be/3GaiDIHUvro
Кейс Zalando о построении своего Data Lake на AWS: https://aws.amazon.com/de/blogs/storage/how-zalando-built-its-data-lake-on-amazon-s3/
Amazon Web Services
How Zalando built its data lake on Amazon S3 | Amazon Web Services
Founded in 2008, Zalando is Europe’s leading online platform for fashion and lifestyle with over 32 million active customers. I am a lead data engineer at Zalando and a steady contributor to the company’s cloud journey. In this blog post, I cover how Amazon…
Forwarded from DevBrain
К вопросу про целесообразность построение проекта на основе микросервисной архитектуры. Почитайте полезный пост от Twitter о том как они у себя удаляют данные в своём распределённом улье: https://blog.twitter.com/engineering/en_us/topics/infrastructure/2020/deleting-data-distributed-throughout-your-microservices-architecture.html
Весьма актуально в эпоху GDPR
Весьма актуально в эпоху GDPR
Twitter
Deleting data distributed throughout your microservices architecture
Twitter shares tips for deleting data in a microservices architecture using an erasure pipeline.
Очень крутой вебинар от архитекторов AWS на русском языке про устройство базы данных AWS Aurora: https://emea-resources.awscloud.com/rus-ua-cis-webinars-in-russian-2020/webinar-aws-aurora
Awscloud
AWS Webinar | Amazon Aurora
На хабре вышла полезная статья про построение кластера на Dask: https://habr.com/ru/post/499086/
Хабр
Домашний кластер на Dask
Я недавно проводил исследование, в рамках которого было необходимо обработать несколько сотен тысяч наборов входных данных. Для каждого набора — провести некото...
Появились доклады с прошедших двух митапов по Data Engineering, последний, к слову, проходил онлайн 🦠:
— Николай Марков – Какие дата инженеры бывают и чего от них все хотят?
— Евгений Ермаков – Что под капотом у Яндекс.Такси?
— Егор Матешук – Обзор Lambda- и Kappa-архитектур
— Денис Хуртин – Как устроена платформа управления данными в Яндекс.Маркет?
Приятного просмотра!
— Николай Марков – Какие дата инженеры бывают и чего от них все хотят?
— Евгений Ермаков – Что под капотом у Яндекс.Такси?
— Егор Матешук – Обзор Lambda- и Kappa-архитектур
— Денис Хуртин – Как устроена платформа управления данными в Яндекс.Маркет?
Приятного просмотра!
YouTube
DE or DIE #1. Николай Марков – Какие дата инженеры бывают и чего от них все хотят?
Материалы всех наших митапов доступны на GitHub: https://github.com/deordie/deordie-meetups
Наш чат в Telegram: https://news.1rj.ru/str/deordie_chat
Новые события сообщества DE or DIE: https://deordie.timepad.ru/events/
Автор доклада: Николай Марков, Principal Architect…
Наш чат в Telegram: https://news.1rj.ru/str/deordie_chat
Новые события сообщества DE or DIE: https://deordie.timepad.ru/events/
Автор доклада: Николай Марков, Principal Architect…
В блоге Confluent вышла интересная статья про построение Telegram бота на Python и ksqlDB: https://www.confluent.io/blog/building-a-telegram-bot-powered-by-kafka-and-ksqldb/
Confluent
Building a Telegram Bot Powered by Kafka and ksqlDB
ksqlDB use case: see how apps can use ksqlDB to ingest, filter, enrich, aggregate, and query data directly with Kafka—no complex architectures or data stores needed.
Вчера прошел онлайн митап на тему, что нового нас ждёт в предстоящем релизе Apache Airflow 2.0
- Слайды
- Запись митапа
Когда именно состоится релиз версии 2.0 точно не известно, но разработчики надеются, что он будет в 3-ем квартале 2020 года. Пожелаем ребятам удачи! 🍀
А вы чем пользуетесь для построение пайплайнов? Напишите, пожалуйста, в комментариях к посту.
- Слайды
- Запись митапа
Когда именно состоится релиз версии 2.0 точно не известно, но разработчики надеются, что он будет в 3-ем квартале 2020 года. Пожелаем ребятам удачи! 🍀
А вы чем пользуетесь для построение пайплайнов? Напишите, пожалуйста, в комментариях к посту.
В прошлом посте я давал ссылку на какой-то стриминговый сервис, который требовал регистрацию перед просмотром.
Сегодня обнаружил, что запись митапа выложена на ютубе
Сегодня обнаружил, что запись митапа выложена на ютубе
YouTube
What's coming in Airflow 2.0?
Presented during the NYC Apache Airflow Meetup may 2020
----
We are thrilled to welcome a group of Airflow core committers to talk about what's coming with Airflow 2.0! Participating will be Jarek Potiuk, Tomasz Urbaszek, Ash Berlin-Taylor, Daniel Imberman…
----
We are thrilled to welcome a group of Airflow core committers to talk about what's coming with Airflow 2.0! Participating will be Jarek Potiuk, Tomasz Urbaszek, Ash Berlin-Taylor, Daniel Imberman…
Forwarded from DevBrain
DataCamp дают бесплатный доступ ко всем их материалам на 1 неделю, с 15 по 22 мая — https://bit.ly/2Z670Sb
Сам периодически прохожу там курсы, очень доволен.
Сам периодически прохожу там курсы, очень доволен.
Datacamp
DataCamp Sale 2023 | DataCamp Promo & Discount
Get the latest DataCamp promos and discounts for 2023. Take advantage of our latest sales and discounts to learn data science today, no promo codes needed.
Гайд от AWS про дата пайплайны в индустрии GameTech: https://aws.amazon.com/ru/solutions/implementations/game-analytics-pipeline/
Amazon
Game Analytics Pipeline | Implementations | AWS Solutions
Deploy a solution that helps game developers launch a scalable serverless data pipeline to ingest, store, and analyze telemetry data generated from games and services.
Forwarded from DevBrain
Совсем забыл. Не так давно писал пост про оконные функции SQL. Рассмотрел далеко не все функции, но постарался основную идею передать, надеюсь, что мне это удалось 🍀
Ссылка на пост: https://khashtamov.com/ru/window-functions-sql/
Ссылка на пост: https://khashtamov.com/ru/window-functions-sql/
Khashtamov
Оконные функции SQL
Оконные функции SQL это, пожалуй, самая мистическая часть SQL для многих веб-разработчиков. Нередко встретишь и тех, кто и вовсе никогда о них не слышал. Да что греха таить, я сам продолжительное вре…
Window_Functions_Cheat_Sheet.pdf
116.5 KB
крутой cheatsheet по оконным функциям SQL 😎
Дмитрий с канала @rockyourdata запустил бесплатный курс по дата инженерии у себя на ютуб-канале: https://www.youtube.com/channel/UCWki7GBUE5lDMJCbn4e1XMg
YouTube
DataLearn
Канал по обучению Big Data, Data Engineering
58d6e45a-1752-4515-a6ed-50b4bafa1fae
58d6e45a-1752-4515-a6ed-50b4bafa1fae
Статья про внутреннее устройство pandas, а если быть точнее, то про BlockManager: https://uwekorn.com/2020/05/24/the-one-pandas-internal.html
Uwe’s Blog
The one pandas internal I teach all my new colleagues: the BlockManager
When new members join our team, they usually are already fluent in data analysis with pandas and know their way around the typical quirks. They know that they should use vectorised functions where possible and avoid using apply with a slow Python callable.…
В современных компаниях накапливается большой объем данных, из которых можно извлекать важную аналитику, строить гипотезы или модели прогнозирования.
Data Engineer — это специалист, который как раз и собирает данные из разных источников, структурирует и передает аналитикам для принятия бизнес-решений.
Потребность в специалистах Data Engineering сейчас очень высокая и, по прогнозам, будет расти. По версии кадрового агентства Glassdoor, профессия Data Engineer входит в топ-10 в рейтинге самых лучших профессий Америки.
В SkillFactory идет набор на курс Data Engineer. Курс предназначен для людей, которым нужно освоить основные инструменты и методы по работе с Big Data. Программа рассчитана на тех, кто знаком с Python и построена по принципу от простого к сложному. Вы узнаете и освоите самое важное о Data Engineering, что нужно знать аналитику данных. И как итог, в конце курса вы завершите собственный проект по настройке пайплайнов и хранилища данных
🧨Прямо сейчас на курс дают скидку 50%. Торопитесь: https://clc.to/S1GeJw
Data Engineer — это специалист, который как раз и собирает данные из разных источников, структурирует и передает аналитикам для принятия бизнес-решений.
Потребность в специалистах Data Engineering сейчас очень высокая и, по прогнозам, будет расти. По версии кадрового агентства Glassdoor, профессия Data Engineer входит в топ-10 в рейтинге самых лучших профессий Америки.
В SkillFactory идет набор на курс Data Engineer. Курс предназначен для людей, которым нужно освоить основные инструменты и методы по работе с Big Data. Программа рассчитана на тех, кто знаком с Python и построена по принципу от простого к сложному. Вы узнаете и освоите самое важное о Data Engineering, что нужно знать аналитику данных. И как итог, в конце курса вы завершите собственный проект по настройке пайплайнов и хранилища данных
🧨Прямо сейчас на курс дают скидку 50%. Торопитесь: https://clc.to/S1GeJw
Кратко о том, что будет в Apache Airflow 2.0: https://www.youtube.com/watch?v=FLlO3QTIrUI
YouTube
Airflow 2.0: What to expect?
👍 SMASH THE LIKE BUTTON
❤️ SUBSCRIBE TO MY CHANNEL TO STAY UP TO DATE
🏆 THE COURSE : https://www.udemy.com/course/the-ultimate-hands-on-course-to-master-apache-airflow/?couponCode=WEBSITE-13
(SPECIAL PROMOTION)
🚨 PATREON: https://www.patreon.com/marclamberti…
❤️ SUBSCRIBE TO MY CHANNEL TO STAY UP TO DATE
🏆 THE COURSE : https://www.udemy.com/course/the-ultimate-hands-on-course-to-master-apache-airflow/?couponCode=WEBSITE-13
(SPECIAL PROMOTION)
🚨 PATREON: https://www.patreon.com/marclamberti…
Обзор альтернатив pandas https://towardsdatascience.com/beyond-pandas-spark-dask-vaex-and-other-big-data-technologies-battling-head-to-head-a453a1f8cc13
Medium
Beyond Pandas: Spark, Dask, Vaex and other big data technologies battling head to head
API and performance comparison on a billion-rows dataset. What should you use?
Введение в ksqlDB: https://www.youtube.com/watch?v=7mGBxG2NhVQ
YouTube
An introduction to ksqlDB
You've got streams of data that you want to process and store? You've got events from which you'd like to derive state or build aggregates? And you want to do all of this in a scalable and fault-tolerant manner? It's just as well that Kafka and ksqlDB exist!…