NEW BOT Телеграм, страница

Чатик, а вы знаете про конфу datalove, которая совсем скоро? https://datalove.konfy.care/
И вы только посомтрите какой там лайнап? Я не видел Холден уже больше года, например!

2.91K viewsDmitry Anoshin, 15:56

Инжиниринг Данных

https://lnkd.in/gsuAmb5

2.92K viewsDmitry Anoshin, 02:01

Инжиниринг Данных

https://towardsdatascience.com/lessons-from-building-a-highly-reproducible-data-warehouse-3900da6cb1d1

Medium

Lessons From Building a Highly Reproducible Data Warehouse

How we improved our data warehouse reproducibility and maintainability

3.04K viewsDmitry Anoshin, 02:07

Инжиниринг Данных

Детская книга про data science https://www.dominodatalab.com/childrens-book-florence-the-data-scientist-sweepstakes/ (вроде бесплатная)

Dominodatalab

Florence the Data Scientist and Her Magical Bookmobile: The First-Ever Children’s Book on Data Science | Domino Data Lab

Inspire the next generation of data scientists with this magical story of patterns, predictions, dogs, and dragons. Get the digital e-book or paperback today!

2.99K viewsDmitry Anoshin, 01:23

Инжиниринг Данных

Я потратил 4 месяца на full time изучение Databricks на Azure. Вчера написал письмо пользователям, что вот все готово, переходим с HDInsight/SQL Server на Databricks. А сегодня оказалось, что больше мы не используем Databricks, и теперь Synapse Analytics. У которого тоже есть managed spark, delta lake, но все это еще местами сыровато. Все мои планы про крутые кейсы на databricks, про collaboration и продвижение продукта среди студий Microsoft улетучились. С завтрашнего дня начинаю ковырять Synapse. Чувствую себя примерно, как переходить с Tableau на Power BI, и вам обещают, что все будет так же и даже лучше🤪 Последние 4 месяца я в голове строил планы про архитектуру решения, возможные use cases, общался с другими командами и убеждал их в превосходстве Databricks над другими решениям, и многое другое, а теперь все это стало не актуальным, надо будет разобраться как это сделать на Synapse.

В любом случае опыт хороший получил по Databricks. Принципы Spark, pyspark и delta lake останутся неизменны. Но есть недостатки, например максимальная версия, которая есть у Synapse -> Spark 2.4.

Из хорошего, будет легче в datalearn засунуть Databricks и Synapse Analytics.

3.11K viewsDmitry Anoshin, edited 01:38

Инжиниринг Данных

С виду полезная книга

3.16K viewsDmitry Anoshin, 04:37

Инжиниринг Данных

Forwarded from Alexander ⚛️ Morozov

Florence the Data Scientist and Her Magical Bookmobile.epub

27.1 MB

Florence the Data Scientist and Her Magical Bookmobile.pdf

32.8 MB

4.43K viewsDmitry Anoshin, 14:14

Инжиниринг Данных

Куда будет развиваться Google Cloud https://cloudwars.co/google-cloud/google-cloud-ceo-thomas-kurian-where-cloud-needs-to-go/

3.06K viewsDmitry Anoshin, 16:04

Инжиниринг Данных

#datamesh будет мероприятие, может будет интересно, название веселое)) https://www.linkedin.com/events/howthe-ck-heck-doyoubuildadatam6780462587961319424/

How the **ck (heck) do you build a Data Mesh? | LinkedIn

TO REGISTER VISIT: https://app.livestorm.co/cinchy/s2-ep7-data-mesh

Data Mesh - Everyone is talking about it but who is actually making it happen? Once you scratch beneath the surface several big questions emerge.

Join Cinchy CEO, Dan DeMers, and Data…

3.12K viewsDmitry Anoshin, 22:26

Инжиниринг Данных

https://www.confessionsofadataguy.com/the-3-types-of-data-engineers-which-one-are-you/

Confessions of a Data Guy

The 3 Types of Data Engineers, Which One Are You? - Confessions of a Data Guy

Every good story starts with a few different characters right? It’s like the spice of life, little bit of this, little bit of that. It’s the way of the world. In all my data wandering I’ve come across lot’s of different types of data engineers. I can usually…

2.89K viewsDmitry Anoshin, 14:20

Инжиниринг Данных

Microsoft продолжает экспериментировать с дата центрами. В статье они используют в качестве охлаждения специальную жидкость. До этого они проводили эксперимент, в котором положили дата центр на дно океана в специальной капсуле. В статье будет ссылку на это.

Крупные tech компании обсуждают экологические проблемы и сокращение выброса CO2. Датацентры потребляют огромное количество энергии и один из главных расходов - охлаждение.

The Verge

Microsoft is now submerging servers into liquid baths

The cooling should improve performance and reliability while using less water.

2.77K viewsDmitry Anoshin, 17:45

Инжиниринг Данных

Вы используете облачные вычисления в работе? (Cloud computing). То есть решения и продукты крупных облачный провайдеров.

Anonymous Poll

Google Cloud Platform🔎

Yandex Cloud🚩

Mail Cloud💌

Мы пользуемся услугами хостинга (арендуем виртуальные машины)🛠️

Планируем изучать западное облако🌈

Планируем изучать отечественное облако🤞

21%

Не используем и не планируем🦕

516 voters2.71K viewsDmitry Anoshin, 19:06

Инжиниринг Данных

2.89K viewsDmitry Anoshin, 20:11

Инжиниринг Данных

Сегодня на работе затронули важную тему, которую часто упускают из виду, и потом получается не очень комильфо.😵‍💫 Я кстати всегда на эти грабли наступаю. Это naming convention. То есть как вы будете называть ETL jobs, ресурсы в облаке, хосты баз данных, и другие компоненты инфраструктуры. У Azure есть хороший документ про это. Скиньте в коменты ещё полезные ссылки по этой теме.

Docs

Define your naming convention - Cloud Adoption Framework

Learn about the considerations for naming your Azure resources and assets, and review example names for resources and assets in Azure.

3.34K viewsDmitry Anoshin, edited 22:06

Инжиниринг Данных

Конференция Microsoft про game development https://developer.microsoft.com/en-us/games/events/game-stack-live/

3K viewsDmitry Anoshin, edited 01:02

Инжиниринг Данных

Для оптимизации запросов через Apache Spark используется система индексации данных hyperspace. Вот описание от Synapse, но там есть ссылка на основной продукт. Используете? #spark

TECHCOMMUNITY.MICROSOFT.COM

Open-sourcing Hyperspace v0.1: An Indexing Subsystem for Apache Spark™

Today, we are making that possible by open-sourcing Hyperspace v0.1 open-sourcing Hyperspace v0.1 – an indexing subsystem for Apache Spark™. Hyperspace is the..

3.01K viewsDmitry Anoshin, edited 19:16

Инжиниринг Данных

На конференции Microsoft ignite было много новинок, их можно найти в книге.

Microsoft Ignite 2021 Book of News

The Book of News is a guide to all the announcements made during Microsoft Ignite, March 2 - 4, 2021.

2.87K viewsDmitry Anoshin, 06:20

Инжиниринг Данных

Оказывается Билайн, это не только мобильный оператор. У hive есть CLI приложение beeline, которое позволяет через командную строку подключаться к spark через JDBC. Кто-то использовал? #spark

2.76K viewsDmitry Anoshin, edited 15:26

Инжиниринг Данных

2.8K viewsDmitry Anoshin, 15:29

Инжиниринг Данных

Анастасия Дробышева записала новое видео для своего курса:

Курс "Поиск работы для аналитических специальностей в России и за рубежом". Модуль JH 1-4. Стратегия поиска работы. Профессиональное ценностное предложение (PVP)

Что обсуждаем в этом видео:

- зачем PVP и где его применять;
- 3 шага для формулировки PVP;
- 2 примера PVP для аналитика данных и продуктового аналитика.

Шаблон PVP на русском:

Я ____ специалист с опытом в ____ (индустрия/ продукт). Мои сильные стороны - это ____, ___ и ___. Мои достижения/ примеры проектов: _____. Я буду рад(а) применить свои знания в качестве ______ (название должности) в ____ (индустрия/ компания).

Шаблон PVP на английском:

I am a ________________ professional specialising in ________________ . My strengths
include ________________ and ________________ . I have achieved ________________
and ________________ and am excited about ________________ in my next role.

YouTube

DATALEARN | JOB HUNTING - 101 | АНАСТАСИЯ ДРОБЫШЕВА | УРОК 1-4 | PVP

Курс "Поиск работы для аналитических специальностей в России и за рубежом". Модуль JH 1-4. Стратегия поиска работы. Профессиональное ценностное предложение (PVP)

Что обсуждаем в этом видео:

- зачем PVP и где его применять;
- 3 шага для формулировки PVP;…

3.14K viewsDmitry Anoshin, edited 17:13

About

Blog

Apps

Platform