Dagster и Great Expectations: Интеграция без боли
Great Expectations позволяет определить так называемые ожидания от ваших данных, то есть задать правила и условия, которым данные должны соответствовать.
Dagster, с другой стороны, это платформа с открытым исходным кодом для управления данными, которая позволяет создавать, тестировать и развертывать пайплайны данных. Написан на python, что позволяет пользователям гибко настраивать и расширять его функциональность.
https://habr.com/ru/articles/746874/
Great Expectations позволяет определить так называемые ожидания от ваших данных, то есть задать правила и условия, которым данные должны соответствовать.
Dagster, с другой стороны, это платформа с открытым исходным кодом для управления данными, которая позволяет создавать, тестировать и развертывать пайплайны данных. Написан на python, что позволяет пользователям гибко настраивать и расширять его функциональность.
https://habr.com/ru/articles/746874/
Хабр
Dagster и Great Expectations: Интеграция без боли
Меня зовут Артем Шнайдер, и я занимаюсь DataScience в Бланке. Сегодня я хочу рассказать вам о том, как можно интегрировать два мощных инструмента – Dagster и Great Expectations . Great Expectations...
🔥3
Статистика для чайников, Рамси Д
Цель этой книги заключается в том, чтобы научить вас понимать и критически оценивать невероятное количество статистической информации, с которой вам приходится сталкиваться ежедневно (диаграммы, графики, таблицы, а также газетные заголовки, посвященные результатам последних опросов, экспериментов или других научных исследований).
Благодаря этой книге вы разовьете способность разбираться в статистических результатах и принимать на их основе важные решения (например, о результатах новейших медицинских исследований).
Не забывайте о том, что с помощью статистических данных вас могут попытаться ввести в заблуждение, поэтому учитесь справляться с такими проблемами.
Читать далее
#книги 📚
Цель этой книги заключается в том, чтобы научить вас понимать и критически оценивать невероятное количество статистической информации, с которой вам приходится сталкиваться ежедневно (диаграммы, графики, таблицы, а также газетные заголовки, посвященные результатам последних опросов, экспериментов или других научных исследований).
Благодаря этой книге вы разовьете способность разбираться в статистических результатах и принимать на их основе важные решения (например, о результатах новейших медицинских исследований).
Не забывайте о том, что с помощью статистических данных вас могут попытаться ввести в заблуждение, поэтому учитесь справляться с такими проблемами.
Читать далее
#книги 📚
👍4
Пишем приложение на Python для интерактивной визуализации графов с NetworkX, Plotly и Dash
https://habr.com/ru/articles/728256/
https://habr.com/ru/articles/728256/
Хабр
Пишем приложение на Python для интерактивной визуализации графов с NetworkX, Plotly и Dash
Говорят, хорошая визуализация данных лучше тысячи слов о них, и с этим трудно спорить. Промпт: интерактивная визуализация сети транзакций, абстракция на белом фоне Эта статья посвящена написанию...
👍4
Как SQL и PYTHON используют в аналитике данных?
Аналитики в своей работе с данными часто используют SQL и Python.
И новички часто спрашивают - зачем аналитику нужен Python и SQL, если есть старый добрый Excel?
Ведь многие, даже крупные компании по прежнему используют Excel, как основной инструмент аналитики данных.
В этом видео я рассказываю как именно аналитики используют SQL и Python в своей работе и что вам нужно знать, чтобы успешно применять эти инструменты.
Смотреть
#видео 📺
Аналитики в своей работе с данными часто используют SQL и Python.
И новички часто спрашивают - зачем аналитику нужен Python и SQL, если есть старый добрый Excel?
Ведь многие, даже крупные компании по прежнему используют Excel, как основной инструмент аналитики данных.
В этом видео я рассказываю как именно аналитики используют SQL и Python в своей работе и что вам нужно знать, чтобы успешно применять эти инструменты.
Смотреть
#видео 📺
YouTube
Как SQL и PYTHON используют в аналитике данных?
Регистрируйтесь и используйте объектное хранилище Selectel для хранения неструктурированных данных. Первый месяц — бесплатно: https://slc.tl/ft63l
Аналитики в своей работе с данными часто используют SQL и Python. И новички часто спрашивают - зачем аналитику…
Аналитики в своей работе с данными часто используют SQL и Python. И новички часто спрашивают - зачем аналитику…
👍5
Какие системы управления базами данных используются в аналитике данных
https://sky.pro/media/kakie-sistemy-upravleniya-bazami-dannyh-ispolzuyutsya-v-analitike-dannyh/
https://sky.pro/media/kakie-sistemy-upravleniya-bazami-dannyh-ispolzuyutsya-v-analitike-dannyh/
👍5
SQL для аналитики — рейтинг прикладных задач с решениями
https://habr.com/ru/companies/otus/articles/541882/
https://habr.com/ru/companies/otus/articles/541882/
Хабр
SQL для аналитики — рейтинг прикладных задач с решениями
Привет, Хабр! У кого из вас black belt на sql-ex.ru , признавайтесь? На заре своей карьеры я немало времени провел на этом сайте, практикуясь и оттачивая навыки. Должен отметить, что это было...
👍4
SQL-запросы: основные команды для управления базами данных
https://skillbox.ru/media/code/sqlzaprosy-osnovnye-komandy-dlya-upravleniya-bazami-dannykh/
https://skillbox.ru/media/code/sqlzaprosy-osnovnye-komandy-dlya-upravleniya-bazami-dannykh/
Skillbox
SQL-запросы: основные команды для управления базами данных
Эти команды нужны разработчикам, аналитикам, маркетологам и всем, кто хочет выжимать из данных максимум пользы.
👍5
Pandas DataFrame: как упоительно работать с данными.
Исчерпывающий гайд по самому популярному фреймворку в ML от эксперта по data science и машинному обучению.
Читать
Исчерпывающий гайд по самому популярному фреймворку в ML от эксперта по data science и машинному обучению.
Читать
Skillbox
Pandas DataFrame: как упоительно работать с данными
Исчерпывающий гайд по самому популярному фреймворку в ML от эксперта по data science и машинному обучению.
👍6
Apache Spark.
PySpark может использоваться для распределенных вычислений на Python в рамках анализа и обработки больших данных (Big Data), а также машинного обучения (Machine Learning).
Читать
PySpark может использоваться для распределенных вычислений на Python в рамках анализа и обработки больших данных (Big Data), а также машинного обучения (Machine Learning).
Читать
Курсы Trino, ClickHouse, Airflow, Kafka, МL и ИИ Обучение
PySpark
Apache Spark. PySpark может использоваться для распределенных вычислений на Python в рамках анализа и обработки больших данных (Big Data), а также машинного обучения (Machine Learning).
👍3
Как подключить PySpark и Kaggle в Google Colab
Google Colab — выполняемый документ, который позволяет писать, запускать и делиться своим Python-кодом через Google Drive. Это тот же самый Jupyter Notebook, только блокноты хранятся в Google Drive, а выполняются на сервере.
Читать
Google Colab — выполняемый документ, который позволяет писать, запускать и делиться своим Python-кодом через Google Drive. Это тот же самый Jupyter Notebook, только блокноты хранятся в Google Drive, а выполняются на сервере.
Читать
Курсы Big Data,Arenadata,Greenplum, Kafka и Spark
Как подключить PySpark и Kaggle в Google Colab
Недавно мы рассказывали, что такое PySpark. Сегодня рассмотрим, как подключить PySpark в Google Cola
🔥6
Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas
https://proglib.io/p/samouchitel-po-pandas-dlya-nachinayushchih-chast-25-osnovy-analiza-dannyh-s-pandas-2023-07-24
https://proglib.io/p/samouchitel-po-pandas-dlya-nachinayushchih-chast-25-osnovy-analiza-dannyh-s-pandas-2023-07-24
Библиотека программиста
🐍 Самоучитель по Python для начинающих. Часть 25: Основы анализа данных с Pandas
Покажем основные приемы работы с DataFrame и Series, которые нужно знать начинающему дата-аналитику. В конце статьи – 10 мини-проектов по анализу и визуализации многомерных данных.
👍5
Сбор данных для машинного обучения: этапы, методики и рекомендации
https://habr.com/ru/articles/753212/
https://habr.com/ru/articles/753212/
Хабр
Сбор данных для машинного обучения: этапы, методики и рекомендации
Все успешные компании постоянно собирают данные. Они отслеживают поведение людей в Интернете, организуют опросы, мониторят отзывы, слушают сигналы от умных устройств, извлекают значимые слова из...
👍5
Дорожная карта Data Science 2023: пошаговый гайд
https://tproger.ru/articles/roadmap-data-science-2023/
https://tproger.ru/articles/roadmap-data-science-2023/
Tproger
Дорожная карта Data Science 2023: пошаговый гайд / Tproger
Дорожная карта Data Science 2023, созданная практикующим специалистом. На диаграмме Исикавы 7 ветвей с инструментами учёного по данным.
👍4🔥1