Data Analysis – Telegram
Data Analysis
519 subscribers
17 photos
195 links
Канал для тех, кто занимается сбором и анализом больших данных, обрабатывает их, изучает и делает выводы.

Вопросы/предложения/реклама
@Gromyko_darya
@Mitya770
Download Telegram
Руководство по PySpark для начинающих

Spark предоставляет API для Scala, Java, Python и R. Система поддерживает повторное использование кода между рабочими задачами, пакетную обработку данных, интерактивные запросы, аналитику в реальном времени, машинное обучение и вычисления на графах. Она использует кэширование в памяти и оптимизированное выполнение запросов к данным любого размера.

У нее нет одной собственной файловой системы, такой как Hadoop Distributed File System (HDFS), вместо этого Spark поддерживает множество популярных файловых систем, таких как HDFS, HBase, Cassandra, Amazon S3, Amazon Redshift, Couchbase и т. д.

https://pythonru.com/biblioteki/pyspark-dlja-nachinajushhih
👍5
Книга "Аналитическая культура. От сбора данных до бизнес-результатов"
Подробное пошаговое руководство по внедрению Data-driven-культуры в компании — от сбора данных и наглядных отчетов до анализа и обоснованных решений.
Чтобы стать data-driven-компанией, недостаточно наладить сбор «больших данных» или собрать команду аналитиков. Нужна эффективная культура работы с данными, внедренная на всех уровнях.
Эта практичная книга показывает, какие процессы нужно внедрять повсеместно — от аналитиков и менеджмента до высшего руководства и совета директоров — чтобы создать такую культуру.
Карл Андерсон рассказывает о цепочке аналитической ценности, которая поможет строить предиктивные бизнес-модели — от сбора данных и анализа до идей и конкретных обоснованных действий.

Читать книгу
#книги 📚
👍6
Как превратить данные в продукт: выжать из данных максимум благодаря принципам продакт-менеджмента

Многие компании хотят, чтобы их технологии были не просто затратами, а конкурентными преимуществами. Это в том числе касается технологий работы с данными. Часто такое стремление выражается словами «Мы хотим воспринимать данные как продукт». Команда VK Cloud перевела статью, которая поможет применить принципы продакт-менеджмента к управлению дата-продуктами компании.

Читать далее
👍5
Разбор: Google Analytics и Яндекс.Метрика для эффективной разметки сайтов

https://habr.com/ru/companies/agima/articles/742802/
👍5
Книга «Python для data science»

Книга предназначена для разработчиков, желающим лучше понять возможности Python по обработке и анализу данных. Возможно, вы работаете в компании, которая хочет использовать данные для улучшения бизнес-процессов, принятия более обоснованных решений и привлечения большего количества покупателей.

Или, может быть, вы хотите создать собственное приложение на основе данных или просто расширить знания о применении Python в области data science.

Читать далее
🔥5
Dagster и Great Expectations: Интеграция без боли

Great Expectations позволяет определить так называемые ожидания от ваших данных, то есть задать правила и условия, которым данные должны соответствовать. 

Dagster, с другой стороны, это платформа с открытым исходным кодом для управления данными, которая позволяет создавать, тестировать и развертывать пайплайны данных. Написан на python, что позволяет пользователям гибко настраивать и расширять его функциональность.

https://habr.com/ru/articles/746874/
🔥3
  Статистика для чайников, Рамси Д

Цель этой книги заключается в том, чтобы научить вас понимать и критически оценивать невероятное количество статистической информации, с которой вам приходится сталкиваться ежедневно (диаграммы, графики, таблицы, а также газетные заголовки, посвященные результатам последних опросов, экспериментов или других научных исследований).

Благодаря этой книге вы разовьете способность разбираться в статистических результатах и принимать на их основе важные решения (например, о результатах новейших медицинских исследований).

Не забывайте о том, что с помощью статистических данных вас могут попытаться ввести в заблуждение, поэтому учитесь справляться с такими проблемами.

Читать далее
#книги 📚
👍4
Аналитика: книги для неаналитиков, которые научат понимать, систематизировать и представлять данные
👍8🤯1
Как SQL и PYTHON используют в аналитике данных?

Аналитики в своей работе с данными часто используют SQL и Python.
И новички часто спрашивают - зачем аналитику нужен Python и SQL, если есть старый добрый Excel?
Ведь многие, даже крупные компании по прежнему используют Excel, как основной инструмент аналитики данных.
В этом видео я рассказываю как именно аналитики используют SQL и Python в своей работе и что вам нужно знать, чтобы успешно применять эти инструменты.

Смотреть
#видео 📺
👍5