Datalytics – Telegram
Datalytics
9.08K subscribers
218 photos
18 videos
5 files
674 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
Библиотека D-Tale позволяет отображать датафрейм в удобной таблице с возможностью сортировки и фильтрации. Чем-то похоже на Qgrid, но более навороченный. Ведь D-Tale умеет не просто отображать данные в ноутбуке, но и создавать в один клик веб-сервис, в котором таблица датафрейма будет доступна для обзора по URL. Это удобно для работы с данными из различных IDE, которые не поддерживаю pretty-вывод датафреймов.

https://github.com/man-group/dtale
Обзор пяти простых, но эффективных, методов pandas: shift, mask, value_counts, nlargest, nsmallest

https://towardsdatascience.com/5-elegant-python-pandas-functions-a4bf395ebef4
Forwarded from DataEng
​​Накатал статейку про введение в Apache Airflow: http://bit.ly/37o3tiD
Статья, освещающая эффективные приемы работы с коллекциями: list comprehension, dict comprehension, использованием модулей collection и itertools.

https://sourcery.ai/blog/effective-collection-handling/
В этом году команда Skyeng начинает делиться обезличенными данными о миллионах уроков с командами, которые пилят исследования и коммерческие проекты в сферах педдизайна, психологии, мотивации, контента, рекомендаций и так далее.

О том, как это будет, какие первые проекты уже в работе, и как найти человека, который курирует всю инициативу, Skyeng рассказали на хабре

https://habr.com/ru/company/skyeng/blog/489010/
DevPractice выпустили бесплатную книгу по Matplotlib. В этой книге в форме уроков дана обширная информация, которая поможет решить большую часть задач при построении графиков.

https://devpractice.ru/matplotlib-book/
Обзор нескольких новых функций в Pandas 1.0: конвертация датафрейма в markdown-формат; универсальная константа pd.NA (вместо np.nan, None или pd.NaT); строковый тип данных (вместо универсального object).

https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
Forwarded from GEEK EXPORT
​​🎙{Подкаст #3 - Путь Data Engineer}📊

В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
На канале MoscowPython выложили доклад Николая Фоминых (S7) «Делаем Dashboard для авиакомпании: Dash и не только».

В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.

https://youtu.be/mzIB5zxn6kg
100 полезных приёмов и хаков в Pandas от Kevin Markham, собранные в одном ноутбуке.

https://www.kaggle.com/python10pm/pandas-100-tricks
Небольшая шпаргалка по веб-скрапингу с помощью BeautifulSoup

https://www.banjocode.com/web-scraping/
Онлайн-самоучитель по экосистеме Python для научных вычислений. Множество хорошо детализированных уроков освещают вопросы использования пакетов NumPy, SciPy. На последок немного рассказывается про Sympy и Sklearn

https://scipy-lectures.org/index.html
Гайд по визуализации данных в Python: начиная от раскрашивания ячеек и спарклайнов в Pandas, и завершая интерактивными визуализациями с помощью Bokeh и Altair, а также геовизуализациями в Folium.

https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
Beautiful Soup — это библиотека Python для извлечения данных из файлов HTML и XML. Она обычно экономит программистам часы и дни работы. Появился перевод официальной документации Beautiful Soup на русский язык

http://bs4ru.geekwriter.ru/
Блокнот про анализ данных в E-commerce с примером использования ассоциативных правил (алгоритм Apriori) для создания товарных рекомендаций

https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
Алексей Селезнев написал на Хабре статью, в которой сравнил подход к основным возможностям по манипуляции данных в R и Python.

В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.

Цель статьи упростить миграцию между языками для их пользователей.

https://habr.com/ru/post/475210/
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.

https://habr.com/ru/post/492364/