Datalytics – Telegram
Datalytics
9.05K subscribers
220 photos
17 videos
5 files
675 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
DevPractice выпустили бесплатную книгу по Matplotlib. В этой книге в форме уроков дана обширная информация, которая поможет решить большую часть задач при построении графиков.

https://devpractice.ru/matplotlib-book/
Обзор нескольких новых функций в Pandas 1.0: конвертация датафрейма в markdown-формат; универсальная константа pd.NA (вместо np.nan, None или pd.NaT); строковый тип данных (вместо универсального object).

https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
Forwarded from GEEK EXPORT
​​🎙{Подкаст #3 - Путь Data Engineer}📊

В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
На канале MoscowPython выложили доклад Николая Фоминых (S7) «Делаем Dashboard для авиакомпании: Dash и не только».

В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.

https://youtu.be/mzIB5zxn6kg
100 полезных приёмов и хаков в Pandas от Kevin Markham, собранные в одном ноутбуке.

https://www.kaggle.com/python10pm/pandas-100-tricks
Небольшая шпаргалка по веб-скрапингу с помощью BeautifulSoup

https://www.banjocode.com/web-scraping/
Онлайн-самоучитель по экосистеме Python для научных вычислений. Множество хорошо детализированных уроков освещают вопросы использования пакетов NumPy, SciPy. На последок немного рассказывается про Sympy и Sklearn

https://scipy-lectures.org/index.html
Гайд по визуализации данных в Python: начиная от раскрашивания ячеек и спарклайнов в Pandas, и завершая интерактивными визуализациями с помощью Bokeh и Altair, а также геовизуализациями в Folium.

https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
Beautiful Soup — это библиотека Python для извлечения данных из файлов HTML и XML. Она обычно экономит программистам часы и дни работы. Появился перевод официальной документации Beautiful Soup на русский язык

http://bs4ru.geekwriter.ru/
Блокнот про анализ данных в E-commerce с примером использования ассоциативных правил (алгоритм Apriori) для создания товарных рекомендаций

https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
Алексей Селезнев написал на Хабре статью, в которой сравнил подход к основным возможностям по манипуляции данных в R и Python.

В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.

Цель статьи упростить миграцию между языками для их пользователей.

https://habr.com/ru/post/475210/
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.

https://habr.com/ru/post/492364/
И снова про финансы. Интересный пример анализа котировок в том числе с использованием скользящего среднего, так что если вы хотели посмотреть на рабочие примеры применения rolling() в pandas, то вам сюда. Ну и ещё плюс статьи в том, что в самом начале указана ссылка на скачивание котировок с Финама в csv, что удобно, если вам лень возиться с финансовыми АПИ.

https://habr.com/ru/post/491612/
Крутые примеры генеративного искусства, созданного с помощью библиотеки Processing на Python со ссылками на исходный код

https://github.com/aaronpenne/generative_art
Виталий Черемисинов и Искандер Мирмахмадов из ExperimentFest запустили телеграм-канал. В нем будут публиковаться интересные статьи, книги, лекции и кейсы из мира математической статистики, анализа данных и экспериментов. Bootstrap, методы сокращения дисперсии, AB-тестирования - ребята знают толк в прикладной статистике, так что смело присоединяйтесь!

https://news.1rj.ru/str/exp_fest
Интересная статья о том как использовать if-else конструкции для формирования новых колонок в pandas.

Для многих очевидным будет использование apply(), но в статье показаны и более любопытные примеры, например, применение метода np.select()

https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Дмитрий Осиюк написал отличную инструкцию по отправке Server-side событий через Facebook Pixel. Например, это может быть полезно для формирования аудитории на основе совершения телефонного звонка через коллтрекинг. В инструкции рассказывается о том как активировать Server-Side API в личном кабинете, а также о передаче событий с помощью скрипта на Python.

https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html