Обзор нескольких новых функций в Pandas 1.0: конвертация датафрейма в markdown-формат; универсальная константа pd.NA (вместо np.nan, None или pd.NaT); строковый тип данных (вместо универсального object).
https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
Medium
Top 3 New Features in Pandas 1.0
A couple of new time and nerve saving features
Forwarded from GEEK EXPORT
🎙{Подкаст #3 - Путь Data Engineer}📊
В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
На канале MoscowPython выложили доклад Николая Фоминых (S7) «Делаем Dashboard для авиакомпании: Dash и не только».
В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.
https://youtu.be/mzIB5zxn6kg
В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.
https://youtu.be/mzIB5zxn6kg
YouTube
Делаем Dashboard для авиакомпании: Dash и не только / Николай Фоминых (S7)
Moscow Python Conf++ 2019
Зал 3
5 апреля, 17:00
Тезисы и презентация:
http://conf.python.ru/2019/abstracts/4651
У нас в S7 много разных данных, например, мы собираем параметры наших самолетов и определяем лучшее время для техосмотра. Данные сложные,…
Зал 3
5 апреля, 17:00
Тезисы и презентация:
http://conf.python.ru/2019/abstracts/4651
У нас в S7 много разных данных, например, мы собираем параметры наших самолетов и определяем лучшее время для техосмотра. Данные сложные,…
Статья про потоковую передачу колоночных данных с помощью Apache Arrow
https://habr.com/ru/company/otus/blog/490050/
https://habr.com/ru/company/otus/blog/490050/
Хабр
Потоковая передача колоночных данных с помощью Apache Arrow
Перевод статьи подготовлен специально для студентов курса «Data Engineer». За последние несколько недель мы с Nong Li добавили в Apache Arrow бинарный потоков...
100 полезных приёмов и хаков в Pandas от Kevin Markham, собранные в одном ноутбуке.
https://www.kaggle.com/python10pm/pandas-100-tricks
https://www.kaggle.com/python10pm/pandas-100-tricks
Онлайн-самоучитель по экосистеме Python для научных вычислений. Множество хорошо детализированных уроков освещают вопросы использования пакетов NumPy, SciPy. На последок немного рассказывается про Sympy и Sklearn
https://scipy-lectures.org/index.html
https://scipy-lectures.org/index.html
Гайд по визуализации данных в Python: начиная от раскрашивания ячеек и спарклайнов в Pandas, и завершая интерактивными визуализациями с помощью Bokeh и Altair, а также геовизуализациями в Folium.
https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
Medium
Complete Guide to Data Visualization with Python
Most libraries for data visualization with Python explained. Interactive charts, interactive reports and maps included
Beautiful Soup — это библиотека Python для извлечения данных из файлов HTML и XML. Она обычно экономит программистам часы и дни работы. Появился перевод официальной документации Beautiful Soup на русский язык
http://bs4ru.geekwriter.ru/
http://bs4ru.geekwriter.ru/
Блокнот про анализ данных в E-commerce с примером использования ассоциативных правил (алгоритм Apriori) для создания товарных рекомендаций
https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
Алексей Селезнев написал на Хабре статью, в которой сравнил подход к основным возможностям по манипуляции данных в R и Python.
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
Хабр
Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно
По запросу R или Python в интернете вы найдёте миллионы статей и километровых обсуждений по теме какой из них лучше, быстрее и удобнее для работы с данными. Но к сожалению особой пользы все эти статьи...
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.
https://habr.com/ru/post/492364/
https://habr.com/ru/post/492364/
Хабр
Общий финансовый анализ на Python (Часть 1)
В прошлой статье рассмотрено как можно получить информацию по финансовым инструментам. Дальше будет опубликовано несколько статей о том, что первоначально можно...
Видео с YouTube-канала MoscowPython, в котором ребята обсудили возможности коллективной работы с jupyter notebook и многое другое.
https://www.youtube.com/watch?v=V0XXiOooP_U
https://www.youtube.com/watch?v=V0XXiOooP_U
YouTube
Moscow Python Podcast. Проблемы jupyter notebook и их решения в production (level: junior)
В гостях у Moscow Python Podcast Петр Ермаков, senior data scientist в компании Lamoda, основатель школы DataGym. Обсудили возможности коллективной работы с jupyter notebook и многое другое.
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…
И снова про финансы. Интересный пример анализа котировок в том числе с использованием скользящего среднего, так что если вы хотели посмотреть на рабочие примеры применения rolling() в pandas, то вам сюда. Ну и ещё плюс статьи в том, что в самом начале указана ссылка на скачивание котировок с Финама в csv, что удобно, если вам лень возиться с финансовыми АПИ.
https://habr.com/ru/post/491612/
https://habr.com/ru/post/491612/
Хабр
Сравнение динамики котировок двух акций на python на примере привилегированных и обычных акций Сбербанка
Здравствуйте, сегодня хотел бы рассказать про мой опыт анализа акций сбербанка. Порой они показывают немного разную динамику — мне стало интересно проанализирова...
Крутые примеры генеративного искусства, созданного с помощью библиотеки Processing на Python со ссылками на исходный код
https://github.com/aaronpenne/generative_art
https://github.com/aaronpenne/generative_art
Виталий Черемисинов и Искандер Мирмахмадов из ExperimentFest запустили телеграм-канал. В нем будут публиковаться интересные статьи, книги, лекции и кейсы из мира математической статистики, анализа данных и экспериментов. Bootstrap, методы сокращения дисперсии, AB-тестирования - ребята знают толк в прикладной статистике, так что смело присоединяйтесь!
https://news.1rj.ru/str/exp_fest
https://news.1rj.ru/str/exp_fest
Интересная статья о том как использовать if-else конструкции для формирования новых колонок в pandas.
Для многих очевидным будет использование
https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Для многих очевидным будет использование
apply(), но в статье показаны и более любопытные примеры, например, применение метода np.select()https://medium.com/@ODSC/creating-if-elseif-else-variables-in-python-pandas-7900f512f0e4
Medium
Creating if/elseif/else Variables in Python/Pandas
Summary: This blog demos Python/Pandas/Numpy code to manage the creation of Pandas dataframe attributes with if/then/else logic. It…
Дмитрий Осиюк написал отличную инструкцию по отправке Server-side событий через Facebook Pixel. Например, это может быть полезно для формирования аудитории на основе совершения телефонного звонка через коллтрекинг. В инструкции рассказывается о том как активировать Server-Side API в личном кабинете, а также о передаче событий с помощью скрипта на Python.
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
https://iosiuk.blogspot.com/2020/04/server-side-api-facebook-pixel.html
Blogspot
Настройка Conversions API (Server-Side API) для Facebook Pixel
Как собирать аудиторию ремаркетинга и автоматически оптимизировать показ Facebook рекламы по событиям, которые происходят за пределами сайта: по звонкам, продажам в оффлайне и другим.
Виталий Бахвалов написал статью о том как отправлять целевые звонки из коллтрекинга CoMagic в Facebook Pixel, используя Server-Side API
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
http://italylov.ru/blog/all/otpravlyaem-celevye-zvonki-iz-comagic-v-piksel-feysbuka/
Алексей Селезнёв запустил бесплатный, вводный курс по R.
В ходе курса рассмотрены основные возможности инфраструктуры
На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
В ходе курса рассмотрены основные возможности инфраструктуры
tidyverse, т.е. своего рода аналог pandas на R.На данный момент открыто уже 5 уроков, и каждую неделю по понедельникам открывается новый урок.
Кому интерсно велкам.
Программа и информация о курсе на proglib
Подписка на youtube канал
Библиотека программиста
Бесплатный видеокурс «Язык R для пользователей Excel»
Курс по языку R для пользователей Microsoft Excel: 12 уроков об архитектуре tidyverse и входящих в неё пакетах: readr, vroom, dplyr, tidyr и ggplot2.