Библиотека D-Tale позволяет отображать датафрейм в удобной таблице с возможностью сортировки и фильтрации. Чем-то похоже на Qgrid, но более навороченный. Ведь D-Tale умеет не просто отображать данные в ноутбуке, но и создавать в один клик веб-сервис, в котором таблица датафрейма будет доступна для обзора по URL. Это удобно для работы с данными из различных IDE, которые не поддерживаю pretty-вывод датафреймов.
https://github.com/man-group/dtale
https://github.com/man-group/dtale
GitHub
GitHub - man-group/dtale: Visualizer for pandas data structures
Visualizer for pandas data structures. Contribute to man-group/dtale development by creating an account on GitHub.
Обзор пяти простых, но эффективных, методов pandas: shift, mask, value_counts, nlargest, nsmallest
https://towardsdatascience.com/5-elegant-python-pandas-functions-a4bf395ebef4
https://towardsdatascience.com/5-elegant-python-pandas-functions-a4bf395ebef4
Medium
5 Elegant Python Pandas Functions
Five beautiful Pandas method for everyday data science usage
Статья с интересными примерами использования pandas для тестирования алгоритмов сбора и обработки данных
https://habr.com/ru/post/486756/
https://habr.com/ru/post/486756/
Хабр
Python для тестировщика: как маленькие скрипты c pandas помогают в тестировании больших наборов данных
Я работаю тестировщиком на проекте, суть которого состоит в сборе и хранении различных данных и формировании на их основе разных отчетов и файлов-выгрузок. При ф...
Статья, освещающая эффективные приемы работы с коллекциями: list comprehension, dict comprehension, использованием модулей collection и itertools.
https://sourcery.ai/blog/effective-collection-handling/
https://sourcery.ai/blog/effective-collection-handling/
sourcery.ai
Getting the most out of Python collections
A guide to comprehensions, generators and useful functions and classes
В этом году команда Skyeng начинает делиться обезличенными данными о миллионах уроков с командами, которые пилят исследования и коммерческие проекты в сферах педдизайна, психологии, мотивации, контента, рекомендаций и так далее.
О том, как это будет, какие первые проекты уже в работе, и как найти человека, который курирует всю инициативу, Skyeng рассказали на хабре
https://habr.com/ru/company/skyeng/blog/489010/
О том, как это будет, какие первые проекты уже в работе, и как найти человека, который курирует всю инициативу, Skyeng рассказали на хабре
https://habr.com/ru/company/skyeng/blog/489010/
Хабр
Делимся самым большим в РФ пластом данных по онлайн-обучению с проектами по лингвистике, персонализации, педдизайну, ML
Перед Новым годом команда Михаила Sverdlove Свердлова объявила, что готова делиться обезличенными данными уроков Skyeng с внешними исследователями и стартапами.
Статья про ускорение обработки больших датасетов (но не очень больших как вы думаете) с помощью dask и parquet
https://habr.com/ru/post/488594/
https://habr.com/ru/post/488594/
Хабр
Пандас и другие для толстых данных
В этой заметке я расскажу о паре простых приемов, полезных при работе с данными, не помещающимися в память локальной машины, но все еще слишком мелкими чтобы наз...
DevPractice выпустили бесплатную книгу по Matplotlib. В этой книге в форме уроков дана обширная информация, которая поможет решить большую часть задач при построении графиков.
https://devpractice.ru/matplotlib-book/
https://devpractice.ru/matplotlib-book/
Обзор нескольких новых функций в Pandas 1.0: конвертация датафрейма в markdown-формат; универсальная константа pd.NA (вместо np.nan, None или pd.NaT); строковый тип данных (вместо универсального object).
https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
https://towardsdatascience.com/top-3-new-features-in-pandas-1-0-4a92d98a9a8f
Medium
Top 3 New Features in Pandas 1.0
A couple of new time and nerve saving features
Forwarded from GEEK EXPORT
🎙{Подкаст #3 - Путь Data Engineer}📊
В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
В третьем эпизоде у нас в гостях Дмитрий Смирнов, кандидат когнитивных нейронаук, консультант в области Big Data и Cloud Computing. Поговорили про то, как работать с таким обширным стэком и что за языки/технологии для этого требуются. Подписывайтесь, ставьте оценки и оставляйте свои комментарии на платформах, которыми пользуетесь - нас это мотивирует продолжать выпускать подкаст!
На канале MoscowPython выложили доклад Николая Фоминых (S7) «Делаем Dashboard для авиакомпании: Dash и не только».
В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.
https://youtu.be/mzIB5zxn6kg
В докладе рассказывается о сильных и слабых сторонах решений для построения дашбордов, а также области применения. Больше всего достанется Dash: пытаясь сделать на нем все, что нужно, S7 набили все возможные шишки.
https://youtu.be/mzIB5zxn6kg
YouTube
Делаем Dashboard для авиакомпании: Dash и не только / Николай Фоминых (S7)
Moscow Python Conf++ 2019
Зал 3
5 апреля, 17:00
Тезисы и презентация:
http://conf.python.ru/2019/abstracts/4651
У нас в S7 много разных данных, например, мы собираем параметры наших самолетов и определяем лучшее время для техосмотра. Данные сложные,…
Зал 3
5 апреля, 17:00
Тезисы и презентация:
http://conf.python.ru/2019/abstracts/4651
У нас в S7 много разных данных, например, мы собираем параметры наших самолетов и определяем лучшее время для техосмотра. Данные сложные,…
Статья про потоковую передачу колоночных данных с помощью Apache Arrow
https://habr.com/ru/company/otus/blog/490050/
https://habr.com/ru/company/otus/blog/490050/
Хабр
Потоковая передача колоночных данных с помощью Apache Arrow
Перевод статьи подготовлен специально для студентов курса «Data Engineer». За последние несколько недель мы с Nong Li добавили в Apache Arrow бинарный потоков...
100 полезных приёмов и хаков в Pandas от Kevin Markham, собранные в одном ноутбуке.
https://www.kaggle.com/python10pm/pandas-100-tricks
https://www.kaggle.com/python10pm/pandas-100-tricks
Онлайн-самоучитель по экосистеме Python для научных вычислений. Множество хорошо детализированных уроков освещают вопросы использования пакетов NumPy, SciPy. На последок немного рассказывается про Sympy и Sklearn
https://scipy-lectures.org/index.html
https://scipy-lectures.org/index.html
Гайд по визуализации данных в Python: начиная от раскрашивания ячеек и спарклайнов в Pandas, и завершая интерактивными визуализациями с помощью Bokeh и Altair, а также геовизуализациями в Folium.
https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
https://towardsdatascience.com/complete-guide-to-data-visualization-with-python-2dd74df12b5e
Medium
Complete Guide to Data Visualization with Python
Most libraries for data visualization with Python explained. Interactive charts, interactive reports and maps included
Beautiful Soup — это библиотека Python для извлечения данных из файлов HTML и XML. Она обычно экономит программистам часы и дни работы. Появился перевод официальной документации Beautiful Soup на русский язык
http://bs4ru.geekwriter.ru/
http://bs4ru.geekwriter.ru/
Блокнот про анализ данных в E-commerce с примером использования ассоциативных правил (алгоритм Apriori) для создания товарных рекомендаций
https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
https://www.kaggle.com/ostrowski/market-basket-analysis-exploring-e-commerce-data
Алексей Селезнев написал на Хабре статью, в которой сравнил подход к основным возможностям по манипуляции данных в R и Python.
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
В статье сравниваются следующие пакеты: tidyverse, data.table и pandas.
Цель статьи упростить миграцию между языками для их пользователей.
https://habr.com/ru/post/475210/
Хабр
Какой язык выбрать для работы с данными — R или Python? Оба! Мигрируем с pandas на tidyverse и data.table и обратно
По запросу R или Python в интернете вы найдёте миллионы статей и километровых обсуждений по теме какой из них лучше, быстрее и удобнее для работы с данными. Но к сожалению особой пользы все эти статьи...
Статья о том как проводить простейший финансовый анализ с помощью Python. Показаны простые, но эффективные способы расчета показателей, таких как доходность, кумулятивная доходность, а также матрица рассеяния по парам акций. Отличный пример анализа реальных данных.
https://habr.com/ru/post/492364/
https://habr.com/ru/post/492364/
Хабр
Общий финансовый анализ на Python (Часть 1)
В прошлой статье рассмотрено как можно получить информацию по финансовым инструментам. Дальше будет опубликовано несколько статей о том, что первоначально можно...
Видео с YouTube-канала MoscowPython, в котором ребята обсудили возможности коллективной работы с jupyter notebook и многое другое.
https://www.youtube.com/watch?v=V0XXiOooP_U
https://www.youtube.com/watch?v=V0XXiOooP_U
YouTube
Moscow Python Podcast. Проблемы jupyter notebook и их решения в production (level: junior)
В гостях у Moscow Python Podcast Петр Ермаков, senior data scientist в компании Lamoda, основатель школы DataGym. Обсудили возможности коллективной работы с jupyter notebook и многое другое.
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…
Ведущие выпуска — сооснователь MoscowPython и компании DryLabs…