Datalytics – Telegram
Datalytics
9.07K subscribers
219 photos
17 videos
5 files
674 links
Канал для аналитиков данных про Python, карьерное развитие в анализе данных, всякое разное

Автор – @ax_makarov

Отдельный канал про ChatGPT и его практическое применение —  @ai_forge

Чат канала — @pydata_chat

Вакансии — @data_hr
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Достичь космической скорости можно только с помощью новейшего топлива - данных, собственноручно переработанных при помощи Python.
Научим работать с API и автоматизировать рутинные задачи, не углубляясь в скучную теорию и фундаментальные основы.
Уже завтра 03.03.2019 стартует вводный курс Python для Digital. Промокод на скидку 20% для подписчиков: cosmo0303. https://digitalgod.be/beginner
Статья про различные фишки при работе с Jupyter Notebook, которые могут сильно сэкономить время. Про шорткаты, использование мультикурсора, а также обзор популярных расширений для Jupyter. http://bit.ly/2UjPHb4
Сегодня хочу поделиться с вами крутейшей библиотекой pygsheets для работы с API Гугл Таблиц. Одна из крутейших штук - это то, что с её помощью можно делать графики внутри Гугл Таблиц (смотрите документацию). Также как и большинство библиотек для Гугл Таблиц, библиотека умеет грузить данные из датафрейма (метод set_dataframe). В общем, отличная альтернатива gspread, попробуйте! https://github.com/nithinmurali/pygsheets
Куча небольших, но полезных, туториалов. Есть и суперочевидные, вроде "как загрузить csv в dataframe", но бывают и более любопытные: "4 метода округления в pandas", "конкатенация значений колонок", "применение условия ЕСЛИ в pandas". Советую посмотреть, если хотите открыть для себя новые приёмы в работе с данными. https://datatofish.com/python-tutorials/
Написал для блога CoMagic статью о том как с помощью Python делать запросы к Data API CoMagic. В статье рассмотрены особенности параметров API, с которыми часто возникают сложности, например, как ограничивать результаты с помощью фильтров, как задавать список нужных полей https://www.comagic.ru/blog/posts/mar/kak_delat_zaprosy_k_api_comagic_s_pomoshchyu_python_i_zachem_eto_nuzhno/
В среду 13.03.2019 на митапе "Зачем маркетологу программировать на Python" Дима Родин из DigitalGod расскажет о том для решения каких задач маркетологу имеет смысл учиться программировать, а потом я покажу практический пример анализа данных Facebook Ads с помощью Python. https://digitalgod.be/blog/07032019-meetup-1-python-for-marketers
Начал читать книгу Себастьяна Рашки "Python и машинное обучение". К 36ой странице оказалось, что для того, чтобы примеры кода из книги выполнялись корректно необходимы панды 🐼
😁1
И на этом фоне вот неплохой русскоязычный гайд про панд https://shwanoff.ru/pandas/
Большой туториал про использование словарей в Питоне. Если кто, вдруг, пренебрегает этой структурой данных, то самое время исправиться и начать использовать её чаще, ведь словари - наше всё😄https://www.dataquest.io/blog/python-dictionary-tutorial/
Наткнулся на лекцию Ильи Щурова про Pandas в рамках курса "Программирование на языке Python для сбора и анализа данных", который проходил во ВШЭ. Также на канале можно посмотреть другие лекции из этого курса: http://bit.ly/2F0NI4U. Там много информации, начиная от основ Python и до работы с API, библиотеками numpy и matplotlib. https://www.youtube.com/watch?v=ENKfnIEXyKw
Часто бывает так, что данные для анализа не хранятся в виде удобного csv-файлика или в базе данных, а представляют собой какую-нибудь мало-структурированную кашу, например, логи сервера или длинный эвент лог в формате txt с произвольной структурой. Тогда приходится прежде всего решать задачу извлечения данных в таком виде, чтобы их затем можно было загнать в датафрейм. В блоге DataQuest есть интересный туториал с примером извлечения данных с помощью регулярных выражений https://www.dataquest.io/blog/regular-expressions-data-scientists
Большой пост про различные неочевидные возможности Pandas. Охватывает очень много всяких небольших хаков, про которые вы могли не знать. Например, про функцию map, расчет скользящего среднего, про ресемплирование на time series, stack и unstack и ещё много всяких интересных штуковин http://deanla.com/dont_reinvent_pandas.html
Если вы работаете в Jupyter Notebook или в JupyterLab, то советую поставить расширение Qgrid. Это расширение позволяет добавить к привычной табличной визуализации датафрейма функционал сортировки и фильтрации. Крайне рекомендую!
https://github.com/quantopian/qgrid
Туториал про создание бота для Telegram, который поможет автоматизировать отчетность. Всего в несколько десятков строк кода. Такой бот будет вытягивать данные из Google BigQuery, визуализировать их с помощью Matplotlib и отдавать визуализацию в сообщении Телеграма. Хороший способ автоматизировать задачи отчетности, повторяющиеся изо дня в день. https://habr.com/ru/company/skillbox/blog/443702/
Забавная статья, в которой показано как 4 разными способами сделать левый джоин. В начале статьи подробно объясняется что вообще такое этот левый джоин на примере экселевских функций ИНДЕКС/ПОИСКПОЗ и ВПР. Радует то, что рассказывается как работает каждое из решений, а также сравнивается производительность. https://towardsdatascience.com/name-your-favorite-excel-function-and-ill-teach-you-its-pandas-equivalent-7ee4400ada9f
Так. Важная веха. Нас тут 666 человек! Зовите коллег и друзей, которые до сих пор занимаются репортингом в Excel или пишут какие-то гигантские конструкции на языке M в PowerBI. Да придёт к ним прозрение. А ещё напомню, что у канала есть чатик @pydata_chat, где всегда можно задать вопросы и решить свои затыки
Гайд по созданию собственных виджетов внутри Jupyter Notebook. Кнопки, инпуты, ползунки, чекбоксы, вот это всё...
http://bit.ly/2unflQS
Мне вот лично очень тяжело заставить себя заниматься визуализацией в Python с помощью Matplotlib, потому что это какая-то слишком неинтуитивная штука, постоянно приходится обращаться к справке, а если нужно что-то кастомизировать сверх шаблонного решения, то приходится показывать мастерство гугления, чтобы понять как отшлифовать визуализацию до нужного вида. Если кто-то сталкивается с такими же проблемами, то вам может пригодится шпаргалка по Matplotlib от DataCamp https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Matplotlib_Cheat_Sheet.pdf