Паша душнит – Telegram
Паша душнит
618 subscribers
83 photos
5 videos
1 file
97 links
По вопросам писать @pavel_ld
Download Telegram
Channel created
Первый пост
Начал читать книгу банк 4.0 , также посмотрел видео. И в целом интересна тематика развития Финтеха в России и в мире в целом. Касательно книги допишу позже, но уже сейчас интересно смотреть как пересекаются мысли разных источников.
Наверное с учебы в Новосибирске у меня было хобби разговаривать с людьми старше меня или с другим опытом, чтобы посмотреть какие дорожки доступны. Часто в этом я сталкивался с понимаем того, что мир работает не так, как мы думаем. На 3 курсе я даже специально делал интервью для 1 курса с разными крутыми ребятами студентами. Но сегодня, хочется поделиться видео интервью в котором как раз Илья Красильников (крутой продукт) рассказывает про разные вещи, которые могут тормозить карьеру. Рекомендую всем, даже тем, кто не знает, что такое продукт-менеджмент, retention, когорты, unit-экономика и вот это вот все)

https://youtu.be/gBJo55lZkaY
Забавная новость, с февраля тинкофф заменяет постоянный кэшбэк на возможность выбора его в одной из категории. Теперь вместо 3 категорий будет 4, одна из которых 1% кэшбэк. В целом можно сказать, что ничего не изменилось и даже стало лучше для тех, кто выбирает категории. Но прочитав комментарии, народ негодует. Наверное это можно объяснить тем, что в книге (банк 4.0) называется основные принципы. И людям не очень хочется думать/тратить, и проще когда ты знаешь, что у тебя постоянный кэшбэк. В общем хотели, как лучше…
Хочется начать с отборов и как ботать sql, но начнём с факапов.

Одна из задач бизнес-аналитика подготовить рассылку (определить основную идею, сформулировать проблему). И конечно необходимо сделать выгрузку почт, по которым будет рассылка. И когда я делал эту выборку я забыл поставить фильтр.

Какие выводы можно сделать из этой ситуации:

* всегда надо прикидывать цифры. Это одна из частей отбора в Тинькофф на бизнес-аналитика (всякие задачи про сколько мячиков поместиться в автобус). Если вы знаете, что у вас x целевых компаний, то x*3 (считаем что например от одной компании у нас 3 почты), а в выгрузке у вас y, где y > x*3*N может намекать, что стоить перепроверить данные.

* если есть возможность (немного данных: менее миллиона строк для Excel), выписывайте все параметры (по которым фильтруете) в выгрузке.

P.s хочется отметить, что негатива в мою сторону от команды почти не было (огромное спасибо им за это). За то начальник, теперь шутить не только про коней (потому что я из Казахстана), но и про то, что я мастер рассылок. А письмо с опровержением сделали буквально за 2 дня.

Следующая серия, поделюсь небольшими костылями при работе с питоном и Гугл таблицами, с помощью pygsheets.
Как подружить Google sheets и Питон
p.s. код дублируется в комменты

Зачем
?
Люблю велосипеды
По работе возник кейс: Есть 20 человек, им надо редактировать ексель файл. Вариантов 3
* У каждого свой ексель. Питоном скачиваем каждый и объедениям. Из минусов сложно вносить какие-то изменения. Нужно быть уверенным, все применят изменения, иначе будет несколько версий таблиц, и не факт что их станкуть получится корректно
* Делать фронт, но понятно это долго и сложно (тут хочу попробовать эту шутку, но пока нет времени)
* Гугл таблица. Минусы: требует согласование с безопасниками. Но плюсы: история, если ктото чтото сломает (а это точно произойдет) можно вернуть работающую версию. И самое крутое личные фильтры

Про pygsheets
Теперь про то, как сделать велосипед обрабатывать гугл таблички питоном. Мы будем работать с pygsheets (есть еще gspred у него больше звезд на гитхабе, но мне кажется возможностей поменьше). Конечно вы можете использовать чистый гугловский апи, но я тупой бизнес-аналитик и там надо разбираться с гугловской документацией (но если вам это интересно то смотри это или это)

Авторизация
Можно использовать сервисный аккаунт (с ютубовской апи такое уже не прокатит). Про то как использовать сервисный акк смотри тут. Там немного старая версия google console, но более менее ничего не помаялось. А вот вместо gc = pygsheets.authorize(client_secret='path'), надо gc = pygsheets.authorize(service_account_file=file_path)

Про неочевидные вещи
1. Пропуски
В целом мы тут ради одной функции
df = wks.get_as_df()
которая считывает лист и делает нам пандасовсикй датафрейм. Дальше вы хотите убрать строки с пропусками. И... Ничего не проходит. Это связано с тем, что по умолчанию пустые значения есть пустые строки. Чтобы это избежать пишем так:
wks.get_as_df(empty_value=np.NaN, value_render="UNFORMATTED_VALUE")

2. Работа с датой.
Как вы могли обратить внимание выше value_render="UNFORMATTED_VALUE". Более подробно см тут. К сожалению по умолчанию стоит FORMATTED_VALUE. И я не очень помню почему, но с ним не получается работать с датой. Дальше вы считываете даты. И.... Ничего не работает вы просто получаете набор цифр. Тут нам поможет библиотка xlrd (которая как раз в привычном нам
pd.read_xlsx()
делает это. Ниже код который превратить столбец с непонятными цифрами в привычный нам даты.
data_google_sheets["work_date"] = data_google_sheets["work_date"].loc[data_google_sheets["work_date"].notnull()].apply(xlrd.xldate_as_datetime, args=(0,))

3. Добавление данных на гугл таблицу.
В моем кейсе требуется только перезаписать таблицу для этого делаем так:
wks = sh.worksheet_by_noscript("final")
wks.clear()
wks.set_dataframe(df,(1,1))

Тут первое необходимо убедиться, что
* в
clear()
ничего не стоит, если вы там поставите координаты функция будет чувствительная к скрытым строкам
* И нужно проверить, что вам хватить размеров листа, иначе
wks.set_dataframe(df,(1,1))
выдаст ошибку выхода за границу.
* данный код не меняет форматирование (может есть такие параметры я не смотрел), поэтому если есть объеденные ячейки или нарисованные границы и тд, они останутся.

ps Будут вопросы, пишите)

#python #аналитика
Небольшой пост про Табло (tableau)
Задача вы хотите сделать воронку в абсолютных значениях, Но часть первая воронки это один sheet, а другая часть другой. И вы хотите свести их на дашборде.

Как сделать так, чтобы их оси (двух графиков) были одинакового размера на дашборде?

Ответ https://kb.tableau.com/articles/HowTo/how-to-synchronize-axis-across-multiple-worksheets-without-using-fixed-range
В тему питона. Достаточно давно я писал небольшой обзор основ библиотек по анализу данных. Материал немного может устарел. Но писался достаточно для начинающих.

1. Markdown - https://vk.com/co_science?w=wall-179080065_326

2. установка и работа с jupyter - https://vk.com/co_science?w=wall-179080065_356 (хотя я сам сейчас юзаю VSCODE)

3. Numpy (вычисления) - https://vk.com/feed?q=%23science_tools&section=search&w=wall-179080065_404

4. Pandas (работа с таблицами) - https://vk.com/feed?q=%23science_tools&section=search&w=wall-179080065_432

5. Plotly (визуализация) - https://vk.com/feed?q=%23science_tools&section=search&w=wall-179080065_522

#python #аналитика
👍1
Обо мне
Все привет, как вы наверное знаете, я сейчас работаю бизнес-аналитиком в желтом банке. Отдел автострахования, работа с партнерами (автодилеры, другие страховые)

Сейчас я больше аналитик (SQL, python и это все) на старом проекте, и при этом прорабатываю с нуля новый проект. Тут больше процессы описать в Miro, спланировать Custdev, но есть и задачки по аналитике оценить оценить потенциальный рынок и тд. Поэтому дальше будут постики и про Аналитику (в том числе BI, а/б тесты), что-нибудь про продуктовую тематику (бизнес метрики)

Если есть вопросы всегда можете писать в лс @pavel_ld
Паша душнит pinned «Обо мне Все привет, как вы наверное знаете, я сейчас работаю бизнес-аналитиком в желтом банке. Отдел автострахования, работа с партнерами (автодилеры, другие страховые) Сейчас я больше аналитик (SQL, python и это все) на старом проекте, и при этом прорабатываю…»
Про бизнес-аналитика в Тинькофф
Бизнес-аналитик (технолог на местном слэнге) это не совсем бизнес-аналитик в общем понимании (если оно есть). Это чтото между продуктом, проджектом, аналитиком. Ставит задачи дизайнерам, аналектам (если они есть в команде), может разобраться с логами понять изза чего баг/ошибка (если она простая), если сложная поставить задачу системному аналитику. Я описал все возможные сценарии, но на самом деле все очень сильно зависит от команды. Если команда новая и людей мало, то бизнес аналитик это такой морпех, который должен уметь все (что мне нравится). Если в команде есть продуктовый-аналитик, BI-аналитик и тд, то он просто может заниматься бизнес-анализом (как бы это не звучало).
Казахстан как лучший финтех

Как часть из вас знает у меня Казахстанский паспорт.
Я решил воспользоваться этим и найти и нашёл способ оплатить подписки в AppStore.

1 часть была понятна: переводим с рос. Карты через золотую корону (дешевле чем Swift, но если кто знает как перевести дешевле пишите) на каз. Карту.
Но встала проблема, у меня не было с собой каз. Карты. Была физическая дома Каспи банка, но они не умеют в виртуальные карты. Есть виртуальная карта казахского Сбера. Но с неё очевидно тоже не проходят платежи.

И тут я вспомнил про Фотре банк. И оказалось можно выпустить первую карту полностью удалённо. Нужен был казахский номер телефона, ИИН (аналог Снилс, уникальный номер человека) и пройти биометрию (на камеру повращать головой).

Вот так, Олег) Что там с лучшим финтехом в мире) Теперь вы знаете что это Казахстан))
Постановка задачи

Вы просили скинуть шаблон для постановки задач, который я разработал для команды. Что ж, я не мог... Не мог не заморочиться и не дать вам его. Я его немного доработал, отправил фокус-группе, доработал еще раз и - вот такой шаблон на постановку задач у меня получился.

Сохраняй, делись, внедряй :)

- Скачать шаблон -