DWH: Го Разберем подходы к построению хранилищ данных
Хранилище Данных (DWH) — это сердце аналитики компании. От его структуры зависит, насколько быстро и удобно можно извлекать инсайты.
Сегодня что-то расскажу про два популярных подхода к моделированию данных: снежинку (Star/Snowflake Schema) и якорную модель (Anchor Modeling).
Состоит из:
1.1 Таблицы фактов (где количественные данные, которые нужно анализировать: например фактические продажи).
1.2 Таблицы измерений (содержат описательные атрибуты, которые помогают понять контекст: продукты, кастомеры, даты).
Если видим в названии _fct_ — это таблица фактов, _dim_ (dimensional) — таблица измерений, но так будет не везде(
- хорошо отражает сложные иерархии
- простая и понятная структура данных
Более гибкий подход, особенно полезный для часто меняющихся данных и состоит из:
2.1 Якоря (Anchors) — сущности (например у нас "Заказ", "Клиент").
2.2 Атрибуты (Attributes) — свойства якорей (например у нас атрибуты заказа, или "Имя клиента", "Дата заказа").
2.3 Связи (Ties) — отношения между якорями (например у нас "Заказ имеет Статус" с историей изменений).
2.4 Узлы (Knots) — хранят фиксированные наборы значений (например у нас справочник статусов заказа).
Если видим в названии _anc_, _attr_, _tie_, _knot_ — это про якорную модель
Кстати пока работал в озоне у них была реализована именно эта модель - было удобно и круто)
- Легко масштабируется.
- Поддерживает историчность данных без лишних костылей.
- Удобна для медленно меняющихся измерений (SCD).
Снежинка - про простоту и скорость.
Якорная модель - про часто меняющиеся данные + если важна гибкость.
Потому что уже на позициях типо джуна-миддла и выше в бигтехах могут спрашивать на собесах инфу о том, с чем работал в целом, что знаешь о подходах и их различиях. А еще круче знать о них заранее. Как минимум что они существуют и как называются, а как максимум понимать принципы и вернеуровневое устройство.
По традиции ставим прогрессивного жаба📈 , если шарите за подходы или как минимум слышали, увлекшегося жаба 📃 , если было бы интересно еще узнать о ХД, ну и лайк ❤️ если понравился пост!
Хранилище Данных (DWH) — это сердце аналитики компании. От его структуры зависит, насколько быстро и удобно можно извлекать инсайты.
Сегодня что-то расскажу про два популярных подхода к моделированию данных: снежинку (Star/Snowflake Schema) и якорную модель (Anchor Modeling).
1. Снежинка (Star/Snowflake Schema)
Состоит из:
1.1 Таблицы фактов (где количественные данные, которые нужно анализировать: например фактические продажи).
1.2 Таблицы измерений (содержат описательные атрибуты, которые помогают понять контекст: продукты, кастомеры, даты).
Хинт для детектирования
Если видим в названии _fct_ — это таблица фактов, _dim_ (dimensional) — таблица измерений, но так будет не везде(
Поинт про преимущества
- хорошо отражает сложные иерархии
- простая и понятная структура данных
2. Якорная модель (Anchor Modeling)
Более гибкий подход, особенно полезный для часто меняющихся данных и состоит из:
2.1 Якоря (Anchors) — сущности (например у нас "Заказ", "Клиент").
2.2 Атрибуты (Attributes) — свойства якорей (например у нас атрибуты заказа, или "Имя клиента", "Дата заказа").
2.3 Связи (Ties) — отношения между якорями (например у нас "Заказ имеет Статус" с историей изменений).
2.4 Узлы (Knots) — хранят фиксированные наборы значений (например у нас справочник статусов заказа).
Хинт для детектирования
Если видим в названии _anc_, _attr_, _tie_, _knot_ — это про якорную модель
Кстати пока работал в озоне у них была реализована именно эта модель - было удобно и круто)
Поинт про преимущества
- Легко масштабируется.
- Поддерживает историчность данных без лишних костылей.
- Удобна для медленно меняющихся измерений (SCD).
Саммари
Снежинка - про простоту и скорость.
Якорная модель - про часто меняющиеся данные + если важна гибкость.
Спрашивается и зачем я решил пост-то накатить?
Потому что уже на позициях типо джуна-миддла и выше в бигтехах могут спрашивать на собесах инфу о том, с чем работал в целом, что знаешь о подходах и их различиях. А еще круче знать о них заранее. Как минимум что они существуют и как называются, а как максимум понимать принципы и вернеуровневое устройство.
По традиции ставим прогрессивного жаба
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1 23 17❤9
Гении маркетинга или как жестко хайпануть и поднять кэш.
Автор никуда не пропал, позже выкатит крутецкий пост! [ как и сегодня ]
А сегодня у нас очень прикольный топик. Кайф разобрать как с точки зрения продукта, так и с маркетинга и некой тех. части.
Кольцо от китайской компании - Darry Ring
Давайте приправим это их слоганами:
А теперь по фактам что имеем, делюсь супер популярным и легким языком.
Рынок ювелирки достаточно застывший, новаторства прям жесткого нет - ин май опинион. Надо че-то такое исполнить, чтобы у всех челюсть отпала.
Бля, ну реализация проста как мир.
Есть ты, как пользователь - тебя регают и ты получаешь свой user_id, тут не особо важно как его получают, хоть просто порядковым номером.
Есть твой номер паспорта -> его пропускают через Хэш Функцию [ это такая штука, которая превращает по своему хитроумному и надежному алгоритму одни символы - в другие ] -> ее значение помещают в Базу Данных.
Пример: 6020 123456 -> e56gvwfrg554plbuf813
Ну это вообще песня, если тебе дадут крутой крючок - что ты единственная, кому мог купить этот мужчина кольцо. Многие сразу начнут визжать типо «ВАУ, представляете! Такое вот кольцо, купить можно единожды!»
Звучит хайпово? хайпово! Дарит исключительность? определенно. И это не плохо на самом деле.
Это просто здоровская реализация идеи, которая тебя вынесет среди условных: "Санлайт закрывается! скидки!"
1. Как дела обстоят с
2. Подскажите компанию, которая тоже дарит "исключительность" на рынке в IT?))
3. Напишите плиз, какой мем из 4-х понравился больше, я выбрать не смог...
По традиции ставим прогрессивного жаба📈 , если было интересно почитать за данный кейс, увлекшегося жаба 📃 , если ждете вайб-обзоры на офисы, ну и лайк ❤️ если понравился пост!
Автор никуда не пропал, позже выкатит крутецкий пост! [ как и сегодня ]
А сегодня у нас очень прикольный топик. Кайф разобрать как с точки зрения продукта, так и с маркетинга и некой тех. части.
Кольцо от китайской компании - Darry Ring
Приобрести его можно только в том случае, если вы привяжете его к своей личной записи в базе данных бренда, используя свои паспортные данные. Покупка кольца осуществляется только один раз и только для одной женщины.
Давайте приправим это их слоганами:
1. На всю жизнь, единственная, настоящая любовь
2. Дарю тебе единственное обещание в жизни
А теперь по фактам что имеем, делюсь супер популярным и легким языком.
Мэйн поинт
Рынок ювелирки достаточно застывший, новаторства прям жесткого нет - ин май опинион. Надо че-то такое исполнить, чтобы у всех челюсть отпала.
Реализация
Бля, ну реализация проста как мир.
Есть ты, как пользователь - тебя регают и ты получаешь свой user_id, тут не особо важно как его получают, хоть просто порядковым номером.
Поинт про хранение данных
Есть твой номер паспорта -> его пропускают через Хэш Функцию [ это такая штука, которая превращает по своему хитроумному и надежному алгоритму одни символы - в другие ] -> ее значение помещают в Базу Данных.
Пример: 6020 123456 -> e56gvwfrg554plbuf813
Маркетинг
Ну это вообще песня, если тебе дадут крутой крючок - что ты единственная, кому мог купить этот мужчина кольцо. Многие сразу начнут визжать типо «ВАУ, представляете! Такое вот кольцо, купить можно единожды!»
Звучит хайпово? хайпово! Дарит исключительность? определенно. И это не плохо на самом деле.
Это просто здоровская реализация идеи, которая тебя вынесет среди условных: "Санлайт закрывается! скидки!"
Вопросы
1. Как дела обстоят с
churn_rate-ом [ метрика оттока ] клиентов купивших кольцо?))) Есть мысли по процентам?))2. Подскажите компанию, которая тоже дарит "исключительность" на рынке в IT?))
3. Напишите плиз, какой мем из 4-х понравился больше, я выбрать не смог...
По традиции ставим прогрессивного жаба
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1 36❤22 13
Обзор на зарубежный офис Авито 📱
Ласт тайм был хороший отлик, как в целом на все обзорные посты про IT офисы, поэтому приоткрою завесу тайны еще одного офиса Авито.
- Офис балдеж как минимум потому что он небольшой [ нашел в этом свой вайб ] ~ 60 рабочих мест [ но моя инфа вероятно устарела ]
- Вайбик, ну просто зацените колорит этого офиса, по нему можно в целом догадаться, что за страна [ ну если были в ней ]
- Уютный стилек, много светлого дерева
- Хорошо оборудованные места
- Насколько знаю, спортзала здесь нет
- Получение зп в местной валюте
- ну, а душ как приятное дополнение
Что за страна-то?!
p.s. Больше фото в комментах!
По традиции ставим Прогрессивного жаба📈 , если было занимательно заглянуть внутрь. Заинтересованного жаба📃 если ждете обзор на один не менее дорогой офис [ умолчу компанию ], ну и лайк ❤️ если понравился пост!
Ласт тайм был хороший отлик, как в целом на все обзорные посты про IT офисы, поэтому приоткрою завесу тайны еще одного офиса Авито.
Довелось мне побывать в нем, когда получал туристическую визу в Штаты.
- Офис балдеж как минимум потому что он небольшой [ нашел в этом свой вайб ] ~ 60 рабочих мест [ но моя инфа вероятно устарела ]
- Вайбик, ну просто зацените колорит этого офиса, по нему можно в целом догадаться, что за страна [ ну если были в ней ]
- Уютный стилек, много светлого дерева
- Хорошо оборудованные места
- Насколько знаю, спортзала здесь нет
- Получение зп в местной валюте
- ну, а душ как приятное дополнение
Вопросы
Что за страна-то?!
p.s. Больше фото в комментах!
По традиции ставим Прогрессивного жаба
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
5-й отпуск в 2025. Камчатка.
Аж стыдно писать такие заголовки… Каждый год миксую зарубежные поездки и поездки по России. В этот раз этим местом стала величественная Камчатка.
Большая часть моих отпусков похожа больше не на классический отдых, а на челленджи для себя, давайте кратко перечислю че было за 7 полных дней:
• Хайкинг на горный массив Вачкажец
• Восхождение на Вулкан Горелый [ взошел за час 30 вместо 2.5-3 среднего ], хайкинг на водопад Спокойный, посещение ледяных пещер и крутейшего вулканариума.
• сплав по реке Быстрая, где видели 4х медведей [ маму с ребенком кстати в том числе ]
• эксплоринг Вулканов южной группы [ Корякский, Горелый, Мутновский ] и наблюдение за китами на ВЕРТОЛЕТЕ с высадкой в бухте с черным песком.
• Восхождение на действующий вулкан Авачинский, где пришлось подниматься по черному и красному шлаку, увидеть серные источники, застывшую лаву и пробку на кратере.
[ Набор высоты с 900м до 2841, поднялся за 5.5 часов, но шел с группой, думаю за 4.5 бы осилил ]
• обзорная экскурсия на Халактырский пляж, мыс Маячный, скалы 3 брата, смотровая Мишенная сопка
• Морская прогулка вдоль побережья тихого океана, наблюдение за китами, морская рыбалка [ поймал треску 5кг, камбалу и морскую корову ], смотрел на морских Львов
Это было Ооочень насыщенно, одна из лучших поездок, от всей души рекомендую хотя бы раз посетить Камчатку!
По традиции ставим прогрессивного жаба📈 , если Камчатка есть в вашем вишлисте. Заинтересованного жаба📃 если было бы глянуть больше разбор с цифрами (стоимость, статистика, данные в общем), ну и лайк ❤️ если понравился пост!
Аж стыдно писать такие заголовки… Каждый год миксую зарубежные поездки и поездки по России. В этот раз этим местом стала величественная Камчатка.
Большая часть моих отпусков похожа больше не на классический отдых, а на челленджи для себя, давайте кратко перечислю че было за 7 полных дней:
1 день.
• Хайкинг на горный массив Вачкажец
2 день.
• Восхождение на Вулкан Горелый [ взошел за час 30 вместо 2.5-3 среднего ], хайкинг на водопад Спокойный, посещение ледяных пещер и крутейшего вулканариума.
3 день.
• сплав по реке Быстрая, где видели 4х медведей [ маму с ребенком кстати в том числе ]
4 день.
• эксплоринг Вулканов южной группы [ Корякский, Горелый, Мутновский ] и наблюдение за китами на ВЕРТОЛЕТЕ с высадкой в бухте с черным песком.
5 день.
• Восхождение на действующий вулкан Авачинский, где пришлось подниматься по черному и красному шлаку, увидеть серные источники, застывшую лаву и пробку на кратере.
[ Набор высоты с 900м до 2841, поднялся за 5.5 часов, но шел с группой, думаю за 4.5 бы осилил ]
6 день.
• обзорная экскурсия на Халактырский пляж, мыс Маячный, скалы 3 брата, смотровая Мишенная сопка
7 день.
• Морская прогулка вдоль побережья тихого океана, наблюдение за китами, морская рыбалка [ поймал треску 5кг, камбалу и морскую корову ], смотрел на морских Львов
Среднее время подьема: 6-7 утраСреднее время сна: 6-7 часов Среднее количество шагов: 16кСредний уровень энергии на конец дня: 10%Это было Ооочень насыщенно, одна из лучших поездок, от всей души рекомендую хотя бы раз посетить Камчатку!
p.s. Больше фото, видео, и кадров с дрона в комментах!
По традиции ставим прогрессивного жаба
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
3 57❤29 27🔥6