Forwarded from Коля Валиотти • Дата консалтинг
Стратегия управления на основе данных
Data-driven подход — это такая штука, к которой все стремятся, но не все понимают, что это такое и как к этому прийти.
▶️ Data-driven — это подход, когда все решения в компании принимаются на основе цифр. Чтобы этого добиться, нужно твердо понимать, зачем эти цифры нужны, о чем говорят и как влияют на развитие бизнеса. Система аналитики должна быть максимально согласована с целями и с миссией компании.
▶️ В идеале к этому состоянию надо идти по определенным шагам. Чтобы не превращать пост в простыню, вынес их на карточки.
Но что надо обязательно учесть: в реальности у большинства компаний нет точного понимания, как должна выглядеть аналитика и какие данные они хотят видеть. А делать выводы на основе цифр хочется уже сейчас.
В начале пути важно научиться работать со всеми доступными данными. Они уже у вас как-то собираются — например, в CRM-системе; можно начать собирать их в хранилище для построения отчетности, делать первые выводы, смотреть, чего не хватает. Постепенно бизнес будет развиваться и вместе с этим появится понимание, какие данные и метрики вам нужны.❗️
@datakolya
Data-driven подход — это такая штука, к которой все стремятся, но не все понимают, что это такое и как к этому прийти.
Но что надо обязательно учесть: в реальности у большинства компаний нет точного понимания, как должна выглядеть аналитика и какие данные они хотят видеть. А делать выводы на основе цифр хочется уже сейчас.
В начале пути важно научиться работать со всеми доступными данными. Они уже у вас как-то собираются — например, в CRM-системе; можно начать собирать их в хранилище для построения отчетности, делать первые выводы, смотреть, чего не хватает. Постепенно бизнес будет развиваться и вместе с этим появится понимание, какие данные и метрики вам нужны.
@datakolya
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍23⚡9❤5😱3
Внедрили аналитику на старте и увеличили прибыль до 1,2M$
Недавно в комментариях попросили «что-нибудь посложнее». Окей, есть и посложнее.
💬 Как с нуля построить аналитику для быстро растущего стартапа?
💬 Как на практике выглядит «data-driven подход», и как данные помогают принимать решения в бизнесе?
💬 Какие знакомые любому предпринимателю проблемы решает аналитика?
Разбираемся на реальном примере кейса Valiotti Analytics — кастомной системе аналитики, которую сделали для EdTeh-стартапа Refocus. Мы присоединились к проекту прямо на старте и построили инфраструктуру по работе с данными, которая росла вместе с компанией. От двух отчетов с данными из AmoCRM она выросла в полноценную систему из 40+ дашбордов по продажам, маркетингу и продуктовому направлению.
🔜 Что мы такого сделали с данными, что компания выросла в 25 раз — в новой статье фаундера Valiotti Analytics на vc.ru. Если интересно заглянуть прямо внутрь системы аналитики и узнать, как и что в ней работает, это отличный шанс!
Недавно в комментариях попросили «что-нибудь посложнее». Окей, есть и посложнее.
Разбираемся на реальном примере кейса Valiotti Analytics — кастомной системе аналитики, которую сделали для EdTeh-стартапа Refocus. Мы присоединились к проекту прямо на старте и построили инфраструктуру по работе с данными, которая росла вместе с компанией. От двух отчетов с данными из AmoCRM она выросла в полноценную систему из 40+ дашбордов по продажам, маркетингу и продуктовому направлению.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍50❤41🔥20⚡11🌚4
Postgres против всех
Чем сложнее проект, тем длиннее и запутаннее стек — это не всегда удобно, но неизбежно.
Или нет.
Часто стек растет, потому что под каждую задачу или проблему стараются подобрать наиболее подходящий инструмент. Но как выбрать этот «подходящий инструмент»? На что смотреть — на цену, скорость работы, простоту использования?
Или просто выбрать PostgreSQL?👀
Нашли для вас короткую статью, почему вместо раздувания списка инструментов иногда можно просто выбрать проверенный временем, универсальный и понятный PostgreSQL.
Хотя по сути дело даже не в конкретной БД — на месте PostgreSQL может оказаться любой другой вариант. Дело в самом подходе — не усложнять себе жизнь, внедряя множество инструментов под разные задачи. И вместо этого стремиться к тому, чтобы ИТ-инфраструктура была понятной и не перегруженной. Так проще с ней работать и поддерживать работоспособность.
🔜 А что вы думаете — как найти баланс между перегруженностью и простотой, которая уже не тянет стоящие перед командой проекта задачи?
Чем сложнее проект, тем длиннее и запутаннее стек — это не всегда удобно, но неизбежно.
Или нет.
Часто стек растет, потому что под каждую задачу или проблему стараются подобрать наиболее подходящий инструмент. Но как выбрать этот «подходящий инструмент»? На что смотреть — на цену, скорость работы, простоту использования?
Или просто выбрать PostgreSQL?
Нашли для вас короткую статью, почему вместо раздувания списка инструментов иногда можно просто выбрать проверенный временем, универсальный и понятный PostgreSQL.
Хотя по сути дело даже не в конкретной БД — на месте PostgreSQL может оказаться любой другой вариант. Дело в самом подходе — не усложнять себе жизнь, внедряя множество инструментов под разные задачи. И вместо этого стремиться к тому, чтобы ИТ-инфраструктура была понятной и не перегруженной. Так проще с ней работать и поддерживать работоспособность.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍80🔥32❤🔥20⚡14❤7
Box plots: датавиз не для всех
Смысл визуализации данных — в том, чтобы представить сложную информацию наглядно и понятно. Так, чтобы человек мог быстро в ней разобраться и извлечь что-то полезное для себя.
Но иногда что-то идет не так.
Вот давайте честно, вам нравятся box plots — они же «ящики с усами» или диаграммы размаха?
💬 Если не знаете, что это, то вот объяснение на русском, а вот — видео на английском.
В теории это прекрасный способ визуализации, в который очень плотно упакован большой объем информации:
🔵 максимальное, минимальное и медианное значения;
🔵 квартили и асимметрия данных — если в каком-то квартиле сильный разброс значений, это будет видно по длине «уса» или «ящика»;
🔵 сравнение сразу нескольких сущностей по всем этим показателям.
Проблема в том, что эта информация изображена контринтуитивно. Про это есть длинный материал, но если кратко, то вот главные тезисы.
🔵 Чтобы разобраться в box plots, надо, как минимум, знать, что такое квартиль. Из-за этого возникают сложности с восприятием. Например, если один «ус» очень длинный, подсознательно воспринимается, будто в нем больше всего значений, но на самом деле — в нем просто большая разница между максимумом и минимумом. Число значений во всех частях графика одинаковое.
🔵 Дизайн заставляет думать, что крупная часть в центре, сам «ящик» — самая значимая, а «усы» как бы приложение. Хотя с чего бы?
🔵 К тому же, кажется, будто на графике три элемента: «ящик» и два «уса». На самом деле их 4: два «ящика» разделены медианой.
С одной стороны, все эти недопонимания — проблема зрителя. Box plots существуют давно, инструкций, как их читать — достаточно. Кто захочет, тот вникнет. Но всю ту же информацию, которую содержат «ящики» можно показать более наглядно и доступно. А не в этом ли цель всего датавиза?
По ссылке выше есть примеры — распределение значений показывают «тепловыми картами» и точками. Чем ярче участок на графике или чем плотнее на нем расположены точки, тем больше там значений.
А вы пользуетесь ли box plots в работе? Вам легко в них разбираться?
Смысл визуализации данных — в том, чтобы представить сложную информацию наглядно и понятно. Так, чтобы человек мог быстро в ней разобраться и извлечь что-то полезное для себя.
Но иногда что-то идет не так.
Вот давайте честно, вам нравятся box plots — они же «ящики с усами» или диаграммы размаха?
В теории это прекрасный способ визуализации, в который очень плотно упакован большой объем информации:
Проблема в том, что эта информация изображена контринтуитивно. Про это есть длинный материал, но если кратко, то вот главные тезисы.
С одной стороны, все эти недопонимания — проблема зрителя. Box plots существуют давно, инструкций, как их читать — достаточно. Кто захочет, тот вникнет. Но всю ту же информацию, которую содержат «ящики» можно показать более наглядно и доступно. А не в этом ли цель всего датавиза?
По ссылке выше есть примеры — распределение значений показывают «тепловыми картами» и точками. Чем ярче участок на графике или чем плотнее на нем расположены точки, тем больше там значений.
А вы пользуетесь ли box plots в работе? Вам легко в них разбираться?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥55⚡6❤4
Data Heroes: интервью с Марией Бородецкой
«Синхронизация» — онлайн-школа, где рассказывают про культуру, искусство, психологию и софт-скиллы. Соосновательница Мария Бородецкая говорит, что это уже не совсем эдтех, а скорее проект по саморазвитию, и его главный конкурент — не другие школы, а Netflix.
Про что еще поговорили?
🔵 Как проект прошел путь от лекций «для себя и для друзей» до успешного стартапа и пережил ковид.
🔵 Почему оффлайн — это лакшери, а за онлайном и искусственным интеллектом будущее.
🔵 Какую роль играет культурный код при выходе на международные рынки.
🔵 Почему маркетинг — это здорово, но учиться лучше на философа, математика или искусствоведа.
🔵 Какие метрики бизнеса самые важные для предпринимателя в онлайн-образовании.
🔵 И причем здесь Юрий Дудь*?..
🔜 Где посмотреть: YouTube
Где послушать: Apple Podcasts, Яндекс Музыка, Spotify
#dataheroes
*Юрий Дудь признан в России иноагентом.
«Синхронизация» — онлайн-школа, где рассказывают про культуру, искусство, психологию и софт-скиллы. Соосновательница Мария Бородецкая говорит, что это уже не совсем эдтех, а скорее проект по саморазвитию, и его главный конкурент — не другие школы, а Netflix.
Про что еще поговорили?
Где послушать: Apple Podcasts, Яндекс Музыка, Spotify
#dataheroes
*Юрий Дудь признан в России иноагентом.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍68🔥29❤10⚡5👎1
В российских вузах начнут готовить специалистов по ИИ
Роль ИИ постоянно растет, и он постепенно проникает во все сферы деятельности — от науки до повседневной жизни. Так что неудивительно, что в разных странах уже появляются целые программы в вузах, посвященные искусственному интеллекту.
И в России тоже.
🔜 В новом учебном году Яндекс и Сбер запускают вместе с НИУ ВШЭ, ИТМО, МФТИ и Университетом Иннополис программу AI360 или ИИ360. Там будут готовить специалистов по ИИ, которые будут двигать вперед науку и технологии. А если конкретнее — ML-исследователей и AI-архитекторов.
Что ждет студентов?
🔵 Фундаментальная подготовка с углубленным изучением математики.
🔵 Доступ к технологиям от Яндекса и Сбера и изучение лучших мировых практик в сфере ИИ.
🔵 Научная деятельность со второго курса. Студенты смогут присоединиться к исследованиям и посетить международные конференции.
Легко не будет, но чтобы дополнительно поддержать студентов во время учебы, им обещают повышенную стипендию на протяжении всех 4 лет обучения. Подать документы можно до 25 июля.
Роль ИИ постоянно растет, и он постепенно проникает во все сферы деятельности — от науки до повседневной жизни. Так что неудивительно, что в разных странах уже появляются целые программы в вузах, посвященные искусственному интеллекту.
И в России тоже.
Что ждет студентов?
Легко не будет, но чтобы дополнительно поддержать студентов во время учебы, им обещают повышенную стипендию на протяжении всех 4 лет обучения. Подать документы можно до 25 июля.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66🔥26⚡16❤3👎1
ИИ-поисковик по мемам и не только
У предпринимателя Харпера Рида было 12 000 картинок с мемами, желание разобраться, что такое «векторные представления», и некоторое количество свободного времени. Все это привело к тому, что он создал простое приложение на основе мультимодальных моделей CLIP и siglip, которое умеет искать по картинкам.
Оно принимает как текстовые запросы, так и изображения. В первом случае оно подберет картинки, соответствующие запросу, во втором — найдет похожие в своей базе.
🔜 Работает с любыми изображениями. То есть его можно использовать не только поиска мемов для важных переговоров в интернете, но и, например, чтобы искать по фотографиям в галерее. Вдруг вам нужно оперативно собрать в кучу все фотки любимого кота.
🔜 Проверьте сами — приложение бесплатное и лежит на GitHub.
🔜 Заодно рекомендуем почитать пост про разработку. Он доказывает, что в любой теме можно разобраться — было бы желание. Харпер признался, что никогда не делал ничего похожего и вообще до сих пор плохо понимает, что такое «вектор». Но ему захотелось разработать приложение, и он это сделал вполне успешно.
И главное — показал, как это делал по этапам. Так что если тоже хотите попробовать сделать что-то подобное, вот отличный повод погрузиться в тему.
У предпринимателя Харпера Рида было 12 000 картинок с мемами, желание разобраться, что такое «векторные представления», и некоторое количество свободного времени. Все это привело к тому, что он создал простое приложение на основе мультимодальных моделей CLIP и siglip, которое умеет искать по картинкам.
Оно принимает как текстовые запросы, так и изображения. В первом случае оно подберет картинки, соответствующие запросу, во втором — найдет похожие в своей базе.
И главное — показал, как это делал по этапам. Так что если тоже хотите попробовать сделать что-то подобное, вот отличный повод погрузиться в тему.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍70🔥35⚡10❤5
Карьера в Data — новый проект LEFT JOIN
Поиск работы — занятие утомительное. Надо обновить резюме, перерыть гору вакансий, потратить время на сопроводительные, тестовые и собеседования... Не то, чем хочется заниматься без необходимости.
С обратной стороны тоже не все гладко: из огромного числа откликов предстоит отобрать подходящие, провести серию собеседований и заинтересовать кандидата.
💙 Мы LEFT JOIN решили, что в наших силах сделать этот процесс приятнее для всех участников — так уж получилось, что у нас большая аудитория, где есть и работодатели, и потенциальные сотрудники. Так что почему бы не создать для них специальный канал, где они смогут найти друг друга.
Канал так и назвали — Карьера в Data. Что будем постить?
🔵 Вакансии для аналитиков, дата-инженеров, дата-саентистов, продакт-менеджеров разных уровней — от джунов до тим лидов.
🔵 Советы от HR, как составить резюме, написать сопроводительное и не запороть собеседование.
🔵 Инсайты про рынок труда, количество вакансий и динамику зарплат.
🔵 Разборы тестовых заданий и советы, как построить карьеру в данных, от тех, кто уже это сделал.
Даже если не ищете работу прямо сейчас, будет много полезной информации, чтобы оставаться в курсе последних тенденций в нашей сфере. Убедитесь сами!
@leftjoin_career🔥
Поиск работы — занятие утомительное. Надо обновить резюме, перерыть гору вакансий, потратить время на сопроводительные, тестовые и собеседования... Не то, чем хочется заниматься без необходимости.
С обратной стороны тоже не все гладко: из огромного числа откликов предстоит отобрать подходящие, провести серию собеседований и заинтересовать кандидата.
Канал так и назвали — Карьера в Data. Что будем постить?
Даже если не ищете работу прямо сейчас, будет много полезной информации, чтобы оставаться в курсе последних тенденций в нашей сфере. Убедитесь сами!
@leftjoin_career
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥108👍28⚡10🥰6❤3
Microsoft выложила GraphRAG на GitHub
GraphRAG — это технология от Microsoft, которая строит графы с помощью LLM на основе данных, с которыми раньше не работала. То есть тех, которые не использовались для обучения модели.
Она обрабатывает весь набор данных, выявляет упоминающиеся в нем сущности и находит связи между ними. А затем создает сложный граф, где каждый кружок — это отдельная сущность. Размер зависит от количества связей с кружками, а одинаковыми цветами раскрашиваются близкие по смыслу объекты.
🔜 Таким образом можно обработать большие массивы текстовых данных — например, архивы переписок, документы или исследования. А затем искать среди них нужную информацию.
Особенность технологи в том, что когда она ищет ответ на запрос пользователя, она ищет по всему датасету с учетом контекста. Это помогает ей отвечать на вопросы, где требуется полное понимание смысла материала, чтобы объединить разрозненные куски информации или ответить на общие вопросы в духе «Опиши 5 главных тем этого документа».
🔜 И вот недавно эта технология стала доступна общественности: ее выложили на GitHub и даже сопроводили FAQ’ом и инструкцией по написанию промптов.
GraphRAG — это технология от Microsoft, которая строит графы с помощью LLM на основе данных, с которыми раньше не работала. То есть тех, которые не использовались для обучения модели.
Она обрабатывает весь набор данных, выявляет упоминающиеся в нем сущности и находит связи между ними. А затем создает сложный граф, где каждый кружок — это отдельная сущность. Размер зависит от количества связей с кружками, а одинаковыми цветами раскрашиваются близкие по смыслу объекты.
Особенность технологи в том, что когда она ищет ответ на запрос пользователя, она ищет по всему датасету с учетом контекста. Это помогает ей отвечать на вопросы, где требуется полное понимание смысла материала, чтобы объединить разрозненные куски информации или ответить на общие вопросы в духе «Опиши 5 главных тем этого документа».
Please open Telegram to view this post
VIEW IN TELEGRAM
👍74🔥26⚡16❤🔥4
Как построить сквозную аналитику в компании?
Отвечает… нет, не Александр Друзь.
🔜 25 июля в 19:00 по Москве Николай Валиотти расскажет про создание системы аналитики на бесплатном вебинаре. Это будет эфир про данные, но не для аналитиков, а для предпринимателей, руководителей отделов, маркетологов, продакт-менеджеров. Так что будет много практики и решения проблем бизнеса и мало — технических тонкостей и терминов.
💙 Николай не просто создал этот канал, но и основал успешный дата-консалтинг Valiotti Analytics. С 2019 года в портфолио команды собралось уже больше 40 успешных кейсов, 2 из которых разберут на вебинаре.
На их примере слушатели узнают:
🔵 Как понять, что уже пора строить серьезную аналитику, и с чего начать это делать?
🔵 Из чего состоит система аналитики, и зачем нужен каждый ее компонент?
🔵 Какие топ-5 отчетов нужны каждому бизнесу, и какие рабочие инсайты можно извлекать из данных?
🔜 Если вы захотите погрузиться в эту тему глубже, на вебинаре откроется запись на онлайн-экскурсии. Николай проведет ее лично и покажет, как строится работа над системой аналитики на примерах готовых проектов. Количество мест ограничено.
Больше информации о вебинаре и новости постим на канале @system_of_analytics. Там же выложим ссылку для подключения в день эфира, так что подпишитесь, чтобы не пропустить.
На их примере слушатели узнают:
Больше информации о вебинаре и новости постим на канале @system_of_analytics. Там же выложим ссылку для подключения в день эфира, так что подпишитесь, чтобы не пропустить.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔27👌15⚡12❤7🤩4
26 must-read статей про AI
Хотите начать разбираться в теме искусственного интеллекта, как профессионал?
Тогда у нас для вас есть прекрасная подборка статей на эту тему. То есть, не совсем у нас.
🔜 Авторство подборки приписывают Илье Суцкеверу (сооснователю OpenAI, из которой он ушел в прошлом месяце). Он составил ее для Джона Кармака — того самого, который в 90-х подарил нам Doom и Quake, а потом ушел развивать мета-вселенные и искусственный интеллект.
Кармак попросил Суцкевера посоветовать, что почитать на тему ИИ. Суцкевер выдал ему этот список и сказал:
🔜 Правда, в том документе было аж 40 научных статей, а у нас всего 26. Но внимания список все равно заслуживает, несмотря на то что некоторым материалам из него уже много лет. Это основы, на которых стоят почти все современные инновации в теме ИИ.
А у вас есть must-read материалы про AI и ML? Делитесь в комментариях!
Хотите начать разбираться в теме искусственного интеллекта, как профессионал?
Тогда у нас для вас есть прекрасная подборка статей на эту тему. То есть, не совсем у нас.
Кармак попросил Суцкевера посоветовать, что почитать на тему ИИ. Суцкевер выдал ему этот список и сказал:
«Если ты действительно выучишь это все, то будешь знать 90% того, что важно сегодня».
А у вас есть must-read материалы про AI и ML? Делитесь в комментариях!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥84👍23❤18⚡4
Forwarded from Коля Валиотти • Дата консалтинг
Куда рынок IT привела осознанная меркантильность?
В рунете разгорелся довольно крупный скандал о «вкатунах в IT», в стороне которого я и моя команда остаться не можем. Расскажу кратко как я его вижу и поделюсь мнением.
🔜 Итак, есть главный герой этой истории — Антон Назаров и его «Осознанная меркантильность». Он рассказывает как работать на нескольких работах и в деталях учит как сфабриковать резюме, чтобы ты прошел скрининги и тебя все-таки взяли на работу, когда на нее не берут. У ребят свое комьюнити, зовутся они «волками», и их целая стая.
🔜 И вот как раз оппонирующая сторона — Глеб Кудрявцев и Леся Набока — выпустили «разоблачение» Антона Назарова и в формате подкаста описывают, как для работодателя выглядит пиздеж, который предлагает Антон.
🔜 Параллельно сам Антон стримил и давал комментарии на этот разоблачительный контент. Удовольствие, конечно, сомнительное, но ссылку все-таки дам для полноты картины.
🔜 А также у моего товарища Саши Ильина, который пожелал стать публичным рефери переговоров (хотя затея пока не вышла), разгорелось бурное обсуждение в комментах. Туда, кстати, ворвался и сам Глеб Кудрявцев, который вероятно в порыве эмоций накидал неоднозначного для меня контента в качестве ответов «волкам».
А что вы об этом думаете? Кто прав, кто виноват? Поддерживаете ли идеи осознанной меркантильности — 🤓 или против волков — 🌚?
В рунете разгорелся довольно крупный скандал о «вкатунах в IT», в стороне которого я и моя команда остаться не можем. Расскажу кратко как я его вижу и поделюсь мнением.
В целом, подход довольно сомнительный, но окей. Наверняка каждый из нас в той или иной мере привирал в резюме. Вопрос, конечно, в итоговом объеме правды. Тут у ребят целый подход к тому, как «вкатиться» и как максимально заработать на нескольких работодателях.
Глубинная же проблема заключается том, что рынок «вкатывания в IT» поломан — мы имеем кучу ребят, прошедших курсы, которые «вошли не в ту дверь» и не могут трудоустроиться. И как будто бы Антон Назаров нашел этому решение. Видно, что подвох тут присутствует: обманув систему рекрутинга, компания получает на какое-то время не вполне квалифицированные кадры, но раз система их пропускает — получается, что они окей?!
Искренне попытался посмотреть первые 3-5 минут, чтобы понять о чем видео. Но это смотреть просто тошно, максимально токсичный контент с переходом на личности и оскорблениями.
Как-то по-другому я себе представлял разоблачителей и борцов за «правое дело». А то, выходит, а чем они лучше-то, если презентуют себя таким образом? Короче максимальный дизреспект по формату и подаче этого контента.
А что вы об этом думаете? Кто прав, кто виноват? Поддерживаете ли идеи осознанной меркантильности — 🤓 или против волков — 🌚?
Please open Telegram to view this post
VIEW IN TELEGRAM
🤓33🌚25😱8🔥6👍4