LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Одна из самых ключевых стадий стартапа — поиск так называемого product / market fit. Об этом, например, интересно рассказывают в различных акселлераторах. Однако часто команды не могут создать ценность или найти этот самый product/market fit. Но если это произошло, наступает фаза роста, а для нее нужны деньги и значит придется идти к инвесторам. Кому дают деньги, а кому нет? Об этом расскажет Андрей Торбичев, партнер инвестиционного фонда Месторождение (группа ТилТех), автор канала Индекс дятла.

У каждого инвестора свой подход и инструменты оценки. И все же есть несколько вещей, на которые смотрят все:

1. Рынок. “Главное — правильно выбрать стол”, — говорил Тони Шей, основатель Zappos. Если потребителей мало, не имеет значения насколько круто выстроен ваш продукт. Он просто не сможет расти. И да, если вы показываете нишевое решение, придётся убедительно объяснить, как сможете выйти из ниши. В России интересны рынки, где есть хотя бы 10 млрд.+ рублей.

2. Конкуренты и преимущество. Если есть рынок значит есть и конкуренты. У кого вы будете отбирать клиентов и за счет чего — вот два вопроса, которые волнуют инвесторов. Обычно мы видим таблички с кучей галочек, где приводятся сравнения разных решений. Лучше выбрать трёх главных конкурентов и выделить ОДНО, но сильное преимущество перед ними.
🌳Свежак — исследование Sequoia о компенсациях в США. Помимо того, что там красивые, приятные графички, есть интересные наблюдения:

1. Распределение зарплат у женщин смещено в левую (более низкую) сторону, чем у мужчин (куда же смотрит ваш chief diversity officer?)
2. Самый большой разрыв между мужчинами и женщинами в финансах технических компаний.
3. В BI, аналитике и Data science ЗП женщин растут, а у мужчин нет (ах, вот куда смотрел Chief Diversity officer)
4. А вот с точки зрения цвета кожи белые люди растут в заарплате в Продуктах и дизайне и Административном управлении в сравнении с цветными людьми.
😁4
Учитесь у экспертов Microsoft!

Станьте участником бесплатного онлайн-митапа «Microsoft Virtual Training Day: основы Power Platform». В первый раз профессионалы поговорят об этой теме на русском языке.

Там вы научитесь:
> Создавать инновационные бизнес-решения и управлять ими с помощью Microsoft Power Platform.
> С лёгкостью подключать все данные для анализа эффективности бизнеса.
> Автоматизировать рабочие процессы.

После мероприятия вы сможете бесплатно сдать сертификационный экзамен по основам платформы.

Чтобы стать участником, регистрируйтесь по ссылке

Ждём вас 9 февраля в 12.00 (МСК).
#реклама
👍1
📣 Ищем спикеров!

Я уже рассказывал, что мы в процессе создания подкаста и первый выпуск уже совсем скоро будет опубликован! В нем мы обсуждали платное онлайн-образование в области анализа данных. Теперь разбираемся с бесплатным и я прошу подписчиков, которые обучались на бесплатных платформах, откликнуться. Просьба такая: если вы готовы дать аудиокомментарий по ряду вопросов относительно бесплатного образования (он будет опубликован публично), отпишитесь, пожалуйста, в комментариях к этому посту плюсиком или еще как-то 🙂
Затем мы свяжемся с вами и зададим вопросы, которые у нас имеются.

P.S. Конкретных пожеланий по вашим историям нет. Если вы изучали бесплатно только базовые инструменты, а продолжали обучение за деньги, или вовсе бросили затею учиться все истории интересны!
👍1
Disclaimer: This course can be very tough for many!
The amounts of time students spend on this class greatly vary, based on their backgrounds, and what they may already know. Some former students told us they spent about 40-60 hours on each homework assignment (we have 4 big assignments, and no exams), and some reported much less.

Именно с такого дисклеймера начался мой очередной курс в Georgia Tech OMSA. Курс назывался CSE-6242 и был посвящен визуализации и обработке данных. Домашние работы и правда отнимали львиную долю времени, но оно того стоило, разумеется. Это была супер-жесть, а не курс! Изначально, я хотел взять два (этот и еще один), но от второго пришлось быстренько отписаться, после того как я увидел программу CSE-6242.

На курсе мы освоили:
1. Обработку данных на Python и построение графа связей
2. Изучение библиотеки d3.js с нуля до вменяемых рабочих графиков (все хочу небольшой интро-курс сделать, но рук не хватает)
3. Облачные масштабируемые вычисления: Databricks, Google Computing, AWS
4. Методы машинного обучения: кластеризацию и классификацию.

Преподаватели Georgia Tech очень любят, чтобы домашние задания представляли собой не простые отработки моделей “fit-predict”, а состояли из алгоритмов, написанных с нуля с использованием самых базовых библиотек.

В финале курса был групповой проект, который мы выполняли с 5 студентами из разных стран: надо придумать задачу, где используются технологии инжиринга данных и машинного обучения на одном из огромных датасетов.
Мы придумали проект про создание EDA Tool, который берет датасет и выдает всю описательную статистику, в том числе для текстов. В моем идеальном представления это выглядело очень круто, на деле получилось прям совсем не очень. Видимо, за полтора месяца слепить MVP группой студентов оказалось тяжеловато.

Однако, в курсе было много полезных знаний и картинок (отправляю их вам) + супер полезные видео.
Из интересных результатов работы: кривая Retention из Игры в Кальмара на d3.js, много погружения в Scala, Spark. Короче, прошлись по современному датавизу и клауду “галоппом по европам“.

Итоговый результат: оценка A, клевый опыт, рабочие ноутбуки, остаточные знания d3.js.
P.S. А ниже картинка с напоминанием себе ряда слайдов из обучения.

#omsa #gatech
🔥2👍1
В последнем выпуске рассылки от Benn Stancil есть абсолютно прекрасный абзац с кучей ссылок на современные инструменты в области данных и аналитики, поэтому хочется прямо его процитировать как есть:

Instead, the front of the data stack is represented by an explosion of tools, all tacking in slightly different directions. There’s
traditional BI; there’s modern BI; there’s headless BI; there’s open-source BI; there’s Bitcoin-based BI. There are notebooks for analysis, notebooks for SQL, notebooks for collaboration, notebooks for apps, and apps for notebooks. There are data visualization tools, data visualizations for notebooks, and notebooks for data visualizations. There are SQL editors for teams, SQL editors for people who don’t want to write SQL, and SQL editors for Snowflake customers. There are collaborative workspaces, and tools that combine lots of things together. There are spreadsheets we can’t get rid of and spreadsheets replacing the spreadsheets we can’t get rid of; there are rebuilt spreadsheets; there are spreadsheets, but BI. And more of everything is coming.

#ссылка
😱9👍3🔥2😁2
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞

🧩 Список ежедневных дел пополняется
После оглушительного успеха классического Wordle и продажи игры за весьма приличную сумму, многие разработчики с фантазией стали следовать примеру мастера и создавать подобные игры. Теперь у нас есть русский Вордли (отчаянно советую создателю поработать над названием!), немецкий, французский, испанский (если вы знаете эти языки, конечно), Nerdle (угадать арифметическое выражение) и Three Magical Words (угадать фразу из трех слов с некоторыми подсказками). Хоть последний сильно отличается от оригинала, все эти игры отлично разминают мозг перед началом рабочего дня или на кофе-брейке!

🕸 Кажется, подключить всех людей к одной сети не получится
Если бы Facebook был человеком, то недавно он бы достиг совершеннолетия. А еще, впервые за свою 18-летнюю историю, в социальной сети снизился ежедневный поток пользователей: за последние три месяца примерно полмиллиона человек перестали заходить в фейсбук на ежедневной основе. Больше всего “отточных пользователей” в Африке, Латинской Америке и Индии. Новостные ресурсы пестрят заголовками “Мечты о подключении всего мира к одной соцсети мертвы“, однако, результаты, которых достиг Цукерберг и без того впечатляющи!

🥱 К чему приводит хронический недосып? (ни к чему хорошему)
В период пандемии многие люди стали гораздо сильнее заботиться о своем здоровье. Однако, если вы все еще отчаянный трудоголик и спите недостаточно много, то вот вам пугающий (он таким и должен быть) список крайне неприятных последствий недостатка сна. Тут и потенциальный набор веса, нездоровые зависимости, ухудшение памяти и многое другое. Высыпайтесь, друзья!

🎤 Секреты и тайны Apple Podcacts
Шон Холлистер заметил весьма странную закономерность. Во-первых, рейтинг приложения в App Store сильно вырос за последнее время, хотя в приложени не было никаких обновлений. Во-вторых, большинство пользователей в отзывах хвалят не само приложение, а сами подкасты, которые им нравятся. В итоге, у приложения невероятно высокий рейтинг, несмотря на то, что в нем куча мелких и крупных багов. А вам нравится приложение Apple Podcasts? Если нет, то какое приложение лучше?

👨‍🏫 Школьники, выдыхаем!
На Open AI вышел интересный материал про нейронную сеть, которую обучили для решения теорем из школьных олимпиад по математике. Модель учится на всех примерах, которые она успешно решила и постепенно справляется с более сложными теоремами. В общем, если вы учитесь (или преподаете) в школе, то можете попробовать воспользоваться таким красивым методом для решения домашек.

🪁 Бонус: Увлекательный комикс о том, как не жить от отпуска до отпуска, а быть счатливым всегда

#weekly #дайджест
👍4🔥4👎1
💣💥Мы узнали абсолютно все про рынок онлайн-образования в России (и спешим вам рассказать) 🚀
Как вы помните (а если не помните, то кликайте сюда), несколько месяцев назад мы проводили большой опрос по российскому рынку онлайн-образования. Сегодня мы наконец-то можем поделиться с вами результатами, выводами и инсайтами, которые, на наш скромный взгляд, получились весьма крутыми! Но, обо всем по порядку.
В нашем телеграм-канале мы собрали данные с помощью подробного анкетирования. После этого, не без помощи Романа Бунина, наша коллега Олеся структурировала информацию в дашборде Табло. В итоге, для тех, кто хочет быстро посмотреть на результаты на одной странице есть дашборд, а для тех, кому интересно увидеть все подробности, то ниже мы прикрепляем pdf-файл – презентацию результатов исследования, которой призываем делиться.

Короткий How-To к дашборду для самостоятельного изучения:
Дашборд разделен на две части: слева – панель фильтров, справа – результаты опроса.
Панель фильтров содержит информацию об участниках опроса и курсах. Каждая группа участников опроса из панели слева фильтрует данные и графики обновляются. Если вы хотите отменить фильтрацию – щелкните еще раз на ту же строку или обновите страницу для сброса всех фильтров.
На каждом графике (кроме графика с оценками) есть всплывающие подсказки, в которых указано количество участников, в выбранной категории.

Теперь мы с гордостью можем рассказать обо всем, что обнаружили:
◼️ Всего в опросе приняло участие 457 человек. Из них – 90% проходят/проходили онлайн курсы, 7% планируют пройти, 3% не проходили и не планируют. Весьма впечатляет! Но, на самом деле, тут нет ничего неожиданного, мы лишь подтвердили свою гипотезу о широкой распространенности онлайн-курсов.
◼️ Самые популярные направления образования среди участников – Аналитика данных (66%) и Data Science (19%). Самые популярные платформы – Яндекс.Практикум (30%) и KARPOV.COURSES (14%).
◼️ В качестве целей прохождения курсов чаще всего указывали «Получение новой работы» (49,5%) и «Получение новых знаний/навыков» (25%). Что касается достижения поставленных целей, то наши результаты абсолютно совпали с цифрой, которую получили Яндекс и ВШЭ в своем исследовании (учитывая совершенно разные выборки респондентов, это – удивительно!). У них 78% достигли целей после прохождения Практикума и у нас тоже 78%. Мы сильно удивлены и рады, что данные совершеннно репрезентативно описывают опыт прохождения онлайн-курсов в России.
◼️ Все участники, которые не планируют проходить онлайн курсы считают важным для профессионального развития опыт и практику в реальном бизнесе. Такое мнение тоже имеет право на существование, ведь эти два направления – теоретические знания и практический опыт – два столпа, на котором основывается человеческий капитал.
◼️ Подавляющее большинство участников относятся положительно к онлайн-образованию (даже среди тех, кто не планирует проходить онлайн курсы).

В данных еще можно найти множество более узких выводов. Однако, становится понятно, что стереотип о том, что онлайн-образование сильно уступает высшему образованию и “не котируется” в современном обществе постепенно отмирает. И это круто, потому что мир развивается, а онлайн курсы имеют ряд неоспоримых преимуществ, которые давно стоит перестать недооценивать!

Небольшой спойлер: совсем скоро вы также сможете послушать первый эпизод нашего свежего, но все еще секретного подкаста (пока не можем раскрыть всех деталей), в котором мы поговорим об онлайн-образовании с несколькими участниками опроса, а также с ведущими экспертами рынка!
🔥20👍64
Результаты исследования @leftjoin.pdf
3.9 MB
Результаты исследования рынка онлайн-образования аналитики данных

@leftjoin
👍57👎4
Ремарка об исследовании онлайн-школ по аналитике данных

Дискуссия по поводу исследования онлайн-школ оказалась оживленной — это объяснимо: мы громко заявили о себе, и с нас соответствующим образом спросили в комментариях.

Ключевое:
— я не делал это исследование по чьему-то заказу
— нет органа, который меня контролирует в этом опросе и говорит мне как правильно, а как нет
— я не планирую публиковать исследование в научном журнале и считать статистическую значимость различий в процентах на малой выборке.
Если вам это интересно — возьмите данные и ответьте на свои вопросы с учетом статистической значимости, вся информация доступна. Если вы не верите в результаты или не видите ценности в этой работе — окей, это ваше право. Я хотел и получил реальный срез рынка от студентов основных школ индустрии, поделился результатами с коммьюнити.

Почему я верю в результаты?
Я абсолютно убежден в адекватности результатов, поскольку мы (я и моя команда) выборочно лично общались с респондентами, вручную проверяли и отсеивали ряд анкет на этапе подготовки данных перед созданием дашборда.
Тем не менее, никаких гарантий. Может быть как на выборах: вбросы, карусельщики. Достоверных способов это определить у нас нет.
В софтверной разработке это называется as-is. Ответственность за использование результатов на вашей стороне. Для меня все выводы имеют большую ценность, и я еще раз убедился в ряде своих гипотез относительно школ и их выпускников.

Зачем я делал исследование?
Я нанимаю людей к себе в компанию и вижу проблемы с компетенциями ряда школ, скоро расскажу об этом голосом в подкасте. Я хотел узнать, что думают сами студенты о качестве образования.
Мне полезно понять как оценивают студенты эффективность трудоустройства, добились ли они своих целей, чем различаются школы в оценках между собой, насколько в них сложно учиться.

На все вопросы я получил исчерпывающие ответы и интересные истории учащихся, о которых скоро расскажем в подкасте.

P.S.
Спасибо энтузиастам и профессионалам за ценные замечания: аргументированные комментарии по делу принимаются с благодарностью!

P.P.S.
Каждый раз удивляет токсичность рунета, в этом полностью согласен с Димой Аношиным. Все так и есть: делаешь что-то полезное, полностью за свой счет, получаешь в комментариях хейт, переход на личности, хейт пораждает следующий хейт в виде частных мнений людей, тотально не вникающих в материал (на военной кафедре у нас это называлось ОБС — «одна бабка сказала»).
👍5213
Старенький, но прикольный тематический пост о том, как сделать диаграмму в виде сердца в Tableau. Актуально, чтобы порадовать свою вторую половину симпатичным датавизом ❤️ 🙂
👍19🔥5
В коммьюнити часто обсуждается тема как интересно переквалифироваться и стать аналитиком / дата саентистом, но, например, есть и другая сторона медали.

Недавно мне попался интересный пост на реддите, где чел рассуждает о том, что карьера дата саентиста крайне сложна и требует постоянного развития и улучшения навыков, просто чтобы оставаться "в игре". Автор пишет, что такая работа для него постоянный стресс и противопоставляет карьеру дата саентиста с водителем поезда / электрика, которые всего лишь каждый день выполняют свою работу. А дата саентист как будто всегда остается джуниором, если не улучшает свои навыки, потому что они регулярно устаревают.

Что думаете? Согласны ли с этим утверждением?
👍61
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞

🪄 Секреты мультипликации: как визуализировать сказку
Как человеку, незнакомому с киноиндустрией, а, тем более, индустрией анимации, мне всегда было интересно узнать, как много нужно времени, чтобы идея превратилась в яркую сказочную историю, как персонажи обретают мимику, движения и привычки, а самое главное, кто за этим всем стоит. И сколько вообще человек работают над созданием одного мультфильма? Всемирно известная компания Disney рассказывает о том из чего состоит мультфильм на общих данных и на конкретном примере – новом мультике Энканто. Например, в среднем, создание одного полнометражного мультфильма занимает от 3 до 5 лет!

👨‍💼 Как прийти на собеседование во всеоружии?
Как вы обычно готовитесь к собеседованию? Наверняка, как и многие, вы правите резюме, вспоминаете самые важные достижения и проекты, освежаете какие-то полезные знания, придумываете ответы на классические вопросы о планах и развитии в компании. Однако, потенциальный кандидат может также задавать вопросы и это скорее повысит его шансы получить должность, чем наоборот, ведь вы проявите интерес к компании и сможете понять, подходят ли вам существующие в ней условия работы. Напимер, следует уточнить есть ли в компании дресс-код, возможности для повышения квалификации на курсах, как выстроена внерабочая коммуникация, есть ли бюджет на посещение конференций и многое другое.

⚙️ Настройки и зачем они нужны
Иногда в приложениях пользователю нужно настроить слишком много всего для удобного использования, потому что дизайнеры поленились и не смогли выяснить, какие именно расположение элементов, цвета и функции должны быть в финальной верстке. И отправили все эти функции в настройки, мол, сами решайте. Дизайнер из Linear рассуждает на тему того, нужны ли на самом деле пользователю настройки и, если коротко, то да, нужны. Дело в том, что часть настроек продукта, действительно должна быть продумана по умолчанию, однако, другая их часть отвечает за соответствие личным предпочтениям. Именно благодаря этим настройкам мы можем установить светлую или темную тему и поставить любимую картинку на заставку, подстроив приложение “под себя“.

👨‍🎨 Мона Лиза и разработчики
Разработчики программного обеспечения, всегда стремятся к улучшению всех используемых инструментов, но вот шрифт… Он всегда остается “за кадром“. Тем не менее, разработчики проводят большую часть наших дней, глядя на экран, читая и создавая код (который, разумеется, написан определенным шрифтом). Использование обычного Times New Roman может негативно сказаться на производительности программиста и даже привести к ошибкам, поэтому и был придуман идеальный шрифт MonoLisa. Все её особенности и преимущества описаны на сайте создателей, на сам шрифт и его модификации (например, курсивную версию) можно посмотреть там же.

📺 Убыточный формат рекламы (или нет?)
Трое ученых из разных университетов объединились, чтобы провести большое исследование рекламы на телевидении. Они выяснили, что почти треть телерекламы вещает о преимуществах нового пылесоса или удивительного Nespresso в совершенно пустых комнатах, а зрители в четыре раза вероятнее уйдут из комнаты (за вафелькой), чем переключают канал. К огромному сожалению для рекламодателей, ценообразование на рекламу зависит от того, на скольких телевизорах включен определенный канал, а не от того, смотрят ли люди в эти телевизоры на самом деле. В исследовании, конечно, в разы больше полезных выводов о поведении человека во время рекламной паузы, что лучше его удерживает у экрана телевизора, а что хуже (спойлер: реклама лекарства от изжоги).

#weekly #дайджесто
👍9🔥4👎2🥰2
Влюблены в аналитику? VK подготовил для вас что-то крутое :)

26 и 27 февраля компания проведёт Weekend Offer по двум направлениям: экосистемной и продуктовой аналитике. А теперь коротко, но подробно, чем занимаются ребята в Data Office:

• Экосистемная аналитика. Вы можете погрузиться в мир growth hacking, исследований и формирований гипотез для роста, разбор в кросс-девайсном и кросс-продуктовом матчинге при работе с сервисами VK.
• Продуктовая аналитика. Это про формулирование гипотез, проведение исследований и A/Б-экспериментов, настройку аналитических мониторингов и отчётов. Ну и, конечно, вместе с командой вы будете запускать фичи внешних и внутренних сервисов экосистемы. Звучит круто!

Аналитики, интересно? Тогда, не пропустите — у вас появилась возможность поменять работу всего за два дня. Успейте отправить заявку на участие до 25 февраля. Удачи!
#реклама
👍5
Любопытный пост на Observable и симпатичный график-гантелька о том, какие слова лучше знают мужчины, чем женщины (и наоборот). Признаться, большинства слов из списка не знаю, ну разве что кроме checksum, разумеется. 🙃
Такой же чарт есть про сравнение знания слов в UK и US.
👍1