LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞

💸 Больше никаких фраз “зарплата по итогам собеседования” (пока только в Нью-Йорке)
Поиск работы с каждым днем становится все более сложной задачей: требования к кандидатам растут, вакансий все меньше, а соискателей все больше. Еще сильнее дело усложняется тем, что часть вакансий публикуются без указания ожидаемой зарплаты на старте работы или хотя бы зарплатной вилки. Люди проходят несколько кругов изнурительных собеседований, а затем узнают, что зарплата вообще не соответствует их ожиданиям. И вот, на радость всем желающим найти новую работу, власти Нью-Йорка приняли закон, который запретит публикацию любых вакансий без указания уровня зп, начиная с апреля 2022. Да пребудет с вам открытая информация, Нью-Йоркцы.

😷 Очередная новость про коронавирус
Почему это нас интересует? Конечно, новость не касается исследований болезни, новых вакцин или симптомов (такие темы поднимать сейчас вообще стало опасно!). Однако, если на эпидемию коронавируса смотреть с аналитической точки зрения, то открывается безграничный простор для визуализации данных. В заметке с Medium вы можете увидеть очень нашумевший в Twitter график количества заражений Covid-19 в США. Точнее, целых три версии этого нестандартного спирального графика. Советую присмотреться к такой идее для визуализации временных рядов, выглядит классно! Если хотите узнать, как построить такой график – мы за вас уже погуглили.

🚗 Машина, которая зарабатывает деньги на оплату парковки
Недавно мир наконец увидел первый прототип трехколесного автомобиля Daymak Spiritus, который майнит биткоины во время парковки. Вау! Постарайтесь не думать о собственной бесполезности, потому что эта машина, в отличие от всех нас, зарабатывает пока отдыхает.

🏆 Лучшие исследования в Computer Science
Срочно повышаем уровень собственной осведомленности о событиях в мире, а конкретно – в науке. Джефф Хуанг проделал большую часть труда и отобрал лучшие исследования в теме computer science за 2021 год. Осталось лишь выделить несколько интересных вам статей и прочесть их – вот вам и продуктивный отдых (почти как у машины Daymak Spiritus).

🧠 А думать-то как?
На самом деле, об исследованиях в области искусственного интеллекта не может быть и речи без понимания, как именно мыслит человек. Поэтому Дэвид Чапман посвятил этой теме много лет своей жизни и написал эссе обо всех нюансах мышления. «Учитесь в областях, сильно отличающихся от привычных для вас. В каждой из них есть методы изучения новой информации, которые могут быть полезны в самые неожиданные времена. Научитесь думать как антрополог, психолог или философ, и это крайне сильно разовьет вашу способность размышлять», – пишет Дэвид и трудно с ним не согласиться.

#weekly #дайджест
👍92
🎮Wordle – игра, которая быстро завирусилась, а потом собрала волну хейта 🔥
То ли дело в праздничных выходных, то ли это просто удачное стечение обстоятельств, то ли гениальные навыки автора идеи (а может и все вместе), но в начале января за считанные дни игра Wordle набрала огромную популярность. Скорее всего, повлиял тот факт, что создатель в первую очередь отталкивался от собственных желаний, создавая игру для себя и своей подруги. Так ведь часто получаются самые лучшие продукты.

📝 Что это за игра такая?
Суть игры простая – нужно угадать слово из 5 букв за 6 попыток. Если вы угадали букву и место, на котором она должна быть – она становится зеленой, если только букву – желтой, а если такой буквы в слове нет, то она станет серой. Игра разработана только в веб-версии, является бесплатной и в ней можно угадывать по одному слову в день. Никакой рекламы, только искреннее желание угадать слово, поделиться этим в соцсетях и заставить шестеренки в голове скрипеть 💭

🥷 Без скандала – никуда!
С этой популярной игрой уже (конечно же) случился скандал. Другой разработчик Зак Шеккед взял и скопировал ее, создав приложение для iOS + добавил платные фичи. За что он потом и поплатился. Людям, конечно, хотелось бы разгадывать больше слов в день и на этом разработчик и сыграл, однако все не так просто. Компания Apple удалила приложение спустя пару дней , а на Шеккеда обрушилась волна хейта, ведь приложение любили за его доступность и отсутствие рекламы. К слову, игру реплицировали на русском языке, пока без происшествий.

🎯 И причем тут аналитика?
Лично меня игра привлекла тем – каким алгоритмом ее оптимальнее решать. Я даже задумался его писать, но потом понял, что нет смысла изобретать велосипед – такая статья уже есть.

Голосуйте, нужен ли перевод этой статьи в нашем блоге или достаточно оригинала на английском?
👍13
Нужен ли перевод статьи с алгоритмом прохождения Wordle?
Anonymous Poll
65%
Хочу перевод!
35%
Все прочитал на английском и понял
Forwarded from Yandex Cloud
Как можно получить максимум от данных из CRM-системы? Обработать их с помощью функций и проанализировать с помощью Yandex DataLens.

В нашем блоге на vc.ru команда дата-аналитиков из Valiotti Analytics делится своим опытом →

#yacloud_news
👍2
Использование регулярок в SQL
Как найти телефонные номера в столбце данных? А e-mail адреса? На помощь приходят регулярные выражения. Понятно, что их можно изучать и отдельно и хорошие референсы я уже давал в канале, но что если регулярные выражения хочется использовать в SQL-запросе? Разбираем несколько типовых примеров в свежей статье в блога LEFT JOIN!
🔥7
Десять open-source альтернатив вашему Google Analytics

На hackernews был интересный тред, где спрашивали про различные open-source аналоги для Google Analytics. Мы изучили тред и делимся находками. Описание — компиляция заявленного на сайтах платформ + собственное мнение.

PostHog — наверное, самая известная и нашумевшая сейчас платформа для продуктовой аналитики, анализа воронки, записи сеансов, пометок функций и многого другого.

GoatCounter — удобная платформа для веб-аналитики без отслеживания личных данных пользователей. Бесплатна для некоммерческого использования.

Piwik — достаточно олдскульный уже инструмент для анализа пути клиента по веб-сайтам и приложениям. Вновь важной частью является акцент на конфиденциальность пользователей и безопасность данных и отказ от продажи данных третьим лицам.

Plausible — инструмент, который не использует cookie и полностью соответствует GDPR, CCPA и PECR. Гораздо быстрее, чем Google Analytics (как заявляют создатели: скрипт в 45 раз меньше), а, значит, сайт с 10 000 посетителей в месяц может сократить выбросы CO2 на 4,5 кг в год за счет перехода.

Matomo — 100% точные отчеты, рекомендации от службы поддержки, которая отвечает очень быстро а также возможность импортировать данные GA непосредственно в свой Matomo. Нет ограничений на количество сайтов, пользователей, сегментов и объем хранимых данных.

Open Web Analytics — полностью бесплатная платформа веб-аналитики, которая позволяет вам строить аналитические дашборды, изучать тепловые карты кликов пользователей и изучать сведения об использовании любой веб-страницы, включая предыдущие и следующие просмотренные страницы.

Countly — аналитическая платформа для понимания и оптимизации пути клиентов в веб-приложениях, настольных и мобильных приложениях. Countly можно установить локально или в безопасном частном облаке. В любом случае вы сохраняете 100% права собственности на собранные данные и получаете прямой доступ к детализированным необработанным аналитическим данным о продукте.

Umami — простое и удобное в использовании решение для веб-аналитики с собственным хостингом. Цель состоит в том, чтобы предоставить вам более удобную, ориентированную на конфиденциальность альтернативу Google Analytics и бесплатную альтернативу платным решениям с открытым исходным кодом. Umami собирает только те показатели, которые вам интересны, и все умещается на одной странице.

Ackee — аналитический инструмент на основе Node.js для тех, кто заботится о конфиденциальности. Работает на вашем собственном сервере, анализирует трафик ваших сайтов и предоставляет полезную статистику. Позволяет анализировать столько доменов и приложений, сколько вы хотите. Интерфейс Ackee поможет вам оставаться сосредоточенным, не путаться в сотнях диаграмм и параметрах фильтрации.

Fugu — аналитический инструмент с платной (managed version) и бесплатной (self-hosting) версией. Как и все остальные, Fugu не отслеживает какую-либо личную информацию пользователей. Fugu создан для людей, которым не нужны причудливые инструменты аналитики продуктов, но которые предпочитают набор простых в использовании функций сложному пользовательскому интерфейсу. Fugu полностью финансируется исключительно из собственных средств. Единственным источником дохода является абонентская плата в размере 9 долларов США в месяц за сервис с поддержкой.
👍15
Не пора ли менять стандарт SQL?

На глаза попалось несколько ссылочек на эту тему:

1. PRQL — Pipelined Relational Query Language. Его идея в том, чтобы представить обращение к базе данных как логически выстроенный пайплайн трансформаций.
Например, вместо такого запроса
SELECT TOP 20
noscript,
country,
AVG(salary) AS average_salary,
SUM(salary) AS sum_salary,
AVG(salary + payroll_tax) AS average_gross_salary,
SUM(salary + payroll_tax) AS sum_gross_salary,
AVG(salary + payroll_tax + benefits_cost) AS average_gross_cost,
SUM(salary + payroll_tax + benefits_cost) AS sum_gross_cost,
COUNT(*) as count
FROM employees
WHERE salary + payroll_tax + benefits_cost > 0 AND country = 'USA'
GROUP BY noscript, country
ORDER BY sum_gross_cost
HAVING count > 200


запрос на PRQL будет выглядеть так:
from employees
filter country = "USA"
let gross_salary = salary + payroll_tax
let gross_cost = gross_salary + benefits_cost
filter gross_cost > 0
aggregate by:[noscript, country] [
average salary,
sum salary,
average gross_salary,
sum gross_salary,
average gross_cost,
sum gross_cost,
count,
]
sort sum_gross_cost
filter count > 200
take 20


ИМХО, не выглядит существенно удобнее / читаемее. А вы как считаете?

2. Malloy — другая попытка заменить SQL от Looker (однако есть примечание, что этот эксперимент без поддержки Google).
Запрос выглядит вот так:

query: table('malloy-data.faa.flights') -> {
where: origin: 'SFO'
group_by: carrier
aggregate: [
flight_count is count()
average_flight_time is flight_time.avg()
]
}


В общем, резюме: каждая метла метет по своему 🥸

А как вам эти варианты замены SQL, что думаете?
👍10👎5
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞

🎰 Wordle продолжает захватывать мир
Популярность игры в слова с крайне простым интерфейсом бьет все рекорды, блоггеры и не только хвастаются результатами в сети (особенно, в Twitter), а аналитики собирают статистику, строят графики и анализируют игру и игроков вдоль и поперек.

📉 Лучшая новость для студентов и начинающих аналитиков (и не только)
Возможно, вы уже слышали о библиотеке Faker, но мы все-таки расскажем. Эта библиотека позволяет сгенерировать нужные вам случайные данные для разработки, учебных проектов и вообще любых целей, кроме, пожалуй, научных и исследовательских. Она доступна на языках Ruby, Python, Java, Clojure, PHP, и C#. Наконец можно не искать данные по всем открытым ресурсам в надежде, что они ответят всем нужным условиям, а самостоятельно создать датасет с именами, адресами, ID, телефонными номерами, местом работы человека, кредитными данными, датой, временем, email адресами и еще много-много чем.

💻 Вы точно знаете CSS?
На просторах интернета появился хороший тест из 10 вопросов на знание селекторов CSS. Для новичков есть подсказки из документации, а профи могут проверить себя на скорость, так как на сайте есть таймер.

💸 Утопия, в которой каждый получает базовый доход и все счастливы
Есть мнение, что если всем людям будут выплачивать базовый доход, то большинство людей не будут работать совершенно. Свежее исследование, к счастью, это опровергает. Группа психологов из университета Лейдена, которые занимаются поведенческими экспериментами провели серию исследований. Они показали, что гарантированный базовый доход дает людям возможность найти работу, которая лучше всего соответствует их предпочтениям, мотивации и способностям. В итоге, появится возможность найти лучшее соответствие между желаниями работодателя и работника, ведь люди реже бы оставались на нелюбимой работе только ради зарплаты. Win-win situation, однако, такое пока что возможно только в какой-нибудь чудесной богатой европейской стране.

📝 Вопрос, который пока остается без ответа
Поиск работы – неприятный процесс для любого соискателя. Нужно много раз отправить резюме и сопроводительное письмо, а иногда заполнить с нуля всю информацию на сайте работодателя. Автор этого поста попытался структурировать свое CV, чтобы его было удобно читать и парсить, ведь хочется упростить не только подачу заявок на работу, но и их последующую обработку и быстрее получать четкий и понятный ответ. Как именно это делать пока не ясно, но поскольку вопрос остается открытым, вы можете поучаствовать в дискуссии и предложить свой вариант или просто поделиться мнением.

#weekly #дайджест
👍18🔥1🤩1
Добро пожаловать в мир главного ит тренда - машинного обучения: @machinelearning_ru

В канале вы найдет :
📃Статьи ,
📚Книги
👨‍💻 Код
🔗Ссылки

и много другой полезной информации
#ArtificialIntelligence #DeepLearning
#MachineLearning #DataScience
#Python

1 канал вместо тысячи учебников и курсов 👇👇👇

🤖 @machinelearning_ru
3
🧠 Давайте вместе разберемся, как решать задачки Wordle в Python

Про Wordle вы наверняка слышали уже много раз, многие в него играют, кто-то пытается изучать и исследовать (об этом мы писали вчера в дайджесте). Поскольку большинство из вас проголосовали за перевод статьи про решение Wordle, мы прислушались и опубликовали перевод в нашем блоге.

Читайте, пробуйте повторить для русского языка и не стесняйтесь задавать вопросы в комментариях, если что-то остается непонятным! 😎
👍6
Как-то рассказывал про Mprove.io на одном из мероприятий, посвященным стартапам в СПб. После мероприятия познакомился с очень интересным предпринимателем из списка Forbes 30 Under 30, CEO компании Narrative BI (кажется, писал ранее об этом инструменте) и основателем стартап-платформы founders.ai — Михаилом Румянцевым.

Оказалось, что Михаил ведет свой телеграм канал Start and Win, на который я подписан, в нем реально масса полезных советов для начинающих предпринимателей. Поэтому подписавшись, вы получите полезный контент для основателей стартапов, венчурных и частных инвесторов и всех, кто мечтает начать собственный бизнес.

Если вы хотите больше узнать о том, как строят компании в Кремниевой Долине, и посмотреть на венчурный и публичный рынок глазами инсайдера - велком в канал к Михаилу! 🙂

@startandwin
👍6
Не могу не запостить😄

via @datanature
👍42🔥25😁23
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞️

💈Новая игра! Повелись? Все ещё новости про Wordle
Дни идут, недели сменяются, но Wordle – это уже классика нашего дайджеста (в блоге даже есть статья о решении Wordle с помощью Python). Так вот, в понедельник The New York Times купили игру Wordle у создателя - программиста Джоша Уордла - за скромную семизначную цену (не меньше миллиона долларов). Самое интересное в этой истории – ее цикличность: Уордл сказал репортеру Times, что он создал Wordle после того, как они с девушкой подсели на кроссворды The Times и игру Spelling Bee во время пандемии. Теперь Wordle тоже в числе этих игр 🎲

🧠 Опровержение метода ‘мозгового штурма
Перед вами исследование теории “мозгового штурма“, которое провел Мэтью Стром. Оказалось, что этот метод был впервые использован в середине прошлого века, а также описан Алексом Озборном в книге “Your Creative Power” во всех своих положительных чертах. На самом деле, метод работает далеко не всегда и иногда может загубить стоящие идеи. Только в случае, когда в группе построено психологически безопасное пространство, “мозговой штурм” может сработать, как случайно и получилось в эксперименте Озборна, поскольку в 1940е годы иметь хоть какую-то идею было уже весьма почетно.

📉 И маркетплейс, и инструмент для аналитики
Теперь продавцы товаров на Ozon могут получать аналитические отчеты по обороту в своей категории товаров. Помимо просмотра показателей собственного товарооборота, у каждого продавца есть возможность отследить место, которое они занимают по заработку среди конкурентов и как эта позиция меняется. Все данные, конечно, обезличены и часто предоставляются в агрегированном виде: средний оборот в категории, средний оборот среди 5% и так далее. Такой ход наверняка усилит конкуренцию между участниками маркетплейса и заставит их прилагать больше усилий для повышения позиции в рейтинге.

💡У вас появилась идея. Что дальше?
Для начала стоит разобраться в том, что такое идея и она ли это. Может, это просто мысль? Затем стоит задуматься о её дополнении и, что самое важное, о том, как объяснить идею другим. Все это (а также наглядные примеры работы с идеями) есть в увлекательной статье Марка Полларда, которую стоит посмотреть даже если ваша работа/деятельность никак не связана с генерацией идей.

#weekly #дайджест
👍4
Одна из самых ключевых стадий стартапа — поиск так называемого product / market fit. Об этом, например, интересно рассказывают в различных акселлераторах. Однако часто команды не могут создать ценность или найти этот самый product/market fit. Но если это произошло, наступает фаза роста, а для нее нужны деньги и значит придется идти к инвесторам. Кому дают деньги, а кому нет? Об этом расскажет Андрей Торбичев, партнер инвестиционного фонда Месторождение (группа ТилТех), автор канала Индекс дятла.

У каждого инвестора свой подход и инструменты оценки. И все же есть несколько вещей, на которые смотрят все:

1. Рынок. “Главное — правильно выбрать стол”, — говорил Тони Шей, основатель Zappos. Если потребителей мало, не имеет значения насколько круто выстроен ваш продукт. Он просто не сможет расти. И да, если вы показываете нишевое решение, придётся убедительно объяснить, как сможете выйти из ниши. В России интересны рынки, где есть хотя бы 10 млрд.+ рублей.

2. Конкуренты и преимущество. Если есть рынок значит есть и конкуренты. У кого вы будете отбирать клиентов и за счет чего — вот два вопроса, которые волнуют инвесторов. Обычно мы видим таблички с кучей галочек, где приводятся сравнения разных решений. Лучше выбрать трёх главных конкурентов и выделить ОДНО, но сильное преимущество перед ними.
🌳Свежак — исследование Sequoia о компенсациях в США. Помимо того, что там красивые, приятные графички, есть интересные наблюдения:

1. Распределение зарплат у женщин смещено в левую (более низкую) сторону, чем у мужчин (куда же смотрит ваш chief diversity officer?)
2. Самый большой разрыв между мужчинами и женщинами в финансах технических компаний.
3. В BI, аналитике и Data science ЗП женщин растут, а у мужчин нет (ах, вот куда смотрел Chief Diversity officer)
4. А вот с точки зрения цвета кожи белые люди растут в заарплате в Продуктах и дизайне и Административном управлении в сравнении с цветными людьми.
😁4