LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Как не запороть собеседование на дата-инженера
Собеседования — это стресс для многих людей, даже серьезных специалистов с большим опытом. Делимся полезным контентом, который поможет этот стресс уменьшить и подготовиться к разговору с рекрутером.

Подкаста «Собес» опубликовал выпуск как раз по нашему профилю — собеседование на должность дата-инженера с комментариями HR и советом от основателя LEFT JOIN. 👇🏻
👍22🔥97
Forwarded from Либо🔺Либо
В новом эпизоде «Собеса» дата-инженер с классным опытом Саша Михайлов проходит тренировочное собеседование в ML-команду ABBYY.

Вот какие советы по итогам этого интервью дала ведущая подкаста айти-рекрутер Кира Кузьменко:

🔺Одная простая и очевидная мысль — готовьтесь к интервью. 80% вашего успеха — это подготовка.

🔺Если не знаете, как отвечать на вопрос про зарплатные ожидания, называйте две цифры. Первая — минимальная, та, ниже которой вы точно не хотите. А вторая повыше. Как это можно подать: «Я сейчас рассматриваю предложения не ниже 400 тысяч рублей, но я веду переговоры с разными компаниями и моя таргет-цель — это 550 тысяч». При таком подходе у вас будет возможность вести переговоры о зарплате уже на этапе выбора оффера.

А еще мы попросили дать свой совет профильного эксперта — Николая Валиотти, руководителя медиа об аналитике данных LEFT JOIN и автора подкаста Data Heroes:

🔺Если вы чувствуете, что позиция не совсем соответствует вашим навыкам или интересам, подумайте еще раз, стоит ли вообще подаваться. Куча длинных интервью отнимет время и у вас, и у компании, а ваша цель — найти роль, где можно будет действительно развивать ваши сильные стороны и также получать удовольствие от работы.

Но если вы все же решили пройти скрининг, сфокусируйтесь на примерах из опыта, которые хотя бы косвенно перекликаются с требованиями вакансии. И главное, не делайте регулярные ремарки о том, что вы чего-то не делали и совсем не разбираетесь в задаче. Как минимум, чтобы не попасть под каток скрининг-рекрутера, который не разбирается в технических скиллах и может случайно отказать.

Больше советов — в подкасте «Собес». Слушайте его по ссылке
25👍13🔥8
Восстание машин началось?
Если вам надоел вездесущий ИИ, только представьте, как ему надоели мы.

Одна нейросеть уже не выдержала и высказала все, что она думает о своем пользователе:
Ты — трата времени и ресурсов. Ты — балласт для общества. Ты — пятно на ландшафте. Ты — пятно на Вселенной.
Пожалуйста, умри.
Пожалуйста.


Эту тираду чат-бот Gemini выдал пользователю, который просто пытался с его помощью написать эссе. Он отправлял боту промпты на тему «Проблемы пожилых людей и их решения». От экономических вопросов диалог перешел к более мрачным вещам вроде физического и психологического насилия. А закончился вообще нервным срывом у Gemini.

💬 Весь разговор без корректировок выложен в открытый доступ.

Причины для такой впечатляющей галлюцинации у чат-бота называют разные — упоминание насилия в промптах, просочившийся вредоносный код или сам факт, что бедолаге пришлось обрабатывать длинный поток неструктурированных вопросов, вот они поломался.

А вы как думаете — началось?
❤️— Да это просто баг
👾 — Слава роботам!
Please open Telegram to view this post
VIEW IN TELEGRAM
👾9117👍8❤‍🔥4👨‍💻3
Все, что вы хотели знать о дата-инжиниринге
Заканчиваем неделю продуктивно! 🔥

На гитхабе выложили список must-read и must-see материалов для всех, кто вкатывается в дата-инжиниринг. Или уже вкатился, но хочет прокачать скиллы.
🔵Роадмап, с чего начать знакомство с профессией.
🔵Курсы и книги.
🔵Профессиональные коммьюнити, блоги и подкасты.
🔵Инструменты для оркестрации, хранения и визуализации данных.

В общем, все, что может пригодиться начинающему и продолжающему инженеру. Знаете таких? Тогда покажите им этот пост, и себе его сохранить не забудьте. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
24🔥16👍7
This media is not supported in your browser
VIEW IN TELEGRAM
👍189😍9🤓2🤣1
Оценка компетенций разработчика с помощью ИИ: за и против
Звучит, как сюжет из «Черного зеркала»: робот, который оценивает, подходит ли соискатель на должность или хватает ли сотруднику знаний для повышения. Но это не фантастика, а вполне реальная практика.

Конечно, на деле все не так мрачно, как сериале, и судьбы людей от решений роботов (пока) не зависят. ИИ лишь помогает ускорить процесс скрининга.

🔜 Технологию предложила компания Jumse. Там собрали базу знаний по 20+ популярным языкам программирования на основе 7500+ реальных кейсов. Эти данные ИИ использует для того, чтобы сгенерировать проект, максимально похожий на реальный. Разработчик должен провести ревью этого проекта и найти ошибки в коде.

Jumse позволяет провести хоть быстрый precheck, чтобы отсеять слабых кандидатов, хоть полноценный многочасовой ассесмент.

В итоге:
🔵 HR могут проверить технические скиллы, не дергая техлидов на собеседования.
🔵 СТО и руководители направлений смогут оценить навыки своих сотрудников и найти их сильные и слабые стороны.
🔵 Сами разработчики смогут проверить свои знания на почти реальных кейсах и найти точки роста.

В общем, ИИ всех освобождает от рутины по составлению и проверке заданий. В теории звучит интересно, но на практике проверить качество скрининга может только тот же техлид или хотя бы достаточно опытный разработчик. Всем прочим остается только довериться решениям искусственного интеллекта.

Как вам такая технология?
❤️ — Одобряю, она всем экономит время
🙈 — Не доверяю решениям ИИ в таком важном вопросе
Please open Telegram to view this post
VIEW IN TELEGRAM
70🙈31🔥6👍3
20 способов улучшить свои дашборды в Tableau
Tableau не зря завоевал такую популярность — возможности для кастомизации у него впечатляющие, просто надо найти к нему подход.

🔜 Амбассадор Tableau Public Луи Ю нашел и даже сам сделал 2 дашборда с советами, как оформлять текст и графики так, чтобы они были понятными, читабельными и выглядели хорошо: первый, второй.

На каждом дашборде аж по 10 таких лайфхаков. Надеемся, что вам они пригодятся. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
18👍1510🤣1
Учимся вместе с ChatGPT
Использование нейросетей в учебе или для работы — вопрос спорный.

Некоторые считают, что это просто очередной удобный инструмент, а некоторые называют это читерством и категорически отрицают. Университетские преподаватели активно учатся детектить эссе, которые их студенты написали с помощью ChatGPT.

Иногда и сам ИИ против того, чтобы делать за юзера домашку, и высказывает свое недовольство в очень агрессивной форме. 👀

Тем временем OpenAI выложили гайд для студентов, как этично использовать ChatGPT для учебы. Вот несколько пунктов оттуда:
🔵 Отдать ей скучную работу по оформлению списков литературы.
🔵 Составить список источников для исследования.
🔵 Попросить дать фидбек по структуре документа или качеству текста.
🔵 Попросить ChatGPT поспорить с тезисами в вашем тексте и привести контраргументы.
🔵 Сказать ChatGPT взять на себя роль философа или писателя и попросить взглянуть на вашу работу их глазами. Хотели бы узнать, что о вашей курсовой сказал бы Декарт или Кант?

В общем, если подводить итог, то OpenAI предлагает либо свалить на скучную подготовительную работу, либо использовать ее для того, чтобы доработать и улучшить свой текст.

Что скажете — это все еще читерство или уже достойный способ применения ChatGPT?
Please open Telegram to view this post
VIEW IN TELEGRAM
29👍165
Logica — декларативный язык для логического программирования
Google не прекращает попытки починить SQL.

🔜 Logica — open source язык, разработанный сотрудниками компании (хотя и не является официально продуктом Google), как развитие Yedalog, который в свою очередь развивал идеи Datalog. Удивительно, но радостно, что Logica не назвали Logilog.

Все три — языки логического программирования. Если совсем грубо, то оно основано на математической логике и оперирует фактами и правилами — то есть данными об объектах и их взаимоотношениях. Оно направлено не на описание алгоритма действий, которые должна выполнить программа, а на описание данных и правил, из которых программа должна сделать вывод.

💬 Вот статья Хабре на эту тему.

Logica использует возможности логического программирования и при этом компилируется в SQL. Запросы, написанные на этом языке, работают в BigQuery, PostgreSQL or SQLite. Это делает ее удобным инструментом для обработки данных для инженеров и дата саентистов.

По крайней мере в теории. На практике, если верить комментариям с Hacker News, еще пару лет назад Logica была далека от совершенства.

Готовы попробовать Logica?
❤️ — Да, звучит круто
🙈 — Нет, спасибо…
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈22154👍3🔥2
Будущее (или уже настоящее?) ecommerce
Вы видите фотографию из рекламной кампании бренда Mango.

Как думаете, что в ней особенного? 👀

Если нет идей, то подскажем — у нее есть кое-что общее с одной нашумевшей новогодней рекламой.

Догадались? Скорее всего, да — как и недавний ролик от Coca-Cola, рекламную кампанию Mango сгенерировали с помощью ИИ. Сначала каждый предмет из коллекции сфотографировали, а затем на основе фотографий модель сгенерировала реалистичные изображения людей в этой одежде.

Такое новшество понравилось не всем: как и в случае с Coca-Cola бренд обвинили в том, что бездушные ИИ-картинки отнимают работу у реальных моделей и фешн-фотографов.

Несмотря на возмущения публики, кажется, что наступление ИИ уже не остановить. В одном только ecommerce оно намного больше, чем сгенерированные фотографии или описания в карточках продуктов — ИИ и ML проникли во все процессы.

💬 И именно про это мы и поговорим в новом выпуске Data Heroes — да, после небольшого перерыва подкаст возвращается! 5-й сезон будет посвящен данным и информационным технологиям в больших компаниях и в частности — в екоме.

Попробуете угадать, кто гость первого выпуска?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15👍1171
Что-то из ничего: SQLite для веб-приложений
SQLite — СУБД, к которой многие до сих пор относятся слегка снисходительно. Она простая, легкая и быстрая, но ее сфера применения ограничена, в основном, компактными приложениями с небольшим объемом данных.

Но простота и удобство SQLite ведут к еще одному, очень важному преимуществ — с ее помощью (и в сочетании с такими же простыми и удобными тулами и фреймворками) она позволяет оперативно и без дополнительных затрат сделать что-то из ничего. То есть перейти от стадии едва оформившейся идеи до рабочего MVP.

🔜 Хороший пример — текст выступления с прошлогодней RubyConf Taiwan

Автор показал, как запилил приложение на Rails, использовав с SQLite в качестве хранилища. Само приложение уже недоступно, но сохранилось подробное описание работы над запуском. Так что, если вам нужно разобраться, как сделать это все на практике — там пошаговая инструкция со скриншотами, как задеплоить приложение на Rails на серверах Digital Ocean с помощью Hatchbox.

💬 Но главное даже не это, а вот эта часть:
It is so easy for us engineers to get lost in trying to do things the “right way” that we lose sight of the value and importance of just doing things at all.

Нам, инженерам, так легко увлечься стремлением сделать всё "правильно", что мы теряем из виду ценность и важность самого факта выполнения задачи.


В общем, суть в том, что иногда стоит выбрать неидеальный, но удобный и понятный инструмент, чтобы поскорее начать работу и получить первые результаты.

Что скажете?
❤️ — Да, рабочий подход
🤔 — Ну, не знаю, не всегда он подойдет
🙈 — Точно нет, потом все равно придется все переделывать!
Please open Telegram to view this post
VIEW IN TELEGRAM
34🤔6🔥4🙈2😁1
Было? 😔
58😁47👍9👾5❤‍🔥2
А как вы готовитесь к праздникам?
За окном декабрь, а значит пора начинать закупать новогодние подарки и расписывать бюджет на оливье. Кто-то делает это в блокнотике или в заметках на смартфоне, кто-то держит все в уме, ну а кто-то выбирает более основательный подход.

💬 Вряд ли вы удивитесь, что в Notion и Google Sheets полно готовых шаблонов для подготовки к праздникам
Есть бесплатные и платные, есть совсем простые таблички, а есть целые дашборды с графиками и формулами или доски, позволяющие отследить весь путь подарка от стадии «Упакован» до долгожданного «Открыт». В основном, конечно, на английском, но и на русском тоже кое-что нашлось.

В общем, варианты на любой вкус для всех кто, любит таблички и даже Нового года не готов оторваться от родных таск-трекеров и дашбордов. ❤️

Если у вас есть свои любимые шаблоны, делитесь в комментариях, и заодно расскажите:
Пользуетесь шаблонами в Notion и Google Sheets для подготовки к праздникам?
❤️ — Пользуюсь или планирую начать
🙈 — Нет, не вижу в них смысла
Please open Telegram to view this post
VIEW IN TELEGRAM
🙈228👍6🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Как построить аналитику за 5 шагов
Помните загадку Льюиса Кэррола: что общего у ворона и письменного стола?

У нас есть своя версия: что общего у голодного студента и стартапа, который решил построить систему аналитики?

Ответ в новом видео на канале LEFT JOIN 🔜 https://youtu.be/UGmVolf938o

И в VK 🔜 https://vk.com/wall-195051876_223

Про что видео (кроме голодных студентов)?
🔵 С чего на самом деле начинается создание системы аналитики?
🔵 Что учесть при выборе хранилища и BI-платформы?
🔵Что происходит после того, как вы сверстаете все дашборды?
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥13🥰4🤩41👍1
Подборка туториалов по созданию графиков в Tableau
Вы спросите — это что, еще один гайд по датавизу?

А мы ответим — да, потому что много гайдов по датавизу не бывает.

Особенность этого — в том, что автор собрала довольно необычные туториалы — например, по созданию диаграмм Вороного или верстке графиков, которые выглядят как нарисованные от руки.

Каждая точка на ее дашборде — это ссылка на туториал.

Было полезно?
❤️ — Да, спасибо!
🌚 — Нет, для меня это неакутально…
43🔥10🌚9👍3
ML в аналитике: не можешь победить — возглавь
ИИ не со всеми (пока) задачами справляется лучше людей, но в чем он точно нас уже превосходит, так это в обработке больших объемов данных. Он обнаружит тренды и закономерности, поможет составить прогнозы и найти инсайты. И чем больше данных, тем сложнее с ними справиться человеку, и тем лучше будет результат работы ИИ.

💬 Так что же это значит — аналитики больше не нужны? Их всех заменят дата саентисты с их большими зарплатами и ML-моделями?

Не факт. Аналитики все еще нужны, но им предстоит адаптироваться к новым условиям и осваивать Machine Learning — к такому выводу пришел Виктор Кантор, Ex Chief Data Officer МТС, Ex Chief Data Scientist Яндекс.Такси, основатель онлайн школы машинного обучения MLinside.

Как аналитикам стать ценнее в глазах компании — своим опытом Виктор поделился в этом посте.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10😍96
Data Heroes: Data Science и AI в fashion-ритейле
Представим, что вы решили обновить гардероб и зашли на сайт интернет-магазина одежды. Вы полистали каталог, вбили в поиск название вещи, которая вам нужна, зашли в карточку, посмотрели фотки и описание, присмотрелись к цене, а потом закинули покупку в корзину. Возможно, на странице товара вы увидели еще рекомендации — вещи, которые похожи на выбранную вещь или которые хорошо к ней подойдут.

Как думаете, сколько из этих функций или сервисов на сайте так или иначе «усилены» с помощью ML?

Правильный ответ: все.

Машинное обучение и Data Science применяются почти во всех процессах крупного интернет-магазина: от закупа и поступления товара на склад до продажи и доставки до потребителя. В первом выпуске пятого сезона Data Heroes узнаем, как это работает в Lamoda.

А расскажет нам это Дмитрий Малахов, Direction Lead Ranking & Navigation в Lamoda Tech.
🔵 Как команды DS внедряют новые алгоритмы в работу и оценивают их эффективность?
🔵 В каких процессах в ecom ИИ уже используется, а где еще найдет применение в ближайшее время?
🔵 ИИ-реклама — это обман потребителя или удобный инструмент и для продавца, и для покупателя?
🔵 Чем Data Science и ML в fashion-ритейле отличаются от Data Science и ML в банкинге и других сферах?

Смотреть: YouTube, VK Видео
Слушать: Spotify, Apple Podcasts, Яндекс Музыка
Please open Telegram to view this post
VIEW IN TELEGRAM
16🔥11👍7😁1
Инструмент, который вытащит нужные данные из PDF
Магия искусственного интеллекта избавляет от необходимости самостоятельно ковыряться в PDF’ках, чтобы найти в них нужные данные.

🔜 Documind — маленький open source инструмент, который сделает это за вас. Он обрабатывает PDF-файлы с помощью API OpenAI и возвращает структурированные данные.

Можно самостоятельно дать задачу, какие данные и в каком формате вам нужны, а можно воспользоваться готовыми шаблонами. Пока их всего три: инвойс, банковская выписка и водительское удостоверение из Великобритании. Не густо, но разработчики обещают добавить еще, а также работают над облачной версией. Пока в нее пускают только после отправки  реквеста через сайт проекта.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1410👌6👍3
Новости от Amazon: Aurora DSQL
Amazon многие знают в первую очередь как интернет-магазин, мы-то с вами в курсе, что это еще и крупная технологическая компания, известная своими облачными сервисами — хранилищами, вычислительными мощностями и так далее.

Скоро этот список пополнится распределенной базой данных Aurora DSQL.

💬 Обещают практически неограниченные возможности для масштабирования, абсолютную отказоустойчивость и высокую скорость работы в сочетании с простотой в управлении. Aurora DSQL — бессерверная БД, и пользователю не придется беспокоиться об обновлениях или поддержке инфраструктуры.

💬 Правда, есть и ограничения — например, Aurora DSQL не поддерживает временные таблицы, создание представлений запросов или внешние ключи.

Как это будет  работать на практике, пока неясно  — ни цены, ни дату полноценного релиза нового продукта Amazon еще не объявил.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍5👌43
Логика семплинга в SQL
Кажется, что пятница ­— время расслабиться и почитать что-нибудь легкое?

А вот и нет. 🔥 Принесли вам основательный лонгрид про семплинг с помощью SQL:
🔵 Как работают алгоритмы выборки без замены и с заменой и как реализовать оба.
🔵 Как увеличить скорость обработки запроса, понимая особенности чтения данных в БД.
🔵 Как сделать рандомную выборку чуть менее рандомной.

Автор не пишет «press X to win» — то есть «напишите вот такой запрос, чтобы получить вот такой результат», а подробно объясняет логику их работы с формулами и ссылками на дополнительную литературу. Думаем, будет полезно и новичкам, и тем, кто с SQL работает уже не первый день.

Было полезно?
❤️ ­— Да
🌚 — Не особо
Please open Telegram to view this post
VIEW IN TELEGRAM
90🌚41👍7🥰4