LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Состоялся релиз Sora Turbo
☝🏻 Это видео сгенерировала новая модель OpenAI — Sora.

Sora представили еще в начала года, и вот наконец-то к ней открыли доступ. На этот раз официально, а не как когда ее слили на Hugging Face.

🔥 Публике доступна Sora Turbo — более мощная, чем предыдущая версия. Она умеет генерировать видео с разрешением до 1080p и продолжительностью до 20 секунд на основе текстовых промптов, изображений или других видео.

Правда, это функционал для пользователей с подпиской Pro — на Plus можно генерировать видео с разрешением не больше 720p. По крайней мере, пока, а в начале следующего года обещают представить новые тарифы. Может быть, тогда и бесплатным пользователям что-нибудь достанется — сейчас поэкспериментировать с Sora без подписки нельзя.

Как вам новости?
❤️ — Круто, уже хочу потестить!
🌚 — Не впечатляет…
Please open Telegram to view this post
VIEW IN TELEGRAM
17🌚8🔥6👍53
Media is too big
VIEW IN TELEGRAM
Ксения Сухова про любовь к Лондону, партнерство в бизнесе и роль мемов в создании бренда
Консалтинг — это развод и скам?

Иногда да. Как понять, какой консалтинг создает ценность для бизнеса, а какой только тратит время и деньги — обсуждаем в новом выпуске LEFT JOIN Partners.

Гостьей второго эпизода Partners стала Ксения Сухова — managing partner в дата-консалтинге ASAO DS.

Про что еще говорили?
🔵 Про жизнь и бизнес за границей, а также риски регистрации компании на Кипре.
🔵 Про то, как отличить хорошего аналитика от так себе специалиста (и каких «аналитиков» вообще лучше не нанимать).
🔵 Про то, как именно консалтинги помогают заказчикам извлекать профит из своих данных.

👀 Смотрите на YouTube и на VK!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥189😍8👍32
А вы используете естественные ключи?
Использование естественных ключей кажется вполне логичным решением. Особенно, если у вас есть простой естественный ключ — что-то вроде ИНН или серийного номера, который в теории должен быть уникальным для каждой сущности в таблице.

💬 Если простого ключа нет, почти всегда можно придумать составной. Например, здесь автор приводит в пример студенческий проект — базу данных для сайта со списком 50 лучших ресторанов, где в качестве ключа предложили использовать сочетание названия заведения и города. Уже можно догадаться, какие минусы есть у такого подхода — чем больше город, тем больше вероятность, что там заведутся два ресторана с одинаковыми названиями. Но для небольшого набора данных, он вполне применим.

Кроме вопросов к уникальности, которые почти неизбежно возникнут при работе с большим датасетом, есть и другие сложности.
🔵 Многие данные, которые можно было использовать в качестве первичного ключа, могут со временем меняться — например, телефон, email, номер и серия паспорта. В той же статье автор приводит пример, когда во время техосмотра выяснилось, что у его машины неправильный VIN. Проблема решилась тем, что механик просто исправил его в системе. То есть даже такие, казалось бы, неизменяемые вещи, как VIN или серийный номер могут в какой-то момент измениться.
🔵Никто не застрахован от ошибок и опечаток, и чем больше датасет, тем выше вероятность, что кто-то неправильно запишет номер или опечатается в собственном имени. Будет неприятно, если такая ошибка закрадется в поле, которое используется как первичный ключ.
🔵 Искусственный (суррогатный) ключ помогает избежать этих проблем, а еще в теории — упростить запросы и внесения изменений в таблицы.

Хотя у них тоже есть минусы — неинформативность или сам факт создания каких-то дополнительных сущностей в таблице вместо того, что навести в данных порядок и обеспечить их точность, актуальность и уникальность.

А какой вариант вам ближе? 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍11
Оцифровать нецифруемое: как понять, чем на самом деле робот хуже человека
Обидная особенность аналитики в том, что очень часто сложно доказать прямую связь между работой аналитиков и дата-инженеров и бизнес-результатом компании. Все понимают, что грамотная работа с данными важна для любой компании, но как посчитать точный эффект от нее — сколько именно денег она принесла или сколько времени всем сэкономила?

Тем приятнее читать такие кейсы, где профит от аналитики очевиден и неоспорим, правда же?

💬 И такой кейс у нас есть — история о том, как мы помогли ИИ-стартапу улучшить его продукт, голосового бота-продажника. Мы перелопатили гору данных сразу нескольких компаний, вооружились ML-моделями и алгоритмами и нашли, как же сделать бота умнее и полезнее для владельцев и пользователей.

Подробно расписали, как мы это делали, в новой статье на VC 🔜 https://vc.ru/dev/1703499
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7🔥43
Присылайте ваш любимый мем с chill guy в комментарии @leftjoin_career 👀
Please open Telegram to view this post
VIEW IN TELEGRAM
😍2
Forwarded from LEFT JOIN Insider
Мы просто chill guys and girls, поэтому влетаем в последний вагон этого милого тренда.

Кстати, в комментариях приветствуются свои вариации этого мема.

🔜 @leftjoin_career
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
15👌7🔥3🙈2
This media is not supported in your browser
VIEW IN TELEGRAM
Почему рекомендации Netflix работают так плохо?
Те, кто с нами давно, знают, что это перезалив.

Если вы подписаны на Netflix, то знаете, что иногда его лента рекомендаций… удивляет. Почему популярный сервис, который собирает гору всевозможной информации о вас и ваших вкусах, так часто советует посмотреть какую-то чушь? Что он делает с этими данными — и что это вообще за данные, на которых строится работа рекомендательных алгоритмов?

Разбираемся в нашем видео:
🔜 YouTube
🔜 VK
Please open Telegram to view this post
VIEW IN TELEGRAM
👍13😁62
Кто тоже до сих пор не понял, в чем разница, поднимите руки...
😁25👍132💯2🔥1
Dataviz, Data Science и HR
К традиции подводить итоги в конце года все относятся по-разному: кому-то все равно, для кого-то это повод вспомнить, что хорошего произошло за последние 12 месяцев, а для кого-то —причина для стресса.

В последнюю категорию нередко попадают сотрудники корпораций. Те тоже в конце года подводят итоги и оценивают результаты своих подчиненных. 10% (или 15%, или 20%) лучших получат премии, а 10% со дна рейтинга отправятся искать новое место работы.

Обычно результат этой оценки представляют в виде всем знакомой куполообразной кривой. И это выглядит логично:
🔵 Это универсальный график, уместный для визуализации данных из самых разных областей. Если в компании дела идут нормально, то и результаты сотрудников тоже распределятся по осям нормально.
🔵График четко делит людей на несколько групп: «среднячки» в центре, топы и аутсайдеры по краям. Это наглядный, честный и объективный способ визуализировать, кто работал хорошо, а кто не постарался.

Так ведь?
Ну, не совсем. На графике данные распределяются симметрично, но давайте честно — отражает ли это реальность?
🔵 В любом коллективе почти всегда есть несколько топовых сотрудников, которые и правда «тянут» на себе весь отдел и генерируют львиную долю результата.
🔵 При этом обратной картины не наблюдается — их успехи не нивелируют провалы аутсайдеров из анти-топа. Встречаются люди, которые своей некомпетентностью приносят реальные убытки, но это скорее исключения, а не стабильные 10-20% от всего штата компании.

Если описывать ситуацию так, то это уже не скучное нормальное распределение, а правило Парето про 20% усилий, которые генерируют 80% результата. То есть сотрудники делятся на небольшую долю топ-перформеров, большинство «среднячков» и редких аутсайдеров.

Если интересно почитать подробнее, то в блоге Data Science for Fun and Profit про это есть любопытная статья. А мы просто отметим, что это отличный пример того, как датавиз влияет на восприятие данных и принятие решений.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥43
Что внутри Postgres?
«Just use Postrges» — это выражение уже почти мем. Кто-то иронизирует над тенденцией в любой непонятной ситуации использовать Postgres, а кто-то говорит это вполне серьезно. Его любят за бесплатность, производительность, умение работать с разными типами данных — в общем, есть за что.

Но что, если заглянуть глубже и разобраться, как именно он работает?
🔵 Как хранит данные и распределяет ваши таблицы по папкам?
🔵 Как Postgres оптимизирует работу с большими файлами?
🔵 Что делают Pages, и как они помогают снизить вероятность ошибок записи?

Ответы — в лонгриде аж на 30+ минут вдумчивого чтения How Postgres stores data on disk.

Если вникнуть в тонкости того, как Postgres хранит данные, то, во-первых, появится еще несколько веских причин его любить. А во-вторых, это может пригодиться в работе — когда вы понимаете, как что-то устроено, намного проще исправлять ошибки или искать причины проблем.

Хотите переведем статью целиком и выложим в блог leftjoin.ru?
❤️ — Да, давайте!
🌚 — Нет, оригинала достаточно
Please open Telegram to view this post
VIEW IN TELEGRAM
84👍8🌚7🔥31
This media is not supported in your browser
VIEW IN TELEGRAM
Найти ценность для клиентов на пересечении науки и бизнеса | Ecom.tech (ex-Samokat)
🔵 Сервис по созданию рецептов из продуктов в корзине интернет-магазина.
🔵 Определение склонности покупателя к мошенничеству по его истории просмотра.
🔵 Сервис для «виртуальных фотосессий», которой позволяет «примерить» одежду из магазина на сгенерированного нейросетью аватара.
🔵Лента видеообзоров на товары, из которой понравившуюся вещь можно отправить прямо в корзину.

Что объединяет все эти вещи?
Это все — сценарии использования ИИ и Data Science в «Самокате». Кое-что уже внедрили в работу, а кое-что пока на стадии разработки. Хотите узнать, что уже применяется, а что ждет пользователей в будущем?

Тогда смотрите новый выпуск подкаста Data Heroes. Его героем стал Петр Лукьянченко, руководитель департамента машинного обучения в ecom.tech — бывшем Samokat.tech.

Про что выпуск?
🔵 Почему Samokat.tech сменил название?
🔵 Чем занимается департамент машинного обучения, почему он так быстро растет и как в него попасть?
🔵 Какую пользу ML и Data Science приносят всем отделам компании, продавцам и покупателям?
🔵 Почему операционное планирование — одна из самых красивых задач, которую бизнес ставит перед Data Science?

Смотреть: YouTube, VK Видео
Слушать: Spotify, Apple Podcasts
Please open Telegram to view this post
VIEW IN TELEGRAM
8👍6🔥4😁2😍1
Все задачи перед выходными закончили? 👀
#мем
Please open Telegram to view this post
VIEW IN TELEGRAM
😁35🙈6🔥5🌚3💯1
Media is too big
VIEW IN TELEGRAM
Дмитрий Аношин про разницу между туризмом и иммиграцией, выгорание в Amazon и work-life balance
Работа в корпорации с громким названием вроде Microsoft или Amazon для кого-то может выглядеть, как мечта — ведь это большая зарплата, стабильность, интересные проекты. Но иногда реальность разочаровывает, и перестают мотивировать что статус, что деньги.

И как быть?
В новом выпуске LEFT JOIN Partners дата-инженер Дмитрий Аношин (вы наверняка знаете его по его проектам вроде Surfanalytics и курсам на Data Learn), рассказал о переезде в Канаду, работе в Amazon и Microsoft и борьбе с выгоранием.

Обсудили не только трудности.

🔵 Как сегодня переехать в Северную Америку и найти работу в IT?
🔵 Сколько платят дата-инженерам в Amazon?
🔵 Что нужно, чтобы стать востребованным специалистом и построить карьеру в IT на западе?

🔜 YouTube
🔜 VK
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥15❤‍🔥5😱4🌚2🏆1
Как показать выполнение KPI на графиках
Шпаргалка для всех, кто занимается версткой дашбордов — 20 способов изобразить выполнение KPI. В основном это разные вариации барчартов и линейных графиков, но все равно поглядеть что-нибудь полезное для себя можно.
13👍6🔥3
Реалии работы в ML
#мем
👍39😁12🔥7