LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Что получится, если заставить ChatGPT заполнить налоговую декларацию?
Программист Майк Макферсон решил это выяснить, а заодно — взглянуть на нейросети под довольно любопытным ракурсом. Их часто рассматривают как самостоятельный инструмент, который генерирует тексты, картинки, видео, код и так далее. Но что, если воспринимать ИИ как операционную систему, которая связывает несколько элементов вместе и помогает взаимодействовать с ними?

🔜 Возможности нейросетей сегодня впечатляют — и все же они до сих пор ограничены. Но их можно расширить, если «подружить» ИИ с другими приложениями, библиотеками или базами данных.

В 2022 Майк создал библиотеку Python tenforty — она помогает юзерам посчитать, сколько налогов они должны государству в зависимости от доходов, расходов, семейного положения и прочих факторов. Сразу оговоримся — эта штука знакома только с законодательством США.

Он планировал когда-нибудь сделать на ее основе приложение, но вместо этого сделал кастомную GPT Tax Driver. Ее функция та же — считать налоги и вычеты, только при этом она еще понимает запросы на естественном языке, пишет подробные ответы и даже может нарисовать график.

🔵 В целом, она с этими задачами отлично справляется, хотя иногда неправильно понимает суть вопроса или игнорирует некоторые требования пользователя.
🔵Это теоретически удобный инструмент, но он предъявляет высокие требования к пользователю — надо тщательно подходить к написанию промптов и внимательно перепроверять ответы.
🔵 Несмотря на эти недостатки, у подхода «ИИ как ОС» точно есть потенциал — он делает разработку приложений намного проще и быстрее.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115🔥6141👌12💔3
Data Heroes с Александром Шестопаловым из BBE
Гостем нового выпуска подкаста стал коммерческий директор Bang Bang Education Александр Шестопалов. Это онлайн-школа дизайна и технологий, где студентов учат дизайну, анимации, монтажу и вот теперь аналитике.

Александр в эдтехе больше 8 лет — он успел поработать в маркетинге GeekBrains и Skillfactory. В BBE он с нуля построил команду маркетинга

Про что говорили?
💬 Про эдтех. Почему эта сфера сложная, но интересная? Чем отличаются массовые онлайн-школы от нишевых в подходах к продвижению и созданию курсов? Почему BBE, онлайн-школа творческих профессий, решила вести курсы для аналитиков?
💬 Про работу с людьми. Как нанимать людей и не ошибаться (или ошибаться, но редко)? Как проверить скиллы соискателя на собеседовании, и почему если человек сделал тестовое с помощью ИИ, это не всегда плохо?
💬 Про аналитику. Как устроена аналитика в эдтехе? За какими метриками следит коммерческий директор?
💬 Про будущее и технологии. С какими задачами ИИ справляется хорошо, а в чем все еще не может заменить человека? И что ждет эдтех ­— уйдем ли вы офлайн или сфера будет расти и дальше?

Выпуск уже на всех платформах: Яндекс Музыка, Apple Podcasts, Spotify.

Пишите, как вам подкаст?

#DataHeroes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥97👍8623👌84
OpenAI купила Rockset и Multi
Обе сделки выглядят как acqui-hire — покупка компании в первую очередь для того, чтобы нанять работающих в ней людей.

💬 Rockset — база данных для real-time аналитики. Она умеет оперативно обрабатывать огромные массивы данных и подходит для создания поисковых систем и рекомендательных алгоритмов, мониторинга и алертинга.
💬 OpenAI планирует интегрировать разработки Rockset в свои продукты. Предположительно, это поможет повысить точность ответов ChatGPT.
💬 Это хорошие новости для пользователей нейросети и не очень — для клиентов Rockset. Компания будет постепенно «отключать» их от своих сервисов и полностью сконцентрируется на работе на благо ИИ. Им придется найти новую БД до конца сентября.

Еще сложнее придется клиентам компании Multi.
💬 Multi — платформа для распределенных команд. Она позволяет расшаривать экран во время созвонов сразу нескольким пользователям, всем вместе редактировать документы, писать, рисовать на экране. В общем, работать удаленно, но всем вместе, как будто вы сидите рядом в одном помещении.
💬 Правда, только до 24 июля. После все данные клиентов будут удалены.

Вот такая цена прогресса — в любой момент может прийти OpenAI и присвоить себе ваш любимый сервис, чтобы он улучшал ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥86👍3527👎3
💙 Новый интересный пост от создателя LEFT JOIN и фаундера Valiotti Analytics на канале Коля Валиотти • Дата консалтинг про данные и внедрение data-driven подхода в компании!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65🏆4
Стратегия управления на основе данных
Data-driven подход — это такая штука, к которой все стремятся, но не все понимают, что это такое и как к этому прийти.

▶️ Data-driven — это подход, когда все решения в компании принимаются на основе цифр. Чтобы этого добиться, нужно твердо понимать, зачем эти цифры нужны, о чем говорят и как влияют на развитие бизнеса. Система аналитики должна быть максимально согласована с целями и с миссией компании.

▶️ В идеале к этому состоянию надо идти по определенным шагам. Чтобы не превращать пост в простыню, вынес их на карточки.

Но что надо обязательно учесть: в реальности у большинства компаний нет точного понимания, как должна выглядеть аналитика и какие данные они хотят видеть. А делать выводы на основе цифр хочется уже сейчас.

В начале пути важно научиться работать со всеми доступными данными. Они уже у вас как-то собираются — например, в CRM-системе; можно начать собирать их в хранилище для построения отчетности, делать первые выводы, смотреть, чего не хватает. Постепенно бизнес будет развиваться и вместе с этим появится понимание, какие данные и метрики вам нужны. ❗️

@datakolya
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2395😱3
Внедрили аналитику на старте и увеличили прибыль до 1,2M$
Недавно в комментариях попросили «что-нибудь посложнее». Окей, есть и посложнее.

💬 Как с нуля построить аналитику для быстро растущего стартапа?
💬 Как на практике выглядит «data-driven подход», и как данные помогают принимать решения в бизнесе?
💬 Какие знакомые любому предпринимателю проблемы решает аналитика?

Разбираемся на реальном примере кейса Valiotti Analytics — кастомной системе аналитики, которую сделали для EdTeh-стартапа Refocus. Мы присоединились к проекту прямо на старте и построили инфраструктуру по работе с данными, которая росла вместе с компанией. От двух отчетов с данными из AmoCRM она выросла в полноценную систему из 40+ дашбордов по продажам, маркетингу и продуктовому направлению.

🔜 Что мы такого сделали с данными, что компания выросла в 25 разв новой статье фаундера Valiotti Analytics на vc.ru. Если интересно заглянуть прямо внутрь системы аналитики и узнать, как и что в ней работает, это отличный шанс!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5041🔥2011🌚4
Postgres против всех
Чем сложнее проект, тем длиннее и запутаннее стек — это не всегда удобно, но неизбежно.

Или нет.

Часто стек растет, потому что под каждую задачу или проблему стараются подобрать наиболее подходящий инструмент. Но как выбрать этот «подходящий инструмент»? На что смотреть — на цену, скорость работы, простоту использования?

Или просто выбрать PostgreSQL? 👀

Нашли для вас короткую статью, почему вместо раздувания списка инструментов иногда можно просто выбрать проверенный временем, универсальный и понятный PostgreSQL.

Хотя по сути дело даже не в конкретной БД — на месте PostgreSQL может оказаться любой другой вариант. Дело в самом подходе — не усложнять себе жизнь, внедряя множество инструментов под разные задачи. И вместо этого стремиться к тому, чтобы ИТ-инфраструктура была понятной и не перегруженной. Так проще с ней работать и поддерживать работоспособность.

🔜 А что вы думаете — как найти баланс между перегруженностью и простотой, которая уже не тянет стоящие перед командой проекта задачи?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍80🔥32❤‍🔥20147
Box plots: датавиз не для всех
Смысл визуализации данных — в том, чтобы представить сложную информацию наглядно и понятно. Так, чтобы человек мог быстро в ней разобраться и извлечь что-то полезное для себя.

Но иногда что-то идет не так.

Вот давайте честно, вам нравятся box plots — они же «ящики с усами» или диаграммы размаха?

💬 Если не знаете, что это, то вот объяснение на русском, а вот — видео на английском.

В теории это прекрасный способ визуализации, в который очень плотно упакован большой объем информации:
🔵 максимальное, минимальное и медианное значения;
🔵 квартили и асимметрия данных — если в каком-то квартиле сильный разброс значений, это будет видно по длине «уса» или «ящика»;
🔵 сравнение сразу нескольких сущностей по всем этим показателям.

Проблема в том, что эта информация изображена контринтуитивно. Про это есть длинный материал, но если кратко, то вот главные тезисы.

🔵 Чтобы разобраться в box plots, надо, как минимум, знать, что такое квартиль. Из-за этого возникают сложности с восприятием. Например, если один «ус» очень длинный, подсознательно воспринимается, будто в нем больше всего значений, но на самом деле — в нем просто большая разница между максимумом и минимумом. Число значений во всех частях графика одинаковое.
🔵 Дизайн заставляет думать, что крупная часть в центре, сам «ящик» — самая значимая, а «усы» как бы приложение. Хотя с чего бы?
🔵 К тому же, кажется, будто на графике три элемента: «ящик» и два «уса». На самом деле их 4: два «ящика» разделены медианой.

С одной стороны, все эти недопонимания — проблема зрителя. Box plots существуют давно, инструкций, как их читать — достаточно. Кто захочет, тот вникнет. Но всю ту же информацию, которую содержат «ящики» можно показать более наглядно и доступно. А не в этом ли цель всего датавиза?

По ссылке выше есть примеры — распределение значений показывают «тепловыми картами» и точками. Чем ярче участок на графике или чем плотнее на нем расположены точки, тем больше там значений.

А вы пользуетесь ли box plots в работе? Вам легко в них разбираться?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍114🔥5564
Data Heroes: интервью с Марией Бородецкой
«Синхронизация» — онлайн-школа, где рассказывают про культуру, искусство, психологию и софт-скиллы. Соосновательница Мария Бородецкая говорит, что это уже не совсем эдтех, а скорее проект по саморазвитию, и его главный конкурент — не другие школы, а Netflix.

Про что еще поговорили?
🔵 Как проект прошел путь от лекций «для себя и для друзей» до успешного стартапа и пережил ковид.
🔵 Почему оффлайн — это лакшери, а за онлайном и искусственным интеллектом будущее.
🔵 Какую роль играет культурный код при выходе на международные рынки.
🔵 Почему маркетинг — это здорово, но учиться лучше на философа, математика или искусствоведа.
🔵 Какие метрики бизнеса самые важные для предпринимателя в онлайн-образовании.
🔵 И причем здесь Юрий Дудь*?..

🔜 Где посмотреть: YouTube

Где послушать: Apple Podcasts, Яндекс Музыка, Spotify

#dataheroes
*Юрий Дудь признан в России иноагентом.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍68🔥29105👎1
В российских вузах начнут готовить специалистов по ИИ
Роль ИИ постоянно растет, и он постепенно проникает во все сферы деятельности — от науки до повседневной жизни. Так что неудивительно, что в разных странах уже появляются целые программы в вузах, посвященные искусственному интеллекту.  

И в России тоже. 

🔜 В новом учебном году Яндекс и Сбер запускают вместе с НИУ ВШЭ, ИТМО, МФТИ и Университетом Иннополис программу AI360 или ИИ360. Там будут готовить специалистов по ИИ, которые будут двигать вперед науку и технологии. А если конкретнее — ML-исследователей и AI-архитекторов.

Что ждет студентов?  
🔵 Фундаментальная подготовка с углубленным изучением математики.
🔵 Доступ к технологиям от Яндекса и Сбера и изучение лучших мировых практик в сфере ИИ.
🔵 Научная деятельность со второго курса. Студенты смогут присоединиться к исследованиям и посетить международные конференции.

Легко не будет, но чтобы дополнительно поддержать студентов во время учебы, им обещают повышенную стипендию на протяжении всех 4 лет обучения. Подать документы можно до 25 июля.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍66🔥26163👎1
ИИ-поисковик по мемам и не только
У предпринимателя Харпера Рида было 12 000 картинок с мемами, желание разобраться, что такое «векторные представления», и некоторое количество свободного времени.  Все это привело к тому, что он создал простое приложение на основе мультимодальных моделей CLIP и siglip, которое умеет искать по картинкам.

Оно принимает как текстовые запросы, так и изображения. В первом случае оно подберет картинки, соответствующие запросу, во втором — найдет похожие в своей базе.

🔜 Работает с любыми изображениями. То есть его можно использовать не только поиска мемов для важных переговоров в интернете, но и, например, чтобы искать по фотографиям в галерее. Вдруг вам нужно оперативно собрать в кучу все фотки любимого кота.

🔜 Проверьте сами — приложение бесплатное и лежит на GitHub.

🔜 Заодно рекомендуем почитать пост про разработку. Он доказывает, что в любой теме можно разобраться — было бы желание. Харпер признался, что никогда не делал ничего похожего и вообще до сих пор плохо понимает, что такое «вектор». Но ему захотелось разработать приложение, и он это сделал вполне успешно.

И главное — показал, как это делал по этапам. Так что если тоже хотите попробовать сделать что-то подобное, вот отличный повод погрузиться в тему.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍70🔥35105
Карьера в Data — новый проект LEFT JOIN
Поиск работы — занятие утомительное. Надо обновить резюме, перерыть гору вакансий, потратить время на сопроводительные, тестовые и собеседования... Не то, чем хочется заниматься без необходимости.

С обратной стороны тоже не все гладко: из огромного числа откликов предстоит отобрать подходящие, провести серию собеседований и заинтересовать кандидата.

💙 Мы LEFT JOIN решили, что в наших силах сделать этот процесс приятнее для всех участников — так уж получилось, что у нас большая аудитория, где есть и работодатели, и потенциальные сотрудники. Так что почему бы не создать для них специальный канал, где они смогут найти друг друга.

Канал так и назвали — Карьера в Data. Что будем постить?
🔵 Вакансии для аналитиков, дата-инженеров, дата-саентистов, продакт-менеджеров разных уровней — от джунов до тим лидов.
🔵 Советы от HR, как составить резюме, написать сопроводительное и не запороть собеседование.
🔵 Инсайты про рынок труда, количество вакансий и динамику зарплат.
🔵 Разборы тестовых заданий и советы, как построить карьеру в данных, от тех, кто уже это сделал.

Даже если не ищете работу прямо сейчас, будет много полезной информации, чтобы оставаться в курсе последних тенденций в нашей сфере. Убедитесь сами!

@leftjoin_career 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥108👍2810🥰63
LEFT JOIN pinned a photo