LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
🤣124💯23👍12👏6🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Очередная коллаборация GPT – теперь с Google Sheets
То, с какой скоростью влияние и применение моделей GPT распространяется на нашу жизнь просто поражает воображение. Мы уже показывали вам, как один разработчик использовал gpt3 для заполнения таблиц. Но и этот метод активно развивается и улучшается!

Что на гифке?
Несколько дней назад в профиле LinkedIn ChatGPT, появилось видео автозаполнения пустых полей в таблице функцией gpt3(). С её помощью можно найти и добавить информацию из интеренета в вашу таблицу за считанные секунды. Нужны лишь заполненные ячейки и подписи строк и столбцов.
Главное теперь научиться использовать сэкономленное время с умом!
😱43🔥29👍15
Одеваться как разработчик — скучно?
Нет, практично! Как минимум, если одеваться как вполне конкретный разработчик Олоф Ховерфельт.

Почему?
Все дело в том, что Олоф подошел к анализу предметов гардероба, как к рабочей задаче. Он отмечал, какие вещи и когда носит, а затем проанализировал данные. В итоге, он смог разобраться какие вещи служат дольше, какие стоят своих денег и, самое главное, что ему вообще больше всего нравится и к чему «тянется рука».

Какие данные он собирал?
Всего у Олофа было 426 предметов одежды, которые он разделил на 12 типичных категорий. Каждый вечер он вносил в дневник информацию об одежде, которую носил в течение дня. На основе этих данных он посчитал специфические метрики: Cost Per Wear (CPW) — стоимость износа вещи или, иными словами, амортизацию новых вещей — и Category Daily Cost — сумму всех CPW вещей категории.

Что получилось?
▫️ «Скупой не всегда платит дважды» — в зависимости от бренда, иногда более дешевые вещи служили дольше, чем дорогие, а иногда — нет. Например, кроссовки от Converse радовали обладателя дольше более дешевого аналога, но их CPW была значительно ниже дорогущих Diesel.
▫️ «Качество не ограничивается долговечностью и не может быть измерено только ею» — не стоит забывать про важность эмоций и переплату за бренд, который нравится и все тут.
▫️ Количество вещей, которые нуждаются в стирке, должно быть достаточным, чтобы они не закончились в неподходящий момент, но не слишком большим, чтобы они циклично стирались и не лежали неделями без дела.
▫️ Благодаря трекингу частоты носки вещей, получилось составить капсульный гардероб, то есть группу вещей, которые больше всего любит Олоф.

В конце статьи есть список из 10 простых советов по оптимизации гардероба, а в комментарии к посту есть несколько графиков, которые получились у Олофа. Если честно, ничего прорывного и удивительного он не обнаружил. Однако, подход, который он использовал, помог ему изучить собственные привычки и заставил задуматься о тех вещах, на которые многие привыкли совсем не обращать внимание!
👍33🤣17🔥9
📹 YouTube-канал LEFT JOIN вновь оживает: обзор на RocketBI 🚀
Спешу поделиться с вами первым (и далеко не последним!) ютуб-роликом в 2023 году.

Что в обзоре?
Мы познакомимся с новым BI-инструментом, Rocket.BI, и детально изучим его внушительные возможности визуализации данных, а также определим, в чем преимущества данного инструмента и его недостатки. А еще обсудим, почему разработчикам Redash стоит побеспокоиться о своем продукте, ведь на рынке у него появился сильный конкурент!

Можно ли было увидеть его раньше?
Можно! В канале FULL JOIN все эксклюзивные материалы выходят на две недели раньше. Присоединяйтесь и будьте в курсе всех новинок вместе с нами.
👍3915👏10🔥7🏆7
This media is not supported in your browser
VIEW IN TELEGRAM
Sketch — библиотека, которая выполнит всю работу за вас
Если честно, при просмотре этого видео складывается ощущение, что больше можно совершенно не учиться программировать на Python, ведь Sketch может писать код и проводить анализ самостоятельно.

Как она работает?
Волшебно. А если серьезно, то эта библиотека — AI-ассистент по написанию кода: она заточена под анализ данных, в особенности с использованием библиотеки pandas (но и других тоже). Вам нужно подключить Sketch, загрузить данные, а затем либо задавать модели вопросы по данным, либо просить ее посчитать что-то на их основе, добавить переменные или нарисовать график.

Если вы уже запереживали
Спешим напомнить, что любое развитие науки и техники можно приручить и получать от него выгоду (а не потерю рабочего места). Не забывайте, что задачи, которые под силу лишь человеку, всегда будут.

Не знаю, как вы, а я уже набираю pip install sketch и начинаю тестировать.
Делитесь в комментариях, если вам уже это удалось!
🔥46😱13👍12
This media is not supported in your browser
VIEW IN TELEGRAM
Студенты: хочу блистать знаниями во время онлайн семинаров и не палиться
NVIDIA: ✔️
Мечты сбываются: в свежем релизе NVIDIA Broadcast — платформы для стриминга и видеоконференций. NVIDIA внедрила AI, чтобы ваш зрительный контакт с человеком по ту сторону экрана не прерывался. AI «нарисует» вам глаза (максимально реалистично, надо отдать честь!) пока вы будете спокойно смотреть видео на Youtube во время очередного совещания.

Также, для создания более реалистичной картинки, разработчики представили в новой версии возможность размывать фон и добавлять виньетку, что позволяет увеличить глубину пространства в кадре и придать ему большую достоверность или более аккуратный вид. Ну а вдруг вы боитесь, что аккуратно разложенные позади вас предметы домашнего быта кто-то может заклеймить фразой «визуальный шум» 🧐

...Где-то негодуют студенты, которые сдавали экзамены по Zoom'у в сезон локдауна в 2020 году.
🔥95🤣14👏1198
Знаете ли вы реальные цены на Enterprise-внедрение dbt?
Пташки нашептали мне реальный прайс на внедрение dbt в одну US-организацию. Хотел бы поделиться и раскрыть карты на реальное коммерческое положение дел по внедрению модного analytics engineering solution.

Итак, 10 developer-доступов и 50 read-доступов обойдутся вам в $38K в год, добавьте к этому $6.3K в качестве one-time fee на онбординг и дело в шляпе. Кстати, в 2017 году по сравнимой цене внедрялся Looker (модель с так называемым «jump start kit» была очень похожей).

И еще по этой теме — недавно я наткнулся на интересный пост: автор придумал как оптимизировать такие приличные затраты на dbt заменив их github workflows.
🤯17❤‍🔥9😱8👍3
MusicLM: новая веха в музыкальной истории 🎼
Разработчики из Google Research выпустили доклад о модели MusicLM, которая генерирует музыку на основе текстовых подсказок, а также открыли доступ к датасету MusicCaps, в который входит 5.5k пар текст + музыка.

Такое мы уже где-то видели!
В отличие от Riffusion, модели для генерации музыки на основе Stable Diffusion, о которой мы писали ранее, MusicLM генерирует музыку высокого качества, а также может основываться не только на тексте, который описывает предназначение трека, настроение и инструменты, но и мелодию, позволяя также регламентировать каждый из этих аспектов указанием тайминга. Например, вы можете задать последовательную смену настроения композиции: начать с меланхоличной мелодии, перейти к бодро-танцевальной и закончить на симфоническом буйстве в стиле саундтреков Marvel.
По ссылке на исследование вы также можете ознакомиться с интересными примерами генерации музыки на основе описаний картин, которые словно воссоздают полотна в аудио контексте, давая вам возможность представить, как бы «звучала» та или иная работа художника.

Где попробовать запустить?
Несмотря на релиз доклада и датасета, сама модель MusicLM выложена в открытый доступ еще не была, и, по слухам, в ближайшее время не будет. Вероятно, для релиза модели нужно подготовить данные о том, на чем ее обучали, что может привести к всплеску исков со стороны правообладателей о нарушении авторского права.

Что вы думаете о развитии AI-технологий? Оставляйте ❤️, если вам нравится заметный прорыв в этом направлении, и 😱, если стремительное развитие нейросетей вас пугает или тревожит.
40😱8👍1
Для ребят из @setters (которых мы любим и уважаем за их маркетинг, обучение и другие сайд-проекты) собрали подборочку AI-сервисов. Думаю, что и наши подписчики найдут что-то интересненькое для себя 😎
👍4🔥4🥰1
Forwarded from SETTERS Media
Умные заметки, генератор сопроводительных и мемов: семь AI-моделей, которым можно делегировать задачи
— подборка @leftjoin для всех, кому нужен перерыв от ChatGPT

1. Summari — инструмент, который трансформирует любой текст на английском языке в короткий абзац с главной мыслью. Подойдет, если нужно быстро вытащить суть, а статью достаточно прочесть по диагонали.

2. Spreadsheet Magic — модель на основе GPT-3, которая может дополнить Google-таблицу через поиск и анализ информации в интернете. Закрытые и непопулярные данные не подтянет, но найти Twitter-аккаунты известных личностей или население штатов США у неё получится.

3. Refraction — сервис работает с C#, C++, Java, Python и другими языками и помогает создавать тесты, писать документацию, искать баги и объяснять код. Ваш код тоже может оптимизировать — никто не догадается, если программировать вы начали недавно. Первые пять попыток бесплатно.

4. Supermeme — генератор мемов на основе текста. Чувство юмора теперь можно отдать на аутсорс — с вас только жизненная ситуация, а генератор сам придумает, как ее обыграть. Первые 20 генераций бесплатные, причем получается не один вариант мема, а целая подборка.

5. Mem — не еще один генератор юмора, а умные заметки. Задача сервиса — автоматически рассортировать ваши идеи или записи по событиям, темам и людям, сохранить важные ссылки, назначить встречу и напомнить на нее явиться. Есть умный поиск и подсказки по редактуре.

6. Your Cover Letter — генератор сопроводительных писем на основе загруженного резюме и текста вакансии. Сводит ваш опыт с требованиями к должности и оформляет в красивый текст. Полезно, если устали выдумывать оригинальные сопроводительные для откликов на Linkedin.

7. Supernormal — AI-платформа, которая генерирует заметки с онлайн-встречи. Больше не придется выделять отдельного человека на самап и все смогут полноценно участвовать в созвоне — в конце достаточно отредактировать готовую заметку. Поддержки русского языка пока нет, но ждем локализаций. А если работаете в англоговорящей компании, уже можно тестировать.

А что из своих задач вы бы делегировали на нейросеть? Пишите в комментарии — вдруг и под это уже придумали сервис.
👍34🔥76
OpenAI выпустили классификатор, который определяет написан ли текст вручную или с использованием нейронки. Чем-то напоминает мне историю про антивирусные компании, которые вирусы сами и создают. Однако у меня данный классификатор не смог детектировать сгенерированную жалобу на простейшем промпте к ChatGPT — две картинки в карусели.
🔥21👍84
Аналитик SQL: профессия прошлого? 😥
Мы продолжаем знакомить вас с возможностями GPT-3 и, в частности, тем, как модель может повлиять на рабочий инструментарий аналитиков и инженеров данных в самом ближайшем будущем.

Что произошло?
Кен ван Харен, сооснователь платформы Patterns, решил проверить способности GPT-3, создав бот в Patterns Studio и подключив его к закрытой базе данных Crunchbase. Разработчика еще с прошлой работы беспокоила проблема необходимости тратить свое время на бессистемные мелкие SQL задачи, когда компания спонтанно требует предоставить отчет или уточнить какую-то информацию, отвлекая аналитика от более глобальных и серьезных проблем.

И что получилось?
Кену удалось, посредством стратегии из 6 шагов, создать CrunchBot — бот в Slack, который способен самостоятельно (при поддержке GPT-3, конечно) найти ответ на заданный вопрос, выгрузить необходимые данные и предоставить SQL запрос, который модель использовала в ходе решения задачи. Конечно, из-за дефицита контекста или недостаточной отладки процесса, CrunchBot может выдавать результаты с ошибками, но сам факт автоматизации SQL аналитики таким простым способом говорит о том, что восстание GPT-моделей против рутинных задач не за горами.

Познакомиться с пошаговым гайдом по созданию аналогичного бота вы можете в статье Кена, где также можно подробнее узнать о том, как его настроить.
👍52🔥115
iPhone выпустил команду SiriGPT для Siri 🍏
Что будет, если подружить два искусственных интеллекта в вашем смартфоне? Конечно же, обострение паранойи по поводу того, что вас подслушивают!

Ну, а если серьезно, то для владельцев iPhone выпустили команду для Siri, которая подключается к OpenAI через API и превращает Siri в почти всемогущего виртуального ассистента.

Если хотите попробовать
В этой пошаговой инструкции на русском описаны все необходимые шаги, от создания аккаунта на сайте OpenAI до активации команды. Решать задачи, переводить, искать ответы и болтать с AI теперь гораздо удобнее!
🔥31👍116
AI захватят мир. Завтра.
Бенн Стансил, сооснователь Mode, опубликовал в своем блоге эссе, где сравнивает AI со вторым пришествием. Некоторые тезисы показались нам интересными, поэтому мы делимся ими с вами:

‣ AI изменят не только рабочие дни аналитика и инженера данных, но и индустрию данных в целом.
‣ Интеграция AI в ткань современной дата реальности сопоставима с проблемой внедрения беспилотного транспорта в сложноустроенную инфраструктуру мегаполиса: придумать AI инструмент для определенной аналитической задачи возможно, но такой продукт может не потянуть особенности проектов каждого отдельного пользователя.
‣ И здесь Бенн видит неординарное решение: вместо того, чтобы учить модели работать с базами данных, где одна компания может под словом «account» подразумевать одно, а другая — другое, что неизбежно будет создавать проблемы, он предлагает отказаться от реляционных баз данных в целом.
‣ Бенн приводит в пример инструмент Narrator, который предложил использовать шаблон, названный разработчиками «activity schema» — вся БД выглядит как одна единственная таблица событий.
‣ Имея вместо реляционной БД такую таблицу, AI сможет безошибочно находить необходимую информацию и генерировать отчет или строить прогноз.

Но все эти футуристические изменения произойдут не сегодня, как считает Бенн, а в неопределенном «завтра», ведь нам придется перекроить все процессы, раннее разрабатываемые для удобной работы человека, в пользу сверхинтеллекта машины.

А что вы думаете об изменениях, которые влечёт развитие AI-технологий?
20👍12💔5
📽 Dreamix: диффузионная модель для генерации видео 🎞
Группа разработчиков Google из 8ми человек презентовала Dreamix — модель для редактирования и генерации видео на основании текста, картинки или другого видео.

Как она работает?
Используя «fine-tuning» и трансформируя статическое изображение в динамическое, Dreamix удается создавать видео, которые включают элементы, обстановку и действия, указанные в текстовой подсказке. Так, Dreamix может «подрисовать» акулу в кадр к мирно плавающей черепахе или надеть праздничный колпак на вашего песеля-именинника (смотрите пример в комментариях!).

Правда, судя по превью на сайте, где опубликована презентация Dreamix, модели все же не хватает реалистичности и детализации финальных видео. Возможно, эти моменты будут проработаны и улучшены, когда Dreamix станет доступен для массового использования. А пока видеографы могут спать спокойно — видеостоки по-прежнему остаются во власти человека, а не AI.
12🔥7😱6👍4🤔1
На днях Алексей Колоколов провел конференцию Data2Speak вместе с конкурсом работ в сфере дэшбордов и сторителлинга. Победителей можно посмотреть у него в посте.

Хочу отметить несколько работ, которые особенно приглянулись:
- Дата-артовая инфографика от Martina Dossi про работу организации Bridges to Prosperity (посмотрите, как круто человечки зашиты в круги) – и призовое 1е место
- Очень удобно сделанные распределения в работе Ajay Varghese про геронтократию в Индии
- Простая и лаконичниая работа Saverio Rocchetti про ментальгое здоровье в Танзании
- Дэшборд Натальи Веселовой для HR – классический и удобный
👍19🔥4😱2
Forwarded from Data Nature 🕊 (Alex Barakov)
Новый год и новый заход на тему компетенций BI команды

Мы прошли очередной "операционный круг" и созрели для обновления BI Team Upgrade Guide - нашего внутреннего тула для оценки BI аналитиков и гайда для осмысленного саморазвития. Наша старая версия сильно уступала прекрасной Матрице Ромы Бунина, что очевидно недопустимо 😎

Воруют бездарности, гении заимствуют). В итоге мы:
🔹позаимствовали эксель-шаблон с отличным графиком итоговой синьорности
🔹доработали подход с self-assessment идеей - сделали шаблон более компактным за счет выпадающих списков при выборе вариантов ответа
🔹Обновили список скилов, их группировку на актуальные для нашей команды
🔹Ссылки на полезные материалы по скилам обновили и вывели в отдельную секцию "How to develop the skill". Тут удобнее кликать
🔹Добавилась менеджерская вкладка "BI Team overview" (используется отдельно), где сводится общая картина по команде: доменная экспертиза, оценка синьорности по компетенциям, оценка рисков и ценности
🔹ну и да, наш тул на английском

Делюсь этой историей как примером получения реальной пользы от opensource-подхода к инструментам в комьюнити.
Свою версию также шарим на всех. Может кто подхватит и продолжит апгрейд, фидбек-welcomed
Копирайты и слава остаются - revealthedata

Еще из полезного по теме компетенций в data/BI/Product сфере:
🔗 Миро борд компетенций для ролей управления продуктом от Сергея Тихомирова
🔗
Навыки и требования к аналитикам данных на разных уровнях в «Яндексе»
🔗 Карта компетенций РМ от Дмитрия Зиновкина
23👍8🥰5
Вчера провел третий Cyprus Data Meetup. Получаются уже довольно масштабные мероприятия, да и спикеры все очень крутые. Настолько впечатлили доклады, что решил организовать видеозапись, поэтому ожидаю, что вчерашние выступления будут доступны более широкой группе лиц на ютубе.
У нас выступали ребята из inDriver, Semrush, SpatialChat.
Так что, если вы на Кипре, то велком к нам, а если не на Кипре, но хотите приехать выступить, пишите мне 😎

Вчера были в офисе компании ASBIS. Крутой офис и общая организация топ. Вот вам фоточка с моим заглавным слайдом и немножко спикеров.
🔥50👍17❤‍🔥7🤮1