LEFT JOIN – Telegram
LEFT JOIN
44.9K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Что известно про Apple Intelligence
Apple не может без инноваций и даже расшифровка AI у нее теперь своя, особенная — Apple Intelligence.

Компания представила свой ИИ вчера на конференции WWDC 2024. Целиком выступление можно посмотреть на YouTube. Кроме Apple Intelligence там рассказали про visionOS для Vision Pro, очередную версию iOS, новые функции у AirPods и Apple TV и другие новости. Но нам интереснее всего последний блок презентации про Apple Intelligence.

💬 Это — персонализированный ИИ на основе нескольких генеративных моделей, который получит поддержку на iPhone, iPad и Mac
Apple Intelligence сможет работать с текстами, изображениями и разными приложениям. Если конкретнее, то он поможет вычитать или переписать сообщение (в почте и не только), написать краткое содержание звонка или текста, сгенерировать по запросу кастомный эмодзи или картинку, а заодно сделает Siri еще умнее, чем раньше. Голосовая помощница научится понимать команды, даже если человек запнулся или оговорился. Также он получит интеграцию с ChatGPT.

💬 Главная особенность Apple Intelligence — персонализация
Его представляют как ИИ, который максимально подстраивается под пользователя. Например, сможет выбрать из кучи оповещений самые приоритетные для получателя и обратить внимание именно на них. Или найти среди множества фотографий снимки с определенным человеком. Потому что он знает, как выглядят ваши друзья и родственники.

Также ИИ сможет понимать команды на естественном языке. То есть ему можно будет сказать: «Найди файлы, которые начальник прислал мне на прошлой неделе», и он, как обещают, с задачей справится.

💬 Большая часть операций выполняется на устройстве
Если же Apple Intelligence понадобятся дополнительные ресурсы, он постучится в облако с говорящим названием Private Cloud Compute. Apple уверяет, что оно только предоставляет вычислительные мощности и не хранит никакую пользовательскую информацию.

Apple Intelligence будет доступен на iPhone 15 Pro и iPhone 15 Pro Max, на iPad с процессорами M-серии и на Mac этой осенью.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥82👍32293
«Найти и удержать»: пять дискуссий о маркетинге
18 июня пройдет бесплатная онлайн-конференция о маркетинге. Руководители из разных сфер расскажут, как привлекать лидов и превращать их в постоянных клиентов, продвигать бренд, работать с рекламными каналами и форматами, выстраивать процессы в команде.

🔜 Спикеры — руководители маркетинга из EdTech, Fashion, Beauty, общепита и магазинов техники. Будет много знакомых брендов: Zarina, Yves Rocher, «Нетология», Redmond, «Тануки» и другие.

Старт в 12 по МСК. Всего будет 5 выступлений — около часа на каждое выступление. Можно выделить весь день и посмотреть все или выбрать несколько самых интересных.

🔥 Участие бесплатное, понадобится регистрация через Telegram-бот.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍49🔥3261🤡1
Нейроаналитика от GPT-4o
Флагманская нейросеть от OpenAI умеет не только шутить красивым голосом, подозрительно похожим на Скарлет Йоханссон, но и работать с данными.

А именно:
🔵 загружать таблицы из облачных сервисов вроде Google Drive и Microsoft OneDrive;
🔵составлять и редактировать таблицы по запросу пользователя;
🔵визуализировать данные на графиках и диаграммах;
🔵анализировать информацию.

Со всеми задачами нейросеть справляется весьма неплохо и рисует на основе ваших данных симпатичные таблицы и графики, которые потом можно использовать в отчетах и презентациях. GPT-4o не просто генерирует картинку или табличку, но и дает скопировать код, который за это отвечает.

🔜 У аналитиков она хлеб не отберет, но точно ускорит работу над некоторыми рутинными задачами. Сделает график (причем любой, какой попросите, и во всех возможных цветах) на основе таблицы или таблицу на основе графика, сама напишет выводы из данных, чтобы вам не пришлось ручками печатать их.

Главное — не забывать перепроверять все, что вам пишет GPT-4o. Даже флагманские модели не защищены от галлюцинаций.

А вы уже пользовались этими функциями GPT-4o? Как вам результат?
👀
Please open Telegram to view this post
VIEW IN TELEGRAM
👍76🔥3321😁31
Датавиз сегодня и 100 лет назад
Любопытная вещь — датавиз.

💬 Думаю, что первая ассоциация с этим словом (или с двумя словами, если расшифровать до «data visualization») — это что-то про бизнес-аналитику, интерактивные дашборды, про современность и технологичность. Но ведь люди искали способы графически отображать информацию на протяжении всей своей истории. А отличные и до сих пор актуальные книги по датавизу писали еще 100+ лет назад.

💬 Как раз про это на канале Ромы Бунина @revealthedata вышел пост. Рому знают, наверное, почти все, кто в русскоязычном пространстве связан с данными и их визуализацией. Я сам давно с ним знаком и его канал рекомендую всем, кому интересна тема датавиза. И что круто, он еще и активный участник коммьюнити: проводит вебинары и лекции, ходит на конференции, помогает школьникам осваивать основы визуализации данных и притягивает к себе таких же классных талантливых людей.

💬 И один из них, Виталий Балобанов, и написал для его канала пост про книги от пионера в области датавиза — Вилларда Коупа Бринтона. Они обе вышли еще в прошлом веке, но актуальность до сих пор не потеряли. В общем, получился интересный экскурс в историю. Но, кстати, посты, которые пишет сам Рома ничуть не хуже, почитайте и их тоже. 😁

Написать этот пост я решил не только из уважения к тому, что делает Рома, но и потому что мы с ним оба попали в новую папку каналов про аналитику. Мы все, кто в ней оказался, рассказываем про своих «соседей» по папке подписчикам ­— каждый про кого-то одного.

Этот флешмоб еще и весьма удобная штука для читателей. Этакая рецензия на каждый канал, можно зайти, всех посмотреть и выбрать, кто больше по душе. Надеюсь, конечно, что все, потому что подборка получилась реально хорошая. 🔥
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥80👍491610🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
AI-видео от Алексея Лоткова
ИИ-картинками уже никого не удивишь — наступило время ИИ-видео. К тому же, мощных нейросетей, которые умеют генерировать ролики, скоро станет больше. Зимой всех уже впечатлила Sora, готовимся встречать Veo от Google и записываемся в лист ожидания китайской Kling.

🔥 А пока ждем, можем позалипать в работы художника и моушен-дизайнера Алексея Лоткова. С помощью After Effects, Stable Diffusion, ComfyUI и Photoshop он создает крутые сюрреалистичные видео.

Как вам такое творчество? Ставьте ❤️, если заходит, или 💔, если нет. И в комментариях заодно расскажите подробнее, что думаете.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9577💔14🔥4😍3
Главная задача продуктового аналитика
Можно долго рассуждать, зачем нужны аналитики, маркетологи, проджекты, продакты и так далее, приводить много аргументов и доказывать свою ценность для компании. Но так или иначе конечная цель у нас у всех одна — помогать бизнесу зарабатывать деньги и увеличивать прибыль.

Просто каждый делает это по-своему. Как это делают продуктовые аналитики, рассказывает на своем канале @firstanalyticsguide Ярослав Хромов. Он построил собственную компанию с прибылью 50М+ и рулил аналитикой в Wakie, Fura и Turbo, так что он знает, о чем говорит.

Про что он пишет:
💬 как научиться определять Use Case, понимать, в чем польза вашего продукта, и составить модель монетизации;
💬 как и зачем измерять вовлеченность;
💬 и почему не надо строить дерево метрик (и что надо вместо него).

В общем — про пользу и практический опыт. И даже в посте про то, как он проиграл деньги в казино, сможет объяснить случившееся с точки зрения продуктовой аналитики!

🔜 Любите такое? Тогда вам сюда
Please open Telegram to view this post
VIEW IN TELEGRAM
👍106🔥7116😁1🤡1
Quary: BI для инженеров
Есть Big Data — это большие объемы данных, обработать которые под силу только машинам. Есть Small Data — это, наоборот, небольшие данные, справиться с которыми может и человек.

💬 А что делать, если данные еще не большие, но табличек уже многовато и заполнять их вручную становится слишком сложно? Эту стадию развития бизнеса разработчики Quary назвали Middle Data, и именно для таких случаев они и создали свой продукт.

🔵 Он умеет подключаться к базам данных и внешним источникам через API, преобразовывать данные, собирать их в таблицы и визуализировать на графиках. Дашборды и отчеты в разработке.
🔵 Все это делается с помощью кода, поэтому инструмент и позиционируется как «BI для инженеров».
🔵 Полноценную систему аналитики он не заменит, но поможет навести в данных порядок.

Это open source проект, так что узнать о нем побольше и скачать все необходимое для работы можно на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍103🔥5112🤔6👎1
Идеальный курс по SQL: какой он?
Наша команда уже выпустила один курс по SQL и Python — «Марафон Данных». Его прошли больше 10 000 человек, а средняя оценка составила 4,8 баллов.

Еще не идеал, но уже весьма неплохо! 🔥

Мы почти готовы выпустить продолжение — новый курс, который поможет более глубоко познакомиться с SQL, от основ перейти к более сложным и продвинутым функциям и отточить знания на практических задачах. Чтобы он получился еще лучше и полезнее, просим вас пройти короткий опрос по ссылке.

В нем всего 5 вопросов, но они помогут нам понять, какие задачи вам интересны и чему уделить особое внимание. Всем, кто пройдет опрос, обещаем бонус — промокод на новый курс. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍89🔥3722
Neosync: помощник по работе с данными для разработчиков
Neosync — open source решение, которое позволяет анонимизировать реальные данные и генерировать синтетические. Оно пригодится для тестирования кода, воспроизведения багов или заполнения БД начальными данными.

🔜 В общем, для ситуаций, когда вам нужен набор данных, максимально приближенных к реальным. Или когда вы не можете использовать реальные данные — например, потому что они содержат чувствительную информацию, которую нигде «светить» нельзя.

У разработчиков часто есть специальные датасеты для таких задач, но проблема в том, что тестовые данные, как правило, плохо передают все особенности того, что творится в реальности.  

Neosync предлагает решение:
🔵 анонимизирует реальные данные, убирая из них всю информацию, по которой их можно идентифицировать;
🔵 генерирует набор синтетических данных с нуля на основе схемы вашей базы данных.

При этом он сохраняет все взаимосвязи между таблицами. А еще умеет интегрироваться с Postgres, MySQL, AWS S3 и другими популярными системами и платформами.

Больше про функционал и возможности инструмента можно узнать на странице на GitHub.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍67🔥32👌1322
Вероятностные крестики-нолики
Новая версия игры, где вы своими же действиями можете принести оппоненту победу.

🔜 Поле такое же, как всегда — сетка 3 х 3. И суть игры та же — игроки ходят по очереди и пытаются нарисовать три крестика или три нолика подряд. Но у каждой клетки прописаны вероятности — что произойдет, если вы попытаетесь поставить в ней крестик. Есть три варианта развития событий.
🔵 Благоприятный— игрок нарисует свою фигуру.
🔵 «Ну такой» — клетка останется пустой.
🔵 Неблагоприятный — игрок нарисует фигуру противника.

Вероятность каждого результата прописана прямо на клетке и никогда не равна 100%.

У игры есть два уровня сложности и два режима — против компьютера и против человека.

🔜 Как пишет автор до этой идеи он додумался, когда размышлял о том, какую большую роль в жизни играет случайность. Иногда вы можете все сделать правильно, но все равно проиграть, потому что удача была не на вашей стороне. Но все равно после какого-то количество попыток, если продолжать стараться, вы обязательно добьетесь своего.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍155🔥63179😁4
PDF Search: заставьте AI искать нужную информацию за вас
Многим из нас приходится постоянно работать с огромным количеством всевозможных файлов и документов, и чем больше их становится, тем сложнее находить среди них нужную информацию.

Современные технологию эту проблему не создали, но усугубили. И они же предлагают решение. Кто намного лучше людей справляется с большими объемами данных? Искусственный интеллект.

ИИ за несколько минут прошерстит документы, которые человек будет перечитывать полдня.

Это обещают создатели PDF Search — приложения для iPhone, Mac и iPad
🔵 Оно ищет информацию в ваших документах по запросу. ИИ здесь нужен для того, чтобы не просто высматривать ключевые слова, но и понимать контекст и поисковые запросы на естественном языке.
🔵 ИИ анализирует содержание документа целиком и в выдаче показывает наиболее релевантные страницы. Если подходящих документов несколько, он может вытащить из них информацию под ваш запрос в отдельную PDF-ку.
🔵 Отдельное приложение PDF Converter конвертирует в PDF файлы других форматов, чтобы PDF Search смог работать и с ними тоже.
🔵 И, конечно же, вы можете синхронизировать свои устройства, чтобы PDF Search смог работать со всеми файлами, какие только у вас есть.

Приложение платное, но есть пробный период.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍89🔥6737👌294
This media is not supported in your browser
VIEW IN TELEGRAM
ML и нейросети в российских сервисах
Большинство обсуждаемых новостей про нейросети и искусственный интеллект предсказуемо генерируют США и Китай. Но ими дело не ограничивается, поэтому мы решили посмотреть, как дела за их пределами — например, в России.

Самый очевидный пример — маркетплейсы. Они внедряют ИИ, чтобы сделать проще заполнение карточек текстами и картинками.

🔵 «Яндекс Маркет» добавил в личные кабинеты продавцов YandexGPT, создающую описание по информации в карточке. Wildberries тестирует сервис, которому достаточно только названия товара, чтобы составить текст.
🔵 Также внедряют нейросети, генерирующие картинки с товарами. YandexART представили в декабре прошлого года. Она до сих пор в бете и доступна не для всех категорий товаров. У Wildberries и Ozon аналогичные функции тоже пока находятся на стадии тестирования.
🔵 Ozon пошел дальше всех и еще в прошлом году выкатил сервис для генерации обложек на основе ML. Результат работы прикрепили к посту — кажется, дизайнерам бояться пока нечего.
🔵 «Яндекс Маркет» заботится не только о продавцах, но и покупателях — для них нейросеть генерирует персонализированные подборки товаров.

ML‑калькулятор для расчета стоимости квартир. Опять «Яндекс» — на этот раз «Яндекс Недвижимость».
🔵Сервис «Про дом» рассчитывает стоимость покупки или аренды жилья на основе данных в карточке: этаж, площадь, число комнат. Он принимает во внимание также состояние дома и цены на соседние квартиры в моменте и в динамике.

«2ГИС» наводит порядок в карточках.
🔵 Нейросеть собственного изготовления сортирует фотографии по альбомам — отделяет фото интерьера от экстерьера и фото блюд из меню от фото парковки.
🔵 Сберовская GigaChat делает то, что в комментариях на vc.ru метко назвали «жмых по отзывам» — то есть краткое описание места или заведения на основе того, что о нем писали люди.

А нам все не дает покоя ML-обложка от Ozon. Если наберется 100 👍🏻 — наш дизайнер сделает свою версию.

Ставьте лайки, если интересно, что получится!
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17891🔥5918👌2
Ищем спеца по датавизу в команду Valiotti Analytics
Если вы любите дизайн, данные и визуализацию, то у нас к вам деловое предложение.

С нас:
🔵 Разнообразная и интересная работа — надо будет создавать крутые дашборды для наших заказчиков совместно с командой аналитиков, писать стайлгайды и статьи про датавиз.
🔵 Достойная зарплата, классная молодая команда, корпоративный английский и другие плюшки.
🔵Полная удаленка с гибким графиком.

С вас:
🔵 Владение Power Point, Google Slides, Keynote и графическими программами — Figma, PS, Illustrator.
🔵 Опыт работы с визуализацией данных.
🔵 Знакомство с Tableau и аналитикой данных — большой плюс.

Подробное описание вакансии читайте по ссылке.

Это про вас? Тогда пишите скорее нашему HR Татьяне @tanya_zab. Будет классно, если у вас есть портфолио!

Если это не про вас, но у вас есть кандидат на примете — помогите нам найти друг друга и отправьте ему этот пост. ❤️
Please open Telegram to view this post
VIEW IN TELEGRAM
👍51🔥37143
Мы теряем интернет
«Все, что попадает в интернет, остается там навсегда» — слышали такую фразу? Ее еще любят припоминать, когда заходит речь об эффекте Стрейзанд или той самой фотографии Бейонсе, которую ее адвокат удалил из интернета.

Оказывается, это неправда.

🔜 38% веб-страниц, существовавших в 2013, сегодня уже недоступны — это обнаружила команда дата саентистов из Pew Research Center. Они изучили ссылки на новостных и правительственных сайтах, в примечаниях в «Википедии» и твиты. Последние — чтобы разобраться, как «цифровой распад» сказывается на соцсетях.

Для того, чтобы отследить появление и исчезновение страниц за 10 лет, с 2013 по 2023 годы, они использовали Common Crawl. Это бесплатный архив, который каждый месяц собирает данные об доступных сайтах в интернете. В выборку исследователей попало чуть меньше миллиона разных страниц.

🔵23% новостных страниц и 21% страниц на правительственных сайтах содержат как минимум одну битую ссылку.
🔵 50 000 статей из «Википедии» в сумме содержали больше миллиона ссылок в разделе «Примечания» — то есть они вели на внешние сайты. Из них 11% оказались нерабочими.
🔵 За 10 лет почему-то исчезла половина твитов, написанных на турецком и арабском языках.
🔵 1/5 опубликованных твитов исчезают в течение нескольких месяцев.

Даже немного грустно от мысли, сколько информации — полезной и не очень — потеряно и сколько еще мы потеряем. Может, когда-нибудь и знаменитая фотография Бейонсе исчезнет.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍123🔥6613😁84
Что получится, если заставить ChatGPT заполнить налоговую декларацию?
Программист Майк Макферсон решил это выяснить, а заодно — взглянуть на нейросети под довольно любопытным ракурсом. Их часто рассматривают как самостоятельный инструмент, который генерирует тексты, картинки, видео, код и так далее. Но что, если воспринимать ИИ как операционную систему, которая связывает несколько элементов вместе и помогает взаимодействовать с ними?

🔜 Возможности нейросетей сегодня впечатляют — и все же они до сих пор ограничены. Но их можно расширить, если «подружить» ИИ с другими приложениями, библиотеками или базами данных.

В 2022 Майк создал библиотеку Python tenforty — она помогает юзерам посчитать, сколько налогов они должны государству в зависимости от доходов, расходов, семейного положения и прочих факторов. Сразу оговоримся — эта штука знакома только с законодательством США.

Он планировал когда-нибудь сделать на ее основе приложение, но вместо этого сделал кастомную GPT Tax Driver. Ее функция та же — считать налоги и вычеты, только при этом она еще понимает запросы на естественном языке, пишет подробные ответы и даже может нарисовать график.

🔵 В целом, она с этими задачами отлично справляется, хотя иногда неправильно понимает суть вопроса или игнорирует некоторые требования пользователя.
🔵Это теоретически удобный инструмент, но он предъявляет высокие требования к пользователю — надо тщательно подходить к написанию промптов и внимательно перепроверять ответы.
🔵 Несмотря на эти недостатки, у подхода «ИИ как ОС» точно есть потенциал — он делает разработку приложений намного проще и быстрее.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍115🔥6141👌12💔3
Data Heroes с Александром Шестопаловым из BBE
Гостем нового выпуска подкаста стал коммерческий директор Bang Bang Education Александр Шестопалов. Это онлайн-школа дизайна и технологий, где студентов учат дизайну, анимации, монтажу и вот теперь аналитике.

Александр в эдтехе больше 8 лет — он успел поработать в маркетинге GeekBrains и Skillfactory. В BBE он с нуля построил команду маркетинга

Про что говорили?
💬 Про эдтех. Почему эта сфера сложная, но интересная? Чем отличаются массовые онлайн-школы от нишевых в подходах к продвижению и созданию курсов? Почему BBE, онлайн-школа творческих профессий, решила вести курсы для аналитиков?
💬 Про работу с людьми. Как нанимать людей и не ошибаться (или ошибаться, но редко)? Как проверить скиллы соискателя на собеседовании, и почему если человек сделал тестовое с помощью ИИ, это не всегда плохо?
💬 Про аналитику. Как устроена аналитика в эдтехе? За какими метриками следит коммерческий директор?
💬 Про будущее и технологии. С какими задачами ИИ справляется хорошо, а в чем все еще не может заменить человека? И что ждет эдтех ­— уйдем ли вы офлайн или сфера будет расти и дальше?

Выпуск уже на всех платформах: Яндекс Музыка, Apple Podcasts, Spotify.

Пишите, как вам подкаст?

#DataHeroes
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥97👍8623👌84
OpenAI купила Rockset и Multi
Обе сделки выглядят как acqui-hire — покупка компании в первую очередь для того, чтобы нанять работающих в ней людей.

💬 Rockset — база данных для real-time аналитики. Она умеет оперативно обрабатывать огромные массивы данных и подходит для создания поисковых систем и рекомендательных алгоритмов, мониторинга и алертинга.
💬 OpenAI планирует интегрировать разработки Rockset в свои продукты. Предположительно, это поможет повысить точность ответов ChatGPT.
💬 Это хорошие новости для пользователей нейросети и не очень — для клиентов Rockset. Компания будет постепенно «отключать» их от своих сервисов и полностью сконцентрируется на работе на благо ИИ. Им придется найти новую БД до конца сентября.

Еще сложнее придется клиентам компании Multi.
💬 Multi — платформа для распределенных команд. Она позволяет расшаривать экран во время созвонов сразу нескольким пользователям, всем вместе редактировать документы, писать, рисовать на экране. В общем, работать удаленно, но всем вместе, как будто вы сидите рядом в одном помещении.
💬 Правда, только до 24 июля. После все данные клиентов будут удалены.

Вот такая цена прогресса — в любой момент может прийти OpenAI и присвоить себе ваш любимый сервис, чтобы он улучшал ChatGPT
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥86👍3527👎3
💙 Новый интересный пост от создателя LEFT JOIN и фаундера Valiotti Analytics на канале Коля Валиотти • Дата консалтинг про данные и внедрение data-driven подхода в компании!
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥65🏆4
Стратегия управления на основе данных
Data-driven подход — это такая штука, к которой все стремятся, но не все понимают, что это такое и как к этому прийти.

▶️ Data-driven — это подход, когда все решения в компании принимаются на основе цифр. Чтобы этого добиться, нужно твердо понимать, зачем эти цифры нужны, о чем говорят и как влияют на развитие бизнеса. Система аналитики должна быть максимально согласована с целями и с миссией компании.

▶️ В идеале к этому состоянию надо идти по определенным шагам. Чтобы не превращать пост в простыню, вынес их на карточки.

Но что надо обязательно учесть: в реальности у большинства компаний нет точного понимания, как должна выглядеть аналитика и какие данные они хотят видеть. А делать выводы на основе цифр хочется уже сейчас.

В начале пути важно научиться работать со всеми доступными данными. Они уже у вас как-то собираются — например, в CRM-системе; можно начать собирать их в хранилище для построения отчетности, делать первые выводы, смотреть, чего не хватает. Постепенно бизнес будет развиваться и вместе с этим появится понимание, какие данные и метрики вам нужны. ❗️

@datakolya
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2395😱3