LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
🎨 Is it real or is it fake? 🤖
За последние несколько недель мы часто рассказывали вам про AI-модель DALL-E: про ее устройство и ограничения. Теперь пришла пора проверить, насколько внимательно вы читали наши посты и насколько хорошо модель создает реалистичные изображения. This Image Does Not Exist – простой тест, в котором вам показываются настоящие и сгенерированные моделью изображения, а вам нужно предположить, кто его создал. Например, изображение выше: как думаете, кто его создал? Ставьте ❤️, если вы думаете, что изображение реальное и 🔥, если думаете, что его создала DALL-E

#leftjoin_ai
69🔥69👍2
LEFT JOIN pinned a photo
🛢SQL hub - без баз даных программирование невозможно. Узучи SQL быстро и легко. В канале собраны самые доступые и понятные гайды для освоения SQL.

Полная ит-библиотека вместо тысячи платных курсов и книг.
👍19
LEFT JOIN
🎨 Is it real or is it fake? 🤖 За последние несколько недель мы часто рассказывали вам про AI-модель DALL-E: про ее устройство и ограничения. Теперь пришла пора проверить, насколько внимательно вы читали наши посты и насколько хорошо модель создает реалистичные…
Итак, модели DALL-E удалось запутать большую часть наших подписчиков! На самом деле, изображение сгенерировала именно она, получив на вход следующую инструкцию: "A photograph of a saguaro cactus wearing a sun hat and aviator sunglasses in a sunny desert".

Мы тоже по-началу ей поверили, ведь получилось весьма похоже на настоящую фотографию. Следите за нашими постами, мы планируем и дальше делиться новостями и статьями о лучшей современной AI-модели 🤖
👍19🤯8🤔1
☕️ Под утренний кофе: еженедельный дайджест о технологиях, данных и аналитике 🗞
🌯 Мексиканский фастфуд и хитрые инженеры
Когда появляется какая-то проблема, люди делятся на тех, кто придумывает решение, и тех, кто смиряются с её существованием. Студенты-инженеры из университета Джона Хопкинса были крайне недовольны разваливающимся в процессе употребления буррито. К поиску решения они подошли как настоящие ученые: изучили исследования скотча и различных склеивающих материалов, а затем начали создавать собственный съедобный скотч для скрепления буррито. Финальный продукт представляет собой кусочки сьедобного скотча на гладкой бумаге, которые нужно открепить, добавить немного воды и скрепить буррито или любой другой ролл.
К сожалению, секретные ингридиенты еще не известны, так как авторы подали заявку на патент, но тестовый вариант выглядит космически!

🗣 А мы разве знакомы?
В самом высокоцитируемом научном журнале Nature вышла новая статья, авторы которой выяснили, что когда мы узнаем информацию о незнакомце, мы склонны ошибочно полагать, что они тоже знают о нас. Гипотеза исследователей была такой: зачастую социальные отношения имеют двухстороннюю связь (например, тот, кого вы считаете другом, наверняка тоже считает вас таковым), однако, иногда отношения все же односторонние, но наш мозг продолжает думать, что это не так. Авторы провели эксперимент, и выяснили, что когда жителям района рассказывают личную информацию о местных полицейских, уровень преступности в этом районе падает. Все это происходит потому, что люди склонны думать, что раз они знаю что-то о человеке (полицейском), то и он о них тоже осведомлен. Такой простой метод борьбы с преступностью может даже заменить текущий (консервативный): увеличение числа полицейских в неблагополучных районах также уменьшает уровень преступности.

👨🏼‍🎨 Мы же обещали: снова про DALL-E
Если в этом году у вас не получится поехать в отпуск, DALL-E вам поможет убедить всех друзей, что вы отлично отдохнули на Сейшелах. Мэтт Белл уже воспользовался такой возможностью и опубликовал пост с 22 настоящими фото со своего отпуска и добавил 4 автоматически сгенерированных по описанию того, что он видел. 83% его аудитории, которые после прошли опрос о реалистичности фото, даже не подумали, что это фейк (несмотря на водяной знак в углу изображения и другой размер кадра). Конечно, аудитория, состоящая из друзей в фейсбуке, более склонна "поверить" автору, чем засомневаться, но тем не менее это очередной аргумент в пользу высокого качества работы модели!

🧀 Никаких больше подделок итальянских сыров
Самый лучший сыр Пармиджано запрещено подделывать, однако, бороться с этим очень трудно. Именно поэтому итальянские сыроделы решили внедрить технологию отслеживания головок сыра. Чтобы защитить свой пармезан, консорциум Parmigiano Reggiano Consortium, по сути, профсоюз, основанный в 1934 году, объединился с голландской компанией, которая специализируется на производстве чипов p-Chips. Эти чипы дают каждому сыру уникальную и сканируемую бирку. Кроме того, информация о пармезане сохраняется в блокчейне, поэтому её легко отследить.

#weekly #дайджест
👍23🔥21
📊 Excel в Python – это точно хорошая идея? 🤔

Знаем-знаем, этот заголовок звучит как изобретение велосипеда. Многие аналитики были счастливы в какой-то момент перестать работать в Excel и перешли на работу с CSV-шками в Pandas, но нашлись те, кто наоборот попытался создать Excel в Python.
Разработчики Mito создали mitosheet package для Python, который воссоздает в JupyterLab Notebook кликабельный Excel-подобный интерфейс. Они заявляют, что возможность доступа и редактирования таблицы без необходимости писать код сильно упрощает процесс работы с данными, потому что не нужно искать решение очередной ошибки данных на Stack Overflow. Каждый ваш клик в таблице преобразуется в корректный код, с помощью которго можно добиться той же цели.
Такой вариант может быть весьма неплохим решением для тех, кто переходит из Excel в Python без знания языка программирования, однако, по сути, этот плагин превращает работу с данными из формата "запрос – результат" в ручное преобразование.
На наш взгляд, это весьма спорный метод, однако, он, как и многие другие, имеет право на существование и свою аудиторию. А что вы думаете?
👍29🤔42
💻 Еще один BI-инструмент, о котором мы не можем не рассказать 💭

Кажется, раньше мы (совершенно зря!) не рассказывали вам про сервис GoodData BI-сервис, который очень и очень хорош, а также чем-то напоминает Tableau.
Преимущества:
🔍 Подключается к таким сервисам, как AWS Redshift, BigQuery, Snowflake, PostgreSQL, Vertica;
🔍 Создает публичные и выделенные пространства;
🔍 Хорошо распознает форматы данных в таблице;
🔍 Максимально нативный интерфейс.

Тестировали? 🙂
👍19😱4
🚨 Будьте аккуратнее с AirTag 📍
🎉 В начале прошлого года Apple выпустила шикарные небольшие метки AirTags, чтобы находить оставленные ключи и кошельки. Учитывая успешное повсеместное внедрение продуктов компании, таких как iPhone, AirTags вполне могли бы привести потребителей к постоянному отслеживанию местоположения своих вещей, чтобы ничего больше не было потеряно или забыто. Принцип его работы в следующем: AirTag транслирует по Bluetooth защищённый сигнал, который умеют принимать ближайшие устройства с включённой функцией «Сеть Локатора». Они отправят геопозицию вашего AirTag в iCloud, и тогда вы можете увидеть свой трекер на карте в приложении «Локатор». То есть для того чтобы узнать местоположение AirTag рядом должен быть хотя бы один любой смартфон.

🤔 Но у каждой новой технологии, которая делает нашу жизнь удобнее, будь то бесконтактные платежи или Face ID, есть своя цена. В последние месяцы люди чувствуют себя крайне некомфортно и небезопасно, обнаружив метки AirTags, спрятанные в их сумках и автомобилях. Они небеспочвенно боятся, что их будут сталкерить или что кто-то хочет украсть их вещи или автомобили. Вот история девушки, которая рассказала историю о слежке с точки зрения преследователя, а вот статья о том, как люди внезапно находили AirTag в своих сумках и машинах. Люди, конечно, получили предупреждения на свои iPhone — функция, которую Apple встроила в систему AirTag, чтобы предотвратить нежелательное отслеживание. Однако, это не меняет сути дела, ведь оповещение приходит не сразу.

📝 Почему я так подробно рассказываю вам об этом сейчас?
Все дело в том, что в понедельник вечером к моей машине на Кипре прикрепили AirTag. А во вторник вечером я об этом узнал, потому что айфон среагировал на то, что за мной следят. Разумеется, я вызвал полицию. В целом, конечно, дело пахнет керосином, потому что найти мошенника крайне сложно. Однако, Apple раскрывает немного информации о хозяине AirTag: серийный номер устройства и последние 4 цифры телефона. Исходя из этой информации полиция может запросить у Apple остальные детали.

🔍 Как себя обезопасить?
Если честно, мы мало что можем сделать в этой ситуации, кроме как хорошенько следить за своими личными вещами. К сожалению, оповещения об оставленном устройстве приходят не сразу (мне пришло примерно спустя полдня). В этой статье собраны те немногие меры, которые могут помочь вам отслеживать подброшенный AirTag или любое другое устройство (например, по тому же принципу осуществляется поиск беспроводного наушника). Нужно включить службы геолокации, Bluetooth, а также разрешить "Уведомления об отслеживании".

Все это, конечно, очень и очень неприятный опыт, друзья. Будьте бдительны, сегодня технологии далеко не всегда используются во благо!
😱22👍13🔥2🤔1
А так выглядит скриншот считанного чужого AirTag. И у полиции есть все шансы найти злоумышленника по опознавательным знакам, отправив запрос в 🍏
Научись визуализировать данные с Яндекс Практикумом

Сервис онлайн-обучения цифровым профессиям Яндекс Практикум запускает программу обучения навыкам «Визуализация данных и введение в BI-инструменты». Курс предназначен для обучения студентов с нуля, специальных знаний для старта не требуется.

Авторы и преподаватели – практикующие эксперты ведущих российских IT-компаний.

Длительность — 3 месяца.

Курс построен в формате симулятора — стажировки в компании, чтобы приблизить обучение к реальным рабочим процессам. Вы будете интерпретировать запросы руководства и коллег, исправлять ошибки ваших предшественников, получать и давать обратную связь.

Вы научитесь:

▪️Фундаментальным основам визуализации: какие бывают данные, как разные данные преподносить, как создавать визуализацию информативной и понятной для пользователя;
▪️Пошаговому алгоритму визуализации;
▪️Выбирать и создавать подходящие типы визуализации для разных данных и бизнес-запросов;
▪️Базовому функционалу и построению различные графических конструкций в нескольких BI-системах – Tableau, DataLens, Datawrapper.

В финальной части обучения вы самостоятельно выполните бизнес-проект по требованиям заказчика: создадите интерактивный дашборд, отражающий разные грани бизнеса — от финансовых потоков до эффективности сотрудников.

Стоимость курса:

64 500 рублей при разовой оплате, при оплате в рассрочку – 22 500 рублей в месяц.

По завершении программы студенты получат удостоверение о повышении квалификации.

Запись на обучение в первый поток и подробности по ссылке
#реклама
👍22🤔6
💭 Anything you can Imagen 🌏

Про модель генерации DALL-E 2 (очевидно созвучную фамилии великого художника Дали) мы написали несколько подробных постов: про запуск модели, про устройство модели и про её ограничения. Однако, это не все, что просходит в сфере AI на данный момент. 24 мая Google тоже выпустили модель "text-to-image", которая называется Imagen (созвучно imagine – представлять, воображать). К сожалению, Google пока что не открыл доступ к модели по причине возможного злоупотребления полученными результатами.

🤔 Imagen работает с естественным языком, например «Золотистый ретривер в синем клетчатом берете и водолазке с красными точками», а затем используя "замороженный кодировщик" T5-XXL, преобразует этот текст во эмбединги. Затем «условная диффузионная модель» отображает встроенный текст в маленькое изображение размером 64x64. На последнем этапе Imagen использует текстовые диффузионные модели сверхвысокого разрешения для повышения дискретизации изображения 64x64 до 256x256 и 1024x1024. Чуть подробнее об этом рассказывают здесь.
Поскольку вы уже погружены в контекст работы DALL-E 2 (если нет, скорее погрузитесь), то мы сделаем акцент на отличиях моделей.

🎨 Во-первых, многие отмечают разницу в реалистичности изображений. DALL-E 2 превосходно создаст картину в определенном стиле с заданными объектами, а реальные изображения почти всегда вызывают сомнения. Imagen же поражает «беспрецедентным фотореализмом» и по оценкам Google, Imagen побеждает DALL-E 2 в тестах на человеческую оценку как по точности, так и по достоверности.

🛠 Во-вторых, Imagen сильно превосзодит предшественника в работе с деталями. Вы можете задать очень подробное описание объектов и их расположения и, скорее всего, результат даже превзойдет ваши ожидания. В то время как DALL-E 2 скорее всего либо перегрузится, либо упустит какую-то часть деталей.

📦 В третьих, коротко опишем разницу в устройстве моделей. Несмотря на то что модели создавались параллельно и разработки не пересекались, смысловые блоки элементов, преобразующих текст в изображение, достаточно похожи. Однако, одним из основных отличий является первый этап – text encoding. Разработчики Google AI используют большую обученную модель, похожую на GPT-3, для того чтобы понять текст так хорошо, как только это можжет сделать AI система. Вместо того, чтобы обучить текстовую и генерирующию изображения модели, они используют предобученную модель и "замораживают" ее на время обучения модели генерации изображений. Исходя из исследования, сопровождающего выход модели, именно это сильно улучшило эффективность модели.

#leftjoin_ai
👍11🥰1
Хотя предпочтения моделей и их сравнения субъективны, поделитесь вашим мнением, какая модель по-вашему лучше? Для примера, слева изображение, созданное Imagen, справа – DALL-E, а, для большего понимания работы моделей, советуем посмотреть другие варианты изображений с одинаковыми входными данными.
🔥 за свежую гугловскую Imagen и ❤️ за хорошо изученную DALL-E 2!
🔥6812👍1
Forwarded from Reveal the Data
Вакансии аналитиков март-май 2022
Количество вакансий аналитиков относительно прошлого года упало не на много, всего на 14%. Но по сравнению с предыдущими тремя месяцами сократилось на более значительную цифру в 27%. Это можно было бы списать на сезонность и меньшую активность весной. Она и вправду есть, но в прошлом году весной вакансий в сумме было больше, чем зимой.

Зарплаты относительно прошлого года выросли на приличные 20%. И рынок при этом всё ещё перегрет — на одно активное резюме на сайте приходится в среднем две вакансии.

В разбивке по срезам просели все типы вакансий, кроме удалённых. Таких стало на 16% больше даже с учетом отступающего ковида. Больше всего упали позиции младших аналитиков, на целых 40%, получить первую работу, к сожалению, станет сложнее. Зарплаты выросли больше всего у инженеров данных и дата саентистов.

Данные и обзор подготовили:
@revealthedata @leftjoin
👍22
Forwarded from Reveal the Data
Ещё повторили карточки с прошлого годового обзора. Здесь данные для Москвы и Питера с декабря 2020 по май 2022 и лучше видно общую динамику.

Основной дашборд

Данные и обзор подготовили:
@revealthedata @leftjoin
👍19