LEFT JOIN – Telegram
LEFT JOIN
45K subscribers
944 photos
28 videos
6 files
1.2K links
Понятно про анализ данных, технологии, нейросети и, конечно, SQL.

Услуги — leftjoin.ru
Курсы по аналитике — https://stepik.org/users/431992492

Автор — @valiotti
Реклама — @valiotti

Перечень РКН: https://tapthe.link/PpkTHavwS
Download Telegram
Аватарка точка ру: версия 2022📱
Вы не могли не заметить вирусный тренд (особенно, в инстаграме, через одну историю)) на сгенерированные AI аватарки. Давайте разбираться, что случилось!

Что случилось?
Та самая Prisma Labs на днях выпустила обновление Magic Avatars для своего фото редактора Lensa, чем несказанно порадовала многочисленных фанатов игр, фэнтези, приключений и научпопа во всех их креативных проявлениях, а также просто любителей менять аватарки в соцсетях раз в месяц.

Как это работает?
Карманный аналог Stable Diffusion удобен тем, что имеет интерфейс фото редактора и не требует дополнительных действий от пользователя кроме выбора фотографий для генерации аватара. Разработчики заявляют, что их AI сгенерирует аватар на основе различных художественных стилей и типажа пользователя.

Что нужно для генерации аватарок?
Загрузив от 10ти до 20ти своих портретов и подождав не более получаса, вы получите как минимум 50 картинок, которыми можно радовать друзей, мам и бабушек до следующего года!

Сколько это стоит?
К сожалению, сервис не бесплатный. Lensa сгенерирует 50 аватарок за 279 ₽.
Приложение доступно в Google Play и App Store.

Оставляйте ❤️, если вы уже пробовали Lensa, и 🤮, если уже вас уже утомила эта оригинальность!
🤮7918👍17
ChatGPT
На прошлой неделе я был в отпуске и не смог своевременно рассказать о нашумевшем релизе ChatGPT. Реально, это крутейший прорыв от OpenAI!

В карусели несколько моих SQL-промптов и ответы нейронки. В общем, будущее реально наступило! Кажется, что поисковые сети в ближайшее время ожидает мощнейшая трансформация (вообще-то удобный экстеншен для браузера уже есть). Однако, OpenAI предупреждает о том, что ChatGPT порой генерирует ерунду. И действительно, такое случается: например, я попросил Query для расчета Retention Rate и получил какую-то ахинею (см. последний скриншот).
Таким образом, будучи новичком, пока нет никакой возможности слепо полагаться на результаты ChatGPT. Но, в целом, это очень удобный компаньон во многих вопросах (кроме обсуждения текущих событий и рилтайма).

И немного отличного по теме
* Рома Бунин собрал примеры генерации ответов по датавизу
* Парень написал игру, используя только ChatGPT
* Чувак создал целый репозиторий на гите, используя только ChatGPT
* Запуск виртуальной машины внутри ChatGPT
* Написание интерпретатора для собственного языка программирования, используя ChatGPT
* Поиск конкретных рецептов без воды и лишней информации
* Решение домашних заданий с помощью ChatGPT
* ChatGPT может даже объяснить научные концепции так, будто бы это делает парень, который вырастил ОГРОМЕННЫЕ тыквы и не может об этом молчать

Оставляйте 🔥, если вы уже протестировать новое чудо света!
🔥27👍73🤩2
Do you speak SQL? 👅
Мы решили собрать подборку 10 суперполезных, на наш взгляд, сервисов для проверки и прокачки навыков SQL.

DATALEMUR
Сервис позволяет потренироваться на тестовых заданиях, выбрав один из трех уровней сложности: Easy, Medium и Hard. Создатель сервиса — Ник Сингх, автор книги «Ace the Data Science Interview». Сервис бесплатный, но требуется регистрация.

LEETCODE
Удобный в навигации сервис с более чем 2.5К тестовых заданий, позволяющий задать себе собственную программу обучения, чтобы подготовиться к конкретному карьерному апгрейду. Есть два вида подписок: на месяц ($35) и на год ($13.25/месяц).

Zachary Thomas' SQL Questions
Небольшой гид для аналитика данных с тестовыми задачами средней и повышенной сложности. Успеете разобрать за 1 час — лишним не будет!

WINDOW FUNCTIONS
Вы же любите оконные функции? Тогда этот бесплатный тренажер на Postgres стоит добавить в закладки.

CODE ACADEMY
Более 940К студентов, сертификат по окончании курса — прекрасные показатели того, что закончив этот курс (пишут, что можно уложиться в 8 часов), начинающий дата аналитик освоит SQL в достаточной мере, чтобы любое тестовое задание было по силам. Есть бесплатный базовый аккаунт, Pro Lite ($13.99/месяц) или Pro ($19.99/месяц).

SQL BOLT
Полностью бесплатный курс по SQL из 20ти интерактивных уроков, создатели которого будут благодарны донатам через Paypal, но не настаивают. Интерфейс сервиса довольно строг и минималистичен, что позволит по максимуму погрузиться в тему, не отвлекаясь на рекламу и лимиты бесплатных версий, как бывает с конкурентами этого курса.

SQL ZOO
Построенный на движке MediaWiki, этот каталог бесплатных уроков начинает с азов и поэтапно подводит ученика к использованию SQL с C#, PHP на серверах Amazon EC2 и транзакциям.

HACKERANK
Сервис, клиентами которого являются компании из списка Fortune 100, Atlassian, Bloomberg, Adobe, LinkedIn, у которого свыше 3К компаний-клиентов. Он не только предоставляет услуги опосредованного тестирования соискателя, но и предлагает курсы по совершенствованию навыков SQL. Регистрация обязательна.

SQL TEACHING
CASE, SUBSTR, COALESCE — это темы трех последних уроков из курса, который вы можете пройти совершенно бесплатно. Целых 31 функции, навыки использования которых вы можете отшлифовать, всего лишь открыв ссылку сверху!

W3 SCHOOL
Довольно удобный бесплатный сервис, но с небольшим недостатком — интерактивные упражнения открываются в новой вкладке, и если вы не минималист, познавший дзен в браузере, вкладки и окна которого можно пересчитать на пальцах одной руки, то три сосны могут внезапно разрастись в целый сосновый бор.

🆒 Все сервисы англоязычные!

Знаете ли вы подобные проекты на русском? Если да, кидайте ссылки и ваши впечатления в комментарии.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍59🔥22🏆43🤮2
Актуалочка: вчерашний футбольный датавиз ⚽️🇦🇷
🔥344👍3🤮2
Спринт FineBI
14 декабря 2022 (то есть послезавтра!) стартует бесплатный образовательный проект Спринт FineBI. Он представляет собой 2 недели эффективного ознакомления и обучения основным принципам работы с удобной и функциональной системой бизнес-анализа FineBI. Решение вполне способно заменить системы ушедших с российского рынка вендоров, и вы сами сможете в этом убедиться!

Что за FineBI?
FineBI – инструмент для Self Service BI-анализа, поскольку он имеет не только функции анализа данных на уровне визуализации, но и управление загрузкой и трансформацией данных.

Что в программе проекта?
▪️В рамках занятий будет несколько онлайн-разборов, которые организаторы проведут в декабре 2022 и в январе 2023. Поэтому вы сможете пройти программу в удобное для Вас время – в том числе и на каникулах, если в конце декабря «завал» работы 🥵
▪️Задания будут приходить ежедневно и займут от 30 до 90 минут вашего времени, все учебные материалы будут круглосуточно доступны в записи.
▪️После обучения для желающих проведут финальный тест и вручат сертификат о прохождении программы.

Регистрируйтесь на Спринт FineBI, чтобы не пропустить ни одного дня!
#реклама
👍4🤡2
Отличная работа 👍👍
Forwarded from 🗞 Виз Ньюз (Nikita Rokotyan)
This media is not supported in your browser
VIEW IN TELEGRAM
🥳 🎉 Представляю Unovis — новую библиотеку визуализации данных для React, Angular, Svelte, а также «голого» TypeScript и JavaScript.

У меня второй большой (после Космографа) open source анонс в этом году, который будет интересен в первую очередь веб-разработчикам. Сегодня мы выложили в открытый доступ дитавиз библиотеку, над которой я работаю уже на протяжении последних трех лет (разработка началась в стартапе Volterra, и продолжилать в купившей его компании F5).

Немного об отличительных особенностях Unovis:
🏗 Удобно интегрируется в React, Angular и Svelte, что дает возможность использовать одну библиотеку в совсем разных проектах;
🗺 Помимо классических графиков умеет рисовать детальные карты и графы;
💇 Легко кастомизируется под ваш стиль (спасибо CSS переменным);
📖 Детальная документация и галерея примеров с кодом для разных фреймворков.

Если заинтерисовались, добро пожаловать на сайт библиотеки unovis.dev, и не забудьте лайкнуть наш репозиторий на GitHub!
🔥23👍2
Сегодня Data Heroes перевоплощается в Data Science Heroes, ведь в выпуске будет много науки… и не только! 🧑🏻‍🔬
Хороший дата саентист может найти применение своим навыкам в разных областях: в области бизнеса он помогает улучшать показатели, а в науке – упрощать рутинный труд и даже продлевать жизнь!

Наши эксперты – люди из науки и бизнеса. Они расскажут о своем пути в профессии и ответят на самые важные вопросы:
▪️Где интереснее: в бизнесе или в науке?
▪️Правда ли, что научная область Data Science менее популяризирована, чем коммерческая?
▪️Как специалисту перейти в другую область и какие сложности поджидают на пути?
▪️И главное: в чем основные отличия работы дата саентиста в науке и в бизнесе?

Скорее включайте подкаст и погружайтесь в специализацию вместе с нами! 🚀

СПИКЕРЫ: Иван Ямщиков, Мария Попцова, Эмели Драль

Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Mave, Castbox, Telegram (↓)
#подкаст #DataHeroes
🔥33👍27🏆98👏4
Audio
13
🧐 Что внутри у GPT-3? 🤖
Первое, что необходимо уяснить, это что же входит в состав исходных данных и данных на выходе. На входе у нас есть последовательность слов (токенов), а на выходе — предположение в виде самого последнего слова во фразе.

Что же там?
Но как же тогда GPT-3 подбирает слова, ведь это ML-модель, которая работает, на самом деле, с числами? Дело в том, что для того чтобы сгенерировать фразу, GPT-3 преобразовывает каждое слово в вектор (последовательность чисел), представляющий это слово. Например,
«Not all heroes wear» ➡️ «capes».

Затем, токены проходят слой Embedding и кодировку по позиции, которая позволяет учитывать порядок вводимых токенов, так как порядок слов критически важен для построения предложения.

Если вы хотите разобраться, как устроены блоки Attention, Feed Forward и Add & Norm, а затем модель декодирует числа обратно в слова, используя SoftMax, читайте подробную статью авторства Даниэля Дугаса – кандидата в доктора наук машинного обучения и роботехники Швейцарской высшей технической школы Цюриха.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥133👍3🤯2🤔1
Знакомьтесь, Hydra (не та, о которой вы сначала подумали) 🐍
Clickhouse, Redshift, Snowflake, …? Кажется, появился колоночный конкурент на PostgreSQL!

Hydra — новое хранилище данных с открытым исходным кодом, благодаря удобству которого, он идеален для OLAP и гибридных процессов, связанных с транзакциями. Разработчики даже уверяют, что Hydra в 23 раза быстрее Postgres.

Как же им это удалось?
Секрет кроется в колоночном хранении данных, паралелльном выполнении запросов и векторизации вычислений. Эталонное тестирование (бенчмаркинг) произведено с помощью ClickBench от Clickhouse, а для финального тюнинга настроек предлагается набор параметров, чтобы дать Hydra возможность максимально раскрыть свой потенциал с учетом ваших локальных особенностей.

Дорого наверное?
Вся эта прелесть бесплатна только для локальной работы. Если вам нужно облачное решение, то придется оформить подписку, самая дешевая из которых стоит $400 в месяц. Тем не менее, разработчики предлагают 14-дневную пробную версию, чтобы протестировать новинку.

В релизе указано, что создатели Hydra обещают продолжить работу над ее ускорением и далее. Ну что, готовы попробовать триалку? Если да, то вот образ Docker!
❤‍🔥25🔥21👏11🌚11👍9
🎨 Как AI генерирует картинки: версия для тех, кто так и не разобрался 😏
The Washington Post опубликовали статью с подробным разбором того, как работает Stable Diffusion 2.0. Взяв интервью у разработчиков и разбив этап генерации изображения на отдельные шаги, журналисты создали доступный и наглядный гайд для знакомства с моделью.

«‎Опять графики и скриншоты!» — воскликните вы. Нет, в этот раз все гораздо интереснее!

На странице статьи вам будет предложено четыре условия для AI, на основе которых сеть сформирует изображение. Далее, вы пройдете весь путь модели от того, какими картинками ее кормили в младенчестве и как, будучи зрелой и натренированной, она научилась генерировать то, что вы получили в качестве результата после выбора четырех условий.

Один из самых интересных этапов — это работа модели с цифровым шумом. Оказывается, чтобы научить Stable Diffusion 2.0 генерировать изображения, разработчики сначала научили ее видеть «спрятанные» объекты в картинках с разным уровнем шума.

Ставьте ❤️, если статья вам понравилась, и пишите в комментарии, какие аспекты работы Stable Diffusion 2.0 вам больше всего интересны!
#leftjoin_ai
82👍2
На связи Data Heroes и в эфире э-э-эксперименты! ⚡️ (Если вам кажется, что эту фразу вы где-то слышали – вам точно кажется!)

В сегодняшнем выпуске речь пойдет об интересном и важном этапе в аналитике – А/Б-тестировании. О методе исследования, при котором сравниваются результаты разных вариантов эксперимента. Наши спикеры поделятся своими лайфхаками и ответят на самые важные вопросы:

▪️Почему А/Б-тесты так важны для бизнеса?
▪️Какие есть неочевидные ошибки и как их не допускать?
▪️Как правильно интерпретировать результаты А/Б-теста?
▪️Есть ли какой-то ТОП инструментов для проведения А/Б-тестов?

Включайте подкаст и прокачивайте свои скиллы вместе с нами! 🚀

БОНУС: Конечно же, наши спикеры обязательно дадут советы для новичков в А/Б-тестировании. Будет очень полезно!

СПИКЕРЫ: Виталий Черемисинов, Анатолий Карпов, Ксения Шипулина

Слушайте подкаст на платформах: Spotify, Anchor, Apple Podcasts, Google, Yandex, Overcast, Mave, Castbox, Telegram (↓)

#подкаст #DataHeroes
❤‍🔥67🔥24🏆119🎉7