Обработка дубликатов в SQL
Ребята, давайте разберемся, как работать с дубликатами в данных — это важный навык для получения чистых и точных результатов!
Чтобы выявить дубликаты, используйте
Этот запрос показывает все повторяющиеся имена в таблице Employees.
Чтобы удалить дубликаты, используйте
Этот запрос возвращает уникальные комбинации имени и отдела.
👉 @SQLPortal | #ресурсы | дать буст
Ребята, давайте разберемся, как работать с дубликатами в данных — это важный навык для получения чистых и точных результатов!
Чтобы выявить дубликаты, используйте
GROUP BY с HAVING:SELECT name, COUNT(*) AS count
FROM Employees
GROUP BY name
HAVING COUNT(*) > 1;
Этот запрос показывает все повторяющиеся имена в таблице Employees.
Чтобы удалить дубликаты, используйте
DISTINCT:SELECT DISTINCT name, department
FROM Employees;
Этот запрос возвращает уникальные комбинации имени и отдела.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥3
SQL Представления (Views)
Давайте упростим работу со сложными запросами, используя представления
Представление — это виртуальная таблица, созданная на основе запроса. Вместо того чтобы каждый раз писать один и тот же запрос, вы можете создать представление и использовать его как таблицу.
Пример:
В данном случае мы создаем представление под названием HighEarners, чтобы отобрать сотрудников с зарплатой выше 50,000.
😢 Задание для вас: Если у вас есть таблица Sales, какое представление вы бы создали, чтобы найти регионы с продажами выше 100,000
👉 @SQLPortal | #ресурсы | дать буст
Давайте упростим работу со сложными запросами, используя представления
Представление — это виртуальная таблица, созданная на основе запроса. Вместо того чтобы каждый раз писать один и тот же запрос, вы можете создать представление и использовать его как таблицу.
Пример:
CREATE VIEW HighEarners AS
SELECT name, salary
FROM Employees
WHERE salary > 50000;
SELECT * FROM HighEarners;
В данном случае мы создаем представление под названием HighEarners, чтобы отобрать сотрудников с зарплатой выше 50,000.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍12❤1🔥1
Кардинальность относится к количеству уникальных значений в столбце по отношению к общему числу строк в таблице 😮
• Высокая кардинальность означает, что столбец имеет много уникальных значений. • Низкая кардинальность означает, что столбец имеет мало уникальных значений.
Когда вы создаёте индекс на столбце с низкой кардинальностью, это часто неэффективно, потому что:
🍩 Низкая кардинальность означает, что каждое проиндексированное значение указывает на много строк, что уменьшает способность индекса сузить область поиска. 🍩 Поддержка индекса требует дополнительное место и время на обновление. Для столбцов с низкой кардинальностью эти затраты могут перевесить выгоду. 🍩 Оптимизаторы запросов баз данных умны; они знают статистику столбцов, включая кардинальность. Когда они обнаруживают индекс с низкой кардинальностью, они часто игнорируют его и выполняют полное сканирование таблицы.
👇 Пример
Предположим таблицу "Employees" с 1 миллионом записей:
Рассмотрим индексацию различных столбцов:
• ID: Высокая кардинальность (1 миллион уникальных значений). Индекс здесь будет очень эффективным.
• Name: Высокая кардинальность (много уникальных имен). Индекс может быть полезен для поиска.
• Department: Средняя кардинальность (10-20 уникальных значений). Индекс иногда может быть полезен, но менее эффективен, чем для EmployeeID или Name.
• Gender: Очень низкая кардинальность (2-3 уникальных значения). Оптимизатор запросов вероятно игнорирует индекс.
Когда стоит рассмотреть индексацию столбца с низкой кардинальностью?🤔
Есть сценарии, когда индексация столбца с низкой кардинальностью может быть полезной.
Например, комбинирование столбцов с низкой и высокой кардинальностью может быть эффективным.
👉 @SQLPortal | #ресурсы | дать буст
• Высокая кардинальность означает, что столбец имеет много уникальных значений. • Низкая кардинальность означает, что столбец имеет мало уникальных значений.
Когда вы создаёте индекс на столбце с низкой кардинальностью, это часто неэффективно, потому что:
Предположим таблицу "Employees" с 1 миллионом записей:
Рассмотрим индексацию различных столбцов:
• ID: Высокая кардинальность (1 миллион уникальных значений). Индекс здесь будет очень эффективным.
• Name: Высокая кардинальность (много уникальных имен). Индекс может быть полезен для поиска.
• Department: Средняя кардинальность (10-20 уникальных значений). Индекс иногда может быть полезен, но менее эффективен, чем для EmployeeID или Name.
• Gender: Очень низкая кардинальность (2-3 уникальных значения). Оптимизатор запросов вероятно игнорирует индекс.
Когда стоит рассмотреть индексацию столбца с низкой кардинальностью?
Есть сценарии, когда индексация столбца с низкой кардинальностью может быть полезной.
Например, комбинирование столбцов с низкой и высокой кардинальностью может быть эффективным.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🔥3
SQL-кальмар: выживут только мастера запросов 😐
Нашёл годноту — SQL Squid Game
9 уровней, растущая сложность, а заодно — отличная прокачка навыков. Не уверены в силах? На сайте есть 33 урока, чтобы подтянуть SQL перед стартом
Готовы принять вызов? Тогда вперёд: https://datalemur.com/sql-game
👉 @SQLPortal | #ресурсы | дать буст
Нашёл годноту — SQL Squid Game
Вы — новоиспечённый дата-сайентист в загадочной организации. Ваш босс, Фронтмен, требует от вас решения бизнес-задач с помощью SQL. Не справитесь —☠️
9 уровней, растущая сложность, а заодно — отличная прокачка навыков. Не уверены в силах? На сайте есть 33 урока, чтобы подтянуть SQL перед стартом
Готовы принять вызов? Тогда вперёд: https://datalemur.com/sql-game
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥10👍3
Давно не было шпаргалок по MongoDB, исправляемся 😅
🟣 Работа с базами данных
🟣 Работа со строками
🟣 Работа с документами
🟣 Запрос данных из документов
🟣 Изменение данных в документах
🟣 Поиск
👉 @SQLPortal | #ресурсы | дать буст
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1👍7🔥4🌚1
Порядок выполнения простого SQL-запроса
График подробно показывает шаги выполнения запроса и разницу между порядком написания (coding order) и порядком выполнения (execution order) SQL-команд.
👉 @SQLPortal | #ресурсы | дать буст
График подробно показывает шаги выполнения запроса и разницу между порядком написания (coding order) и порядком выполнения (execution order) SQL-команд.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍21🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4🔥1🤯1
Подзапросы – запросы внутри запросов
Подзапросы – это запросы, вложенные в другой запрос. Они особенно полезны для извлечения сложных данных.
Пример:
Этот запрос извлекает имена студентов, возраст которых больше среднего.
Подзапросы помогают разбить сложные задачи на более простые и управляемые части.
😒 Задание для вас:
Как, используя таблицу Employees, найти сотрудников, зарабатывающих больше среднего уровня зарплат?
👉 @SQLPortal | #ресурсы | дать буст
Подзапросы – это запросы, вложенные в другой запрос. Они особенно полезны для извлечения сложных данных.
Пример:
SELECT name
FROM Students
WHERE age > (SELECT AVG(age) FROM Students);
Этот запрос извлекает имена студентов, возраст которых больше среднего.
Подзапросы помогают разбить сложные задачи на более простые и управляемые части.
Как, используя таблицу Employees, найти сотрудников, зарабатывающих больше среднего уровня зарплат?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Одна из N причин, почему шардинг — отличный способ масштабировать базу данных:
Скорость резервного копирования.
👉 @SQLPortal | #ресурсы | дать буст
Скорость резервного копирования.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10🔥2🤔1
Media is too big
VIEW IN TELEGRAM
Основы работы в Microsoft Power BI
Николай Павлов, объясняет основные компоненты и возможности Power BI, который является не просто одной программой, а набором инструментов для анализа и визуализации данных. Power BI поддерживает подключение более чем к 170 источникам данных, включая файлы Excel, базы данных, облачные сервисы и веб-платформы.
📹 Cмотреть: тык
👉 @SQLPortal | #курсы
Николай Павлов, объясняет основные компоненты и возможности Power BI, который является не просто одной программой, а набором инструментов для анализа и визуализации данных. Power BI поддерживает подключение более чем к 170 источникам данных, включая файлы Excel, базы данных, облачные сервисы и веб-платформы.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6🔥4🏆2
На изображении представлена визуализация работы SQL-запросов с использованием оператора SELECT.
Оно иллюстрирует, как извлекать данные из базы данных, используя SQL.
👉 @SQLPortal | #ресурсы | дать буст
Оно иллюстрирует, как извлекать данные из базы данных, используя SQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍14🔥3