SQL и БД Learning – Telegram
SQL и БД Learning
10.2K subscribers
797 photos
9 videos
22 files
445 links
№ 5060218708

Изучаем SQL с нуля

По всем вопросам @mascarov_valentin

Реклама на бирже - https://telega.in/c/SQl_and_DB_Learning
Download Telegram
Использование CROSS JOIN для задач поиска пересечений в исторических данных

CROSS JOIN
- это декартово произведение множеств, которое соединяет таблицы без условий. Его использование может помочь в решении сложных задач, таких как нахождение пересечений в исторических данных.

1. На примерах в изображении 1 представлена структура таблиц.

2. В изображении 2 показано, что заявка была неправильно распределена на сотрудника, из-за того, что у андеррайтера и клиента совпадают девичьи фамилии - результат

3. Для решения этой проблемы можно использовать простой запрос с CROSS JOIN, как показано в изображении 3 - результат

Полноценное продолжение - здесь
👍5
SQLGlot - это универсальный инструмент для работы с SQL.

Он может использоваться для форматирования SQL-запросов, а также для трансляции между 20 различными диалектами, включая DuckDB, Presto, Spark, Snowflake и BigQuery.

Более того, при помощи SQLGlot можно проводить оптимизацию SQL-запросов, что повышает их эффективность и быстродействие.
👍4
#Вопросы_с_собеседования
Объясните разницу между INNER JOIN и LEFT JOIN в SQL и приведите пример ситуации, в которой каждый из них наиболее подходит

INNER JOIN в SQL возвращает строки, когда есть совпадение в обеих таблицах, в то время как LEFT JOIN возвращает все строки из левой таблицы и совпадающие строки из правой таблицы; строки, для которых нет совпадений в правой таблице, будут иметь NULL в этих столбцах. INNER JOIN подходит, когда необходимо найти точные совпадения между таблицами, тогда как LEFT JOIN используется, когда нужно включить все записи из одной таблицы, даже если соответствующих совпадений в другой таблице нет.
👍18
#Вопросы_с_собеседования
Как SQL-запрос с использованием операторов JOIN может быть оптимизирован для ускорения выполнения, если одна из таблиц содержит миллионы записей, а другая – только несколько сотен? Опишите три различных подхода к оптимизации

Использование Индексов: Создание индексов на столбцах, участвующих в JOIN, может значительно ускорить процесс, особенно на столбцах большой таблицы. Если JOIN выполняется по столбцу, который является первичным ключом или имеет уникальный индекс, это обычно обеспечивает наилучшую производительность.

Оптимизация Порядка JOIN: Порядок, в котором таблицы соединяются в запросе, может влиять на производительность. Лучше начинать с таблицы с наименьшим количеством строк (в данном случае, таблицы с несколькими сотнями записей), что может уменьшить количество обрабатываемых данных на более ранней стадии выполнения запроса.

Использование Подзапросов или CTE (Common Table Expressions): В некоторых случаях, использование подзапросов или CTE для предварительной фильтрации данных перед выполнением JOIN может быть эффективным. Например, можно сначала выделить необходимые данные из меньшей таблицы с помощью подзапроса или CTE, а затем выполнить JOIN с большей таблицей. Это может сократить количество обрабатываемых данных и ускорить выполнение запроса.

Каждый из этих подходов может помочь в оптимизации запросов SQL, особенно когда речь идет о соединении таблиц с большим различием в размерах.
👍161
#Вопросы_с_собеседования
Как в SQL можно определить и устранить "фантомное чтение" в транзакциях и какие уровни изоляции транзакций необходимо учитывать для предотвращения этого явления?

"Фантомное чтение" в SQL - это ситуация, когда транзакция читает набор строк дважды и получает разные результаты из-за изменений, внесенных другими транзакциями. Для устранения фантомного чтения можно использовать уровни изоляции транзакций, такие как SERIALIZABLE, который предотвращает фантомное чтение, обеспечивая полную изоляцию транзакции. Однако использование высоких уровней изоляции может снизить производительность из-за увеличения блокировок и ожидания.
👍4🔥2
Поиск подстроки в SQL

Смотреть статью
👍5🔥1
#Вопросы_с_собеседования
Как изменить тип данных столбца?

Это можно сделать с помощью инструкции ALTER TABLE.
👍9🔥31
#Вопросы_с_собеседования
Объясните, как вы бы оптимизировали производительность SQL-запроса, работающего медленно на большом объеме данных. Какие факторы вы бы учли и какие методы применили?

Этот вопрос проверяет понимание кандидатом принципов оптимизации запросов и управления производительностью баз данных. Ответ должен включать обсуждение различных аспектов, таких как использование индексов, понимание плана выполнения запроса, анализ статистики базы данных, а также методы оптимизации, такие как денормализация данных или изменение структуры запроса. Кандидат также может обсудить использование определенных инструментов для профилирования и мониторинга производительности запросов.
👍10
SQL Server: DATEFROMPARTS

Функция
DATEFROMPARTS принимает в качестве параметров год, месяц и день и возвращает значение даты.

Синтаксис функции следующий:
DATEFROMPARTS ( year, month, day )

Функция принимает следующие параметры:
- year - (целое число);
- month - (целое число от 1 до 12);
- day - (целое число от 1 до 31).
👍4
#Вопросы_с_собеседования
Какое основное различие между внешним и внутренним соединением в SQL?

Внешнее соединение возвращает все строки из левой таблицы, даже если в правой таблице нет сопоставленных строк. Внутреннее соединение возвращает только строки, которые имеют сопоставленные строки в обеих таблицах.

Этот вопрос является сложным, потому что он требует понимания основ соединения таблиц в SQL. Внешние и внутренние соединения - это два основных типа соединения таблиц, и важно понимать, как они работают, чтобы правильно писать запросы.
👍9
#Вопросы_с_собеседования
Как вы можете оптимизировать производительность запроса SQL, который объединяет несколько больших таблиц и содержит множественные условия JOIN и WHERE?

Для оптимизации такого запроса можно использовать следующие стратегии:

1) Индексирование: Создайте индексы на столбцы, которые часто используются в условиях JOIN и WHERE, чтобы ускорить поиск и сопоставление данных.
2) Оптимизация условий JOIN: Убедитесь, что условия JOIN соединяют таблицы по индексированным столбцам. Избегайте ненужных соединений.
3) Использование подзапросов: Иногда подзапросы могут быть эффективнее, особенно если они помогают уменьшить объем данных перед JOIN.
4) Ограничение результата: Используйте LIMIT для ограничения количества возвращаемых строк, если это возможно.
5) Использование агрегатных функций с умом: Избегайте ненужных агрегатных вычислений на больших наборах данных.
6) Анализ плана выполнения запроса: Используйте инструменты, такие как EXPLAIN PLAN, для понимания, как SQL-сервер выполняет ваш запрос, и находите узкие места в производительности.

Эти методы помогают уменьшить время выполнения запроса и улучшить общую производительность.
👍103
Функции LOCALTIMESTAMP и LOCALTIME

Функция LOCALTIMESTAMP и LOCALTIME в MySQL используются для получения текущего времени на сервере базы данных. Как следует из названия, эти функции возвращают локальное время, которое находится на сервере базы данных.

LOCALTIME возвращает текущее время в формате HH:MM:SS, а LOCALTIMESTAMP возвращает текущую дату и время в формате YYYY-MM-DD HH:MM:SS. Обе функции могут быть использованы в качестве значения по умолчанию для столбцов таблицы.
👍4
#Вопросы_с_собеседования
Что такое "SQL инъекция" и как её можно предотвратить?

SQL инъекция – это вид атаки на приложения, при котором злоумышленник вводит или "инъецирует" вредоносный SQL-код в запрос, который затем выполняется базой данных. Это может привести к несанкционированному доступу к данным, их изменению или удалению, а также к другим серьезным уязвимостям безопасности.

Для предотвращения SQL инъекций следует использовать параметризованные запросы, при которых вводимые пользователем данные обрабатываются как параметры, а не как часть SQL-кода. Это изолирует эти данные от самого запроса, предотвращая их интерпретацию как часть SQL-команды. Также важно проводить валидацию и санитизацию вводимых данных, ограничивая возможность ввода потенциально опасных символов или конструкций.
👍9
This media is not supported in your browser
VIEW IN TELEGRAM
🖥 Хотите проиндексировать атрибуты, хранящиеся в массиве #JSON?

В Oracle Database 21c это можно сделать с помощью функции

CREATE MULTIVALUE INDEX ...
ON t ( t.col.json_array_path[*]... ).


Затем база данных может использовать его для обработки SQL-запросов JSON_exists с поиском пути к массиву.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4