NEW BOT Телеграм, страница

Шпаргалка SQL → Pandas

— выбрать один столбец или несколько из них;
— фильтрация;
— выбор уникальных значений по столбцу;
— подсчет числа значений;
— перечисление названий столбцов и т.д.

👍9❤‍🔥3

2.15K views17:02

SQL и БД Learning

Интеграция PostgreSQL и Hadoop

Читать статью

Хабр

Интеграция PostgreSQL и Hadoop

Привет, Хабр! Представим некое перепутье, где с одной стороны — мощные возможности PostgreSQL , а с другой — необъятные просторы Hadoop . Выбор кажется сложным, но зачем выбирать одно, если можно...

👍2❤‍🔥1

2.38K views06:12

SQL и БД Learning

#Вопросы_с_собеседования

Что такое сущности и отношения?

Объект представляет собой абстракцию набора связанных данных и представлен в виде таблиц . Отношения определяют, как объекты связаны друг с другом.
Например, предположим, что у нас есть две таблицы с именами orders и users. Наши orders и users являются нашими сущностями.

Мы можем представить, что у одного пользователя может быть много заказов. Таким образом, пользователи могут иметь отношения «один ко многим» с заказами. Сущности и отношения часто используются в процессе разработки схемы таблицы. Понимая, как определять объекты и отображать их отношения, вы показываете, что можете продуктивно работать в коллективном сеансе проектирования таблиц базы данных.

👍3❤‍🔥2

2.56K views09:45

SQL и БД Learning

Стоимостной подход в SQL

Стоимостной подход - это один из методов оптимизации запросов в SQL. Он основывается на том, что оптимальный план запроса может быть выбран путем оценки стоимости каждого возможного плана и выбора того, который имеет наименьшую стоимость.

Для выполнения данного запроса в SQL сервере может быть несколько возможных планов, например:

1. Сначала выполнить выборку из таблицы customers, затем из orders. Далее объединить результаты с помощью оператора JOIN по customer_id.
2. Сначала выполнить выборку из таблицы orders, затем из customers. Далее объединить результаты с помощью оператора JOIN по customer_id.
3. Использовать индексы на таблицах для выполнения быстрой выборки.

Для выбора наилучшего плана выполнения запроса SQL-сервер оценивает стоимость каждого плана, исходя из статистики таблиц, наличия индексов и других факторов.

Например, если таблица customers содержит много строк и немного соответствующих строк в таблице orders, то выборка из таблицы customers должна быть выполнена первой, чтобы уменьшить количество строк, которые нужно объединять с таблицей orders. Таким образом, стоимостной подход позволяет выбирать наиболее эффективный план выполнения запроса, что ускоряет работу SQL-сервера и сокращает время выполнения запросов.

❤‍🔥6👍2

3.29K views18:17

SQL и БД Learning

#Вопросы_с_собеседования

❓Для чего используются агрегатные функции?

Агрегатные функции используются для выполнения вычислений на одном или нескольких значениях и возвращают одиночное значение с осмысленной информацией.

Несколько примеров агрегатных функций: COUNT(), SUM(), MAX(), MIN(), AVG() и ROUND().

❤‍🔥8👍5

2.53K views07:42

SQL и БД Learning

🥽

Наглядная шпаргалка: Шардирование базы данных

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥6

2.2K views17:49

SQL и БД Learning

Решаем загадку Джиндоша на SQL в пять строчек

Смотреть статью

Хабр

Решаем загадку Джиндоша на SQL в пять строчек

В недавней статье обсуждалось решение логической задачи с помощью SQL. Скрытый текст На званом обеде были леди Уинслоу, доктор Марколла, графиня Конти, мадам Нациу и баронесса Финч. Женщины сидели в...

👍3

2.07K views10:54

SQL и БД Learning

JupySQL — позволяет выполнять SQL-запросы в Jupyter/IPython с помощью %sql и %%sql

— pip install jupysql duckdb-engine

JupySQL — это форк ipython-sql с множеством исправленных ошибок и массой новых возможностей

JupySQL позволяет выполнять SQL-запросы и строить графики для больших наборов данных в Jupyter с помощью команд %sql, %%sql и %sqlplot.
JupySQL совместим со всеми основными БД (PostgreSQL, MySQL, SQL Server и др.), хранилищами данных (типа Snowflake, BigQuery, Redshift) и движками (SQLite и DuckDB).

🖥

GitHub

🟡

Доки

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5😁2🎄1

2.11K views18:14

SQL и БД Learning

🖥

sqlite-vec

Чрезвычайно маленькое и "достаточно быстрое" расширение для векторного поиска SQLite, которое работает в любом месте!

Проект преемник sqlite-vss.

- Храните и запрашивайте float, int8 и двоичные векторы в виртуальных таблицах vec 0.
- Написан на чистом C, без зависимостей, работает везде, где работает SQLite (Linux/ macOS /Windows, в браузере с WASM, Raspberry Pis и т.д.)
- Предварительная фильтрация векторов с rowid В подзапросах (...)

▪ Github

Please open Telegram to view this post

VIEW IN TELEGRAM

👍2❤‍🔥1

1.77K views07:58

SQL и БД Learning

Spice — унифицированный интерфейс запросов SQL и портативная среда выполнения для быстрого извлечения данных из любой БД, хранилища данных или озера данных


curl https://install.spiceai.org | /bin/bash
spice init spice_qs
cd spice_qs
spice run

Spice — open-source портативная среда выполнения, предлагающая унифицированный интерфейс SQL для получения данных из любой базы данных и не только.
Spice написана на Rust для максимальной производительности.

🖥

GitHub

🟡

Доки

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥2👍2

2.33K views11:17

SQL и БД Learning

🤝

SQL vs Polars vs Pandas

Please open Telegram to view this post

VIEW IN TELEGRAM

❤‍🔥9🔥5👍3

2.27K views09:02

SQL и БД Learning

Выберите правильный пример запроса с использованием UNION:

Anonymous Quiz

19%

SELECT id, city FROM Orders ORDER BY id UNION SELECT id, city FROM Sellers ORDER BY city;

SELECT id, city, seller_id FROM Orders AND UNION SELECT id, city FROM Sellers ORDER BY id;

56%

SELECT id, city FROM Orders UNION SELECT id, city FROM Sellers ORDER BY id;

Все запросы верные

Узнать ответ

👍8❤‍🔥1

366 voters2.35K views11:00

SQL и БД Learning

EdgeDB — open-source БД с декларативной схемой, встроенной системой миграции и языком запросов нового поколения

— curl https://sh.edgedb.com --proto '=https' -sSf1 | sh

EdgeDB — это БД, поддерживающая сложные иерархические запросы; EdgeDB собрала в себе лучшее реляционных БД, графовых БД и ORM.

🖥

GitHub

🟡

Доки

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

2K views14:22

SQL и БД Learning

#Вопросы_с_собеседования
Как SQL-запрос с использованием операторов JOIN может быть оптимизирован для ускорения выполнения, если одна из таблиц содержит миллионы записей, а другая – только несколько сотен? Опишите три различных подхода к оптимизации

Использование Индексов: Создание индексов на столбцах, участвующих в JOIN, может значительно ускорить процесс, особенно на столбцах большой таблицы. Если JOIN выполняется по столбцу, который является первичным ключом или имеет уникальный индекс, это обычно обеспечивает наилучшую производительность.

Оптимизация Порядка JOIN: Порядок, в котором таблицы соединяются в запросе, может влиять на производительность. Лучше начинать с таблицы с наименьшим количеством строк (в данном случае, таблицы с несколькими сотнями записей), что может уменьшить количество обрабатываемых данных на более ранней стадии выполнения запроса.

Использование Подзапросов или CTE (Common Table Expressions): В некоторых случаях, использование подзапросов или CTE для предварительной фильтрации данных перед выполнением JOIN может быть эффективным. Например, можно сначала выделить необходимые данные из меньшей таблицы с помощью подзапроса или CTE, а затем выполнить JOIN с большей таблицей. Это может сократить количество обрабатываемых данных и ускорить выполнение запроса.

Каждый из этих подходов может помочь в оптимизации запросов SQL, особенно когда речь идет о соединении таблиц с большим различием в размерах.

👍14🔥2

2.41K views17:23

SQL и БД Learning

#Вопросы_с_собеседования

❓Отработает ли данный запрос?

Ответ:

Нет, не отработает. Опытный data-инженер знает, что row_number() — это часть аналитической функции, которая не может быть применена сама по себе. Аналитические функции используются только в конcтрукциях SELECT или ORDER BY.

👍17

2.09K views13:41

SQL и БД Learning

Поиск по префиксу или тайные операторы PostgreSQL

Читать статью

Хабр

Поиск по префиксу или тайные операторы PostgreSQL

Предисловие Всё началось с того, что пролистывая ChangeLog у PostgreSQL, я совершенно случайно натолкнулся на запись: Add prefix-match operator text ^@ text , which is supported by...

👍3

2.83K views17:26

SQL и БД Learning

Узнаем вместимость БД

Этот запрос определяет размер базы данных в мегабайтах путем вычисления суммарного количества страниц, выделенных для базы данных и вычисления размера в мегабайтах. Результат будет показан в столбце MB.

👍10

2.98K views17:11

SQL и БД Learning

Узнать объем памяти базы данных с помощью SQL

Нужно заменить 'имя_базы_данных' на название вашей базы данных. Результатом будет суммарный размер всех таблиц в базе данных, выраженный в байтах.

❤‍🔥8👍6

2.99K views07:31

About

Blog

Apps

Platform