Держите полезную статью о том, как собрать PostgreSQL 16 версии из исходников, инициализировать кластер и запустить его на сервере Debian 12
Причины по которым вам может понадобится собирать PostgreSQL из исходников:
План статьи
├╼ Сборка и установка├╼ Создание кластера├╼ Запуск и остановка кластера├╼ Установка расширений PostgreSQL├╼ Создание и запуск второго кластера╰╼ Создание службы SystemD для кластеровPlease open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍6
Вопрос на SQL собеседовании.
Какие параметры используются в конструкции order by?
Ответ:
ASC и DESC
Какие параметры используются в конструкции order by?
Ответ:
👍10
Как правильно добавить строку в таблицу? Какой запрос верный?
Anonymous Quiz
68%
INSERT INTO `SimpleTable` (`some_text`) VALUES ("my text");
14%
INSERT INTO `SimpleTable` SET `some_text`="my text";
8%
SET INTO `SimpleTable` VALUE `some_text`="my text";
6%
UPDATE INTO `SimpleTable` SET `some_text`="my text";
4%
Узнать ответ
👍7😱2🎄2
Процесс выполнения
SQL-запросов в базе данных включает в себя несколько компонентов, взаимодействующих между собой. Хотя конкретная архитектура различных систем баз данных может отличаться, ниже описана общая последовательность действий.1. Оператор SQL запускается в клиентской программе и передается по сети на сервер базы данных.
2. Когда сервер базы данных получает SQL-оператор, реляционный движок начинает его обработку. Сначала синтаксический анализатор проверяет правильность оператора. Затем он преобразует оператор в дерево запросов, которое представляет собой внутреннюю структуру данных.
3. Оптимизатор запросов просматривает дерево запросов и определяет наиболее эффективный способ выполнения SQL-оператора, создавая план выполнения.
4. План выполнения передается исполнителю запроса, который использует его для координации получения или изменения данных в соответствии с запросом SQL. Для доступа к данным исполнитель взаимодействует с движком хранилища.
5. Движок хранилища использует методы доступа - протоколы чтения и записи данных, наиболее эффективные для выполнения различных операций.
6. При чтении данных менеджер буферов проверяет, кэшированы ли нужные данные в памяти, и при необходимости извлекает их с диска. Это ускоряет последующий доступ.
7. При записи данных со вставкой или обновлением менеджер транзакций следит за тем, чтобы изменения происходили атомарно и сохраняли целостность базы данных.
8. В то же время менеджер блокировок накладывает блокировки, чтобы несколько транзакций могли выполняться одновременно, не конфликтуя между собой. Таким образом, обеспечивается изоляция и согласованность.
Работая вместе, эти компоненты обеспечивают надежную и эффективную обработку SQL-запросов в системе управления базами данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤3
На диаграмме показано множество вариантов использования PostgreSQL - одной базы данных, которая включает в себя почти все функции необходимых разработчикам.
🔹OLTP (Online Transaction Processing)
Мы можем использовать PostgreSQL для CRUD-операций (Create-Read-Update-Delete).
🔹OLAP (Online Analytical Processing)
Мы можем использовать PostgreSQL для аналитической обработки. PostgreSQL основан на архитектуре 𝐇𝐓𝐀𝐏 (Hybrid transactional/analytical processing), поэтому он может хорошо работать как с OLTP, так и с OLAP.
🔹FDW (Foreign Data Wrapper)
FDW - это расширение, доступное в PostgreSQL, которое позволяет нам обращаться к таблице или схеме одной базы данных из другой.
🔹Streaming
PipelineDB - это расширение PostgreSQL для высокопроизводительной агрегации временных рядов, предназначенное для работы с отчетами и аналитическими приложениями в реальном времени.
🔹Geospatial
PostGIS - это расширитель базы данных для объектно-реляционной базы данных PostgreSQL. Он добавляет поддержку географических объектов, позволяя выполнять запросы на определение местоположения в SQL.
🔹Временные ряды
Timescale расширяет PostgreSQL для работы с временными рядами и аналитикой. Например, разработчики могут объединять непрерывные потоки финансовых и тиковых данных с другими бизнес-данными для создания новых приложений и получения уникальных знаний.
🔹Распределенные таблицы
CitusData масштабирует Postgres за счет распределения данных и запросов.
Какая база данных вам нравится больше всего?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7
Для добавления новых записей в таблицу предназначен оператор
Anonymous Quiz
2%
SELECT
85%
INSERT
11%
ADD
1%
Посмотреть ответ
👍7
К какому результату приведет выполнение запроса:
SELECT City FROM Addresses ORDER BY City DESC
SELECT City FROM Addresses ORDER BY City DESC
Anonymous Quiz
2%
Выведется список городов
19%
Выведется список городов в алфавитном порядке (А-Я)
75%
Выведется список городов в обратном алфавитном порядке (Я-А)
4%
Посмотреть ответ
👍4❤1
Open-source решение для хранения и поиска векторов в Postgres.
Сами данные для векторов можно получить, например, из ML-модели и вставить в таблицу с колонкой типа
vector.Или данные можно создать в PostgreSQL как гистограмму определенных категорий. В этом случае можно значения в массивах
real[], integer[] или double precision[], numeric[] привести к типу ::vector.Please open Telegram to view this post
VIEW IN TELEGRAM
👍5
Чем отличается DROP от TRUNCATE?
Anonymous Quiz
16%
DROP - удаляет базу данных, а TRUNCATE - удаляет таблицы
2%
Оба оператора являются аналогами друг друга
77%
TRUNCATE - очищает таблицу, а DROP - удаляет таблицу или запись
5%
Посмотреть ответ
👍14
fselect — поиск файлов при помощи SQL-like запросов
—
Хотя fselect не стремится полностью заменить традиционные find и ls, у fselect есть несколько приятных особенностей:
— SQL-подобная грамматика, легко понятная человеку
— возможность составлять сложные запросы
агрегатные, статистические, даточные и другие функции
поиск в архивах
— поддержка
— поиск по ширине и высоте изображений, метаданным EXIF
— поиск по информации о MP3
— поиск по расширенным атрибутам файлов
— поиск по хэшам файлов
— поиск по типу MIME
— имеет интерактивный режим
— различные форматы вывода (CSV, JSON и другие)
Любители SQL оценят)
🖥 GitHub
🟡 Примеры запросов
—
brew install fselectХотя fselect не стремится полностью заменить традиционные find и ls, у fselect есть несколько приятных особенностей:
— SQL-подобная грамматика, легко понятная человеку
— возможность составлять сложные запросы
агрегатные, статистические, даточные и другие функции
поиск в архивах
— поддержка
.gitignore, .hgignore и .dockerignore — поиск по ширине и высоте изображений, метаданным EXIF
— поиск по информации о MP3
— поиск по расширенным атрибутам файлов
— поиск по хэшам файлов
— поиск по типу MIME
— имеет интерактивный режим
— различные форматы вывода (CSV, JSON и другие)
Любители SQL оценят)
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Sweet-Viz - библиотека, которая предоставляет быструю визуализацию и анализ данных.
Основная фича
i
Основная фича
Sweet-Viz — обширный HTML-дашборд с полезными представлениями и сводками данных, который генерируется выполнением всего одной строки кода.pip install sweetvizi
mport sweetviz as sv
my_report = sv.analyze(my_dataframe)
my_report.show_html() # Default arguments will generate to "SWEETVIZ_REPORT.html"
▪Github👍9
Одинарные кавычки для строк
Да-да, какой-нибудь BigQuery разрешает двойные/тройные кавычки для строк, но для других SQL-диалектов “строки” — это идентификаторы, а ”’строки”’ интерпретируются ещё по-другому.
Поэтому лучше строки всегда писать в одинарных кавычках, ради всеобщего блага.
Во-втором случае некоторые диалекты могут начать жаловаться наподобие column "%@domain.com" does not exist.
Да-да, какой-нибудь BigQuery разрешает двойные/тройные кавычки для строк, но для других SQL-диалектов “строки” — это идентификаторы, а ”’строки”’ интерпретируются ещё по-другому.
Поэтому лучше строки всегда писать в одинарных кавычках, ради всеобщего блага.
Во-втором случае некоторые диалекты могут начать жаловаться наподобие column "%@domain.com" does not exist.
👍6❤4🎄2
TimescaleDB — это open-source БД, разработанная для того, чтобы сделать SQL масштабируемым для данных временных рядов.
TimescaleDB разработана на основе PostgreSQL и упакована как расширение PostgreSQL, обеспечивая автоматическое разделение по времени и пространству (ключ разделения), а также полную поддержку SQL.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍3🎄3
Какие условия следует использовать, чтобы получить из таблицы все записи, в которых значение в колонке last_name начинается со строки 'SM'?
Anonymous Quiz
2%
WHERE last_name[1 TO 2] = 'SM'
88%
WHERE last_name LIKE 'SM%'
1%
WHERE last_name EQUATES TO 'SM'
4%
WHERE last_name IS 'SM*'
2%
WHERE last_name = 'SM'
2%
Узнать ответ
👍12❤5
#Вопросы_с_собеседования
Допустим, у вас есть таблица events с полями user_id, event_type, и timestamp. Как вы можете написать запрос, чтобы получить user_id всех пользователей, которые совершили событие login после события signup?
WHERE Условие: Фильтрует пары событий, где первое событие (e1) — это login, а второе (e2) — signup. Кроме того, проверяется, что timestamp для login (e1.timestamp) должен быть больше, чем timestamp для signup (e2.timestamp), что означает, что login произошел после signup.
Допустим, у вас есть таблица events с полями user_id, event_type, и timestamp. Как вы можете написать запрос, чтобы получить user_id всех пользователей, которые совершили событие login после события signup?
❤5👍5🔥2
Какой оператор необходим для соединения таблиц и вывода результирующей таблицы, в которой данные полностью пересекаются по условию, указанному после ON, и дополняются записями из второй по порядку (правой) таблицы, даже если они не соответствуют условию.
Anonymous Quiz
54%
RIGHT JOIN
19%
INNER JOIN
23%
FULL JOIN
4%
Посмотреть ответ
👍7❤5
Сколько байт занимает самое большое целое число в PostgreSQL?
Anonymous Quiz
5%
2
7%
4
4%
6
55%
8
13%
Все варианты неверные
16%
Узнать ответ
❤3👍3