NEW BOT Телеграм, страница

SQL Portal | Базы Данных

Postgres 18 получил поддержку виртуальных вычисляемых колонок. Вычисляемые STORED-колонки в Postgres уже были несколько версий подряд.

Вычисляемые колонки позволяют:
• создавать колонку на основе других данных
• ссылаться на значения из других колонок
• заранее считать колляции или любые вычисления в базе, а не в приложении

Синтаксис GENERATED ALWAYS AS открывает выражение, а в конце указывается режим VIRTUAL или STORED.
Виртуальные вычисляемые колонки пересчитываются при каждом чтении, поэтому не подходят для тяжёлых вычислений. Для таких случаев лучше использовать STORED-колонку или даже expression index. Но они удобны, когда значение нужно редко и его логично вычислять на лету.

Пример:

CREATE TABLE products (
id serial PRIMARY KEY,
price numeric,
tax_rate numeric DEFAULT 0.05,
total_price numeric GENERATED ALWAYS AS (price * (1 + tax_rate)) VIRTUAL
);

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

🔥9👍5❤3

2.54K views06:07

SQL Portal | Базы Данных

Postgres 18 меняет дефолтные настройки целостности данных

В новом релизе опция data checksums теперь включена по умолчанию. Раньше админам нужно было явно передавать --data-checksums при initdb, иначе кластер поднимался без проверки страниц на тихую порчу. Теперь достаточно обычного initdb -D /data/pg18 — каждая 8KB-страница таблиц и индексов получает checksum, который проверяется при чтении. Это тот же механизм, на который опирается pgBackRest при валидации бэкапов.

При этом меняются и правила игры для апгрейдов через pg_upgrade: старый и новый кластеры должны быть подняты с одинаковыми настройками checksums. Если ваш текущий кластер без checksums, прямой апгрейд на «дефолтный» Postgres 18 провалится. Временный обходной путь — инициализировать новый кластер с флагом --no-data-checksums, чтобы выровнять конфигурацию. Более правильная стратегия будет, заранее включить checksums с помощью pg_checksums (да, с даунтаймом), а в больших инсталляциях сначала включать их на реплике и переключаться уже на неё.

В итоге checksums из рекомендованной опции превращаются в норму по умолчанию. Если вы до сих пор жили без них, самое время заложить в план обслуживания включение checksums и пересмотреть сценарии major-апгрейдов Postgres.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

Crunchy Data

Postgres 18 New Default for Data Checksums and How to Deal with Upgrades | Crunchy Data Blog

Postgres 18 defaults to checksums on. This is a good feature for data integrity but might catch you off guard with an upgrade.

👍2

2.43K views16:07

SQL Portal | Базы Данных

Работаешь с массивами? Оператор ANY позволяет проверить список и увидеть, совпадает ли хоть один элемент.

SELECT * FROM products
WHERE 'Red' = ANY(colors);

color = 'red' срабатывает только для одиночного значения

'Red' = ANY(...) работает, когда у тебя колонка со списком вроде ['red', 'blue', 'green']

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍12❤4

2.44K views06:07

SQL Portal | Базы Данных

SQL Case Files

Изучай SQL, параллельно разбирая детективные расследования.

Пиши запросы, чтобы узнать больше о подозреваемых, находить улики и закрывать дела.

Играть здесь: https://sqlcasefiles.com

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤3

2.52K views16:07

SQL Portal | Базы Данных

DuckLake теперь поддерживает встраивание данных для каталогов PostgreSQL и SQLite! Можно обойти проблему мелких файлов в lakehouse с любым каталогом, который поддерживает DuckLake.

Обнови расширение DuckLake в любом клиенте на DuckDB 1.4.x, чтобы использовать эту фичу.

P.S. Не забудь сделать flush!

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

❤3

2.38K views06:07

SQL Portal | Базы Данных

Продвинутый планировщик задач, который живёт в экосистеме PostgreSQL

Утилита полностью управляемая через базу без серверных конфигов. Поддерживает пайплайны задач, запуск SQL и внешних команд, умные ретраи после сбоев и контроль параллельного запуска тяжёлых джобов.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍5

2.58K views16:07

SQL Portal | Базы Данных

SelfDB — самостоятельно размещенный BaaS как альтернатива Supabase, ориентированная на тех, кто хочет держать базу, схемы и запросы под полным контролем, а не прятать всё за абстракциями

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

❤4👍3

2.67K views06:07

SQL Portal | Базы Данных

3:20

Media is too big

VIEW IN TELEGRAM

Совет по SQL:

Работа с оператором ORDER BY.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍11

2.71K views16:07

SQL Portal | Базы Данных

SQL for Data Science 📈.pdf

225.1 KB

Чтобы быстро освежить в голове SQL-паттерны, которые постоянно встречаются в аналитике и задачах на данных. Удобно как мини-шпаргалка перед собесом, тестовым или когда нужно быстро накидать запрос и не тупить на синтаксисе. ⛄️

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4😁3❤2

2.52K views06:07

SQL Portal | Базы Данных

До Postgres 18 планировщик не рассматривал многоколонные B-tree индексы, если в запросе не использовался их самый левый столбец.
С появлением skip scan многоколонный индекс теперь может использоваться для выполнения запросов по любому из столбцов.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

❤6🔥3🤔1

2.51K views18:00

SQL Portal | Базы Данных

Зимняя уборка в Postgres: посмотрите на самые медленные запросы — где не хватает индексов или есть простор для оптимизации.

В туториале по анализу производительности запросов:

- как использовать pg_stat_statements
- примеры SQL для поиска самых медленных запросов — можно просто скопировать 😉

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3❤2🔥2😁1

2.46K views06:07

SQL Portal | Базы Данных

Хорошие новости для пользователей Postgres под конец года. Команда TimescaleDB выпустила и открыла исходники расширения pg_textsearch.

В Postgres уже есть встроенный полнотекстовый поиск, а это расширение делает его более современным и продвинутым за счёт добавления ранжирования BM25.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

Tiger Data Blog

From ts_rank to BM25. Introducing pg_textsearch: True BM25 Ranking and Hybrid Retrieval Inside Postgres | Tiger Data

pg_textsearch brings BM25 ranking to enable hybrid search to Postgres. Build RAG systems with keyword precision and vector semantics in one database.

👍2😁1

2.75K views12:09

SQL Portal | Базы Данных

Зимняя уборка в Postgres: проверь неиспользуемые индексы и удали их.
Это ускорит записи, снизит расход памяти и освободит место на диске на следующий год.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤1

2.72K views06:07

SQL Portal | Базы Данных

☝️

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍2😁2🔥1

2.45K views12:07

SQL Portal | Базы Данных

Хочешь наглядно разобраться в устройстве Oracle AI Database:

- процессы
- память
- объекты
- файлы

Загляни в документацию с диаграммами технической архитектуры.

Там есть интерактивные схемы: можно кликать и смотреть, как компоненты связаны между собой.

Либо открыть все диаграммы сразу здесь

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍1

2.09K views16:07

SQL Portal | Базы Данных

Обобщённые инвертированные индексы (GIN) - мощный инструмент в Postgres.

Они хороши тем, что переворачивают привычную модель индексации.

Вместо логики вида: строка с ID 2 содержит значение "become a database expert", индекс хранит обратное соответствие: токен "database" указывает на строки с ID 1, 2 и 3, а "expert" — на строку с ID 2.

GIN-индексу на вход подаётся набор значений для каждой строки, которую нужно проиндексировать. Каждое уникальное значение становится ключом в индексе и сопоставляется с набором CTID (идентификаторов кортежей строк), в которых это значение встречается.

У такого подхода есть несколько сценариев применения, и один из самых популярных - полнотекстовый поиск. В MySQL для этого есть отдельный тип индекса FULLTEXT, а в Postgres похожая функциональность строится на более универсальных GIN-индексах.

Как это выглядит на практике:

(a) Добавляем колонку tsvector в таблицу:

CREATE TABLE post (
    author TEXT,
    publish_date DATE,
    content TEXT NOT NULL,
    search_vector tsvector
);

(b) Заполняем её лексемами (нормализованными словами):

UPDATE post
SET search_vector =
    to_tsvector('english', content);

CREATE INDEX post_search_idx
ON post USING GIN(search_vector);

(d) И выполняем запросы:

SELECT * FROM post
WHERE search_vector @@
      to_tsquery('english', 'database & expert');

В итоге получаем быстрый и гибкий полнотекстовый поиск прямо внутри Postgres, без отдельных движков и костылей.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4🔥4❤3

2.44K views06:07

SQL Portal | Базы Данных

Какой запрос корректно выбирает 3 наибольшие различные зарплаты?

Anonymous Quiz

61%

SELECT DISTINCT Salary FROM Employees ORDER BY Salary DESC LIMIT 3;

22%

SELECT Salary FROM Employees ORDER BY Salary DESC LIMIT 3;

16%

SELECT TOP 3 DISTINCT Salary FROM Employees

409 voters2.15K views16:06

SQL Portal | Базы Данных

Зимняя уборка в Postgres:

Проверь, сколько места реально занимают базы и каков физический размер диска. Убедись, что запаса хватит на 2026 год.

Посмотреть список всех БД на сервере и их размеры, отсортированные по убыванию:

SELECT
    datname AS database_name,
    pg_size_pretty(pg_database_size(datname)) AS size
FROM
    pg_database
ORDER BY
    pg_database_size(datname) DESC;

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4

2.13K views06:07

SQL Portal | Базы Данных

Ускорение планирования JOIN’ов — до 16 раз быстрее

Скрытая стоимость избыточной осведомленности. Так можно сказать о ситуации, когда данные распределены неравномерно, целевые значения статистики Postgres установлены высоко, и планировщик пытается оценить стоимость операции JOIN.

Более 20 лет Postgres использовал простой цикл со сложностью O(N²) для сравнения списков наиболее частых значений (Most Common Values, MCV) во время оценки join. Это работало нормально, когда целевые значения статистики малы (по умолчанию default_statistics_target равен 100).

Но сегодня опыт PostgreSQL рекомендует увеличивать это значение. Известно, что пользователи используют высокие значения (1000, а иногда и выше), чтобы справиться со сложным распределением данных, и если добавить к этому запрос с 10 соединениями — этот «простой цикл» легко может стать тихим убийцей производительности на этапе планирования.

В Postgres 19 это меняется.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3

2.13K views16:07

SQL Portal | Базы Данных

SQL-совет: как работает ORDER BY с несколькими колонками

Когда в запросе используется ORDER BY с несколькими полями, база сначала сортирует весь результат по первой колонке (в примере — sales).
Так формируются группы строк с одинаковым значением первичного поля, например все строки с sales = 12000.

Дальше включается вторичная сортировка (age ASC).
Она применяется не ко всей таблице, а только внутри этих групп.

В результате видно, что строки с одинаковым sales стоят рядом.
Например, Mira и Bob сгруппированы вместе, потому что у них одинаковые продажи (12000).
Первичная сортировка по sales DESC дала равенство, и тут в дело вступает второе поле.

Так как сортируем по age по возрастанию, Mira (30) идет перед Bob.

То же самое происходит для всех значений, которые совпали в первой сортировке:
каждое следующее поле в ORDER BY работает как тай-брейкер для предыдущего.

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

👍8❤1

1.99K views06:07

SQL Portal | Базы Данных

PostgreSQL Query Planner: Практический гид по EXPLAIN ANALYZE и ускорению запросов на 50–200%

Представьте ситуацию: вчера приложение работало нормально, сегодня получили звонок – «Сайт грузит 10 секунд!». Заглядываете в логи, видите, что SQL-запрос выполняется 8 секунд вместо обычных 0.2 секунды. Но база данных, таблицы – всё то же самое. Что изменилось?

Дело в том, что PostgreSQL Query Planner – оптимизатор запросов – принимает решения на основе статистики. Когда статистика устаревает или таблица растёт в 10 раз, планировщик может выбрать неэффективный план выполнения. Например, вместо быстрого Index Scan он выберет медленный Seq Scan всей таблицы. Это не баг – это следствие неправильной информации о данных.

Читать гид

👉

@SQLPortal

Please open Telegram to view this post

VIEW IN TELEGRAM

2.16K views16:07

About

Blog

Apps

Platform