Серьёзный конкурент DuckDB 🦆
Ты уже видел аналог DuckDB от ребят из ClickHouse? Называется это чудо chDB. Представляет из себя встроенную OLAP базу данных под капотом которой работает движок ClickHouse. Умеет в Parquet, Arrow, ORC и многие другие форматы, есть биндинги для Python, Go, Rust, NodeJS, Bun. Работает на Linux и MacOS, Windows не поддерживает.
Подробности в новости о том, что chDB присоединяется к ClickHouse
Ты уже видел аналог DuckDB от ребят из ClickHouse? Называется это чудо chDB. Представляет из себя встроенную OLAP базу данных под капотом которой работает движок ClickHouse. Умеет в Parquet, Arrow, ORC и многие другие форматы, есть биндинги для Python, Go, Rust, NodeJS, Bun. Работает на Linux и MacOS, Windows не поддерживает.
Подробности в новости о том, что chDB присоединяется к ClickHouse
Please open Telegram to view this post
VIEW IN TELEGRAM
a Database guy
chDB is joining ClickHouse
The Start During the Lunar New Year in February last year, in order to solve the efficiency problem of the machine learning model sample data I was facing at the time, I created chDB. Of course, compared to everything that the creators of ClickHouse have…
🆒4
psycopg3 прошло уже почти три года. Несмотря на это, многие проекты до сих пор предпочитают использовать версию psycopg2, и причин у этого может быть масса. Однако недавно привлекли моё внимание результаты сравнения производительности этих двух версий, и мне кажется, они заслуживают отдельного поста.psycopg3 опережает psycopg2 в три раза по скорости выполнения простых SELECT FROM запросов. Это значительное улучшение, которое может сыграть ключевую роль для проектов, опирающихся на интенсивное чтение данных из базы. Таким образом, для большинства разработчиков переход на новую версию может стать не просто желательным, но и полезным шагом в плане оптимизации своих приложений.psycopg2 показывает себя лучше. Это указывает на то, что новая версия, несмотря на значительные улучшения в некоторых областях, может пока не подходить для всех сценариев использования.psycopg3 требует тщательного анализа собственных потребностей. Приведенные данные предлагают отличное начало для разговора о том, как версия драйвера может влиять на производительность проектов.Подробнее о сравнении
psycopg2 и psycopg3 ты можешь прочитать на Timescale, где обсуждаются эти результаты и предлагаются размышления о том, как выбор версии может влиять на ваши проекты.Please open Telegram to view this post
VIEW IN TELEGRAM
Timescale Blog
Psycopg2 vs Psycopg3 Performance Benchmark
A comparison of psycopg2 versus psycopg3 to assess the performance gains of the latest version.
❤🔥4
Денормализация данных для повышения производительности
Хотя нормализация необходима для поддержания целостности данных и сокращения избыточности, существуют сценарии, в которых денормализация может повысить производительность запросов. Давай рассмотрим эту технику подробнее.
Определи области в схеме, где часто выполняются операции соединения, что приводит к снижению производительности в высоконагруженных сценариях. Например, если у тебя есть таблица клиентов и таблица заказов с частыми операциями
JOIN, рассмотри возможность денормализации определённых подмножеств данных.Предположим, ты часто запрашиваешь имя, адрес и историю последних заказов клиента. Ты можешь создать денормализованную таблицу, объединяющую данные из таблиц клиентов и заказов, чтобы уменьшить необходимость в соединениях:
CREATE TABLE denormalized_customer_orders (
customer_id INT PRIMARY KEY,
customer_name VARCHAR(255),
customer_address VARCHAR(255),
total_orders INT
);
Ты периодически обновляешь эту денормализованную таблицу, чтобы данные соответствовали нормализованным таблицам.
Хотя денормализация может повысить производительность, важно соблюдать баланс между ней и согласованностью данных. Внедри механизмы, обеспечивающие синхронизацию денормализованных данных с нормализованными. Рассмотри возможность использования триггеров, хранимых процедур или логики на уровне приложения для поддержания целостности данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DE
Методы оптимизации SQL-запросов в высоконагруженных приложениях
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
🆒3❤🔥2
Десять основных улучшений планировщика PostgreSQL в PG16:
DISTINCTORDER BY / DISTINCTmemoize для запросов UNION ALLright anti-joinFULL и RIGHT OUTER джойновROWS оконных функцийleft join и unique joins в секционированных таблицахLIMIT вместо UNIQUE для реализации DISTINCT, когда это возможноMerge Join, в бОльшем количестве случаевПодробнее в статье
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥6
Использование временных таблиц для оптимизации запросов
Временные таблицы могут быть мощным инструментом для оптимизации сложных запросов, когда речь идёт о сложных соединениях и агрегациях. Давай рассмотрим эту технику подробнее.
В высоконагруженных приложениях некоторые запросы включают несколько шагов, агрегации или сложную логику. Временные таблицы разбивают запрос на управляемые фрагменты, сохраняя промежуточные результаты для дальнейшего анализа. Такой подход упрощает последующие операции и повышает производительность запроса.
Временные таблицы создаются и наполняются данными в рамках сеанса. Они живут в течение сеанса или до тех пор, пока не будут явно удалены. Например:
-- Создание временной таблицы для отфильтрованных заказов
CREATE TEMPORARY TABLE tmp_filtered_orders AS
SELECT order_id, customer_id, order_date, total_amount
FROM orders
WHERE order_date BETWEEN '2023-01-01' AND '2023-06-30';
Благодаря этой временной таблице последующие запросы могут сосредоточиться на отфильтрованных данных о заказах, что снижает сложность операций соединения и фильтрации.
Временные таблицы полезны при работе с агрегациями. Вместо агрегации данных непосредственно из первичных таблиц можно сначала заполнить временную таблицу агрегированными результатами, а затем провести дополнительный анализ:
-- Создание временной таблицы с агрегированными данными о заказах
CREATE TEMPORARY TABLE tmp_order_summary AS
SELECT customer_id, COUNT(order_id) AS order_count, SUM(total_amount) AS total_spent
FROM tmp_filtered_orders
GROUP BY customer_id;
Использование временных таблиц упрощает процесс агрегации и позволяет избежать повторной обработки одних и тех же данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DE
Методы оптимизации SQL-запросов в высоконагруженных приложениях
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
❤🔥6
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥2
PEP 723
⭐️ Т.е. по сути ты сможешь описать зависимости скрипта в метадате без их установки через pip.
Если(когда) pep будет принят
# /// noscriptЭтот PEP определяет формат метаданных, который может быть встроен в однофайловые скрипты Python для облегчения запуска, IDE и других внешних инструментов, которым может потребоваться взаимодействовать с такими скриптами.
# requires-python = ">=3.11"
# dependencies = [
# "requests<3",
# "rich",
# ]
# ///
import requests
from rich.pretty import pprint
resp = requests.get("https://peps.python.org/api/peps.json")
data = resp.json()
pprint([(k, v["noscript"]) for k, v in data.items()][:10])
Если
Please open Telegram to view this post
VIEW IN TELEGRAM
🆒3❤🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁3❤🔥2
Оптимизация подзапросов и агрегаций
Подзапросы и агрегации часто встречаются в SQL-запросах, но могут влиять на производительность. Давай рассмотрим дополнительные методы оптимизации.
Помимо преобразования подзапросов в
JOIN или использования EXISTS, рассмотри следующие советы по оптимизации подзапросов:SELECT могут привести к снижению производительности. Если нужно получить данные из связанных таблиц, используйте вместо этого JOIN.TOP (SQL Server) или LIMIT (MySQL, PostgreSQL, SQLite).Агрегации, такие как
SUM, COUNT, AVG и другие, необходимы, но могут быть ресурсоёмкими. Вот как их оптимизировать:Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DE
Методы оптимизации SQL-запросов в высоконагруженных приложениях
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
🆒4❤🔥1
Please open Telegram to view this post
VIEW IN TELEGRAM
postgrespro.ru
PostgreSQL : Документация: 18: Документация к PostgreSQL 18.1
❤🔥7
Избегай курсоров и циклов для повышения производительности
Курсоры и циклы следует редко использовать в SQL, поскольку они могут быть медленными и неэффективными, особенно в высоконагруженных приложениях. SQL предназначен для операций на основе множеств, которые, как правило, эффективнее. Вот как свести к минимуму использование курсоров и циклов:
Вместо использования курсоров или циклов для манипулирования данными строка за строкой используй операции на основе множеств, предоставляемые SQL. Например, ты можешь использовать операторы
UPDATE или DELETE с предложениями WHERE для изменения или удаления нескольких строк на основе определённых условий.Если нужно обработать много строк, рассмотри возможность использования пакетной обработки. Разбей операцию на управляемые фрагменты, используя
LIMIT (MySQL, PostgreSQL, SQLite), FETCH FIRST (IBM Db2) или аналогичные выражения. В каждой итерации обрабатывай подмножество строк, снижая нагрузку на ресурсы сервера.Если ты обнаружишь, что циклы необходимы для решения конкретной задачи, постарайся оптимизировать их, используя операции на основе множеств внутри цикла. Минимизируй взаимодействие с БД, получая и манипулируя большими наборами данных на каждой итерации, сокращая количество взаимодействий с базой данных.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DE
Методы оптимизации SQL-запросов в высоконагруженных приложениях
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
🆒4❤🔥1
Заключительный пост цикла.
🙂 Применяя методы, описанные в постах выше, ты сможешь улучшить навыки оптимизации SQL-запросов, особенно когда речь идёт о высоконагруженных приложениях, сложных соединениях и проблемах индексирования.
🙃 Понимание планов выполнения запросов, стратегий индексирования, переписывания запросов, денормализации данных, временных таблиц, оптимизации подзапросов и агрегирования. А также отказа от таких неэффективных методов, как курсоры и циклы, позволит оптимизировать запросы к БД для достижения максимальной производительности.
Please open Telegram to view this post
VIEW IN TELEGRAM
Telegram
DE
Методы оптимизации SQL-запросов в высоконагруженных приложениях
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
Успех высоконагруженных приложений зависит от эффективной работы БД, лежащих в их основе. По мере роста сложности SQL-запросов, особенно тех, которые включают в себя сложные соединения и проблемы…
🆒3❤🔥1
Команда Postman Open Technologies собирает информацию о стандартах, отраслевых форматах и спецификациях, открытых API.
Каталог практик и паттернов оформлен как рабочее пространство Postman
На текущий момент там описаны следующие паттерны:
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3🆒2
IMG_20240315_000134_555.png
971 KB
Шпаргалка по SQL
JOIN, IN, LIKE, BETWEEN, ORDER BY и другое, ботай!
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3
📦 PyPI
docker pull apache/airflow:2.8.3#airflow
Please open Telegram to view this post
VIEW IN TELEGRAM
❤🔥3