SQL Portal | Базы Данных

Логическая репликация — мощный, безопасный и эффективный инструмент для масштабных миграций в Postgres. В этой статье рассказали, что нужно знать, чтобы выполнить миграцию с помощью logical replication.

@SQLPortal

👍5

1.85K views06:07

SQL Portal | Базы Данных

PostgreSQL использует ленивое «swizzling» указателей (lazy pointer swizzling), чтобы ускорить доступ к буферу и держать данные на диске и в памяти синхронизированными без лишних преобразований. Вот как это работает.

Когда PostgreSQL хранит структуры данных, например страницы B-tree индекса, на диске нельзя использовать обычные указатели из оперативки → адреса на диске и в памяти вообще из разных миров. Но как только данные попадают в память, хочется быстро ходить по структуре через указатели, а не через медленные косвенные ссылки.

На диске PostgreSQL хранит ссылки в виде номеров блоков и смещений. Когда страница читается в общий буферный пул, эти логические ссылки остаются как есть → и вот тут начинается интересное.

Буферные страницы

→ Каждая страница в памяти идентифицируется с помощью структуры BufferTag (в ней указаны база, таблица и номер блока).
→ В памяти PostgreSQL держит массив дескрипторов буферов.
→ Когда нужно получить доступ к странице, код идет через менеджер буферов, который по номеру блока находит реальное местоположение страницы в памяти.
→ Это и есть ленивое swizzling — преобразование адреса выполняется не заранее, а при каждом обращении.

Пример структуры BufferTag из исходников PostgreSQL:

typedef struct
{
  Oid   spcOid;      /* tablespace */
  Oid   dbOid;       /* database */
  Oid   relNumber;   /* relation (table or index) */
  ForkNumber forkNum;/* main, fsm, vm, init forks */
  BlockNumber blockNum; /* block number within the relation */
} BufferTag;

Почему это круто

→ Страницы в буферном пуле сохраняют свой дисковый формат, не нужно ничего конвертировать туда-сюда.
→ Несколько процессов могут обращаться к одной странице, используя номера блоков, а не указатели → это делает параллельный доступ простым и безопасным.
→ Когда страница выкидывается из буфера, не нужно «раскручивать» swizzling обратно.

PostgreSQL таким образом жертвует крошечной долей производительности на каждом обращении (из-за дополнительного уровня косвенности), но выигрывает в простоте буферного менеджмента и надежности при многопоточном доступе.

Очень аккуратный и элегантный дизайн.

👉

@SQLPortal

Please open Telegram to view this post