Database Labdon

🔵 عنوان مقاله
Hybrid Search in Postgres: The Missing Manual

🟢 خلاصه مقاله:
** این مقاله راهنمایی عملی برای جست‌وجوی هیبریدی در Postgres ارائه می‌کند و نشان می‌دهد چرا ترکیب امتیازدهی BM25 با ParadeDB و جست‌وجوی شباهت برداری با pgvector از جست‌وجوی متنی داخلی Postgres در رده‌بندی مرتبط‌تر بهتر عمل می‌کند. BM25 پوشش دقیق کلیدواژه و عبارت را فراهم می‌کند، در حالی‌که بردارها معنای پرسش را با واژه‌های هم‌معنی و بازنویسی‌ها درمی‌یابند. الگوی معمول یا انتخاب نامزدها با BM25 و بازمرتب‌سازی با شباهت برداری است، یا ادغام نتایج هر دو با وزن‌دهی نرمال‌شده. همه این‌ها داخل یک پایگاه Postgres انجام می‌شود—با ایندکس‌های متن و بردار—و بدون نیاز به موتورهای خارجی، در سناریوهایی مثل جست‌وجوی محصول، مستندات و Q&A به بهبود محسوس ربط نتایج نسبت به FTS بومی می‌انجامد.

#Postgres #HybridSearch #BM25 #pgvector #VectorSearch #FullTextSearch #ParadeDB #RelevanceRanking

🟣لینک مقاله:
https://postgresweekly.com/link/176019/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

Paradedb

Hybrid Search in PostgreSQL: The Missing Manual

Build production-ready hybrid search that combines BM25 lexical matching with vector similarity search, all inside PostgreSQL

108 views05:30

Database Labdon

🔵 عنوان مقاله
Introducing pg_lake: Integrate Your Data Lakehouse with Postgres

🟢 خلاصه مقاله:
pg_lake مجموعه‌ای از افزونه‌ها برای Postgres است که اتصال مستقیم به درياچه‌داده و Lakehouse را ممکن می‌کند: پشتیبانی جامع از Iceberg و دسترسی به فایل‌های Parquet، CSV و JSON بدون جابه‌جایی داده یا خروج از محیط Postgres. این راهکار با ادغام شفاف DuckDB در موتور پرس‌وجوی Postgres، اجرای برداری و ستونی سریع را برای اسکن‌ها و تجمع‌های سنگین فراهم می‌کند، در حالی‌که همچنان با SQL آشنا کار می‌کنید. با pg_lake می‌توانید داده‌های دریاچه را مثل جدول‌های عادی بخوانید، آن‌ها را با جداول عملیاتی Postgres جوین بزنید و نیاز به ETL اضافی را کاهش دهید. پشتیبانی از Iceberg برای سناریوهایی مثل پارتیشن‌بندی و تکامل طرحواره مناسب است و مسیرهایی مانند تحلیل‌های موردی، کوئری‌های فدره، و مهاجرت تدریجی به Lakehouse را ساده می‌کند. کد و مستندات آن در GitHub در دسترس است.

#pg_lake #Postgres #DataLakehouse #Iceberg #DuckDB #Parquet #SQL #OpenSource

🟣لینک مقاله:
https://postgresweekly.com/link/176670/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

Snowflake

Introducing pg_lake: Integrate Your Data Lakehouse with Postgres

Introducing pg_lake, a set of open-source PostgreSQL extensions from Snowflake that allow you to query, manage, and write to Iceberg tables in your data lakehouse.

116 views11:30

Database Labdon

🔵 عنوان مقاله
Don't Give Postgres Too Much Memory

🟢 خلاصه مقاله:
خلاصه‌ای از دیدگاه Tomas این است که در Postgres همیشه «حافظه بیشتر=بهتر» نیست. بالا بردن بی‌محابای maintenance_work_mem و work_mem می‌تواند اندازه مجموعه کاری را بزرگ‌تر از CPU cache کند و با افزایش cache miss، سرعت مرتب‌سازی و هش را کم کند. علاوه بر آن، تخصیص‌های بزرگ، بار مدیریت حافظه روی OS را زیاد می‌کند و در بار همزمان، چون work_mem به‌ازای هر نود و هر کوئری اعمال می‌شود، مصرف واقعی حافظه چندبرابر شده و افت کارایی رخ می‌دهد. نتیجه عملی: مقادیر را معقول و مرحله‌ای تنظیم کنید، با سناریوهای واقعی بنچمارک بگیرید، در صورت نیاز به‌صورت موردی با SET مقدار work_mem را برای عملیات سنگین بالا ببرید، و به تعامل CPU cache و مدیریت حافظه OS توجه کنید؛ همیشه مقدار بیشتر سریع‌تر نیست.

#Postgres #PostgreSQL #DatabasePerformance #work_mem #maintenance_work_mem #CPUCaches #OSMemory

🟣لینک مقاله:
https://postgresweekly.com/link/176669/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

Tomas Vondra

Don't give Postgres too much memory

Can it be harmful to set maintenance_work_mem and work_mem limits very high?

95 views05:30

Database Labdon

🔵 عنوان مقاله
pg_timetable 6.1 Released: Advanced Job Scheduling Extension

🟢 خلاصه مقاله:
نسخه 6.1 از pg_timetable منتشر شد؛ یک افزونه مستقل و پخته برای زمان‌بندی کارها که کاملاً داخل پایگاه داده اجرا می‌شود. این ابزار اجازه می‌دهد در خود Postgres، فرمان‌ها و کوئری‌ها، برنامه‌های سیستمی و عملیات داخلی را زمان‌بندی کنید و وظایف را به‌صورت زنجیره‌ای به هم متصل کنید تا گردش‌کارهای چندمرحله‌ای بسازید. اجرای زمان‌بندی داخل پایگاه داده، استقرار را ساده می‌کند، با سیاست‌های دسترسی و پشتیبان‌گیری هماهنگ است و برای نگه‌داری دوره‌ای، ETL، گزارش‌گیری، کنترل کیفیت داده و پشتیبان/خروجی گرفتن بسیار مناسب است. نسخه جدید بر بلوغ و آمادگی تولیدی این راهکار تأکید دارد و گزینه‌ای عملی برای خودکارسازی مبتنی بر پایگاه داده بدون نیاز به سرویس‌های خارجی اضافی ارائه می‌کند.

#pg_timetable #Postgres #JobScheduler #DatabaseAutomation #ETL #DevOps #OpenSource #DataEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176688/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

GitHub

GitHub - cybertec-postgresql/pg_timetable: pg_timetable: Advanced scheduling for PostgreSQL

pg_timetable: Advanced scheduling for PostgreSQL. Contribute to cybertec-postgresql/pg_timetable development by creating an account on GitHub.

109 views08:30

Database Labdon

🔵 عنوان مقاله
14x Faster with 12x Less Compute: Sometimes Postgres Really is All You Need

🟢 خلاصه مقاله:
تیم جیمز یک کلاستر ۱۲ سروره مبتنی بر HBase/OpenTSDB را که برای داده‌های سری‌زمانی استفاده می‌شد، با سامانه‌ای بسیار ساده‌تر بر پایه Postgres/Timescale جایگزین کرد. نتیجه: پرس‌وجوها تا ۱۴ برابر سریع‌تر، با ۱۲ برابر محاسبات کمتر، و ۱۰۰٪ دسترس‌پذیری پس از مهاجرت.

آن‌ها با تکیه بر SQL و قابلیت‌های Timescale مانند hypertable، فشرده‌سازی، continuous aggregates و خط‌مشی‌های نگهداشت داده، هم کارایی پرس‌وجوها و هم پایداری ingestion را بهبود دادند. طرح مهاجرت شامل dual-write، backfill موازی و اعتبارسنجی دقیق بود و در نهایت کل سامانه روی دو سرور با replication و failover خودکار پایدار شد.

پیام اصلی: برای بسیاری از بارهای کاری سری‌زمانی، Postgres/Timescale با طراحی درستِ شِما، ایندکس‌های هدفمند و ابزارهای استاندارد، هزینه و پیچیدگی عملیاتی را به‌طور چشمگیری کاهش می‌دهد و کارایی را بالا می‌برد—گرچه برای نرخ‌نوشتن یا کاردینالیته‌ی بسیار شدید، پایگاه‌های تخصصی هنوز مزیت دارند.

#Postgres #TimescaleDB #TimeSeries #OpenTSDB #HBase #DatabaseMigration #PerformanceEngineering #DevOps

🟣لینک مقاله:
https://postgresweekly.com/link/176022/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

YouTube

James Udiljak - 14x Faster with 12x Less Compute: Sometimes Postgres Really Is All You Need

How big is ""Big Data"" really? The definition has changed drastically over time.
In this talk, James recounts building his own database on top of Postgres to replace a legacy HBase/OpenTSDB cluster. While once considered ""Big Data"", the real-time monitoring…

101 views11:30

Database Labdon

🔵 عنوان مقاله
ShadowTraffic's Postgres Connector (Tool)

🟢 خلاصه مقاله:
کانکتور Postgres از ShadowTraffic داده‌های تولیدشده را مستقیماً به Postgres استریم می‌کند و اختیار کامل مدیریت جدول‌ها را می‌دهد: ساخت خودکار، حذف و ایجاد مجدد، یا واگذاری کامل به فرآیندهای دستی/مهاجرت‌های موجود. با تنظیمات ساده می‌توانید رفتار insert، update و delete را کنترل کنید و نوع ستون‌ها، سرنخ‌های اسکیمای لازم و اندازه/بسامد دسته‌ها را دقیقاً سفارشی‌سازی کنید. نتیجه این است که می‌توانید داده را سریع شبیه‌سازی یا به‌تدریج تکامل دهید، در حالی‌که کنترل و شفافیت عملیاتی بر Postgres و بار وارد بر محیط را حفظ می‌کنید.

#ShadowTraffic #Postgres #DataStreaming #SyntheticData #DataGeneration #ETL #DatabaseTesting #DevTools

🟣لینک مقاله:
https://docs.shadowtraffic.io/connections/postgres/?utm_source=tldrdata

➖➖➖➖➖➖➖➖
👑 @Database_Academy

docs.shadowtraffic.io

ShadowTraffic Docs

Rapidly simulate production traffic to your backend

123 views08:31

Database Labdon

🔵 عنوان مقاله
Did You Know Postgres Tables are Limited to 1,600 Columns?

🟢 خلاصه مقاله:
اگر نمی‌دانستید، در Postgres هر جدول حداکثر ۱۶۰۰ ستون می‌تواند داشته باشد. این یک محدودیت سخت در هسته سیستم است و با NULL بودن فیلدها یا TOAST دور زده نمی‌شود. اگر شماره issue 226 در سال 2017 را خوانده باشید، احتمالاً این نکته را به خاطر دارید. این سقف به معنای آن است که طراحی‌هایی با جدول‌های بسیار عریض—مثل هر شاخص یک ستون یا طرح‌های EAV تثبیت‌شده—به‌سرعت به حد می‌خورند. راه‌حل‌های بهتر شامل نرمال‌سازی، تفکیک عمودی، تبدیل ستون‌ها به سطرها برای سنجه‌ها، یا استفاده از JSONB برای ویژگی‌های کم‌استفاده و پراکنده است. جدول‌های خیلی عریض علاوه بر ریسک رسیدن به سقف، هزینه I/O و نگهداری را بالا می‌برند. نتیجه عملی: با در نظر گرفتن حد ۱۶۰۰ ستون، از طرح‌های باریک‌تر و انعطاف‌پذیرتر استفاده کنید و قبل از اعمال مهاجرت‌ها، تعداد ستون‌ها را بررسی کنید.

#Postgres #PostgreSQL #SQL #DatabaseDesign #DataModeling #SchemaDesign #JSONB #SoftwareEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176989/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

Data Bene

Did you know? Tables in PostgreSQL are limited to 1,600 columns

It's a hard-coded limit in Postgres for tables to not exceed 1,600 columns. Let's test all the ways you can reach that limit, and explore how to address the situation when you reach this limit unexpectedly.

490 views05:30

Database Labdon

🔵 عنوان مقاله
PostGraphile v5 Release Candidate

🟢 خلاصه مقاله:
** نسخه v5 از PostGraphile به مرحله Release Candidate رسیده است؛ ابزاری که مانند PostgREST برای RESTful، به‌صورت خودکار یک GraphQL API مبتنی بر Postgres می‌سازد و طرحواره GraphQL را از همان ساختار دیتابیس (جداول، ویوها و فانکشن‌ها) مشتق می‌کند. این RC نتیجه پنج سال کار است و نشان می‌دهد قابلیت‌ها تقریباً تکمیل شده‌اند و تمرکز روی پایداری و بازخورد دنیای واقعی است. برای تیم‌هایی که روی Postgres سرمایه‌گذاری کرده‌اند، PostGraphile لایه GraphQL را به‌خوبی با مدل رابطه‌ای همسو می‌کند و با تکیه بر ساختار و منطق موجود در دیتابیس، توسعه API را سریع‌تر و منسجم‌تر می‌سازد. در انتخاب مسیر، PostgREST برای APIهای ساده و RESTful مناسب است و PostGraphile زمانی می‌درخشد که انعطاف‌پذیری GraphQL مدنظر باشد. کاربران فعلی بهتر است قبل از ارتقا به v5، RC را در محیط آزمایشی امتحان کنند و یادداشت‌های انتشار و تغییرات احتمالی را مرور کنند.

#PostGraphile #GraphQL #Postgres #API #ReleaseCandidate #OpenSource #Backend #DeveloperTools

🟣لینک مقاله:
https://postgresweekly.com/link/176691/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

postgraphile.org

PostGraphile V5 release candidate! 🎉 | PostGraphile

The code is done, the docs and types need some love. Help us prepare for the release of PostGraphile V5!

104 views08:30

Database Labdon

🔵 عنوان مقاله
a new $8/mo 'developer tier'

🟢 خلاصه مقاله:
** یک پلن جدید با قیمت ماهانه ۸ دلار برای «developer tier» سرویس ابری مدیریت‌شده Postgres معرفی شده که دسترسی کم‌هزینه و قابل پیش‌بینی به دیتابیس را برای مراحل اولیه توسعه فراهم می‌کند. این پلن برای توسعه‌دهندگان مستقل، دانشجوها و تیم‌های کوچک—برای نمونه‌سازی، استیجینگ، CI/CD و پروژه‌های آزمایشی—طراحی شده و امکانات ضروری مانند اجرای مدیریت‌شده Postgres، پشتیبان‌گیری و مانیتورینگ پایه را ارائه می‌دهد. در ازای قیمت پایین، معمولاً محدودیت منابع دارد و قابلیت‌های پیشرفته تولیدی مثل HA یا چندمنطقه‌ای را شامل نمی‌شود. نقطه قوت آن مسیر ارتقا به پلن‌های بالاتر بدون دردسر و سازگاری کامل با اکوسیستم استاندارد Postgres است که هزینه و پیچیدگی میزبانی شخصی را کاهش می‌دهد.

#Postgres #DBaaS #CloudDatabase #DeveloperTier #SaaS #StartupTools #DevOps

🟣لینک مقاله:
https://postgresweekly.com/link/176986/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

Aiven

Introducing Developer Tier for Aiven for PostgreSQL® services

Starting at $8 USD, the new Developer tier includes everything from the Free tier, with extra disk space, preserved uptime for idle services, and Basic support to keep you building without interruption.

118 views11:30

Database Labdon

🔵 عنوان مقاله
ClickPipes for Postgres now supports failover replication slots.

🟢 خلاصه مقاله:
** این به‌روزرسانی اعلام می‌کند که ClickPipes for Postgres اکنون از failover replication slots پشتیبانی می‌کند؛ قابلیتی که در محیط‌های با قابلیت دسترس‌پذیری بالا باعث تداوم جریان داده هنگام جابه‌جایی از primary به standby می‌شود. با حفظ موقعیت اسلات در زمان failover، مصرف‌کنندگان CDC می‌توانند بی‌وقفه روی primary جدید ادامه دهند، بدون از دست‌دادن داده یا رشد غیرقابل‌کنترل WAL. این تغییر ریسک عملیاتی را کم می‌کند، پیاده‌سازی HA را ساده‌تر می‌سازد و برای تیم‌های Go که روی Postgres سرویس‌های داده می‌سازند—طبق پوشش آخرین شماره Golang Weekly—خبر مهمی است.

#Postgres #Replication #Failover #ClickPipes #Golang #CDC #HighAvailability #DataEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176987/web

➖➖➖➖➖➖➖➖
👑 @Database_Academy

ClickHouse

ClickPipes for Postgres now supports failover replication slots

Learn about how failover-ready replication slots keep Postgres CDC pipelines running without interruption.

108 views05:30

About

Blog

Apps

Platform