Database Labdon
834 subscribers
33 photos
3 videos
1 file
787 links
🕸 Database Academy

حمایت مالی:
https://www.coffeete.ir/mrbardia72

ادمین:
@mrbardia72
Download Telegram
🔵 عنوان مقاله
Hybrid Search in Postgres: The Missing Manual

🟢 خلاصه مقاله:
** این مقاله راهنمایی عملی برای جست‌وجوی هیبریدی در Postgres ارائه می‌کند و نشان می‌دهد چرا ترکیب امتیازدهی BM25 با ParadeDB و جست‌وجوی شباهت برداری با pgvector از جست‌وجوی متنی داخلی Postgres در رده‌بندی مرتبط‌تر بهتر عمل می‌کند. BM25 پوشش دقیق کلیدواژه و عبارت را فراهم می‌کند، در حالی‌که بردارها معنای پرسش را با واژه‌های هم‌معنی و بازنویسی‌ها درمی‌یابند. الگوی معمول یا انتخاب نامزدها با BM25 و بازمرتب‌سازی با شباهت برداری است، یا ادغام نتایج هر دو با وزن‌دهی نرمال‌شده. همه این‌ها داخل یک پایگاه Postgres انجام می‌شود—با ایندکس‌های متن و بردار—و بدون نیاز به موتورهای خارجی، در سناریوهایی مثل جست‌وجوی محصول، مستندات و Q&A به بهبود محسوس ربط نتایج نسبت به FTS بومی می‌انجامد.

#Postgres #HybridSearch #BM25 #pgvector #VectorSearch #FullTextSearch #ParadeDB #RelevanceRanking

🟣لینک مقاله:
https://postgresweekly.com/link/176019/web


👑 @Database_Academy
🔵 عنوان مقاله
Introducing pg_lake: Integrate Your Data Lakehouse with Postgres

🟢 خلاصه مقاله:
pg_lake مجموعه‌ای از افزونه‌ها برای Postgres است که اتصال مستقیم به درياچه‌داده و Lakehouse را ممکن می‌کند: پشتیبانی جامع از Iceberg و دسترسی به فایل‌های Parquet، CSV و JSON بدون جابه‌جایی داده یا خروج از محیط Postgres. این راهکار با ادغام شفاف DuckDB در موتور پرس‌وجوی Postgres، اجرای برداری و ستونی سریع را برای اسکن‌ها و تجمع‌های سنگین فراهم می‌کند، در حالی‌که همچنان با SQL آشنا کار می‌کنید. با pg_lake می‌توانید داده‌های دریاچه را مثل جدول‌های عادی بخوانید، آن‌ها را با جداول عملیاتی Postgres جوین بزنید و نیاز به ETL اضافی را کاهش دهید. پشتیبانی از Iceberg برای سناریوهایی مثل پارتیشن‌بندی و تکامل طرحواره مناسب است و مسیرهایی مانند تحلیل‌های موردی، کوئری‌های فدره، و مهاجرت تدریجی به Lakehouse را ساده می‌کند. کد و مستندات آن در GitHub در دسترس است.

#pg_lake #Postgres #DataLakehouse #Iceberg #DuckDB #Parquet #SQL #OpenSource

🟣لینک مقاله:
https://postgresweekly.com/link/176670/web


👑 @Database_Academy
🔵 عنوان مقاله
Don't Give Postgres Too Much Memory

🟢 خلاصه مقاله:
خلاصه‌ای از دیدگاه Tomas این است که در Postgres همیشه «حافظه بیشتر=بهتر» نیست. بالا بردن بی‌محابای maintenance_work_mem و work_mem می‌تواند اندازه مجموعه کاری را بزرگ‌تر از CPU cache کند و با افزایش cache miss، سرعت مرتب‌سازی و هش را کم کند. علاوه بر آن، تخصیص‌های بزرگ، بار مدیریت حافظه روی OS را زیاد می‌کند و در بار همزمان، چون work_mem به‌ازای هر نود و هر کوئری اعمال می‌شود، مصرف واقعی حافظه چندبرابر شده و افت کارایی رخ می‌دهد. نتیجه عملی: مقادیر را معقول و مرحله‌ای تنظیم کنید، با سناریوهای واقعی بنچمارک بگیرید، در صورت نیاز به‌صورت موردی با SET مقدار work_mem را برای عملیات سنگین بالا ببرید، و به تعامل CPU cache و مدیریت حافظه OS توجه کنید؛ همیشه مقدار بیشتر سریع‌تر نیست.

#Postgres #PostgreSQL #DatabasePerformance #work_mem #maintenance_work_mem #CPUCaches #OSMemory

🟣لینک مقاله:
https://postgresweekly.com/link/176669/web


👑 @Database_Academy
🔵 عنوان مقاله
pg_timetable 6.1 Released: Advanced Job Scheduling Extension

🟢 خلاصه مقاله:
نسخه 6.1 از pg_timetable منتشر شد؛ یک افزونه مستقل و پخته برای زمان‌بندی کارها که کاملاً داخل پایگاه داده اجرا می‌شود. این ابزار اجازه می‌دهد در خود Postgres، فرمان‌ها و کوئری‌ها، برنامه‌های سیستمی و عملیات داخلی را زمان‌بندی کنید و وظایف را به‌صورت زنجیره‌ای به هم متصل کنید تا گردش‌کارهای چندمرحله‌ای بسازید. اجرای زمان‌بندی داخل پایگاه داده، استقرار را ساده می‌کند، با سیاست‌های دسترسی و پشتیبان‌گیری هماهنگ است و برای نگه‌داری دوره‌ای، ETL، گزارش‌گیری، کنترل کیفیت داده و پشتیبان/خروجی گرفتن بسیار مناسب است. نسخه جدید بر بلوغ و آمادگی تولیدی این راهکار تأکید دارد و گزینه‌ای عملی برای خودکارسازی مبتنی بر پایگاه داده بدون نیاز به سرویس‌های خارجی اضافی ارائه می‌کند.

#pg_timetable #Postgres #JobScheduler #DatabaseAutomation #ETL #DevOps #OpenSource #DataEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176688/web


👑 @Database_Academy
🔵 عنوان مقاله
14x Faster with 12x Less Compute: Sometimes Postgres Really is All You Need

🟢 خلاصه مقاله:
تیم جیمز یک کلاستر ۱۲ سروره مبتنی بر HBase/OpenTSDB را که برای داده‌های سری‌زمانی استفاده می‌شد، با سامانه‌ای بسیار ساده‌تر بر پایه Postgres/Timescale جایگزین کرد. نتیجه: پرس‌وجوها تا ۱۴ برابر سریع‌تر، با ۱۲ برابر محاسبات کمتر، و ۱۰۰٪ دسترس‌پذیری پس از مهاجرت.

آن‌ها با تکیه بر SQL و قابلیت‌های Timescale مانند hypertable، فشرده‌سازی، continuous aggregates و خط‌مشی‌های نگهداشت داده، هم کارایی پرس‌وجوها و هم پایداری ingestion را بهبود دادند. طرح مهاجرت شامل dual-write، backfill موازی و اعتبارسنجی دقیق بود و در نهایت کل سامانه روی دو سرور با replication و failover خودکار پایدار شد.

پیام اصلی: برای بسیاری از بارهای کاری سری‌زمانی، Postgres/Timescale با طراحی درستِ شِما، ایندکس‌های هدفمند و ابزارهای استاندارد، هزینه و پیچیدگی عملیاتی را به‌طور چشمگیری کاهش می‌دهد و کارایی را بالا می‌برد—گرچه برای نرخ‌نوشتن یا کاردینالیته‌ی بسیار شدید، پایگاه‌های تخصصی هنوز مزیت دارند.

#Postgres #TimescaleDB #TimeSeries #OpenTSDB #HBase #DatabaseMigration #PerformanceEngineering #DevOps

🟣لینک مقاله:
https://postgresweekly.com/link/176022/web


👑 @Database_Academy
🔵 عنوان مقاله
ShadowTraffic's Postgres Connector (Tool)

🟢 خلاصه مقاله:
کانکتور Postgres از ShadowTraffic داده‌های تولیدشده را مستقیماً به Postgres استریم می‌کند و اختیار کامل مدیریت جدول‌ها را می‌دهد: ساخت خودکار، حذف و ایجاد مجدد، یا واگذاری کامل به فرآیندهای دستی/مهاجرت‌های موجود. با تنظیمات ساده می‌توانید رفتار insert، update و delete را کنترل کنید و نوع ستون‌ها، سرنخ‌های اسکیمای لازم و اندازه/بسامد دسته‌ها را دقیقاً سفارشی‌سازی کنید. نتیجه این است که می‌توانید داده را سریع شبیه‌سازی یا به‌تدریج تکامل دهید، در حالی‌که کنترل و شفافیت عملیاتی بر Postgres و بار وارد بر محیط را حفظ می‌کنید.

#ShadowTraffic #Postgres #DataStreaming #SyntheticData #DataGeneration #ETL #DatabaseTesting #DevTools

🟣لینک مقاله:
https://docs.shadowtraffic.io/connections/postgres/?utm_source=tldrdata


👑 @Database_Academy
🔵 عنوان مقاله
Did You Know Postgres Tables are Limited to 1,600 Columns?

🟢 خلاصه مقاله:
اگر نمی‌دانستید، در Postgres هر جدول حداکثر ۱۶۰۰ ستون می‌تواند داشته باشد. این یک محدودیت سخت در هسته سیستم است و با NULL بودن فیلدها یا TOAST دور زده نمی‌شود. اگر شماره issue 226 در سال 2017 را خوانده باشید، احتمالاً این نکته را به خاطر دارید. این سقف به معنای آن است که طراحی‌هایی با جدول‌های بسیار عریض—مثل هر شاخص یک ستون یا طرح‌های EAV تثبیت‌شده—به‌سرعت به حد می‌خورند. راه‌حل‌های بهتر شامل نرمال‌سازی، تفکیک عمودی، تبدیل ستون‌ها به سطرها برای سنجه‌ها، یا استفاده از JSONB برای ویژگی‌های کم‌استفاده و پراکنده است. جدول‌های خیلی عریض علاوه بر ریسک رسیدن به سقف، هزینه I/O و نگهداری را بالا می‌برند. نتیجه عملی: با در نظر گرفتن حد ۱۶۰۰ ستون، از طرح‌های باریک‌تر و انعطاف‌پذیرتر استفاده کنید و قبل از اعمال مهاجرت‌ها، تعداد ستون‌ها را بررسی کنید.

#Postgres #PostgreSQL #SQL #DatabaseDesign #DataModeling #SchemaDesign #JSONB #SoftwareEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176989/web


👑 @Database_Academy
🔵 عنوان مقاله
PostGraphile v5 Release Candidate

🟢 خلاصه مقاله:
** نسخه v5 از PostGraphile به مرحله Release Candidate رسیده است؛ ابزاری که مانند PostgREST برای RESTful، به‌صورت خودکار یک GraphQL API مبتنی بر Postgres می‌سازد و طرحواره GraphQL را از همان ساختار دیتابیس (جداول، ویوها و فانکشن‌ها) مشتق می‌کند. این RC نتیجه پنج سال کار است و نشان می‌دهد قابلیت‌ها تقریباً تکمیل شده‌اند و تمرکز روی پایداری و بازخورد دنیای واقعی است. برای تیم‌هایی که روی Postgres سرمایه‌گذاری کرده‌اند، PostGraphile لایه GraphQL را به‌خوبی با مدل رابطه‌ای همسو می‌کند و با تکیه بر ساختار و منطق موجود در دیتابیس، توسعه API را سریع‌تر و منسجم‌تر می‌سازد. در انتخاب مسیر، PostgREST برای APIهای ساده و RESTful مناسب است و PostGraphile زمانی می‌درخشد که انعطاف‌پذیری GraphQL مدنظر باشد. کاربران فعلی بهتر است قبل از ارتقا به v5، RC را در محیط آزمایشی امتحان کنند و یادداشت‌های انتشار و تغییرات احتمالی را مرور کنند.

#PostGraphile #GraphQL #Postgres #API #ReleaseCandidate #OpenSource #Backend #DeveloperTools

🟣لینک مقاله:
https://postgresweekly.com/link/176691/web


👑 @Database_Academy
🔵 عنوان مقاله
a new $8/mo 'developer tier'

🟢 خلاصه مقاله:
** یک پلن جدید با قیمت ماهانه ۸ دلار برای «developer tier» سرویس ابری مدیریت‌شده Postgres معرفی شده که دسترسی کم‌هزینه و قابل پیش‌بینی به دیتابیس را برای مراحل اولیه توسعه فراهم می‌کند. این پلن برای توسعه‌دهندگان مستقل، دانشجوها و تیم‌های کوچک—برای نمونه‌سازی، استیجینگ، CI/CD و پروژه‌های آزمایشی—طراحی شده و امکانات ضروری مانند اجرای مدیریت‌شده Postgres، پشتیبان‌گیری و مانیتورینگ پایه را ارائه می‌دهد. در ازای قیمت پایین، معمولاً محدودیت منابع دارد و قابلیت‌های پیشرفته تولیدی مثل HA یا چندمنطقه‌ای را شامل نمی‌شود. نقطه قوت آن مسیر ارتقا به پلن‌های بالاتر بدون دردسر و سازگاری کامل با اکوسیستم استاندارد Postgres است که هزینه و پیچیدگی میزبانی شخصی را کاهش می‌دهد.

#Postgres #DBaaS #CloudDatabase #DeveloperTier #SaaS #StartupTools #DevOps

🟣لینک مقاله:
https://postgresweekly.com/link/176986/web


👑 @Database_Academy
🔵 عنوان مقاله
ClickPipes for Postgres now supports failover replication slots.

🟢 خلاصه مقاله:
** این به‌روزرسانی اعلام می‌کند که ClickPipes for Postgres اکنون از failover replication slots پشتیبانی می‌کند؛ قابلیتی که در محیط‌های با قابلیت دسترس‌پذیری بالا باعث تداوم جریان داده هنگام جابه‌جایی از primary به standby می‌شود. با حفظ موقعیت اسلات در زمان failover، مصرف‌کنندگان CDC می‌توانند بی‌وقفه روی primary جدید ادامه دهند، بدون از دست‌دادن داده یا رشد غیرقابل‌کنترل WAL. این تغییر ریسک عملیاتی را کم می‌کند، پیاده‌سازی HA را ساده‌تر می‌سازد و برای تیم‌های Go که روی Postgres سرویس‌های داده می‌سازند—طبق پوشش آخرین شماره Golang Weekly—خبر مهمی است.

#Postgres #Replication #Failover #ClickPipes #Golang #CDC #HighAvailability #DataEngineering

🟣لینک مقاله:
https://postgresweekly.com/link/176987/web


👑 @Database_Academy