🔵 عنوان مقاله
Gateway API v1.3.0: Advancements in Request Mirroring, CORS, Gateway Merging, and Retry Budgets
🟢 خلاصه مقاله:
در نسخه v1.3.0 از Gateway API مجموعهای از قابلیتهای مهم معرفی شده که مدیریت ترافیک و امنیت در Kubernetes را استانداردتر و عملیاتیتر میکند. این موارد شامل percentage-based request mirroring برای سایهزدن بخشی از ترافیک به مقصد جایگزین، CORS filtering برای اعمال سیاستهای cross-origin در لایه دروازه، gateway merging برای ترکیب ایمن پیکربندی تیمهای مختلف، و retry budgets برای محدودسازی رفتار retry و جلوگیری از بار اضافی روی سرویسهاست. مقاله همچنین شفاف میکند کدام قابلیتها در سطح GA قرار دارند و کدام هنوز experimental هستند. نتیجه، کنترل دقیقتر، پذیرش امنتر و یکپارچگی بیشتر سیاستهای ترافیک در خوشههای Kubernetes است.
#Kubernetes #GatewayAPI #CORS #TrafficManagement #RetryBudgets #CloudNative #APIGateway #DevOps
🟣لینک مقاله:
https://ku.bz/JgPp6Zm-P
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Gateway API v1.3.0: Advancements in Request Mirroring, CORS, Gateway Merging, and Retry Budgets
🟢 خلاصه مقاله:
در نسخه v1.3.0 از Gateway API مجموعهای از قابلیتهای مهم معرفی شده که مدیریت ترافیک و امنیت در Kubernetes را استانداردتر و عملیاتیتر میکند. این موارد شامل percentage-based request mirroring برای سایهزدن بخشی از ترافیک به مقصد جایگزین، CORS filtering برای اعمال سیاستهای cross-origin در لایه دروازه، gateway merging برای ترکیب ایمن پیکربندی تیمهای مختلف، و retry budgets برای محدودسازی رفتار retry و جلوگیری از بار اضافی روی سرویسهاست. مقاله همچنین شفاف میکند کدام قابلیتها در سطح GA قرار دارند و کدام هنوز experimental هستند. نتیجه، کنترل دقیقتر، پذیرش امنتر و یکپارچگی بیشتر سیاستهای ترافیک در خوشههای Kubernetes است.
#Kubernetes #GatewayAPI #CORS #TrafficManagement #RetryBudgets #CloudNative #APIGateway #DevOps
🟣لینک مقاله:
https://ku.bz/JgPp6Zm-P
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Kubernetes
Gateway API v1.3.0: Advancements in Request Mirroring, CORS, Gateway Merging, and Retry Budgets
Join us in the Kubernetes SIG Network community in celebrating the general availability of Gateway API v1.3.0! We are also pleased to announce that there are already a number of conformant implementations to try, made possible by postponing this blog announcement.…
🔵 عنوان مقاله
Introducing Gateway API Inference Extension
🟢 خلاصه مقاله:
این مقاله یک افزونه برای Kubernetes Gateway API معرفی میکند که مخصوص بارهای کاری LLM و inference طراحی شده است. هدف آن «مدلآگاه» کردن لایه شبکه است تا مسیریابی و سیاستهای ترافیکی بر اساس مدل، نسخه، ارائهدهنده و فراداده درخواست انجام شود. این کار امکانهایی مانند A/B تست، shadowing، و fallback بین مدلها و ارائهدهندگان مختلف را بدون تغییر کد برنامه فراهم میکند.
همچنین قابلیت تعیین criticality برای هر درخواست را فراهم میکند تا مسیرهای حساس به تأخیر نسبت به کارهای پسزمینه در صفها، بودجه زمانی و ظرفیت، اولویت بگیرند و SLOها بهتر رعایت شوند. از طرفی، load balancing بهینهشده برای inference با درنظرگرفتن عمق صف، وضعیت GPU، اندازه batch، گذردهی توکن و زمان تکمیل تخمینی، به کاهش tail latency و افزایش بهرهوری کمک میکند.
این طراحی بر پایه الگوی آشنای Gateway API بنا شده و با گسترش منابع موجود (Gateway و Route) بهصورت ارائهدهنده-محور خنثی عمل میکند و هم backendهای درون کلاستر و هم خارجی را پوشش میدهد. نتیجه، لایه شبکهای است که محدودیتهای inference را میشناسد و استقرارهای امنتر، سیاستهای هزینهمحور و رصدپذیری دقیقتر در سطح مدل را برای تیمهای پلتفرمی در Kubernetes ممکن میسازد.
#Kubernetes #GatewayAPI #LLM #Inference #MLOps #AIInfrastructure #LoadBalancing #ModelRouting
🟣لینک مقاله:
https://ku.bz/QhNP_lkb3
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Introducing Gateway API Inference Extension
🟢 خلاصه مقاله:
این مقاله یک افزونه برای Kubernetes Gateway API معرفی میکند که مخصوص بارهای کاری LLM و inference طراحی شده است. هدف آن «مدلآگاه» کردن لایه شبکه است تا مسیریابی و سیاستهای ترافیکی بر اساس مدل، نسخه، ارائهدهنده و فراداده درخواست انجام شود. این کار امکانهایی مانند A/B تست، shadowing، و fallback بین مدلها و ارائهدهندگان مختلف را بدون تغییر کد برنامه فراهم میکند.
همچنین قابلیت تعیین criticality برای هر درخواست را فراهم میکند تا مسیرهای حساس به تأخیر نسبت به کارهای پسزمینه در صفها، بودجه زمانی و ظرفیت، اولویت بگیرند و SLOها بهتر رعایت شوند. از طرفی، load balancing بهینهشده برای inference با درنظرگرفتن عمق صف، وضعیت GPU، اندازه batch، گذردهی توکن و زمان تکمیل تخمینی، به کاهش tail latency و افزایش بهرهوری کمک میکند.
این طراحی بر پایه الگوی آشنای Gateway API بنا شده و با گسترش منابع موجود (Gateway و Route) بهصورت ارائهدهنده-محور خنثی عمل میکند و هم backendهای درون کلاستر و هم خارجی را پوشش میدهد. نتیجه، لایه شبکهای است که محدودیتهای inference را میشناسد و استقرارهای امنتر، سیاستهای هزینهمحور و رصدپذیری دقیقتر در سطح مدل را برای تیمهای پلتفرمی در Kubernetes ممکن میسازد.
#Kubernetes #GatewayAPI #LLM #Inference #MLOps #AIInfrastructure #LoadBalancing #ModelRouting
🟣لینک مقاله:
https://ku.bz/QhNP_lkb3
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Kubernetes
Introducing Gateway API Inference Extension
Modern generative AI and large language model (LLM) services create unique traffic-routing challenges on Kubernetes. Unlike typical short-lived, stateless web requests, LLM inference sessions are often long-running, resource-intensive, and partially stateful.…
🔵 عنوان مقاله
Is It Time to Migrate? A Practical Look at Kubernetes Ingress vs. Gateway API
🟢 خلاصه مقاله:
** این مقاله توضیح میدهد چرا Ingress سنتی در Kubernetes با اتکا به annotations اختصاصی و رفتار وابسته به فروشنده شکننده میشود و چگونه Gateway API با مدل استاندارد و نقشمحور (مانند Gateway، GatewayClass و HTTPRoute) این مشکلات را حل میکند. Calico Ingress Gateway (v3.30) مبتنی بر Envoy پیادهسازیای ارائه میدهد که ورود ترافیک را استاندارد و امن میکند، مدیریت TLS را خودکار میسازد و نیاز به annotations ویژه را حذف میکند. اگر با قوانین مسیریابی پیچیده، چرخش گواهیهای TLS، چند محیط ناهمگون یا تکیه به تنظیمات شکننده دستوپنجه نرم میکنید، زمان مهاجرت است: Ingressهای موجود را به HTTPRoute نگاشت کنید، GatewayClass و Gateway بسازید، TLS را خودکار کنید و بهصورت تدریجی و موازی مهاجرت را انجام دهید تا در نهایت به پیکربندی پایدارتر و قابلحمل برسید.
#Kubernetes #GatewayAPI #Ingress #Calico #Envoy #TLS #CloudNative
🟣لینک مقاله:
https://ku.bz/kVLk03Ykw
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Is It Time to Migrate? A Practical Look at Kubernetes Ingress vs. Gateway API
🟢 خلاصه مقاله:
** این مقاله توضیح میدهد چرا Ingress سنتی در Kubernetes با اتکا به annotations اختصاصی و رفتار وابسته به فروشنده شکننده میشود و چگونه Gateway API با مدل استاندارد و نقشمحور (مانند Gateway، GatewayClass و HTTPRoute) این مشکلات را حل میکند. Calico Ingress Gateway (v3.30) مبتنی بر Envoy پیادهسازیای ارائه میدهد که ورود ترافیک را استاندارد و امن میکند، مدیریت TLS را خودکار میسازد و نیاز به annotations ویژه را حذف میکند. اگر با قوانین مسیریابی پیچیده، چرخش گواهیهای TLS، چند محیط ناهمگون یا تکیه به تنظیمات شکننده دستوپنجه نرم میکنید، زمان مهاجرت است: Ingressهای موجود را به HTTPRoute نگاشت کنید، GatewayClass و Gateway بسازید، TLS را خودکار کنید و بهصورت تدریجی و موازی مهاجرت را انجام دهید تا در نهایت به پیکربندی پایدارتر و قابلحمل برسید.
#Kubernetes #GatewayAPI #Ingress #Calico #Envoy #TLS #CloudNative
🟣لینک مقاله:
https://ku.bz/kVLk03Ykw
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
Tigera - Creator of Calico
Is It Time to Migrate? A Practical Look at Kubernetes Ingress vs. Gateway API | Tigera - Creator of Calico
If you’ve managed traffic in Kubernetes, you’ve likely navigated the world of Ingress controllers. For years, Ingress has been the standard way of getting HTTP/S services exposed. But let’s be honest, it often felt like...
🔵 عنوان مقاله
NGINX Gateway Fabric
🟢 خلاصه مقاله:
NGINX Gateway Fabric یک لایه دروازه مدرن و Cloud‑Native مبتنی بر NGINX است که مدیریت یکپارچه ترافیک را برای سناریوهای ingress، API gateway و ارتباطات سرویسبهسرویس فراهم میکند و با Kubernetes و Gateway API همسو است. این راهکار با تفکیک control plane و data plane، مقیاسپذیری افقی، چندمستاجری و چندکلاستری را ممکن میکند و با جریانهای GitOps و CI/CD بهخوبی ادغام میشود. قابلیتهای کلیدی آن شامل مسیریابی L7 هوشمند، TLS termination، mTLS، اعتبارسنجی JWT، rate limiting، تبدیل درخواست/پاسخ، و الگوهای تابآوری مانند retries، timeouts، و انتشارهای تدریجی است. همچنین با ارائه متریک، لاگ و تریس، بهصورت بومی با Prometheus و OpenTelemetry برای رصدپذیری عمیق یکپارچه میشود. هدف، سادهسازی عملیات، بهبود امنیت بر پایه policy‑as‑code و ارائه تجربهای یکسان در edge، محیطهای on‑prem و ابر است.
#NGINX #APIgateway #Kubernetes #GatewayAPI #CloudNative #TrafficManagement #Security #Observability
🟣لینک مقاله:
https://ku.bz/F1y8trBlY
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
NGINX Gateway Fabric
🟢 خلاصه مقاله:
NGINX Gateway Fabric یک لایه دروازه مدرن و Cloud‑Native مبتنی بر NGINX است که مدیریت یکپارچه ترافیک را برای سناریوهای ingress، API gateway و ارتباطات سرویسبهسرویس فراهم میکند و با Kubernetes و Gateway API همسو است. این راهکار با تفکیک control plane و data plane، مقیاسپذیری افقی، چندمستاجری و چندکلاستری را ممکن میکند و با جریانهای GitOps و CI/CD بهخوبی ادغام میشود. قابلیتهای کلیدی آن شامل مسیریابی L7 هوشمند، TLS termination، mTLS، اعتبارسنجی JWT، rate limiting، تبدیل درخواست/پاسخ، و الگوهای تابآوری مانند retries، timeouts، و انتشارهای تدریجی است. همچنین با ارائه متریک، لاگ و تریس، بهصورت بومی با Prometheus و OpenTelemetry برای رصدپذیری عمیق یکپارچه میشود. هدف، سادهسازی عملیات، بهبود امنیت بر پایه policy‑as‑code و ارائه تجربهای یکسان در edge، محیطهای on‑prem و ابر است.
#NGINX #APIgateway #Kubernetes #GatewayAPI #CloudNative #TrafficManagement #Security #Observability
🟣لینک مقاله:
https://ku.bz/F1y8trBlY
➖➖➖➖➖➖➖➖
👑 @DevOps_Labdon
GitHub
GitHub - nginx/nginx-gateway-fabric: NGINX Gateway Fabric provides an implementation for the Gateway API using NGINX as the data…
NGINX Gateway Fabric provides an implementation for the Gateway API using NGINX as the data plane. - nginx/nginx-gateway-fabric