🔵 عنوان مقاله
Determinism is Overrated
🟢 خلاصه مقاله:
Determinism is Overrated یادآور میشود که توسعه و آزمون اپلیکیشنهای AI با نرمافزارهای سنتی فرق دارد، چون خروجیها ذاتاً غیردترمینستیکاند. بهجای تکیه بر تطابق دقیق رشتهای، باید کیفیت را در سطح توزیع نتایج سنجید: تعریف بازههای پذیرش، روبریکها و امتیازدهی سازگار با هدف کاربر، و آزمونهای سناریومحور. Jarad DeLorenzo پیشنهاد میکند در کنار تستهای کاملاً دترمینستیک برای منطق اطراف مدل، از ابزارهای بازتولیدپذیری (نسخهبندی داده/پرومپت/مدل، ثبت seed و پارامترها) و ارزیابی احتمالاتی (آستانههای شباهت، top-k، چند seed) استفاده شود. در استقرار نیز A/B testing، canary، گاردریلها، fallback و observability برای هزینه، تأخیر، درستی و ایمنی لازم است. پیام اصلی: بهجای اجبار به خروجیهای یکسان، برای نتایج قابل اتکا در دل تغییرپذیری طراحی کنید.
#AI #LLM #NonDeterminism #Testing #Evaluation #MLOps #AIBestPractices #SoftwareEngineering
🟣لینک مقاله:
https://cur.at/sfc6P6g?m=web
➖➖➖➖➖➖➖➖
👑 @software_Labdon
Determinism is Overrated
🟢 خلاصه مقاله:
Determinism is Overrated یادآور میشود که توسعه و آزمون اپلیکیشنهای AI با نرمافزارهای سنتی فرق دارد، چون خروجیها ذاتاً غیردترمینستیکاند. بهجای تکیه بر تطابق دقیق رشتهای، باید کیفیت را در سطح توزیع نتایج سنجید: تعریف بازههای پذیرش، روبریکها و امتیازدهی سازگار با هدف کاربر، و آزمونهای سناریومحور. Jarad DeLorenzo پیشنهاد میکند در کنار تستهای کاملاً دترمینستیک برای منطق اطراف مدل، از ابزارهای بازتولیدپذیری (نسخهبندی داده/پرومپت/مدل، ثبت seed و پارامترها) و ارزیابی احتمالاتی (آستانههای شباهت، top-k، چند seed) استفاده شود. در استقرار نیز A/B testing، canary، گاردریلها، fallback و observability برای هزینه، تأخیر، درستی و ایمنی لازم است. پیام اصلی: بهجای اجبار به خروجیهای یکسان، برای نتایج قابل اتکا در دل تغییرپذیری طراحی کنید.
#AI #LLM #NonDeterminism #Testing #Evaluation #MLOps #AIBestPractices #SoftwareEngineering
🟣لینک مقاله:
https://cur.at/sfc6P6g?m=web
➖➖➖➖➖➖➖➖
👑 @software_Labdon
Medium
Determinism is Overrated
Why Your Best Engineers Can’t Build AI Systems
🔵 عنوان مقاله
Looking for AI that helps write and run automated UI tests (Playwright + Jira stack)
🟢 خلاصه مقاله:
** این بحث درباره نیاز تیمها به بهرهگیری از AI در خودکارسازی تستهای UI با محوریت Playwright و Jira است. کاربران Reddit راهکارهایی را مطرح میکنند: تبدیل داستانها و معیارهای پذیرش در Jira به سناریوهای تست و کد Playwright با کمک LLMها، استفاده از locatorهای پایدار و Page Object Model، و تغذیه AI با دانش دامنه و اجزای UI. در اجرای تست نیز به نگهداری اهمیت میدهند: پیشنهاد رفع شکستهای ناشی از تغییر selectorها، کاهش flakiness، خلاصهسازی خطاها با اسکرینشات و لاگ، و ایجاد خودکار تیکتهای Jira با جزئیات بازتولید. یک محور دیگر، اتصال به CI/CD و مدیریت داده/محیط تست با رعایت امنیت و گاردریلها برای سنجش ROI است. جمعبندی این است که ابزار یگانهای وجود ندارد؛ مسیر عملی، شروع کوچک، رعایت الگوهای مهندسی و استفاده کمکی از AI در کنار Playwright و Jira است.
#Playwright #Jira #UIAutomation #AI #Testing #QA #DevOps
🟣لینک مقاله:
https://cur.at/7CKr1ju?m=web
➖➖➖➖➖➖➖➖
👑 @software_Labdon
Looking for AI that helps write and run automated UI tests (Playwright + Jira stack)
🟢 خلاصه مقاله:
** این بحث درباره نیاز تیمها به بهرهگیری از AI در خودکارسازی تستهای UI با محوریت Playwright و Jira است. کاربران Reddit راهکارهایی را مطرح میکنند: تبدیل داستانها و معیارهای پذیرش در Jira به سناریوهای تست و کد Playwright با کمک LLMها، استفاده از locatorهای پایدار و Page Object Model، و تغذیه AI با دانش دامنه و اجزای UI. در اجرای تست نیز به نگهداری اهمیت میدهند: پیشنهاد رفع شکستهای ناشی از تغییر selectorها، کاهش flakiness، خلاصهسازی خطاها با اسکرینشات و لاگ، و ایجاد خودکار تیکتهای Jira با جزئیات بازتولید. یک محور دیگر، اتصال به CI/CD و مدیریت داده/محیط تست با رعایت امنیت و گاردریلها برای سنجش ROI است. جمعبندی این است که ابزار یگانهای وجود ندارد؛ مسیر عملی، شروع کوچک، رعایت الگوهای مهندسی و استفاده کمکی از AI در کنار Playwright و Jira است.
#Playwright #Jira #UIAutomation #AI #Testing #QA #DevOps
🟣لینک مقاله:
https://cur.at/7CKr1ju?m=web
➖➖➖➖➖➖➖➖
👑 @software_Labdon
Reddit
From the QualityAssurance community on Reddit
Explore this post and more from the QualityAssurance community