Software Engineer Labdon

🔵 عنوان مقاله
Determinism is Overrated

🟢 خلاصه مقاله:
Determinism is Overrated یادآور می‌شود که توسعه و آزمون اپلیکیشن‌های AI با نرم‌افزارهای سنتی فرق دارد، چون خروجی‌ها ذاتاً غیردترمینستیک‌اند. به‌جای تکیه بر تطابق دقیق رشته‌ای، باید کیفیت را در سطح توزیع نتایج سنجید: تعریف بازه‌های پذیرش، روبریک‌ها و امتیازدهی سازگار با هدف کاربر، و آزمون‌های سناریومحور. Jarad DeLorenzo پیشنهاد می‌کند در کنار تست‌های کاملاً دترمینستیک برای منطق اطراف مدل، از ابزارهای بازتولیدپذیری (نسخه‌بندی داده/پرومپت/مدل، ثبت seed و پارامترها) و ارزیابی احتمالاتی (آستانه‌های شباهت، top-k، چند seed) استفاده شود. در استقرار نیز A/B testing، canary، گاردریل‌ها، fallback و observability برای هزینه، تأخیر، درستی و ایمنی لازم است. پیام اصلی: به‌جای اجبار به خروجی‌های یکسان، برای نتایج قابل اتکا در دل تغییرپذیری طراحی کنید.

#AI #LLM #NonDeterminism #Testing #Evaluation #MLOps #AIBestPractices #SoftwareEngineering

🟣لینک مقاله:
https://cur.at/sfc6P6g?m=web

➖➖➖➖➖➖➖➖
👑 @software_Labdon

Medium

Determinism is Overrated

Why Your Best Engineers Can’t Build AI Systems

63 views05:31

Software Engineer Labdon

🔵 عنوان مقاله
Looking for AI that helps write and run automated UI tests (Playwright + Jira stack)

🟢 خلاصه مقاله:
** این بحث درباره نیاز تیم‌ها به بهره‌گیری از AI در خودکارسازی تست‌های UI با محوریت Playwright و Jira است. کاربران Reddit راهکارهایی را مطرح می‌کنند: تبدیل داستان‌ها و معیارهای پذیرش در Jira به سناریوهای تست و کد Playwright با کمک LLMها، استفاده از locatorهای پایدار و Page Object Model، و تغذیه AI با دانش دامنه و اجزای UI. در اجرای تست نیز به نگهداری اهمیت می‌دهند: پیشنهاد رفع شکست‌های ناشی از تغییر selectorها، کاهش flakiness، خلاصه‌سازی خطاها با اسکرین‌شات و لاگ، و ایجاد خودکار تیکت‌های Jira با جزئیات بازتولید. یک محور دیگر، اتصال به CI/CD و مدیریت داده/محیط تست با رعایت امنیت و گاردریل‌ها برای سنجش ROI است. جمع‌بندی این است که ابزار یگانه‌ای وجود ندارد؛ مسیر عملی، شروع کوچک، رعایت الگوهای مهندسی و استفاده کمکی از AI در کنار Playwright و Jira است.

#Playwright #Jira #UIAutomation #AI #Testing #QA #DevOps

🟣لینک مقاله:
https://cur.at/7CKr1ju?m=web

➖➖➖➖➖➖➖➖
👑 @software_Labdon

From the QualityAssurance community on Reddit

Explore this post and more from the QualityAssurance community

32 views11:30

About

Blog

Apps

Platform