VIRSUN

📊 بنچمارک SealQA برای Deep Research با مدل‌های کوچک

او به همراه همکارانش یک بنچمارک جالب روی SealQA اجرا کرده است تا روش‌های مختلف پیاده‌سازی ReAct-Agents را بسنجد؛ با یک شرط مهم: استفاده فقط از مدل‌های کوچک (تا 30B پارامتر). در تست اولیه، او از gpt-4o-mini بهره برد.

🤔 چرا این مهم است؟
به گفته او، مدل‌های بزرگ‌تر بدون شک نتایج بهتری دارند، اما همچنان پرهزینه‌اند. دیر یا زود هزینه‌ها کمتر می‌شود، اما همیشه این پرسش باقی می‌ماند که کدام مدل کوچک برای یک کاربرد خاص بهینه است. چنین تحقیقاتی کمک می‌کند توانایی واقعی مدل‌های کوچک‌تر بهتر شناخته شود.

🔎 دو رویکرد مورد بررسی:
1️⃣ SGR Deep Research
(معماری React NextStep با روش هیبریدی SO – پیاده‌سازی پایدار روی GitHub موجود است).
2️⃣ همچنین، ReAct کلاسیک + یک ابزار وب (برای ایجاد سطح پایه جهت مقایسه؛ نسخه اولیه در GitHub موجود است اما هنوز خام است).

📈 نتایج اولیه (از 111 سؤال):

✅ SGR Deep Research:
28 پاسخ درست.

✅ ReAct + FC:
12 پاسخ درست.

❌ بنچمارک رسمی gpt-4o-mini: 0 پاسخ درست.

📌 نتیجه‌گیری: او تأکید می‌کند که حتی یک ReAct-Agent ساده روی مدل کوچک می‌تواند عملکردی فراتر از سطح صفر داشته باشد.

ادامه گزارش شامل جزئیات نتایج، مشکلات و راه‌حل‌ها خواهد بود. 🚀

#هوش_مصنوعی #LLM #ReAct #DeepResearch #SealQA

🥰14👍10👏10🎉10😁9❤7🔥3

384 views06:53

VIRSUN

💡 مجموعه Together AI آموزش ساخت "Lovable Clone" با مدل Kimi K2 را منتشر کرد

این راهنما نشان می‌دهد چطور می‌توانید با استفاده از Next.js اپلیکیشنی بسازید که تنها با یک دستور متنی، کد یک برنامه‌ی کامل React را برایتان بنویسد — درست مثل «کد با یک جمله»!

🧩 مراحل کلیدی:

✳️طراحی رابط کاربری ساده با یک فیلد ورودی برای دستور کاربر (مثلاً: “Build me a calculator app…”)

✳️ایجاد مسیر API به نام /api/generateCode که درخواست را از طریق Together AI SDK به مدل Kimi K2 بفرستد

✳️استفاده از system prompt برای بازگرداندن فقط کد، بدون هیچ توضیح اضافی

✳️تعبیه‌ی ابزار Sandpack (یا مشابه آن) برای اجرای مستقیم کد در مرورگر

✳️افزودن قابلیت streaming تا کاربر بتواند روند تولید کد را در لحظه مشاهده کند

📄 راهنما:
docs.together.ai/docs/how-to-build-a-lovable-clone-with-kimi-k2

#هوش_مصنوعی #توسعه_وب #TogetherAI #KimiK2 #NextJS #React #AItools

🔥2👏2👍1

260 views04:49

About

Blog

Apps

Platform