📊 بنچمارک SealQA برای Deep Research با مدلهای کوچک
او به همراه همکارانش یک بنچمارک جالب روی SealQA اجرا کرده است تا روشهای مختلف پیادهسازی ReAct-Agents را بسنجد؛ با یک شرط مهم: استفاده فقط از مدلهای کوچک (تا 30B پارامتر). در تست اولیه، او از gpt-4o-mini بهره برد.
🤔 چرا این مهم است؟
به گفته او، مدلهای بزرگتر بدون شک نتایج بهتری دارند، اما همچنان پرهزینهاند. دیر یا زود هزینهها کمتر میشود، اما همیشه این پرسش باقی میماند که کدام مدل کوچک برای یک کاربرد خاص بهینه است. چنین تحقیقاتی کمک میکند توانایی واقعی مدلهای کوچکتر بهتر شناخته شود.
🔎 دو رویکرد مورد بررسی:
1️⃣ SGR Deep Research
(معماری React NextStep با روش هیبریدی SO – پیادهسازی پایدار روی GitHub موجود است).
2️⃣ همچنین، ReAct کلاسیک + یک ابزار وب (برای ایجاد سطح پایه جهت مقایسه؛ نسخه اولیه در GitHub موجود است اما هنوز خام است).
📈 نتایج اولیه (از 111 سؤال):
✅ SGR Deep Research:
28 پاسخ درست.
✅ ReAct + FC:
12 پاسخ درست.
❌ بنچمارک رسمی gpt-4o-mini: 0 پاسخ درست.
📌 نتیجهگیری: او تأکید میکند که حتی یک ReAct-Agent ساده روی مدل کوچک میتواند عملکردی فراتر از سطح صفر داشته باشد.
ادامه گزارش شامل جزئیات نتایج، مشکلات و راهحلها خواهد بود. 🚀
#هوش_مصنوعی #LLM #ReAct #DeepResearch #SealQA
او به همراه همکارانش یک بنچمارک جالب روی SealQA اجرا کرده است تا روشهای مختلف پیادهسازی ReAct-Agents را بسنجد؛ با یک شرط مهم: استفاده فقط از مدلهای کوچک (تا 30B پارامتر). در تست اولیه، او از gpt-4o-mini بهره برد.
🤔 چرا این مهم است؟
به گفته او، مدلهای بزرگتر بدون شک نتایج بهتری دارند، اما همچنان پرهزینهاند. دیر یا زود هزینهها کمتر میشود، اما همیشه این پرسش باقی میماند که کدام مدل کوچک برای یک کاربرد خاص بهینه است. چنین تحقیقاتی کمک میکند توانایی واقعی مدلهای کوچکتر بهتر شناخته شود.
🔎 دو رویکرد مورد بررسی:
1️⃣ SGR Deep Research
(معماری React NextStep با روش هیبریدی SO – پیادهسازی پایدار روی GitHub موجود است).
2️⃣ همچنین، ReAct کلاسیک + یک ابزار وب (برای ایجاد سطح پایه جهت مقایسه؛ نسخه اولیه در GitHub موجود است اما هنوز خام است).
📈 نتایج اولیه (از 111 سؤال):
✅ SGR Deep Research:
28 پاسخ درست.
✅ ReAct + FC:
12 پاسخ درست.
❌ بنچمارک رسمی gpt-4o-mini: 0 پاسخ درست.
📌 نتیجهگیری: او تأکید میکند که حتی یک ReAct-Agent ساده روی مدل کوچک میتواند عملکردی فراتر از سطح صفر داشته باشد.
ادامه گزارش شامل جزئیات نتایج، مشکلات و راهحلها خواهد بود. 🚀
#هوش_مصنوعی #LLM #ReAct #DeepResearch #SealQA
🥰14👍10👏10🎉10😁9❤7🔥3
💡 مجموعه Together AI آموزش ساخت "Lovable Clone" با مدل Kimi K2 را منتشر کرد
این راهنما نشان میدهد چطور میتوانید با استفاده از Next.js اپلیکیشنی بسازید که تنها با یک دستور متنی، کد یک برنامهی کامل React را برایتان بنویسد — درست مثل «کد با یک جمله»!
🧩 مراحل کلیدی:
✳️طراحی رابط کاربری ساده با یک فیلد ورودی برای دستور کاربر (مثلاً: “Build me a calculator app…”)
✳️ایجاد مسیر API به نام /api/generateCode که درخواست را از طریق Together AI SDK به مدل Kimi K2 بفرستد
✳️استفاده از system prompt برای بازگرداندن فقط کد، بدون هیچ توضیح اضافی
✳️تعبیهی ابزار Sandpack (یا مشابه آن) برای اجرای مستقیم کد در مرورگر
✳️افزودن قابلیت streaming تا کاربر بتواند روند تولید کد را در لحظه مشاهده کند
📄 راهنما:
docs.together.ai/docs/how-to-build-a-lovable-clone-with-kimi-k2
#هوش_مصنوعی #توسعه_وب #TogetherAI #KimiK2 #NextJS #React #AItools
این راهنما نشان میدهد چطور میتوانید با استفاده از Next.js اپلیکیشنی بسازید که تنها با یک دستور متنی، کد یک برنامهی کامل React را برایتان بنویسد — درست مثل «کد با یک جمله»!
🧩 مراحل کلیدی:
✳️طراحی رابط کاربری ساده با یک فیلد ورودی برای دستور کاربر (مثلاً: “Build me a calculator app…”)
✳️ایجاد مسیر API به نام /api/generateCode که درخواست را از طریق Together AI SDK به مدل Kimi K2 بفرستد
✳️استفاده از system prompt برای بازگرداندن فقط کد، بدون هیچ توضیح اضافی
✳️تعبیهی ابزار Sandpack (یا مشابه آن) برای اجرای مستقیم کد در مرورگر
✳️افزودن قابلیت streaming تا کاربر بتواند روند تولید کد را در لحظه مشاهده کند
📄 راهنما:
docs.together.ai/docs/how-to-build-a-lovable-clone-with-kimi-k2
#هوش_مصنوعی #توسعه_وب #TogetherAI #KimiK2 #NextJS #React #AItools
🔥2👏2👍1