🤖 گوگل مدل جدیدی معرفی کرد: SOTA Computer Use بر پایهی Gemini 2.5 🚀
مدل جدید گوگل توانسته در بسیاری از بنچمارکهای اصلی، عملکردی بهمراتب بهتر از ChatGPT (Agent Mode) و حتی Claude Sonnet 4 / 4.5 داشته باشد — با تأخیر (latency) بسیار پایینتر.
📱 این مدل برای کار با وب و اپلیکیشنهای موبایل بهینه شده و در سیستمعاملهای دسکتاپ معمولی عملکرد متوسطی دارد.
🔍 درونمایه فنی:
در واقع، این نسخه نوعی نسخهی پیشرفته از tool use مدل Gemini 2.5 است.
در هر گام مدل، یک اسکرینشات از صفحه دریافت میکند و سپس با توابعی مثل clicking() یا typing() تعامل انجام میدهد.
🧠 ویژگیهای امنیتی کلیدی:
1️⃣ در system prompt میتوان مشخص کرد که کدام اقدامات نیاز به تأیید کاربر دارند.
2️⃣ یک ارزیاب خارجی خودکار هر مرحله را بهصورت مستقل بررسی میکند تا اگر مدل کاری غیرمنتظره انجام داد، هشدار بدهد.
🔸 مدل اکنون در حالت Public Preview از طریق API در دسترس است.
🔸 و شایعه شده که گوگل تا پایان همین هفته نسخهی بعدی یعنی Gemini 3.0 را نیز منتشر خواهد کرد 👀
@rss_ai_ir
#Google #Gemini #AIagents #LLM #هوش_مصنوعی #ChatGPT #Claude #ComputerUse #Automation
مدل جدید گوگل توانسته در بسیاری از بنچمارکهای اصلی، عملکردی بهمراتب بهتر از ChatGPT (Agent Mode) و حتی Claude Sonnet 4 / 4.5 داشته باشد — با تأخیر (latency) بسیار پایینتر.
📱 این مدل برای کار با وب و اپلیکیشنهای موبایل بهینه شده و در سیستمعاملهای دسکتاپ معمولی عملکرد متوسطی دارد.
🔍 درونمایه فنی:
در واقع، این نسخه نوعی نسخهی پیشرفته از tool use مدل Gemini 2.5 است.
در هر گام مدل، یک اسکرینشات از صفحه دریافت میکند و سپس با توابعی مثل clicking() یا typing() تعامل انجام میدهد.
🧠 ویژگیهای امنیتی کلیدی:
1️⃣ در system prompt میتوان مشخص کرد که کدام اقدامات نیاز به تأیید کاربر دارند.
2️⃣ یک ارزیاب خارجی خودکار هر مرحله را بهصورت مستقل بررسی میکند تا اگر مدل کاری غیرمنتظره انجام داد، هشدار بدهد.
🔸 مدل اکنون در حالت Public Preview از طریق API در دسترس است.
🔸 و شایعه شده که گوگل تا پایان همین هفته نسخهی بعدی یعنی Gemini 3.0 را نیز منتشر خواهد کرد 👀
@rss_ai_ir
#Google #Gemini #AIagents #LLM #هوش_مصنوعی #ChatGPT #Claude #ComputerUse #Automation