VIRSUN
6.08K subscribers
1.07K photos
634 videos
5 files
697 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
⚡️ معماری Mamba-3 بی‌سروصدا در کنفرانس ICLR منتشر شد — و شاید این آغاز پایان عصر ترنسفورمرها باشد.

معماری Mamba-3 نسل جدیدی از معماری‌های مبتنی بر State Space Models (SSM) است که مدل‌ها را هنگام کار با کانتکست‌های طولانی‌تر، سریع‌تر، پایدارتر و کارآمدتر می‌کند.

در این معماری دیگر خبری از Attention Layers نیست — مدل به‌جای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و به‌روزرسانی می‌کند.


---

📘 مروری کوتاه بر تکامل مامبا:

🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل می‌توانست به‌صورت هوشمند فقط بخش‌های مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.

🔹 Mamba-2:
✳️نشان داد که به‌روزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکه‌اند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریع‌تر شود.

🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل به‌صورت پیوسته و نرم‌تر تغییر می‌کند، زیرا به‌جای گام ساده اویلر (Euler Step) از انتگرال‌گیری ذوزنقه‌ای (Trapezoidal Integration) استفاده می‌کند.

✳️در این روش، به‌جای محاسبه‌ی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ می‌کند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعی‌تر حافظه.


---

🧠 چه چیزهایی زیر کاپوت تغییر کرده؟

♻️حافظه به‌صورت ریتمیک (Rhythmic Memory) عمل می‌کند — یعنی می‌تواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) به‌خوبی یاد بگیرد.

♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.



---

⚙️ مزایا در عمل:

مدیریت کارآمد توالی‌های طولانی (متن، ژنوم، داده‌های زمانی)
سرعت خطی و تأخیر ثابت — مناسب برای چت‌بات‌ها، ترجمه زنده، و گفتار به گفتار (real-time)
بهره‌وری انرژی بالا و مقیاس‌پذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار می‌کند.


---

🚀 معماری Mamba-3 فقط جایگزینی سریع‌تر برای ترنسفورمر نیست — بلکه معماری‌ای تازه است که عمق درک متنی، سرعت و پایداری را هم‌زمان در خود دارد.
از سرورهای عظیم تا گوشی‌های هوشمند.

🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj

@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
2👍1
🧩 Segment Anything 3 –
نسل سوم سام از Meta به‌صورت بی‌سر و صدا در ICLR منتشر شد!

📍 اگر SAM 1 فقط اجازه می‌داد با یک کلیک روی تصویر، شیء مورد نظر را بخش‌بندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،

حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی می‌خواهید — مثلاً:

> «اتوبوس زرد مدرسه»، «گربه راه‌راه»، «سیب قرمز» 🍎



مدل خودش همه نمونه‌های آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم می‌کند.
به زبان ساده: بخش‌بندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---

💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسم‌های کوتاه، نمونه‌های تصویری یا ترکیبی از هر دو استفاده کنید.
شما فقط مفهوم را بیان می‌کنید، مدل خودش تشخیص می‌دهد و مرزها را ترسیم می‌کند.
---

🧠 زیرساخت داده‌ای عظیم پشت این مدل:

♻️۴ میلیون مفهوم منحصربه‌فرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسان‌ها و LLMها (که کار یکدیگر را ارزیابی کرده‌اند)
---

⚙️ نتیجه:

✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً هم‌سطح با انسان در آزمون‌های Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)

---

📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw

@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Mesh2Motion — نسخه‌ی اپن‌سورس Mixamo در مرورگر!

اگر با Mixamo کار کرده‌اید، حالا می‌توانید نسخه‌ی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇

💡 کافی است مدل سه‌بعدی خود را آپلود کنید —
سیستم به‌صورت خودکار ریگ (Rig) را ایجاد می‌کند، با قابلیت ویرایش دستی،
و سپس می‌توانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:

♻️رینگ خودکار با کنترل‌های دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرم‌افزاری
♻️خروجی سازگار با تمامی موتورهای سه‌بعدی (Blender, Unity, Unreal و غیره)

---

🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app

@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🥋 Unitree G1 Kungfu Kid V6.0 —
وقتی ربات‌ها واقعاً “هنرهای رزمی” یاد می‌گیرند!

عنوان را همان‌طور می‌گذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عده‌ای هنوز در کامنت‌ها می‌نوشتند
«این فقط رندر کامپیوتری است!» 😏

اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخه‌ی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام می‌دهد که حتی برای انسان‌ها سخت است.
چرخش، پرش، عقب‌گرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.

🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفس‌گیر است —
و حالا دیگر شوخی نیست، این نسل جدید روبات‌های رزمی واقعی است.

⚠️ هنوز می‌خواهید به این موجودات لگد بزنید؟
به‌زودی شاید جواب بدهند. 😄

@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
1👏1
⚡️ گوگل سامانه‌ای ساخت که خودش سازمان می‌یابد — و شاید مسیر ساخت مدل‌ها را عوض کند!

پروژه‌ای به نام TUMIX از تیم Google، به‌گفته‌ی بسیاری، یکی از هیجان‌انگیزترین کارهای هوش مصنوعی امسال است.


---

💡 به‌جای آموزش یک مدل غول‌پیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) هم‌زمان و هماهنگ کار می‌کنند.
هر کدام نقش مخصوص خود را دارند:

یکی کد می‌نویسد 💻

دیگری جست‌وجو می‌کند 🔍

سومی با زبان طبیعی استدلال می‌کند 🧠


همگی به‌صورت مستقل روی یک مسئله کار می‌کنند، سپس پاسخ‌ها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی می‌رسند.


---

📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمون‌های استدلالی تا 17.4٪ بهتر از همه سیستم‌های دیگر عمل کرد،
در حالی که هزینه‌ی استنتاج تقریباً نصف شد!

بدون داده‌ی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.


---

نکته‌ی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخه‌ی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عامل‌های جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!


---

🧩 این پژوهش نشان می‌دهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکه‌ای از مدل‌های کوچک و هماهنگ بیاید که یاد می‌گیرند با هم فکر کنند.

📄 جزئیات کامل:
arxiv.org/pdf/2510.01279

@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
3👏1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
🚛🤖 یک ویدئوی دیگر که ثابت می‌کند خودکارسازی حمل‌ونقل خیلی نزدیک‌تر از آن چیزی‌ست که فکر می‌کردیم.

@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
👏4🤯2👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت Guangnian Innovation در شنژن از ربات پیشرفته‌ی M1 رونمایی کرد.

این ربات از یک سامانه‌ی ماژولار مفصلی با درایو موازی استفاده می‌کند که بازده نیرویی را تا ۴۰٪ نسبت به طراحی‌های سنتی افزایش می‌دهد. بدنه‌ی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.

🛞 ربات M1 ترکیبی از حرکت خارج‌جاده‌ای و حرکت سریع در مسیرهای صاف است، به‌علاوه از نورپردازی هوشمند و ناوبری خودکار بهره می‌برد تا بتواند به‌راحتی از میان چمن، سنگ‌ریزه و شیب‌های تند عبور کند.

این ربات گامی بزرگ در مسیر ربات‌های خودران و کاربردی در صنعت حمل‌ونقل و عملیات میدانی است.

#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
👍2
🧩 LightReasoner —
زمانی که مدل‌های کوچک، مدل‌های بزرگ را در استدلال بهتر آموزش می‌دهند

پژوهشگران روشی به نام LightReasoner معرفی کرده‌اند که به مدل‌های کوچک اجازه می‌دهد به مدل‌های بزرگ‌تر بیاموزند کجا و چگونه باید استدلال کنند.

💡 ایده‌ی اصلی این است که:
به‌جای آموزش مدل روی کل متن، فقط روی توکن‌هایی تمرکز شود که واقعاً مسیر استدلال را تغییر می‌دهند.

🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا می‌کند و نقاطی را پیدا می‌کند که در آن‌ها پیش‌بینی‌هایشان تفاوت زیادی دارد.
این نقاط همان گام‌های بحرانی هستند که مسیر پاسخ درست را تعیین می‌کنند.

سپس مدل:

فقط همین گام‌های دشوار را نگه می‌دارد،

تفاوت استاد را به هدف آموزشی نرم تبدیل می‌کند،

توکن‌های ساده و بدیهی را نادیده می‌گیرد.


📉 نتیجه:

♻️سرعت آموزش تا ۹۰٪ بیشتر،

♻️تعداد توکن‌های آموزشی تا ۹۹٪ کمتر،

♻️اما دقت در بنچمارک‌های ریاضی برابر یا حتی بالاتر از فاین‌تیونینگ سنتی است.


♻️اثر این روش زمانی بیشتر است که مدل شاگرد نه‌تنها کوچک‌تر، بلکه در حوزه‌ی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفه‌ها — انتخاب گام‌ها یا اهداف متضاد — باعث افت عملکرد می‌شود.

📄 مقاله: arxiv.org/abs/2510.07962

#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 باورکردنی نیست اگر این درز اطلاعات واقعیت داشته باشه!

🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!

گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین می‌بره.
مدل نه‌تنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زنده‌ی موسیقی رو هم تولید می‌کنه.

🎹 اگه درست باشه، یعنی وارد دوره‌ای شدیم که مدل‌های مولد چندوجهی (multimodal) واقعاً می‌تونن خلاقیت انسانی رو شبیه‌سازی کنن.

@rss_ai_ir

#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
😶‍🌫️ رندر؟ ویدیو؟ یا تولید مصنوعی؟

🎢 دیزنی‌لند چینی وارد صحنه شده...

از یه طرف، تولیدات تصویری‌ای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، ربات‌هایی که از همین تولیدات مصنوعی هم واقعی‌تر به‌نظر میان.

🔻 «راهروی واقعیت چرمی» داره تنگ‌تر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.

و جالبه که Unitree چطور با سگ‌های رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگ‌ترِ پشت حصار، بیان و روی چمن‌ها قدم بزنن…

@rss_ai_ir

#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 بساز انسان‌نمای خودت!

پروژه‌ی OpenArm یک طرح کاملاً متن‌باز برای ساخت ربات انسان‌نماست که هرچیزی برای شروع لازم دارید را در اختیارتان می‌گذارد — از مدل‌های CAD و فریمور تا نرم‌افزار کنترل و شبیه‌سازها.

🦾 با این سیستم می‌تونید بازوهای رباتیک بسازید، تغییر بدید و کنترل کنید؛
پشتیبانی از تله‌اپراسیون با فیدبک نیرویی و جبران گرانش باعث میشه کنترل بازو طبیعی و دقیق باشه.

💡 یکپارچه با MuJoCo و Isaac Sim — می‌تونید قبل از اجرای واقعی، کنترل و حرکت‌ها رو در محیط مجازی تست کنید.

🔩 هدف پروژه ساده است:
دموکراتیزه کردن رباتیک — تا هر پژوهشگر، استارتاپ یا علاقه‌مند بتونه از مرحله‌ی ایده به ربات واقعی برسه.
می‌تونید خودتون بسازید یا نسخه‌ی آماده سفارش بدید.

توسعه‌دهنده: Enactic (توکیو، ژاپن) 🇯🇵
GitHub: github.com/enactic/OpenArm

@rss_ai_ir

#OpenSource #Robot #Humanoid #Robotics #AI #Engineering #Enactic
3
This media is not supported in your browser
VIEW IN TELEGRAM
💻🤯 Gemini 3.0 Pro
می‌تواند شبیه‌ساز کامل سیستم‌عامل بسازد!

گوگل با مدل جدید Gemini 3.0 Pro مرزهای خلاقیت هوش مصنوعی را جابه‌جا کرده است — کاربران گزارش داده‌اند که این مدل می‌تواند تنها با یک پرامپت ساده، یک سیستم‌عامل شبیه Windows یا macOS را به‌طور کامل در قالب یک فایل HTML ایجاد کند!

🔹 یکی از کاربران از Gemini خواسته بود:
> «یک سیستم‌عامل وب مانند Windows بساز با ویرایشگر متن، ترمینال (با پشتیبانی از Python)، فایل‌منیجر، Paint، ویرایشگر ویدیو و چند ابزار دیگر.»
و مدل تمام کد را در یک مرحله تحویل داد.



🔹 نتیجه؟
یک شبیه‌ساز کامل و تعاملی از Windows و macOS که تنها با HTML، CSS و JavaScript در مرورگر اجرا می‌شود — با آیکون‌ها، انیمیشن‌ها و اپ‌های واقعی.

🔹 دموی زنده را می‌توانید اینجا ببینید:
🪟 نسخه Windows
🍎 نسخه macOS

🔹 نسخه عمومی Gemini 3.0 طبق شایعات در اکتبر منتشر می‌شود، و مدل‌های Pro در Google AI Studio در دسترس خواهند بود.

اگر این دمو واقعاً بازتاب توانایی‌های مدل باشد، Gemini به‌زودی مرز بین دستیار برنامه‌نویسی و خالق خودکار نرم‌افزار را از بین خواهد برد.

@rss_ai_ir

#Gemini3 #AI #Google #WebOS #GenerativeAI #Coding #Innovation
4🔥3
🔥 خبر داغ برای علاقه‌مندان هوش مصنوعی!

کاربرها گزارش داده‌اند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.

🎬 نسخه‌ی جدید Veo طبق شایعات:

♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالت‌های سینمایی و پری‌ست‌های نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow


به‌نظر می‌رسه گوگل داره جدی‌تر از همیشه وارد رقابت با Sora از OpenAI می‌شه.

@rss_ai_ir

#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
🔥 پژوهشی تازه نشان می‌دهد که GPT-6 ممکن است نه فقط هوشمندتر، بلکه از نظر محاسباتی «زنده» باشد!

🧠 مقاله‌ای با عنوان SEAL (Self-Adapting Language Models) در arXiv:2506.10943 منتشر شده که توضیح می‌دهد چگونه یک مدل زبانی می‌تواند پس از استقرار در دنیای واقعی، به یادگیری مداوم ادامه دهد — بدون نیاز به بازآموزی (retraining).

چند نفر از نویسندگان SEAL اکنون در OpenAI فعالیت می‌کنند 👀 و احتمال زیادی وجود دارد که این فناوری در GPT-6 به کار گرفته شود.

ویژگی‌های کلیدی SEAL:

📚 یادگیری از داده‌های جدید در زمان واقعی

🔧 ترمیم خودکار دانش تخریب‌شده

🧩 ایجاد حافظه‌های پایدار در میان جلسات مختلف


اگر GPT-6 این معماری را بپذیرد، دیگر صرفاً از داده‌ها استفاده نخواهد کرد — بلکه آن‌ها را جذب می‌کند.
مدلی که با تغییر جهان، خودش هم تغییر می‌کند و هر روز بهتر می‌شود.

📈 این می‌تواند آغاز عصر یادگیری پیوسته باشد — پایانی بر دوره‌ی مدل‌های ثابت و منجمد.
به فصل جدید خوش آمدید.

https://arxiv.org/abs/2506.10943

@rss_ai_ir
#GPT6 #OpenAI #SEAL #AI #ContinuousLearning #MachineLearning
👍2👏1
🔔 تیمی از پژوهشگران کره‌ای روشی نوین مبتنی بر هوش مصنوعی توسعه داده‌اند که می‌تواند ویژگی‌های مواد را تنها با داده‌های بسیار کم شناسایی کند.

در روش‌های سنتی، این کار به آزمایش‌های متعدد و تجهیزات گران‌قیمت نیاز داشت، اما در این رویکرد جدید، هوش مصنوعی با قوانین فیزیک ترکیب شده تا فرآیند تحلیل بسیار سریع‌تر و کارآمدتر شود.

📘 پژوهشگران از روش یادگیری ماشین آگاه از فیزیک (PIML) استفاده کردند؛ روشی که به مدل‌های هوش مصنوعی می‌آموزد از قوانین فیزیکی پیروی کنند.

🔹 در یک آزمایش، سیستم توانست ویژگی‌های مواد لاستیکی را فقط با داده‌های حاصل از یک آزمایش دقیقاً پیش‌بینی کند.
🔹 در آزمایشی دیگر، ویژگی‌های کلیدی مواد ترموالکتریک (که گرما را به برق تبدیل می‌کنند) را با چند اندازه‌گیری محدود پیش‌بینی کرد.

علاوه بر این، تیم یک مدل جدید با نام Physics Informed Neural Operator (PINO) ساخت که قادر است قوانین فیزیکی را درک کند و ویژگی‌های مواد جدیدی که هرگز ندیده پیش‌بینی کند.
پس از آموزش روی ۲۰ نوع ماده، این مدل توانست ویژگی‌های ۶۰ ماده‌ی جدید را با دقت بالا تخمین بزند.

⚙️ این پیشرفت می‌تواند به‌شدت روند کشف و طراحی مواد جدید را در حوزه‌هایی مانند انرژی، الکترونیک و مهندسی تسریع کند.

@rss_ai_ir
#AI #PIML #PINO #MaterialScience #PhysicsInformedAI #Innovation
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
👤 انسان: می‌خواهد ربات‌ها تمام کارها را به جای او انجام دهند.

🤖 در همین حین، ربات‌ها:

(تصویر یا ویدیو از رباتی که زمین می‌خورد، گم می‌شود یا کار بی‌ربطی انجام می‌دهد 😄)

@rss_ai_ir
#ربات #هوش_مصنوعی #طنز #فناوری
😁3🤣2
🎨 مایکروسافت هم وارد میدان ساخت تصویر شد!

در حالی که از مدت‌ها پیش شایعاتی درباره‌ی فاصله گرفتن مایکروسافت از OpenAI شنیده می‌شد، حالا این شرکت با انتشار MAI-Image-1 رسماً نشان داد که می‌خواهد استقلال خود را حفظ کند.

💡 مدل جدید بخشی از خانواده‌ی MAI است — همان مدل‌هایی که مایکروسافت برای «تفکر و استدلال» توسعه می‌دهد و قرار است جایگزین مدل‌های o1 و o3-mini از OpenAI در Copilot شود.

و حالا، نسخه‌ی تصویری آن هم رسید:
🖼️ هMAI-Image-1 — مدل تولید تصویر از مایکروسافت که به شوخی شبیه‌سازی نام GPT-Image-1 است.
مدل تازه در رتبه‌ی ۹ جدول LMArena قرار گرفته، اما مایکروسافت با افتخار می‌گوید:

> «معرفی MAI-Image-1، که در اولین حضور خود در میان ۱۰ مدل برتر LMArena قرار گرفت.»



👀 از تصاویر منتشرشده در سایت مایکروسافت می‌توان گفت که مدل از نظر کیفیت در حد نسل قبلی سازندگان تصویر است (در حد Flux.dev) — پوست‌ها کمی مصنوعی و براق، ولی باید عملکرد واقعی را دید.

🧩 در حال حاضر مدل به‌صورت عمومی در دسترس نیست، اما به‌زودی در Copilot و Bing Image Creator عرضه خواهد شد.
اگر عجله دارید، می‌توانید آن را به‌صورت محدود در LMArena بیابید — کافی‌ست چند بار کلیک کنید تا ظاهر شود 😄

🔗 معرفی رسمی از Microsoft.ai

@rss_ai_ir
#Microsoft #AI #MAI #ImageGeneration #Copilot #BingImageCreator
1👍1