This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات دودستی جدید از VLAI Robotics با قیمت مقرونبهصرفه معرفی شد!
شرکت VLAI Robotics رباتی دودستی مبتنی بر پلتفرم OpenArm معرفی کرده که قیمت پایهی آن از حدود ۵۵۰۰ دلار شروع میشود. 🇨🇳
🔹 این سیستم دارای ۱۶ درجه آزادی (DoF) است و قادر است حرکات انسان را با دقت بالا تقلید کند — ایدهآل برای آموزش از طریق یادگیری تقلیدی (Imitation Learning).
🔹 تولید آن بهصورت بومی انجام میشود و از الگوریتمهای VLA (Vision-Language-Action) برای درک محیط و تعامل هوشمندانه بهره میبرد.
این گام مهمی است بهسوی دموکراتیزهکردن رباتهای انساننما و در دسترسکردن فناوریهای پیشرفته برای آموزش و پژوهش. ⚙️
@rss_ai_ir
#رباتیک #هوش_مصنوعی #VLA #OpenArm #ImitationLearning #Automation #AI #Robotics
شرکت VLAI Robotics رباتی دودستی مبتنی بر پلتفرم OpenArm معرفی کرده که قیمت پایهی آن از حدود ۵۵۰۰ دلار شروع میشود. 🇨🇳
🔹 این سیستم دارای ۱۶ درجه آزادی (DoF) است و قادر است حرکات انسان را با دقت بالا تقلید کند — ایدهآل برای آموزش از طریق یادگیری تقلیدی (Imitation Learning).
🔹 تولید آن بهصورت بومی انجام میشود و از الگوریتمهای VLA (Vision-Language-Action) برای درک محیط و تعامل هوشمندانه بهره میبرد.
این گام مهمی است بهسوی دموکراتیزهکردن رباتهای انساننما و در دسترسکردن فناوریهای پیشرفته برای آموزش و پژوهش. ⚙️
@rss_ai_ir
#رباتیک #هوش_مصنوعی #VLA #OpenArm #ImitationLearning #Automation #AI #Robotics
🔥2👍1😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🌱 Seed3D 1.0 —
ورود ByteDance به دنیای 3D
شرکت ByteDance (مالک TikTok) خانوادهی کاملی از مولدهای هوش مصنوعی با نام Seed دارد:
🎨 Seedream 4.0 – تولیدکنندهی تصاویر
🧩 Seededit 3.0 – ویرایشگر تصاویر
🎥 Seedance 1.0 – ویدیوژنراتور قدرتمند
🎵 و البته Seedmusic – پروژهای که حالا متوقف شده است
حالا نوبت به Seed3D 1.0 رسیده — مدل تازهای برای تولید مدلها و صحنههای سهبعدی.
🧠 طبق گزارش فنی، Seed3D قادر است:
♻️تولید UV unwraps، تکسچرها و متریالها
♻️انجام retopology (بهینهسازی مش)
♻️خروجی در قالب فایلهای استاندارد مثل OBJ و GLB
♻️ادغام با شبیهساز Isaac Sim برای تولید لایهی برخورد (Collision Layer)
با اینکه هنوز دمویی در دسترس نیست، تیم ادعا میکند که مدل از رقبایی مثل Tripo و Trellis عملکرد بهتری دارد.
با این حال، کاربران چینی اشاره کردهاند که توپولوژی مدلها چندان تمیز نیست و هنوز فاصله با مدلهای حرفهای وجود دارد.
📌 نکتهی جالب:
مدل Seed3D میتواند از روی یک تصویر، کل صحنهی سهبعدی را بازسازی کند —
مدل ابتدا با کمک بینایی ماشینی اشیاء را شناسایی و جدا میکند، سپس بر اساس موقعیت و اندازه، آنها را در صحنه میچیند.
🎯 هنوز در مرحلهی وعدههاست، اما با توجه به کیفیت بالای Seedance، میتوان انتظار پروژهای جدی داشت.
🌐 سایت رسمی:
seed.bytedance.com/en/seed3d
@rss_ai_ir
#Seed3D #ByteDance #AI #3DGeneration #IsaacSim #هوش_مصنوعی #مدلسازی_سهبعدی #تکنولوژی
ورود ByteDance به دنیای 3D
شرکت ByteDance (مالک TikTok) خانوادهی کاملی از مولدهای هوش مصنوعی با نام Seed دارد:
🎨 Seedream 4.0 – تولیدکنندهی تصاویر
🧩 Seededit 3.0 – ویرایشگر تصاویر
🎥 Seedance 1.0 – ویدیوژنراتور قدرتمند
🎵 و البته Seedmusic – پروژهای که حالا متوقف شده است
حالا نوبت به Seed3D 1.0 رسیده — مدل تازهای برای تولید مدلها و صحنههای سهبعدی.
🧠 طبق گزارش فنی، Seed3D قادر است:
♻️تولید UV unwraps، تکسچرها و متریالها
♻️انجام retopology (بهینهسازی مش)
♻️خروجی در قالب فایلهای استاندارد مثل OBJ و GLB
♻️ادغام با شبیهساز Isaac Sim برای تولید لایهی برخورد (Collision Layer)
با اینکه هنوز دمویی در دسترس نیست، تیم ادعا میکند که مدل از رقبایی مثل Tripo و Trellis عملکرد بهتری دارد.
با این حال، کاربران چینی اشاره کردهاند که توپولوژی مدلها چندان تمیز نیست و هنوز فاصله با مدلهای حرفهای وجود دارد.
📌 نکتهی جالب:
مدل Seed3D میتواند از روی یک تصویر، کل صحنهی سهبعدی را بازسازی کند —
مدل ابتدا با کمک بینایی ماشینی اشیاء را شناسایی و جدا میکند، سپس بر اساس موقعیت و اندازه، آنها را در صحنه میچیند.
🎯 هنوز در مرحلهی وعدههاست، اما با توجه به کیفیت بالای Seedance، میتوان انتظار پروژهای جدی داشت.
🌐 سایت رسمی:
seed.bytedance.com/en/seed3d
@rss_ai_ir
#Seed3D #ByteDance #AI #3DGeneration #IsaacSim #هوش_مصنوعی #مدلسازی_سهبعدی #تکنولوژی
🔥2👏1
👟 Nike
وارد دنیای رباتیک شد!
✅شرکت Nike پروژهای به نام Project Amplify معرفی کرده — کفشهایی با سیستم رباتیکی فعال که به دویدن و راهرفتن کمک میکند. 🦾
✅این سیستم از یک موتور سبک و قدرتمند، تسمهی انتقال نیرو و باتری قابلشارژ در قالب مچبند تشکیل شده است.
در هنگام قدمزدن، موتور بخش پاشنهی کفش را بهنرمی بالا میبرد تا حرکت طبیعی و بدون فشار برای کاربر ایجاد کند.
💡 طراحی این فناوری در Nike Sport Research Lab و با همکاری شرکت رباتیکی Dephy انجام شده است.
🎯 هدف: کاهش خستگی و افزایش بازده حرکتی برای ورزشکاران و کاربران روزمره.
⛔️همچنین Nike قصد دارد این کفشهای هوشمند را تا سال ۲۰۲۸ بهصورت تجاری روانه بازار کند — و به نظر میرسد دوران رباتهای پوشیدنی رسماً آغاز شده است. ⚙️
@rss_ai_ir
#Nike #رباتیک #ربات_پوشیدنی #هوش_مصنوعی #Dephy #ورزش_هوشمند #AI #WearableTech
وارد دنیای رباتیک شد!
✅شرکت Nike پروژهای به نام Project Amplify معرفی کرده — کفشهایی با سیستم رباتیکی فعال که به دویدن و راهرفتن کمک میکند. 🦾
✅این سیستم از یک موتور سبک و قدرتمند، تسمهی انتقال نیرو و باتری قابلشارژ در قالب مچبند تشکیل شده است.
در هنگام قدمزدن، موتور بخش پاشنهی کفش را بهنرمی بالا میبرد تا حرکت طبیعی و بدون فشار برای کاربر ایجاد کند.
💡 طراحی این فناوری در Nike Sport Research Lab و با همکاری شرکت رباتیکی Dephy انجام شده است.
🎯 هدف: کاهش خستگی و افزایش بازده حرکتی برای ورزشکاران و کاربران روزمره.
⛔️همچنین Nike قصد دارد این کفشهای هوشمند را تا سال ۲۰۲۸ بهصورت تجاری روانه بازار کند — و به نظر میرسد دوران رباتهای پوشیدنی رسماً آغاز شده است. ⚙️
@rss_ai_ir
#Nike #رباتیک #ربات_پوشیدنی #هوش_مصنوعی #Dephy #ورزش_هوشمند #AI #WearableTech
🔥2👏2❤1😱1
⚙️ لبهٔ فناوری در صنایع مدرن؛ شرکتها روی چه چیزهایی تحقیق میکنند؟
دنیای صنعت با شتابی بیسابقه در حال دگرگونی است. تقریباً هیچ حوزهای نیست که از تحول هوش مصنوعی، رباتیک و مدلسازی دیجیتال بینصیب مانده باشد.
اما شرکتهای بزرگ دنیا امروز روی چه فناوریهایی تمرکز کردهاند؟
🔹 ۱. دوقلوهای دیجیتال (Digital Twin)
صنایع نفت، معدن و تولید، در حال ایجاد مدلهای دیجیتالی از تجهیزات واقعی هستند تا با دادههای بلادرنگ، عملکرد را پایش و پیشبینی کنند.
شرکتهایی مثل Siemens، ABB و NVIDIA پیشرو این حوزهاند.
🔹 ۲. رباتیک هوشمند و اتوماسیون تطبیقی
کارخانهها در حال حرکت به سمت رباتهایی با یادگیری تقویتی (RL) هستند؛ رباتهایی که خود را با تغییرات محیطی سازگار میکنند.
چین و آمریکا در این حوزه رقابت تنگاتنگی دارند.
🔹 ۳. بینایی ماشین در خط تولید
تولیدکنندگان فلزات، خودرو و صنایع غذایی از سیستمهای بینایی ماشین برای تشخیص نقص، پایش کیفیت و کاهش خطا استفاده میکنند.
الگوریتمهای YOLO و EfficientNet در بسیاری از خطوط صنعتی حالا جزئی از استانداردهای کنترل کیفیت شدهاند.
🔹 ۴. انرژی هوشمند و بهینهسازی الکتریکی
صنایع برق و انرژی به سمت هوش مصنوعی برای پیشبینی مصرف، کنترل شبکه و کاهش تلفات حرکت کردهاند.
شرکتهای GE، Schneider Electric و Tesla Energy در خط مقدم این تحول هستند.
🔹 ۵. مواد هوشمند و ساخت افزایشی (Additive Manufacturing)
چاپ سهبعدی صنعتی با استفاده از داده و الگوریتمهای بهینهسازی مواد، در طراحی قطعات سبکتر و مقاومتر انقلاب ایجاد کرده است.
🔹 ۶. مدلسازی شناختی و هوش مصنوعی صنعتی (Industrial AI)
شرکتهایی مانند Honeywell و Bosch در حال توسعه سیستمهایی هستند که از دادههای تاریخی، رفتار ماشینها را "میفهمند" و از خرابی پیشگیرانه جلوگیری میکنند.
🧭 نکتهٔ کلیدی برای پژوهشگران و مهندسان
پروژههای صنعتی همیشه چالشیاند — و دقیقاً همین چالشهاست که ارزش خلق میکند.
بهجای ترس از پیچیدگی، باید هر مسأله را به بخشهای کوچکتر و قابلحل تقسیم کرد تا راهحلهای سادهتر و مؤثرتر بهدست آیند.
🌍 آیندهٔ صنعت متعلق به کسانی است که از فناوری نمیترسند، بلکه با آن آینده را طراحی میکنند.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #دوقلوی_دیجیتال #صنعت۴ #فناوری #اتوماسیون #AI #Industry40 #DigitalTwin #Robotics
دنیای صنعت با شتابی بیسابقه در حال دگرگونی است. تقریباً هیچ حوزهای نیست که از تحول هوش مصنوعی، رباتیک و مدلسازی دیجیتال بینصیب مانده باشد.
اما شرکتهای بزرگ دنیا امروز روی چه فناوریهایی تمرکز کردهاند؟
🔹 ۱. دوقلوهای دیجیتال (Digital Twin)
صنایع نفت، معدن و تولید، در حال ایجاد مدلهای دیجیتالی از تجهیزات واقعی هستند تا با دادههای بلادرنگ، عملکرد را پایش و پیشبینی کنند.
شرکتهایی مثل Siemens، ABB و NVIDIA پیشرو این حوزهاند.
🔹 ۲. رباتیک هوشمند و اتوماسیون تطبیقی
کارخانهها در حال حرکت به سمت رباتهایی با یادگیری تقویتی (RL) هستند؛ رباتهایی که خود را با تغییرات محیطی سازگار میکنند.
چین و آمریکا در این حوزه رقابت تنگاتنگی دارند.
🔹 ۳. بینایی ماشین در خط تولید
تولیدکنندگان فلزات، خودرو و صنایع غذایی از سیستمهای بینایی ماشین برای تشخیص نقص، پایش کیفیت و کاهش خطا استفاده میکنند.
الگوریتمهای YOLO و EfficientNet در بسیاری از خطوط صنعتی حالا جزئی از استانداردهای کنترل کیفیت شدهاند.
🔹 ۴. انرژی هوشمند و بهینهسازی الکتریکی
صنایع برق و انرژی به سمت هوش مصنوعی برای پیشبینی مصرف، کنترل شبکه و کاهش تلفات حرکت کردهاند.
شرکتهای GE، Schneider Electric و Tesla Energy در خط مقدم این تحول هستند.
🔹 ۵. مواد هوشمند و ساخت افزایشی (Additive Manufacturing)
چاپ سهبعدی صنعتی با استفاده از داده و الگوریتمهای بهینهسازی مواد، در طراحی قطعات سبکتر و مقاومتر انقلاب ایجاد کرده است.
🔹 ۶. مدلسازی شناختی و هوش مصنوعی صنعتی (Industrial AI)
شرکتهایی مانند Honeywell و Bosch در حال توسعه سیستمهایی هستند که از دادههای تاریخی، رفتار ماشینها را "میفهمند" و از خرابی پیشگیرانه جلوگیری میکنند.
🧭 نکتهٔ کلیدی برای پژوهشگران و مهندسان
پروژههای صنعتی همیشه چالشیاند — و دقیقاً همین چالشهاست که ارزش خلق میکند.
بهجای ترس از پیچیدگی، باید هر مسأله را به بخشهای کوچکتر و قابلحل تقسیم کرد تا راهحلهای سادهتر و مؤثرتر بهدست آیند.
🌍 آیندهٔ صنعت متعلق به کسانی است که از فناوری نمیترسند، بلکه با آن آینده را طراحی میکنند.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #دوقلوی_دیجیتال #صنعت۴ #فناوری #اتوماسیون #AI #Industry40 #DigitalTwin #Robotics
👍2🔥1👏1
🔥 خلاصه کنفرانس PyTorchCon 2025 در سانفرانسیسکو
⛔️کنفرانس امسال PyTorch واقعاً پر از دستاوردهای مهم بود. در اینجا چهار مورد از جالبترین و کاربردیترین ابزارهایی که در این چند روز معرفی شدند را مرور میکنیم 👇
---
1️⃣ 🧠 Helion —
❌زبان جدید برنامهنویسی مخصوص PyTorch
✳️زبان جدیدی که روی پایه پایتون ساخته شده تا بتوانید هستههای پردازشی (kernels) را مستقیماً بنویسید.
همچنین Helion کد را بهصورت خودکار به Triton کامپایل میکند، یعنی بدون دردسر میتوانید کرنلهای GPU بهینه بنویسید.
🔗 Helion
---
2️⃣ ⚙️ torchcomms —
❌کتابخانه ارتباطی جدید برای یادگیری توزیعشده
✳️کتابخانهای مخصوص آموزش مدلها روی سختافزارهای عظیم (تا ۱۰۰هزار GPU 😮).
هدف اصلی: بهینهسازی ارتباط بین نودها و کاهش تاخیر در سیستمهای بزرگ.
🔗 torchcomms
---
3️⃣ 📱 ExecuTorch 1.0 —
❌ اجرای مدلها روی موبایل و گجتها
✳️راهحلی کامل برای اجرای مدلهای PyTorch روی موبایل، ساعتهای هوشمند و دستگاههای لبهای (Edge Devices).
هم از نظر سرعت، هم مصرف حافظه و انرژی، فوقالعاده بهینه شده.
🔗 ExecuTorch 1.0
---
4️⃣ 🤖 torchforge —
❌کتابخانهای برای یادگیری تقویتی (RL) و ساخت Agentها
✳️همچنین PyTorch با Torchforge مسیر تازهای در هوش مصنوعی عاملمحور باز کرده است.
ساختارش به گونهای طراحی شده که بخش الگوریتمی از زیرساخت جداست — تا تمرکز فقط روی منطق یادگیری باشد.
🔗 torchforge
---
📊 نتیجه:
همچنین PyTorch بهوضوح دارد از یک فریمورک آموزشی به اکوسیستم کامل AI برای تولید، استقرار و بهینهسازی مدلها تبدیل میشود.
دو روز فوقالعاده پربار برای جامعه هوش مصنوعی 🌍
@rss_ai_ir
#PyTorch #Helion #ExecuTorch #torchforge #AI #DeepLearning #ML #PyTorchCon
⛔️کنفرانس امسال PyTorch واقعاً پر از دستاوردهای مهم بود. در اینجا چهار مورد از جالبترین و کاربردیترین ابزارهایی که در این چند روز معرفی شدند را مرور میکنیم 👇
---
1️⃣ 🧠 Helion —
❌زبان جدید برنامهنویسی مخصوص PyTorch
✳️زبان جدیدی که روی پایه پایتون ساخته شده تا بتوانید هستههای پردازشی (kernels) را مستقیماً بنویسید.
همچنین Helion کد را بهصورت خودکار به Triton کامپایل میکند، یعنی بدون دردسر میتوانید کرنلهای GPU بهینه بنویسید.
🔗 Helion
---
2️⃣ ⚙️ torchcomms —
❌کتابخانه ارتباطی جدید برای یادگیری توزیعشده
✳️کتابخانهای مخصوص آموزش مدلها روی سختافزارهای عظیم (تا ۱۰۰هزار GPU 😮).
هدف اصلی: بهینهسازی ارتباط بین نودها و کاهش تاخیر در سیستمهای بزرگ.
🔗 torchcomms
---
3️⃣ 📱 ExecuTorch 1.0 —
❌ اجرای مدلها روی موبایل و گجتها
✳️راهحلی کامل برای اجرای مدلهای PyTorch روی موبایل، ساعتهای هوشمند و دستگاههای لبهای (Edge Devices).
هم از نظر سرعت، هم مصرف حافظه و انرژی، فوقالعاده بهینه شده.
🔗 ExecuTorch 1.0
---
4️⃣ 🤖 torchforge —
❌کتابخانهای برای یادگیری تقویتی (RL) و ساخت Agentها
✳️همچنین PyTorch با Torchforge مسیر تازهای در هوش مصنوعی عاملمحور باز کرده است.
ساختارش به گونهای طراحی شده که بخش الگوریتمی از زیرساخت جداست — تا تمرکز فقط روی منطق یادگیری باشد.
🔗 torchforge
---
📊 نتیجه:
همچنین PyTorch بهوضوح دارد از یک فریمورک آموزشی به اکوسیستم کامل AI برای تولید، استقرار و بهینهسازی مدلها تبدیل میشود.
دو روز فوقالعاده پربار برای جامعه هوش مصنوعی 🌍
@rss_ai_ir
#PyTorch #Helion #ExecuTorch #torchforge #AI #DeepLearning #ML #PyTorchCon
🔥2👏1🙏1
⚡️ عصر بزرگ جایگزینی آغاز شده است!
مدلهای هوش مصنوعی اکنون بیش از انسانها محتوا تولید میکنند — این واقعاً دیوانهکننده است.
ماشینها رسماً به اصلیترین تولیدکنندگان محتوا در جهان تبدیل شدهاند.
اکثریت آنچه امروز در اینترنت میخوانید، دیگر نوشتهی انسان نیست. 🧠💻
و این تازه آغاز ماجراست...
بهزودی همین اتفاق در مقالات علمی، پتنتها و نوآوریها نیز رخ خواهد داد.
جهان دانش و خلاقیت بهسمت اتوماسیون کامل پیش میرود.
@rss_ai_ir
#هوش_مصنوعی #تولید_محتوا #AI #Automation #Innovation #Future
مدلهای هوش مصنوعی اکنون بیش از انسانها محتوا تولید میکنند — این واقعاً دیوانهکننده است.
ماشینها رسماً به اصلیترین تولیدکنندگان محتوا در جهان تبدیل شدهاند.
اکثریت آنچه امروز در اینترنت میخوانید، دیگر نوشتهی انسان نیست. 🧠💻
و این تازه آغاز ماجراست...
بهزودی همین اتفاق در مقالات علمی، پتنتها و نوآوریها نیز رخ خواهد داد.
جهان دانش و خلاقیت بهسمت اتوماسیون کامل پیش میرود.
@rss_ai_ir
#هوش_مصنوعی #تولید_محتوا #AI #Automation #Innovation #Future
👍1
😎 بیا ببین چطور مدلهای زبانی در لحظه پول درمیارن!
یه پروژه فوقالعاده جالبه 👇
در سایت nof1.ai به هر مدل زبانی یک پرومت یکسان و ۱۰هزار دلار مجازی دادن و گذاشتن خودشون ترید کنن! 📈💰
الان میتونی در real-time ببینی که کدوم مدل داره سود میکنه و کدوم داره ضرر میده 😅
یه جور «نبرد هوش مصنوعیها در بازار واقعی» شده — فوقالعاده برای کسایی که دنبال AI Agents در فایننس هستن.
@rss_ai_ir
#AI #Trading #Agents #LLM #Finance #nof1
یه پروژه فوقالعاده جالبه 👇
در سایت nof1.ai به هر مدل زبانی یک پرومت یکسان و ۱۰هزار دلار مجازی دادن و گذاشتن خودشون ترید کنن! 📈💰
الان میتونی در real-time ببینی که کدوم مدل داره سود میکنه و کدوم داره ضرر میده 😅
یه جور «نبرد هوش مصنوعیها در بازار واقعی» شده — فوقالعاده برای کسایی که دنبال AI Agents در فایننس هستن.
@rss_ai_ir
#AI #Trading #Agents #LLM #Finance #nof1
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 آمازون حالا بیش از ۷۵۰ هزار ربات در انبارهای خود دارد! 🇺🇸
هر ربات جمعآوری (picking robot) در انبار میتواند کار ۲۴ کارگر انسانی را انجام دهد — بدون خستگی، بدون توقف و با دقت بالا ⚙️
این یعنی آمازون بهصورت تدریجی در حال تبدیلشدن به یکی از بزرگترین اکوسیستمهای رباتیک صنعتی جهان است، جایی که هوش مصنوعی و مکانیک در کنار هم کار میکنند تا تحویل کالا را سریعتر و ارزانتر کنند.
📦 آیندهی لجستیک دیگر انسانی نیست — ترکیبی از انسان، ربات و الگوریتم است.
@rss_ai_ir
#Amazon #Robotics #AI #Automation #Industry40 #Warehouse #RobotRevolution
هر ربات جمعآوری (picking robot) در انبار میتواند کار ۲۴ کارگر انسانی را انجام دهد — بدون خستگی، بدون توقف و با دقت بالا ⚙️
این یعنی آمازون بهصورت تدریجی در حال تبدیلشدن به یکی از بزرگترین اکوسیستمهای رباتیک صنعتی جهان است، جایی که هوش مصنوعی و مکانیک در کنار هم کار میکنند تا تحویل کالا را سریعتر و ارزانتر کنند.
📦 آیندهی لجستیک دیگر انسانی نیست — ترکیبی از انسان، ربات و الگوریتم است.
@rss_ai_ir
#Amazon #Robotics #AI #Automation #Industry40 #Warehouse #RobotRevolution
🔥2
⚡️ LMMs Engine –
موتور واحد برای آموزش مدلهای چندوجهی (Multimodal)
فریمورکی ساده، منعطف و قدرتمند از LMMs-Lab برای آموزش مدلهایی که همزمان میتوانند متن، تصویر، صدا و ویدیو را درک کنند — همه در یک محیط یکپارچه 🎛️
🎯 ویژگیها:
پشتیبانی از بیش از ۱۹ معماری مختلف:
🧠 Qwen3-VL:
پردازش تصویر با رزولوشن اصلی و کانتکست بیش از ۱۰٬۰۰۰ توکن
🎧 Qwen2.5-Omni:
مدل واحد برای متن، تصویر و صوت
🎥 WanVideo:
تولید ویدیو از متن، تصویر یا ویدیو (T2V, I2V, V2V)
🌫 dLLM:
مدلهای زبانی دیفیوژنی
🪄 LLaVA-OneVision، Bagel، SiT، RAE-SigLip و دیگر مدلهای پیشرفته
📜 لایسنس: Apache 2.0 — قابلاستفاده حتی در پروژههای تجاری
🔗 گیتهاب:
github.com/EvolvingLMMs-Lab/lmms-engine
@rss_ai_ir
#AI #Multimodal #OpenSource #DeepLearning #LLM #LMMsEngine
موتور واحد برای آموزش مدلهای چندوجهی (Multimodal)
فریمورکی ساده، منعطف و قدرتمند از LMMs-Lab برای آموزش مدلهایی که همزمان میتوانند متن، تصویر، صدا و ویدیو را درک کنند — همه در یک محیط یکپارچه 🎛️
🎯 ویژگیها:
پشتیبانی از بیش از ۱۹ معماری مختلف:
🧠 Qwen3-VL:
پردازش تصویر با رزولوشن اصلی و کانتکست بیش از ۱۰٬۰۰۰ توکن
🎧 Qwen2.5-Omni:
مدل واحد برای متن، تصویر و صوت
🎥 WanVideo:
تولید ویدیو از متن، تصویر یا ویدیو (T2V, I2V, V2V)
🌫 dLLM:
مدلهای زبانی دیفیوژنی
🪄 LLaVA-OneVision، Bagel، SiT، RAE-SigLip و دیگر مدلهای پیشرفته
📜 لایسنس: Apache 2.0 — قابلاستفاده حتی در پروژههای تجاری
🔗 گیتهاب:
github.com/EvolvingLMMs-Lab/lmms-engine
@rss_ai_ir
#AI #Multimodal #OpenSource #DeepLearning #LLM #LMMsEngine
❤2
🤖 MiniMax-M2 —
نسل جدید مدلهای MoE از سری MiniMax
مدل MiniMax-M2 نقطهی عطفی در بهینهسازی هوش مصنوعی است:
با ۲۳۰ میلیارد پارامتر (که تنها ۱۰ میلیارد از آنها فعالاند)، این مدل ترکیبی از قدرت مدلهای بزرگ LLM و کارایی بالا برای کاربردهای عاملمحور (Agentic) و برنامهنویسی است ⚙️
---
🔹 ویژگیهای کلیدی
🧠 هوش در سطح جهانی:
بر اساس گزارش Artificial Analysis، مدل MiniMax-M2 عملکردی درخشان در ریاضیات، علوم، برنامهنویسی و استدلال چندمرحلهای دارد.
در شاخص هوش کلی، در رتبهی #۱ بین مدلهای متنباز قرار گرفته است.
💻 کدنویسی هوشمند:
برای کل چرخه توسعه طراحی شده — از ویرایش فایل تا تست و تصحیح خودکار کد.
در آزمونهای Terminal-Bench و SWE-Bench نتایج عالی گرفته و در IDE و CI/CD بسیار مؤثر عمل میکند.
🧩 تواناییهای عاملمحور (Agentic):
توانایی برنامهریزی و اجرای زنجیرههای پیچیدهی اقدامات از طریق shell، مرورگر، retrieval و code runner دارد.
در آزمون BrowseComp بهخوبی منابع سختدسترس را پیدا کرده و پس از خطاها بدون از دست دادن رشته استدلال ادامه میدهد.
⚙️ معماری ترکیبی:
♻️همچنین MiniMax-M2 بر پایهی GPT-OSS ساخته شده و از Full Attention و Sliding Window Attention (SWA) بهصورت همزمان استفاده میکند.
♻️این ترکیب باعث میشود مدل هم دید کلی داشته باشد و هم روی بخشهای نزدیک تمرکز کند — تعادل بین حافظهی طولانی و دقت محلی.
♻️هر سر attention نرمالسازی مستقل (RMSNorm) دارد، و پارامترهای RoPE در بخشهای مختلف متفاوتاند، که منجر به پایداری و انعطاف بالا میشود.
---
🚀 نتیجه:
همچنین MiniMax-M2 استاندارد جدیدی برای عاملهای هوشمند و برنامهنویسی خودکار است —
هوشمندتر، سریعتر و اقتصادیتر از مدلهای مشابه.
🔗 https://huggingface.co/MiniMaxAI/MiniMax-M2
@rss_ai_ir
#AI #MiniMax #LLM #ArtificialIntelligence #Benchmarks #AgenticAI #Coding
نسل جدید مدلهای MoE از سری MiniMax
مدل MiniMax-M2 نقطهی عطفی در بهینهسازی هوش مصنوعی است:
با ۲۳۰ میلیارد پارامتر (که تنها ۱۰ میلیارد از آنها فعالاند)، این مدل ترکیبی از قدرت مدلهای بزرگ LLM و کارایی بالا برای کاربردهای عاملمحور (Agentic) و برنامهنویسی است ⚙️
---
🔹 ویژگیهای کلیدی
🧠 هوش در سطح جهانی:
بر اساس گزارش Artificial Analysis، مدل MiniMax-M2 عملکردی درخشان در ریاضیات، علوم، برنامهنویسی و استدلال چندمرحلهای دارد.
در شاخص هوش کلی، در رتبهی #۱ بین مدلهای متنباز قرار گرفته است.
💻 کدنویسی هوشمند:
برای کل چرخه توسعه طراحی شده — از ویرایش فایل تا تست و تصحیح خودکار کد.
در آزمونهای Terminal-Bench و SWE-Bench نتایج عالی گرفته و در IDE و CI/CD بسیار مؤثر عمل میکند.
🧩 تواناییهای عاملمحور (Agentic):
توانایی برنامهریزی و اجرای زنجیرههای پیچیدهی اقدامات از طریق shell، مرورگر، retrieval و code runner دارد.
در آزمون BrowseComp بهخوبی منابع سختدسترس را پیدا کرده و پس از خطاها بدون از دست دادن رشته استدلال ادامه میدهد.
⚙️ معماری ترکیبی:
♻️همچنین MiniMax-M2 بر پایهی GPT-OSS ساخته شده و از Full Attention و Sliding Window Attention (SWA) بهصورت همزمان استفاده میکند.
♻️این ترکیب باعث میشود مدل هم دید کلی داشته باشد و هم روی بخشهای نزدیک تمرکز کند — تعادل بین حافظهی طولانی و دقت محلی.
♻️هر سر attention نرمالسازی مستقل (RMSNorm) دارد، و پارامترهای RoPE در بخشهای مختلف متفاوتاند، که منجر به پایداری و انعطاف بالا میشود.
---
🚀 نتیجه:
همچنین MiniMax-M2 استاندارد جدیدی برای عاملهای هوشمند و برنامهنویسی خودکار است —
هوشمندتر، سریعتر و اقتصادیتر از مدلهای مشابه.
🔗 https://huggingface.co/MiniMaxAI/MiniMax-M2
@rss_ai_ir
#AI #MiniMax #LLM #ArtificialIntelligence #Benchmarks #AgenticAI #Coding
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 گوگل قابلیت جدیدی را در Gemini Canvas معرفی کرد — محیط کاری تعاملی درون Gemini حالا میتواند برایتان پرزنتیشنهای کامل بسازد! 🚀
کافی است بنویسید:
💬 «ساخت یک پرزنتیشن درباره [موضوع]»
یا یک سند، جدول یا مقاله تحقیقاتی آپلود کنید —
مدل Gemini بهصورت خودکار اسلایدهایی با متن، عناصر بصری و طراحی منسجم ایجاد میکند 🎨
📤 میتوانید نتیجه را مستقیماً به Google Slides صادر کنید و هر بخش را ویرایش یا شخصیسازی کنید.
این قابلیت برای همه کاربران و کشورها در دسترس است،
اما کاربران Gemini 2.5 Pro از نسخهی پیشرفتهتر مدل بهرهمند میشوند ⚡
و جالبتر اینکه این ویژگی فقط مخصوص پرزنتیشن نیست — Gemini Canvas بهزودی به یک پلتفرم کامل برای تولید محتوای چندرسانهای تبدیل میشود.
🔗 اطلاعات بیشتر
@rss_ai_ir
#Google #Gemini #AI #Presentation #Productivity #GenerativeAI #GeminiCanvas
کافی است بنویسید:
💬 «ساخت یک پرزنتیشن درباره [موضوع]»
یا یک سند، جدول یا مقاله تحقیقاتی آپلود کنید —
مدل Gemini بهصورت خودکار اسلایدهایی با متن، عناصر بصری و طراحی منسجم ایجاد میکند 🎨
📤 میتوانید نتیجه را مستقیماً به Google Slides صادر کنید و هر بخش را ویرایش یا شخصیسازی کنید.
این قابلیت برای همه کاربران و کشورها در دسترس است،
اما کاربران Gemini 2.5 Pro از نسخهی پیشرفتهتر مدل بهرهمند میشوند ⚡
و جالبتر اینکه این ویژگی فقط مخصوص پرزنتیشن نیست — Gemini Canvas بهزودی به یک پلتفرم کامل برای تولید محتوای چندرسانهای تبدیل میشود.
🔗 اطلاعات بیشتر
@rss_ai_ir
#Google #Gemini #AI #Presentation #Productivity #GenerativeAI #GeminiCanvas
👍3
📈 ما در یک لحظه تاریخی زندگی میکنیم
برای چهارمین ماه پیاپی، ارزش کل بازار بورس Nasdaq از NYSE پیشی گرفته و جایگاه خود را به عنوان بزرگترین بورس جهان تثبیت کرده است.
🎯 مرکز ثقل سرمایه جهانی اکنون به سمت نرمافزار، تراشهها و زیرساختهای ابری حرکت کرده است — و با ظهور هوش مصنوعی، این تازه آغاز راه است.
در دهههای گذشته، NYSE با تکیه بر بانکها، انرژی و صنایع سنگین سلطه داشت،
اما رشد خیرهکنندهی شرکتهایی مانند Apple، Microsoft، Nvidia، Alphabet، Amazon و Meta همه چیز را تغییر داد.
💰 سرمایهگذاری عظیم در GPU، مراکز داده و نرمافزارهای مبتنی بر AI
منجر به افزایش تریلیوندلاری ارزش بازار شد —
و این تنها آغاز دوران اقتصاد هوش مصنوعی (AI Economy) است.
@rss_ai_ir
#AI #Nasdaq #Economy #TechRevolution #Nvidia #Apple #Microsoft #AIeconomy
برای چهارمین ماه پیاپی، ارزش کل بازار بورس Nasdaq از NYSE پیشی گرفته و جایگاه خود را به عنوان بزرگترین بورس جهان تثبیت کرده است.
🎯 مرکز ثقل سرمایه جهانی اکنون به سمت نرمافزار، تراشهها و زیرساختهای ابری حرکت کرده است — و با ظهور هوش مصنوعی، این تازه آغاز راه است.
در دهههای گذشته، NYSE با تکیه بر بانکها، انرژی و صنایع سنگین سلطه داشت،
اما رشد خیرهکنندهی شرکتهایی مانند Apple، Microsoft، Nvidia، Alphabet، Amazon و Meta همه چیز را تغییر داد.
💰 سرمایهگذاری عظیم در GPU، مراکز داده و نرمافزارهای مبتنی بر AI
منجر به افزایش تریلیوندلاری ارزش بازار شد —
و این تنها آغاز دوران اقتصاد هوش مصنوعی (AI Economy) است.
@rss_ai_ir
#AI #Nasdaq #Economy #TechRevolution #Nvidia #Apple #Microsoft #AIeconomy
👎1
⚡️ Glyph —
فشردهسازی بصری-متنی برای گسترش محدودهی کانتکست در مدلهای زبانی
ایدهی اصلی Glyph بسیار ساده اما نوآورانه است:
بهجای آنکه مدل را با هزاران خط متن تغذیه کنیم، متن بهصورت تصویر نمایش داده میشود و سپس توسط مدلهای Vision-Language پردازش میگردد 🧠🖼️
🔹 مدل از یک الگوریتم ژنتیکی هدایتشده توسط LLM استفاده میکند تا بهترین ترکیب از ویژگیهای بصری را پیدا کند — از جمله نوع فونت، چگالی، و چیدمان متن — و میان فشردهسازی و دقت معنایی تعادل برقرار کند.
💡 نتیجه؟
✳️هزینه محاسباتی بهشدت کاهش مییابد.
✳️ساختار معنایی متن حفظ میشود.
✳️دقت مدل تقریباً همسطح با مدلهای قدرتمندی مثل Qwen3-8B باقی میماند.
در تستهای فشردهسازی افراطی، یک مدل VLM با کانتکست 128K میتواند وظایفی را حل کند که در مدلهای متنی کلاسیک نیازمند بیش از ۱ میلیون توکن است!
بهعبارت دیگر، درک کانتکست طولانی اکنون به یک مسئلهی چندوجهی (Multimodal) تبدیل شده است، نه صرفاً متنی.
📄 مقاله:
arxiv.org/abs/2510.17800
🧩 وزنها:
huggingface.co/zai-org/Glyph
💻 کد منبع:
github.com/thu-coai/Glyph
@rss_ai_ir
#AI #LLM #Multimodal #DeepLearning #Compression #Glyph #Research
فشردهسازی بصری-متنی برای گسترش محدودهی کانتکست در مدلهای زبانی
ایدهی اصلی Glyph بسیار ساده اما نوآورانه است:
بهجای آنکه مدل را با هزاران خط متن تغذیه کنیم، متن بهصورت تصویر نمایش داده میشود و سپس توسط مدلهای Vision-Language پردازش میگردد 🧠🖼️
🔹 مدل از یک الگوریتم ژنتیکی هدایتشده توسط LLM استفاده میکند تا بهترین ترکیب از ویژگیهای بصری را پیدا کند — از جمله نوع فونت، چگالی، و چیدمان متن — و میان فشردهسازی و دقت معنایی تعادل برقرار کند.
💡 نتیجه؟
✳️هزینه محاسباتی بهشدت کاهش مییابد.
✳️ساختار معنایی متن حفظ میشود.
✳️دقت مدل تقریباً همسطح با مدلهای قدرتمندی مثل Qwen3-8B باقی میماند.
در تستهای فشردهسازی افراطی، یک مدل VLM با کانتکست 128K میتواند وظایفی را حل کند که در مدلهای متنی کلاسیک نیازمند بیش از ۱ میلیون توکن است!
بهعبارت دیگر، درک کانتکست طولانی اکنون به یک مسئلهی چندوجهی (Multimodal) تبدیل شده است، نه صرفاً متنی.
📄 مقاله:
arxiv.org/abs/2510.17800
🧩 وزنها:
huggingface.co/zai-org/Glyph
💻 کد منبع:
github.com/thu-coai/Glyph
@rss_ai_ir
#AI #LLM #Multimodal #DeepLearning #Compression #Glyph #Research
👍1