VIRSUN
7.06K subscribers
1.46K photos
832 videos
5 files
918 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🦄 معرفی یک مدل چندوجهی یکپارچه از META

یک رویکرد نو به نام Native Unified Multimodal (UMM) معرفی شده که هدفش ساخت یک فضای بازنمایی یکپارچه و پیوسته برای تصویر و ویدیو است.

در این روش، یک VAE Encoder در کنار یک Representation Encoder قرار می‌گیرد و نتیجه آن یک فضای واحد است که اجازه می‌دهد مدل‌ها به‌صورت End-to-End هم برای درک تصویر/ویدیو و هم برای تولید آن‌ها عمل کنند — با کیفیت در حد مدل‌های SOTA.

کد فعلاً تحت بررسی حقوقی است، اما پروژه و مقاله منتشر شده‌اند و مسیر توسعه روشن است.


🔗 Paper: https://lnkd.in/djT4WGEU
🔗 Project: https://tuna-ai.org/
🔗 Repo: https://github.com/wren93/tuna

#AI #Multimodal #META #UMM #DeepLearning #VisionModels #GenerativeAI 🦄
✈️ شرکت XPeng وارد فاز تولید انبوه «خودروهای پرنده» خود شد

خط تولید این سیستم ترکیبی در گوانگژو راه‌اندازی شده و ظرفیت سالانه آن به ۱۰هزار دستگاه می‌رسد. شاید برای خودروهای کلاسیک رقم بزرگی نباشد، اما برای حوزه «خودروهای پرنده» این اولین حرکت صنعتی واقعی فراتر از نمونه‌های نمایشگاهی است.

🔹 ساختار در واقع از دو بخش مستقل تشکیل شده است:
یک مینی‌ون معمولی روی زمین حرکت می‌کند و یک درون مسافربر جداشونده در صندوق عقب نگه‌داری می‌شود. خودرو می‌رود، درون می‌پرد — بدون نیاز به طراحی عجیب‌وغریب یک وسیله که هم باید خوب برود و هم خوب پرواز کند.

🔹 مزیت بزرگ این رویکرد، ساده شدن قوانین است. به‌جای تدوین مقررات جدید برای «خودرو پرنده»، فقط اصلاحات کوچکی در قوانین پهپادها لازم است و بسیاری از شهرهای چین همین حالا زیرساخت این نوع وسیله را دارند.

🔹 نخستین سری این مدل‌ها برای تست و اخذ گواهینامه عرضه می‌شود و تحویل‌های معمول از سال ۲۰۲۶ آغاز خواهد شد.

این فرمت «جاده + درون» احتمالا عملی‌ترین مسیر ورود حمل‌ونقل هوایی شخصی به زندگی روزمره است: قابل‌استفاده، امن و مقیاس‌پذیر.

@rss_ai_ir
#هوش_مصنوعی #رباتیک #خودرو_پرنده #چین #تکنولوژی
1
پنج تکنیک کلیدی برای فاین‌تیون مدل‌های زبانی بزرگ

با رشد مدل‌های زبانی، نیاز به تنظیم آن‌ها برای وظایف تخصصی بیشتر شده است. اما چگونه می‌توان این کار را به‌صرفه و بدون افت کیفیت انجام داد؟ 🤔
در این پست، پنج روش پیشرفته و پرکاربرد را یکجا مرور می‌کنیم:

1️⃣ LoRA —
کاهش هزینه با یادگیری کم‌پارامتر:
در این روش تنها ماتریس‌های کم‌رتبه آموزش داده می‌شوند. همین موضوع باعث می‌شود فاین‌تیون بسیار سریع‌تر و کم‌هزینه‌تر انجام شود.

2️⃣ LoRA-FA —
ترکیب LoRA با ویژگی‌های افزوده‌شده:
در این نسخه، مدل علاوه بر یادگیری کم‌پارامتر، از ویژگی‌های اضافه‌شده (Feature Augmentation) نیز استفاده می‌کند و عملکرد بهتری روی وظایف تخصصی ارائه می‌دهد.

3️⃣ Vera —
منظم‌سازی توکار در فضای امبدینگ:
این تکنیک با منظم‌سازی امبدینگ‌ها از بیش‌برازش جلوگیری می‌کند و باعث می‌شود مدل روی دامنه‌های مختلف بهتر تعمیم یابد.

4️⃣ Delta LoRA —
تمرکز بر لایه‌های مهم‌تر:
به‌جای آموزش لایه‌های زیاد، تنها لایه‌هایی که بیشترین اثر را دارند به‌روزرسانی می‌شوند. نتیجه: سرعت بیشتر و هزینهٔ کمتر بدون افت کیفیت.

5️⃣ Prefix Tuning —
هدایت رفتار مدل بدون تغییر وزن‌ها:
در این روش وزن‌های مدل دست‌نخورده باقی می‌ماند؛ تنها یک مجموعه "پیشوند آموزشی" یاد گرفته می‌شود که مدل را در جهت موردنظر هدایت می‌کند. روشی فوق‌العاده برای فاین‌تیون سریع و سبک.


---

@rss_ai_ir
#فاین‌تیون #هوش_مصنوعی #LLM #آموزش_مدل #دیپ_لرنینگ #ماشین_لرنینگ 🚀
1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 پیش‌رفت خیره‌کننده تسلا اپتیموس در ۲.۵ سال

تسلا در کمتر از سه سال نشان داد که مسیر ربات‌های انسان‌نما دیگر یک رؤیا نیست، بلکه یک صنعت در حال شکل‌گیری است. اپتیموس از یک نمونه‌ی اولیه خشک و محدود، به رباتی با حرکت نرم، تعادل بالا و قابلیت تعامل دقیق با اشیا تبدیل شده است.

چند نکتهٔ مهم از این تحول سریع:

پیشرفت در موتورهای محرکه و مفاصل
حرکت‌های اپتیموس اکنون طبیعی‌تر، پایدارتر و بسیار نزدیک‌تر به حرکت انسان شده‌اند.

🧠 ادغام مستقیم با شبکه‌های عصبی تسلا
اپتیموس از همان سیستم ادراکی خودروهای FSD استفاده می‌کند؛ این یعنی درک بهتر محیط و یادگیری سریع‌تر از داده‌های واقعی.

🖐️ کنترل ظریف دست‌ها و انگشت‌ها
ربات اکنون می‌تواند اشیای کوچک را بسیار دقیق‌تر برداشت کند؛ یک گام مهم برای کاربردهای صنعتی و خانگی.

⚙️ بهبود چشمگیر در سرعت، مصرف انرژی و هماهنگی کل بدن

این تمام ماجرا نیست — با سرعت پیشرفت موجود، فاصله بین نسخه‌های اپتیموس کمتر از فاصله بین نسل‌های گوشی‌های هوشمند شده است.

آینده ربات‌های انسان‌نما در حال نزدیک شدن است… و تسلا یکی از بازیگران اصلی این مسیر خواهد بود.

@rss_ai_ir

#Tesla #Optimus #Robot #AI #HumanoidRobot
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 شرکت چینی EngineAI ربات جنگی جدید خود را معرفی کرد؛ T-800 واقعاً روی پاهای خودش راه می‌رود!

ادعا می‌کنند که این‌بار نه پای هوش مصنوعی در میان است و نه جلوه‌های ویژه‌ی سینمایی؛

حرکت‌هایی که می‌بینید کاملاً واقعی است و ربات به‌صورت مستقل روی پاهایش قدم برمی‌دارد.

این خبر باعث شده بسیاری، شباهت این ربات به نسخه‌های سینمایی را جدی‌تر از همیشه ببینند.

دنیای ربات‌های انسان‌نما با سرعتی باورنکردنی در حال نزدیک‌ شدن به آینده‌ای است که قبلاً فقط در فیلم‌ها تصور می‌شد.

❤️ @rss_ai_ir
#ربات #EngineAI #روبات_انسان‌نما #هوش_مصنوعی #فناوری #چین #روباتیک
🔥1
A blurred silhouette of a [subject] in motion, wearing a [color] sports kit, captured with a slow shutter for dynamic motion blur. High contrast, minimalist composition with no logos or text. Neutral background, abstract, and energetic. Editorial style reminiscent of [Brand] advertising or street photography.
📌 چطور یک نمونهٔ اولیه LLM را به یک سیستم آماده‌ی تولید تبدیل کنیم؟

🧠 هر مدل زبانی بزرگ وقتی از مرحلهٔ آزمایشی خارج می‌شود، تازه چالش‌های واقعی شروع می‌شوند. مسیری که از یک دمو جذاب به یک سرویس پایدار، مقیاس‌پذیر و مطمئن می‌رسد، پر از جزئیات مهندسی، بهینه‌سازی و تصمیم‌های مهم است.

🔧 در این راهنما مراحل کلیدی برای عملیاتی‌کردن مدل شامل:
— طراحی معماری مقیاس‌پذیر
— انتخاب استراتژی مناسب برای inference
— مانیتورینگ و تست‌پذیری
— مدیریت خطا و ریزش کیفیت
— امنیت، حریم خصوصی و کنترل نسخه
— استقرار در محیط واقعی و MLOps استاندارد

هدف این است که مدل فقط «کار کند» نیست؛ باید همیشه، سریع، دقیق و قابل اتکا عمل کند.
این نوشته خلاصه‌ای است از بهترین روش‌هایی که تیم‌ها برای تبدیل مدل‌ها از مرحلهٔ concept به Production AI استفاده می‌کنند.

https://towardsdatascience.com/how-to-turn-your-llm-prototype-into-a-production-ready-system/


#LLM #MLOps #ProductionAI #LLMOps 🚀
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 آپدیت جدید Code Maestro؛ یک قدم بزرگ برای ساخت بازی با کمک هوش مصنوعی

ابزار Code Maestro که بسیاری آن را «Cursor برای Unity و HTML5» می‌نامند، این بار با مجموعه‌ای از قابلیت‌های جدی برگشته و مستقیماً روی سرعت توسعه و دیده‌شدن بازی‌ها تأثیر می‌گذارد. مدیرعامل Unity هم اخیراً اعلام کرده بود که ابزارهای هوش مصنوعی نقش مهمی در افزایش discoverability بازی‌ها خواهند داشت — و دقیقاً همین مسیر را Code Maestro دنبال می‌کند.

ویژگی‌های مهم نسخهٔ جدید:

🎨 Reskin Mode
یکی از خسته‌کننده‌ترین کارهای تیم‌ها—تغییر تم رویدادها، رنگ‌ها یا اسکین‌ها—حالا با یک کلیک انجام می‌شود. مدل هوش مصنوعی کد، IDها و ساختار را بدون خراب‌کردن منطق، خودش بازسازی می‌کند.

🖼️ تولید UI با متن یا اسکرین‌شات
کافی است ظاهر یک صفحه را توصیف کنید یا اسکرین‌شات بدهید؛ Code Maestro کل لایه‌های UI را همراه با کامپوننت‌ها و state‌ها می‌سازد. یک جهش بزرگ برای کاهش رفت‌وبرگشت بین طراح و برنامه‌نویس.

⚙️ استفاده از چند مدل بزرگ
برای هر وظیفه بهترین مدل انتخاب می‌شود: Sonnet 4.5، Gemini 3 Pro، GPT-5.1 یا Opus 4.5 — مدل‌ها هوشمندانه براساس هزینه و نوع کار انتخاب می‌شوند تا مصرف اعتبار به حداقل برسد.

🧩 پشتیبانی از موتورهای بیشتر
حالا علاوه بر Unity، موتورهای Cocos، Phaser، Pixi.js، Three.js، PlayCanvas و کل پروژه‌های .NET را هم پشتیبانی می‌کند.

💡 جمع‌بندی
نگرانی دربارهٔ «کدنویسی ضعیف توسط هوش مصنوعی» بی‌مورد است؛ انسان‌ها هم به‌قدر کافی کد بد تولید می‌کنند!
اما گرفتن هوش مصنوعی به‌عنوان همکار برای حذف روتین‌ها، یک مزیت واقعی است — مخصوصاً برای تیم‌های کوچک.

🔗 دموی رایگان هم فعال است و برای خرید اعتبار، فعلاً ۳۰٪ هدیه روی موجودی اضافه می‌شود:
https://www.code-maestro.com/

#هوش_مصنوعی #بازی_سازی #Unity #AIGameDev #CodeMaestro
2
📘 ۱۰ موضوع ضروری برای تسلط بر یادگیری ماشین

💡 اگر قصد داری مسیر یادگیری ماشین را جدی دنبال کنی، دانستن این ده محور اصلی مثل داشتن نقشهٔ راه است. این موارد همان پایه‌هایی هستند که همهٔ متخصصان ML روی آن‌ها ایستاده‌اند:

1️⃣ مبانی یادگیری ماشین
درک تفاوت میان ML، هوش مصنوعی و یادگیری عمیق و جایگاه هرکدام در اکوسیستم تکنولوژی.

2️⃣ انواع یادگیری ماشین
نظارت‌شده، بدون‌نظارت و تقویتی — سه ستون اصلی که تمام الگوریتم‌ها روی آن‌ها بنا می‌شوند.

3️⃣ کاربردهای واقعی ML
از تشخیص بیماری و کشف تقلب تا خودروهای خودران و سیستم‌های پیشنهاددهنده.

4️⃣ جمع‌آوری و پاک‌سازی داده
حذف داده‌های ناقص، رفع تناقضات، حذف داده‌های تکراری — همان بخشی که ۷۰٪ زمان پروژه صرف آن می‌شود.

5️⃣ مهندسی ویژگی (Feature Engineering)
تبدیل دادهٔ خام به ویژگی‌های قابل فهم برای مدل — یکی از مهم‌ترین عوامل موفقیت.

6️⃣ پیش‌پردازش داده
نرمال‌سازی، استانداردسازی، کدگذاری دادهٔ دسته‌ای و تقسیم داده‌ها به train/test.

7️⃣ الگوریتم‌های یادگیری نظارت‌شده
رگرسیون خطی، KNN، SVM، Random Forest، XGBoost — ابزارهای اصلی برای طبقه‌بندی و رگرسیون.

8️⃣ شاخص‌های ارزیابی مدل
ملاک های Accuracy، Precision، Recall، F1، ROC-AUC — معیارهایی که کیفیت مدل را می‌سنجند.

9️⃣ بیش‌برازش و کم‌برازش
شناخت این‌که مدل بیش از حد یاد گرفته یا کم — و کنترل آن با تکنیک‌های منظم‌سازی.

🔟 اعتبارسنجی و استقرار مدل
سرویس K-Fold، Flask، Docker و سرویس‌های ابری مثل AWS و GCP — مسیر گذار از تحقیق به محصول واقعی.


---

@rss_ai_ir
#یادگیری_ماشین #هوش_مصنوعی #یادگیری_عمیق #علم_داده #ML #AI #MachineLearning
3🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
جمینی ۳ دیپ‌تینک؛ قابلیت جدید فقط برای اشتراک اولترا

به‌تازگی قابلیت Deep Think در جمینی ۳ فعال شده، اما تنها برای کاربران اشتراک Ultra قابل استفاده است.


این ویژگی عملاً مسیر تفکر عمیق، تحلیل‌های چندمرحله‌ای و پاسخ‌های استدلالی سطح‌بالا را باز می‌کند، اما نبود آن در نسخه Pro باعث ایجاد سؤال در میان کاربران شده است—به‌خصوص حالا که رقابت مدل‌های پیشرفته هر روز شدیدتر می‌شود.



@rss_ai_ir

#هوش_مصنوعی #جمینی #دیپ_تینک #مدل_زبانی #AI
👍5🔥1👏1
📌 اوپن‌اِی‌آی انتشار GPT-5.2 را به ۹ دسامبر جلو انداخت — وضعیت «کُد رِد» فعال شد.

⛔️گزارش‌های جدید نشان می‌دهد که اوپن‌اِی‌آی تحت فشار رقابت با Gemini 3 گوگل، برنامه‌ریزی خود را تغییر داده و انتشار GPT-5.2 را زودتر از موعد انجام می‌دهد.

طبق گزارش منابع داخلی، این تصمیم برای جلوگیری از تثبیت برتری گوگل در بازار مدل‌های پیشرفته گرفته شده است. Gemini 3 با عملکرد قوی در چندین بنچمارک، به‌خصوص در reasoning و long-context، سهم قابل توجهی از توجه بازار را جذب کرده است.

چرا عجله؟

گوگل با Gemini 3 موج جدیدی از قدرت محاسباتی و قابلیت‌های چندوجهی را نمایش داده است.

تحلیل‌ها نشان می‌دهند که اگر اوپن‌اِی‌آی پاسخ سریع ندهد، ممکن است برای اولین بار جایگاه مدل پرچمدارش را از دست بدهد.

اینکه GPT-5.2 نسخه‌ای ارتقایافته از GPT-5.1 است و روی reasoning عمیق، دقت حقایق و سرعت پاسخ تمرکز دارد.


🔥 نکته‌ی مهم:
این اولین بار است که اوپن‌اِی‌آی انتشار یک نسخه را با این سرعت جلو می‌اندازد؛ حرکتی که در رسانه‌ها به‌عنوان «code red» تعبیر شده — یعنی واکنشی اضطراری برای جلوگیری از عقب‌افتادن در رقابت.

https://www.techbuzz.ai/articles/openai-rushes-gpt-5-2-launch-to-dec-9th-as-code-red-hits
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 چین دوباره همه را غافلگیر کرد و WAWA را معرفی کرد؛ ربات بامزه‌ای روی شنی که برای کارهای روزمره و سرگرمی طراحی شده است.

این ربات کوچک و دوست‌داشتنی توسط استارتاپ JoyIn Technology ساخته شده و بیشتر برای انجام وظایف سبک و اجتماعی به کار می‌رود:
📦 جابه‌جایی وسایل کوچک در سفر یا کمپینگ
📸 گرفتن عکس‌ در مهمانی‌ها
جلب توجه مشتری‌ها در کافه‌ها و فروشگاه‌ها

سرمایه‌گذاران هم علاقه زیادی نشان داده‌اند؛ تا امروز نزدیک به ۶۹ میلیون دلار جذب کرده است.
هدف سازندگان این است که با محبوب‌ کردن WAWA، مسیر را برای ورود پروژه‌های بزرگ‌تر در حوزه‌ هوش مصنوعی به بازار مصرفی هموار کنند.

رویکردی هوشمندانه: رباتی بامزه برای جذب دل مردم، و اکوسیستمی بزرگ پشت آن.

#هوش_مصنوعی 🤖 #رباتیک 🚀 #چین 🇨🇳 #فناوری #JoyIn #WAWA
1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
مدل FMA-Net++؛ مدل پیشرفته برای ارتقای ویدئو و رفع تاری

در این پژوهش، مدل FMA-Net++ راهکاری جدید برای فوق‌رزولوشن ویدئو و رفع تاری واقعی ارائه می‌کند؛ آن هم با درنظرگرفتن دو عامل بسیار مهم در ویدئوهای دنیای واقعی:
حرکت و تغییرات نوردهی.

🔍 این مدل از یک معماری هوشمندانه استفاده می‌کند که در آن یادگیریِ نواحی دچار افت کیفیت از فرایند بازسازی جدا شده است. همین تفکیک باعث می‌شود نتیجه‌ی نهایی هم سریع‌تر باشد و هم دقیق‌تر.

🎯 کاربردها:

✳️بهبود کیفیت ویدئوهای تاریِ ناشی از حرکت
✳️بازسازی جزئیات در ویدئوهای کم‌نور
✳️استفاده در دوربین‌های هوشمند، پهپادها و سیستم‌های نظارتی


📄 لینک‌های مقاله:
arXiv
PDF
Project Page
GitHub

#ویدئو #ابررزولوشن #دیبلورینگ #بینایی_ماشینی #یادگیری_عمیق #پردازش_تصویر #AI
👍4
مدل CUDA-L2؛ وقتی هوش مصنوعی از مهندسان NVIDIA هم بهتر CUDA می‌نویسد!

در پروژه‌ای شگفت‌انگیز، تیم DeepReinforce سیستمی ساخته که می‌تواند هسته‌های CUDA را کاملاً خودکار و از صفر تولید کند؛ و حتی ۱۰ تا ۳۰٪ سریع‌تر از cuBLAS و cuBLASLt — کتابخانه‌های فوق‌بهینه‌ی خودِ NVIDIA — عمل کند.

🔧 ایده چیست؟
به‌جای اینکه مهندسان با دست هسته بنویسند و فقط پارامترها تغییر کنند، مدل زبانی (LLM) در کنار یادگیری تقویتی کل ساختار کد را بازطراحی می‌کند:

♻️تغییر حلقه‌ها

♻️انتخاب استراتژی tile و padding

♻️تغییر swizzle pattern

♻️حتی انتخاب بین CUDA خام، CuTe، CUTLASS یا inline PTX


هر هسته تولید می‌شود → روی GPU واقعی اجرا → سنجش سرعت و صحت → بهبود مدل.
این چرخه باعث شده LLM قوانین خودش را برای نوشتن سریع‌ترین کد ممکن یاد بگیرد.

چرا مهم است؟
بخش عظیمی از هزینه‌ی آموزش LLMها صرف عملیات HGEMM می‌شود. اگر این عملیات ۲۰٪ سریع‌تر شود:

کل آموزش ارزان‌تر و سریع‌تر می‌شود

در همان بودجه می‌توان تعداد توکن، ایپاک‌ها و داده‌های بیشتر را پردازش کرد

قابل‌استفاده برای هزاران اندازه ماتریس واقعی (نه فقط چند مقدار ویژه)


📊 نتایج

✳️تا ۲۲٪ سریع‌تر از cuBLAS و torch.matmul در تست‌های آفلاین

✳️تا ۲۹٪ سریع‌تر در سناریوهای واقعی سرور

✳️انتشار ۱۰۰۰ هسته‌ی HGEMM بهینه‌شده برای A100 در GitHub


این پروژه یک قدم بزرگ به‌سمت کدنویسی خودکار فوق‌بهینه برای GPU است؛ جایی که هوش مصنوعی کاملاً جای مهندسان بهینه‌سازی CUDA را می‌گیرد.

🟡 Arxiv
🖥 GitHub

#هوش_مصنوعی #پردازش_GPU #CUDA #یادگیری_تقویتی #مهندسی_عملکرد 🚀
🔥21👏1