VIRSUN
15.6K subscribers
369 photos
223 videos
2 files
227 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
در یک لایه کانولوشن (Convolutional Layer) در CNN، استفاده از فیلترهای کوچک‌تر (مثل 3×3 به جای 7×7) چه مزیت اصلی دارد؟
Anonymous Quiz
5%
کاهش Overfitting از طریق Dropout خودکار
38%
افزایش تعداد پارامترها و دقت شبکه.
52%
کاهش تعداد پارامترها و افزایش عمق شبکه برای استخراج ویژگی‌های پیچیده‌تر
5%
حذف نیاز به لایه Pooling.
👍10🔥7👏75🥰3😁3🎉3
🔑 قانون «توقف روی صفر ممنوع»

در پروژه‌های هوش مصنوعی و رباتیک، خیلی وقت‌ها نتیجه‌ی نهایی اون چیزی نیست که انتظار داریم. مثلا:

♻️مدلی که فقط ۵۰٪ دقت داره.
♻️رباتی که تا نیمه‌ی مسیر می‌ره ولی نمی‌تونه کامل برگرده.
♻️الگوریتمی که سرعتش پایینه اما همچنان از حد تصادف بهتره.


اینجا اصل مهم اینه که هیچ‌وقت روی صفر توقف نکنیم. یعنی حتی اگر به هدف کامل نرسیدیم، همون پیشرفت کوچک یک دارایی ارزشمند محسوب میشه.

مدلی که از ۰ به ۵۰٪ دقت رسیده، پایه‌ای برای رسیدن به ۹۰٪ه.
رباتی که نیمه‌ی مسیر رو طی کرده، داده و تجربه‌ی واقعی برای بهبود کنترل ایجاد کرده.
شکست‌ها فقط زمانی بی‌ارزش میشن که روی صفر متوقف بشیم.

پس در علم و صنعت، اصل «توقف روی صفر ممنوع» یعنی: هر حرکت غیر صفر، یک گام به جلوست 🚀

@rss_ai_ir 🪙 | اصل رشد تدریجی
👍11🎉118🔥6🥰5👏5😁4
🚀 متا با هوش مصنوعی، زبان ویدئوها را حذف می‌کند!

این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفت‌انگیز رونمایی کرد که می‌تواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!

این قابلیت دقیقاً چه کاری انجام می‌دهد؟

تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:

۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه می‌کند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمه‌شده تولید می‌کند که جایگزین صدای اصلی می‌شود.
۳. هماهنگ‌سازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری می‌تواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبله‌شده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت می‌کرده است!

چرا این خبر اینقدر مهم است؟

✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما می‌تواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسی‌پذیری: افرادی که با زبان‌های دیگر مشکل دارند یا کم‌شنوا هستند، می‌توانند از محتوای بیشتری بهره‌مند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوق‌العاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.

⛔️ نگرانی‌ها و چالش‌ها

البته این فناوری چالش‌های خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.

نتیجه‌گیری:
این گام بزرگ متا نشان می‌دهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.

#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync
👍8🔥8😁8👏74🥰3🎉3
🏆 سرویس تازه مبتنی بر هوش مصنوعی برای صعود سایت به رتبه‌های برتر یاندکس

سرویس Seopapa با تکیه بر تحلیل و بهینه‌سازی عوامل رفتاری کاربران، امکان ارتقای جایگاه سایت شما در نتایج جستجوی یاندکس را فراهم می‌کند. در زمان تنظیم، می‌توانید کلیدواژه‌های هدف و موقعیت جغرافیایی (شهر، منطقه یا کل کشور) را انتخاب کنید.

📊 دستاوردهای مورد انتظار:

♻️افزایش رتبه سایت در نتایج جستجو
♻️رشد ترافیک ارگانیک
♻️بالا رفتن تعداد درخواست‌ها و فروش


🎁 پس از ثبت‌نام، یک اعتبار تستی ۱۵۰۰۰ روبلی دریافت می‌کنید تا بدون پیش‌پرداخت، نتایج اولیه را مشاهده کنید.

🔗 سرویس: Seopapa.com

@rss_ai_ir
#SEO #AI #یاندکس #دیجیتال_مارکتینگ #промо
8😁7👏6🔥5🎉5🥰2👍1
🌍 گوگل برای اولین بار آمار دقیقی از اثرات زیست‌محیطی مدل‌های هوش مصنوعی خود منتشر کرد.

🔹 هر درخواست متنی به Gemini مصرف می‌کند:
– حدود ۰.۲۴ وات انرژی (معادل ۹ ثانیه تماشای تلویزیون 📺)
– حدود ۰.۲۶ میلی‌لیتر آب (حدود ۵ قطره 💧)
– حدود ۰.۰۳ گرم CO₂ 🌫

این مقادیر کمتر از برآوردهایی است که پیش‌تر در منابع عمومی منتشر شده بود، زیرا گوگل همه‌چیز را حساب کرده: GPU، CPU، RAM، انرژی حالت آماده‌به‌کار و حتی سیستم‌های خنک‌سازی و زیرساخت دیتاسنتر.

جالب‌تر اینکه فقط در یک سال (مه ۲۰۲۴ تا مه ۲۰۲۵)، ردپای انرژی ۳۳ برابر و ردپای کربن ۴۴ برابر کاهش یافته. این موفقیت بیشتر به لطف طراحی اختصاصی چیپ‌ها، استفاده از انرژی تجدیدپذیر و دیتاسنترهای بهینه به دست آمده است.

📄 متن کامل گزارش (با امضای جف دین) اینجاست:
[PDF Report](https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf)

@rss_ai_ir
#هوش_مصنوعی #Google #پایداری #AI
👏76👍5😁5🥰4🔥2🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ورود DLSS به بلندر!

در نمایشگاه SIGGRAPH 2025 قابلیت جدیدی معرفی شد: استفاده از DLSS (فناوری آپ‌اسکیلینگ هوشمند انویدیا که معمولا در بازی‌ها به کار می‌رود) حالا در وِیوپورت بلندر (Cycles) هم ممکن است.

🔹 چطور کار می‌کند؟
– صحنه ابتدا در رزولوشن پایین رندر می‌شود.
– سپس DLSS با کمک هوش مصنوعی تصویر را به رزولوشن بالا ارتقا می‌دهد.
– نتیجه نهایی تقریبا مشابه رندر کامل است و حتی در انیمیشن هم بدون پرش و نویز (temporal consistency) دیده می‌شود.

⚡️ مزایا:
– کیفیت بالا با مصرف کمتر منابع پردازشی
– افزایش سرعت و روانی وِیوپورت
– عالی برای پروژه‌های سنگین سه‌بعدی

📌 منبع: [Reddit](https://www.reddit.com/r/blender/comments/1mpqv25/blender_showcases_dlss_upscalingdenoising_at/)

@rss_ai_ir
#Blender #DLSS #هوش_مصنوعی #SIGGRAPH2025 #رندرینگ
👏1411🔥11😁11🎉9🥰8👍7
🚀 چطور AutoGLM-OS توانست از OpenAI و Anthropic جلو بزند؟

ایجاد یک عامل RL که بتواند به‌طور مستقل محیط دسکتاپ را کنترل کند، به‌نوعی جام مقدس در HCI به حساب می‌آید. اما GUIها برای انسان‌ها طراحی شده‌اند، نه ماشین‌ها، و مقیاس‌پذیری RL هم همیشه با مشکلاتی مثل ناکارایی و ناپایداری مواجه بوده است.

🔹 تیم Z.ai با معرفی فریم‌ورک COMPUTERRL توانست عامل AutoGLM-OS را بسازد که روی بِنچمارک OSWorld رکورد زد:
📊 ۴۸/۱٪ موفقیت – بالاتر از OpenAI CUA 03 (۴۲/۹٪)، UI-TARS-1.5 (۴۲/۵٪) و Claude 4.0 Sonnet (۳۰/۷٪).

📌 بنچمارک OSWorld چیست؟
یک بِنچمارک بزرگ با ۳۶۹ تسک روی Ubuntu، ویندوز و macOS.
اینجا هوش مصنوعی باید کارهای واقعی انجام دهد:

* کار با اپلیکیشن‌های دسکتاپ و وب 🌐
* مدیریت فایل‌ها 📂
* اجرای پروسس‌ها ⚙️
هر تسک شرایط اولیه و اسکریپت‌های ارزیابی استاندارد دارد تا نتایج قابل بازتولید باشند.

---

💡 سه نوآوری کلیدی که AutoGLM-OS را به SOTA رساند:

1️⃣ پارادایم جدید API-GUI
عامل می‌تواند بین تعامل GUI و فراخوانی‌های API سوییچ کند. جایی که API سریع‌تر است از آن استفاده می‌شود، و در کارهای عمومی GUI فعال می‌شود.
📈 نتیجه ابلیشن: افزایش نرخ موفقیت از ۱۱/۲٪ (GUI-only) به ۲۶/۲٪ (API-GUI).

2️⃣ زیرساخت RL توزیع‌شده و مقیاس‌پذیر

* استفاده از qemu-in-docker برای VMهای سبک ☁️
* ارتباط بین‌گرهی با gRPC 🔗
* فریم‌ورک کاملاً async به نام AgentRL ⚡️
این یعنی هزاران محیط موازی برای یادگیری آنلاین RL.

3️⃣ استراتژی آموزشی Entropulse

* رفع مشکل *entropy collapse*
* تناوب بین فازهای RL و SFT
* ایجاد دیتاست جدید از *trajectory*های موفق برای بهبود یادگیری اکتشافی
📈 پس از اولین فاز RL: ۴۲٪
📈 بعد از Entropulse: ۴۸/۱٪

---

📑 جزییات بیشتر: [Arxiv: 2508.14040](https://arxiv.org/pdf/2508.14040)
🌐 بِنچمارک: [OSWorld](https://os-world.github.io/)

@rss_ai_ir

#هوش_مصنوعی 🤖 #یادگیری_تقویتی #Agents #AutoGLM #OSWorld #Zai
👏1312🥰11👍10🎉9😁8🔥6
🧠 راز دید وسیع در شبکه‌های عصبی: با کانولوشن‌های اتساعی (Dilated) آشنا شوید!

همه ما می‌دانیم که شبکه‌های کانولوشنی (CNN) با دیدن الگوهای کوچک و ترکیب آن‌ها، ویژگی‌های پیچیده‌تر را یاد می‌گیرند. اما یک چالش بزرگ همیشه وجود دارد:

❇️چالش کلاسیک: چطور می‌توانیم “میدان دید” (Receptive Field) شبکه را بزرگ کنیم تا زمینه‌ی وسیع‌تری از تصویر را ببیند، بدون اینکه ابعاد نقشه ویژگی (Feature Map) را با لایه‌های Pooling کاهش دهیم و جزئیات مکانی را از دست بدهیم؟ 🤔

این مشکل مخصوصاً در کارهایی مثل بخش‌بندی معنایی (Semantic Segmentation) که به دقت پیکسلی نیاز داریم، حیاتی است.

❇️راه حل هوشمندانه: کانولوشن اتساعی (Dilated Convolution) 🕳
اینجا یک تکنیک زیبا و کارآمد به نام کانولوشن اتساعی یا Atrous Convolution (که از واژه فرانسوی “à trous” به معنی “حفره‌دار” گرفته شده) وارد میدان می‌شود.

ایده اصلی چیست؟

یک کانولوشن اتساعی، در واقع یک کانولوشن معمولی است که در فیلتر (Kernel) آن “حفره” ایجاد شده است. یعنی به جای اینکه وزن‌های فیلتر روی پیکسل‌های مجاور هم اعمال شوند، با یک فاصله مشخص (که به آن نرخ اتساع یا dilation rate می‌گویند) از هم قرار می‌گیرند.

Dilation Rate = 1: یک کانولوشن کاملاً معمولی.
Dilation Rate = 2: بین هر دو وزن فیلتر، یک پیکسل فاصله (حفره) وجود دارد.
این کار چه مزیتی دارد؟ 🚀

میدان دید بزرگتر با هزینه صفر: بدون اضافه کردن حتی یک پارامتر جدید به مدل، فیلتر ما می‌تواند ناحیه بسیار بزرگتری از ورودی را پوشش دهد. این یعنی درک بهتر از زمینه (context).
حفظ رزولوشن مکانی: چون از لایه‌های Pooling استفاده نمی‌کنیم، ابعاد نقشه ویژگی ثابت می‌ماند و جزئیات دقیق مکانی حفظ می‌شوند. این برای کارهایی که به مرزهای دقیق اشیاء نیاز دارند، عالی است.
به زبان ساده:

تصور کنید با دستتان به یک عکس نگاه می‌کنید. کانولوشن معمولی مثل نگاه کردن با انگشتان چسبیده به هم است. کانولوشن اتساعی مثل این است که انگشتانتان را از هم باز کنید تا ناحیه بزرگتری را بپوشانید، بدون اینکه تعداد انگشتانتان بیشتر شود! 🖐➡️

کاربرد کلیدی:

این تکنیک ستون فقرات معماری‌های معروفی مثل DeepLab برای بخش‌بندی معنایی تصاویر است. همچنین در مدل‌های تولید صوت مثل WaveNet برای درک وابستگی‌های بلندمدت در سیگنال صوتی استفاده شده است. 🔊🏙

نتیجه‌گیری:

کانولوشن اتساعی یک مثال عالی از تفکر هوشمندانه در طراحی شبکه‌های عمیق است: یک ابزار قدرتمند برای افزایش میدان دید بدون قربانی کردن اطلاعات مکانی و افزایش هزینه‌ی محاسباتی.

#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی_کانولوشنی #بینایی_کامپیوتر #کانولوشن_اتساعی #نکات_تخصصی_AI

@rss_ai_ir
😁13👍11🥰1110🔥9🎉9👏7
🔮 گوی بلورین هوش مصنوعی در کارخانه‌ها: خداحافظی با خرابی‌های ناگهانی!

در صنعت، یکی از بزرگترین کابوس‌ها، توقف خط تولید به خاطر خرابی یک دستگاه است. هر دقیقه توقف، یعنی میلیون‌ها تومان ضرر. به طور سنتی، دو رویکرد برای تعمیرات وجود داشت:

1. تعمیر پس از خرابی (Reactive): 👨‍🚒🔥 دستگاه خراب می‌شود، تولید متوقف می‌شود، تیم تعمیرات سراسیمه وارد عمل می‌شود. (پرهزینه و فاجعه‌بار!)
2. تعمیرات پیشگیرانه (Preventive): 📅🔧 تعویض قطعات بر اساس یک برنامه زمانی ثابت (مثلاً هر ۶ ماه). (بهتر است، اما اغلب قطعات سالم را دور می‌ریزیم و جلوی خرابی‌های غیرمنتظره را هم نمی‌گیرد.)

اما هوش مصنوعی یک راه حل سوم و هوشمندانه‌تر را به ارمغان آورده است: نگهداری و تعمیرات پیش‌بینانه (Predictive Maintenance).

⛔️ این جادو چطور کار می‌کند؟ 🧠⚙️

ایده اصلی: به جای حدس زدن، پیش‌بینی دقیق کنیم که یک دستگاه *دقیقاً کِی* و *چرا* در شرف خرابی است.

این فرآیند در چند مرحله انجام می‌شود:

۱. جمع‌آوری داده‌ها (Data Collection): 📶
سنسورهای اینترنت اشیا (IoT) روی تجهیزات حیاتی نصب می‌شوند. این سنسورها به طور مداوم داده‌هایی مثل:
* دما 🌡
* لرزش (Vibration)
* صدا 🔊
* فشار
* مصرف برق
* و...
را جمع‌آوری می‌کنند.

۲. یادگیری الگوها (Pattern Recognition): 🤖
الگوریتم‌های یادگیری ماشین (Machine Learning) با تحلیل این حجم عظیم از داده‌ها، "امضای عملکرد نرمال" هر دستگاه را یاد می‌گیرند. آن‌ها همچنین الگوهای بسیار ظریفی را که معمولاً قبل از وقوع خرابی رخ می‌دهند، شناسایی می‌کنند. (مثلاً یک تغییر جزئی در الگوی لرزش یا افزایش نامحسوس دما).

۳. پیش‌بینی و هشدار (Prediction & Alert): 🚨
مدل هوش مصنوعی به محض اینکه تشخیص دهد داده‌های لحظه‌ای دستگاه از الگوی نرمال خارج شده و به سمت یک الگوی خرابی در حال حرکت است، یک هشدار به تیم فنی ارسال می‌کند. این هشدار فقط نمی‌گوید "دستگاه در خطر است"، بلکه اغلب می‌تواند نوع خرابی احتمالی و زمان باقی‌مانده تا وقوع آن را نیز تخمین بزند.

مثال واقعی: ✈️
موتورهای جت هواپیما هزاران سنسور دارند. هوش مصنوعی داده‌های این سنسورها را تحلیل کرده و قبل از اینکه یک نقص کوچک به یک مشکل فاجعه‌بار در حین پرواز تبدیل شود، به مهندسان روی زمین هشدار می‌دهد تا تعمیرات لازم را برنامه‌ریزی کنند.

مزایای کلیدی:
کاهش چشمگیر توقف تولید (حتی تا ۵۰٪)
کاهش هزینه‌های تعمیرات (تعویض قطعه در زمان مناسب)
افزایش ایمنی برای کارکنان و محیط زیست
افزایش عمر مفید تجهیزات

نتیجه‌گیری:
نگهداری و تعمیرات پیش‌بینانه فقط یک ابزار نیست؛ بلکه یک تغییر پارادایم از یک رویکرد واکنشی و پرهزینه به یک فرهنگ داده‌محور، هوشمند و پیش‌فعال در قلب صنعت است.

#هوش_مصنوعی #صنعت_هوشمند #نگهداری_و_تعمیرات_پیشبینانه #اینترنت_اشیا #یادگیری_ماشین #صنعت_چهارم #تحول_دیجیتال
#AIinIndustry #PredictiveMaintenance #PdM #Industry40 #IoT #MachineLearning
👏15🥰14🔥1210👍9😁9🎉8🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
یک جهش کوانتومی در حرکت ربات‌ها! 🤖 Boston Dynamics چگونه با شبکه‌های عصبی سرتاسری (End-to-End) راه رفتن را از نو تعریف می‌کند؟

همه ما ویدیوهای شگفت‌انگیز ربات‌های Boston Dynamics را دیده‌ایم که می‌دوند، می‌پرند و حتی پشتک می‌زنند! اما راز این همه چابکی و تعادل شبیه به موجودات زنده چیست؟

❇️اخیراً، این شرکت رویکرد خود را برای کنترل ربات‌هایش متحول کرده است. آن‌ها از روش‌های مهندسی سنتی فاصله گرفته و به سمت شبکه‌های عصبی سرتاسری (End-to-End Neural Networks) حرکت کرده‌اند. بیایید ببینیم این یعنی چه.

💡 نکات کلیدی این تحول بزرگ:

1. رویکرد سنتی (مبتنی بر مدل):
در گذشته، مهندسان باید تمام فیزیک ربات، نحوه حرکت مفاصل، مرکز ثقل و نحوه تعامل با محیط را به صورت معادلات پیچیده ریاضی مدل‌سازی می‌کردند. ربات برای هر حرکتی، این مدل‌ها را محاسبه می‌کرد. این روش قدرتمند اما شکننده بود و در محیط‌های پیش‌بینی‌نشده دچار مشکل می‌شد.

2. رویکرد جدید (یادگیری سرتاسری - End-to-End):
در این روش انقلابی، به جای نوشتن قوانین صریح، یک شبکه عصبی عمیق عظیم ساخته می‌شود.
ورودی: داده‌های خام از حسگرهای ربات (مثل تصاویر دوربین، وضعیت مفاصل، شتاب‌سنج‌ها).
خروجی: دستورات مستقیم برای موتورهای ربات (مثلاً چقدر هر مفصل را حرکت بده).
تمام فرآیند از "دیدن" تا "عمل کردن" در یک شبکه یکپارچه اتفاق می‌افتد.

3. چگونه ربات یاد می‌گیرد؟ از طریق آزمون و خطا در دنیای مجازی!
این شبکه عصبی در یک محیط شبیه‌سازی شده (Simulation) بسیار دقیق، میلیون‌ها بار راه رفتن، دویدن و افتادن را تجربه می‌کند! با هر بار موفقیت یا شکست، شبکه خودش را اصلاح می‌کند (فرآیندی شبیه به یادگیری تقویتی). پس از هزاران سال تجربه مجازی (که در چند ساعت در دنیای واقعی اتفاق می‌افتد)، دانش به دست آمده به ربات واقعی منتقل می‌شود.

4. نتیجه: چابکی و انعطاف‌پذیری باورنکردنی!
نتیجه این است که ربات، مانند یک حیوان، یک "درک شهودی" از حرکت پیدا می‌کند. می‌تواند روی سطوح ناهموار راه برود، از لغزش‌ها به سرعت خودش را بازیابی کند و در موقعیت‌هایی که هرگز برایش برنامه‌ریزی نشده، واکنش مناسب نشان دهد. این دیگر فقط دنبال کردن دستورات نیست؛ بلکه یادگیری یک مهارت است.

🚀 این تغییر از "برنامه‌نویسی ربات" به "آموزش دادن به ربات" یک گام بنیادی به سوی ساخت ماشین‌هایی است که می‌توانند به طور مستقل و ایمن در دنیای پیچیده و غیرقابل پیش‌بینی ما انسان‌ها عمل کنند.


#هوش_مصنوعی #رباتیک #بوستون_داینامیکس #یادگیری_عمیق #شبکه_عصبی #کنترل_ربات #یادگیری_تقویتی #آینده_فناوری
#BostonDynamics #Robotics #DeepLearning #NeuralNetworks #EndToEndLearning #AI
9👍8🔥7😁7🥰6👏6🎉6🙏1
🎮 Mirage 2 — موتور تولید دنیای ژنراتیو

نسخه دوم Mirage تنها یک ماه پس از نسخه اول عرضه شد و حالا به‌صورت آنلاین و قابل بازی در دسترس است.

با Mirage 2 می‌توانید:

♻️تصاویر دلخواه خود (از طراحی‌های سایبرپانک تا نقاشی‌های کودکانه) را بارگذاری کنید.
♻️دنیای بازی بسازید و در همان لحظه در آن بازی کنید.
♻️جهان ساخته‌شده را تغییر دهید و با دوستانتان به اشتراک بگذارید.


🔫 تفاوت مهم با Genie 3 (که در پوستر رسمی هم به آن طعنه زده‌اند) این است که Mirage 2 فقط «راه‌رَوی» نیست، بلکه مکانیک‌های شوتر و تعامل پیچیده‌تر با محیط هم دارد.

📌 به گفته توسعه‌دهندگان:
«اگر Mirage 1 ظرفیت خام یک مدل دنیاساز به سبک GTA را نشان داد، Mirage 2 یک جهش عظیم به جلوست — مدلی برای ساخت جهان‌های عمومی که اجازه می‌دهد همزمان خلق کنید، بازی کنید و در لحظه تغییر دهید.»

🔗 جزئیات بیشتر: Dynamics Lab Blog

@rss_ai_ir
#هوش_مصنوعی #بازی_ژنراتیو #Mirage #AIgaming #GameTech
👏14👍12🔥10😁109🥰6🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
🎲 دنیای بازی‌های متنی دوباره زنده شد، این بار با کمک Runway Game Worlds و تصویرسازی هوش مصنوعی.

🔹 در این تجربه تازه، کافی است یک پرامپت بنویسید تا بازی نه‌تنها واکنش متنی نشان دهد، بلکه همزمان یک تصویر از همان صحنه بسازد.
🔹 روایت‌ها کاملاً غیرخطی هستند؛ یعنی هر بار داستان، شخصیت‌ها و مسیر متفاوتی خواهید داشت.
🔹 می‌توانید از سناریوهای آماده استفاده کنید یا حتی بازی متنی اختصاصی خودتان را بسازید.

نتیجه چیزی شبیه کمیک تعاملی + بازی رومیزی دیجیتال است، جایی که تخیل شما با تصویرسازی لحظه‌ای جایگزین می‌شود.

🔗 نسخه بتا را می‌توانید اینجا امتحان کنید: Runway Game Worlds

@rss_ai_ir
#هوش_مصنوعی #بازی_ژنراتیو #Runway #GameWorlds #AIgaming
👍7👏7🎉6🔥43🥰3😁3
🔥 پر سر و صداترین مقاله ماه: Hierarchical Reasoning Model (HRM)

بدون مقدمه، بریم سر اصل ماجرا:
محققان مدلی با تنها ۲۷ میلیون پارامتر ساخته‌اند که روی بِنچمارک ARC-AGI-1 حتی از o3-mini بهتر عمل کرده. همین باعث شده کل جامعه تحقیقاتی در موردش صحبت کنن؛ حتی خود تیم ARC-AGI یک تحلیل مفصل از نتایج این مدل منتشر کرده.


---

🧩 ایده اصلی

معماری HRM شامل دو ماژول بازگشتی است:

یک ماژول سریع و سطح پایین → حل محلی و جزیی مسائل.

یک ماژول کندتر و سطح بالا → مدیریت انتزاعی و دادن تسک به ماژول پایین.


🔄 نکته کلیدی اینه که این دو ماژول با فرکانس‌های متفاوت آپدیت می‌شن:

♻️ماژول بالا در هر چرخه فقط یک بار آپدیت می‌شه.
♻️ماژول پایین در همون چرخه چندین بار قدم‌های کوچک محاسباتی برمی‌داره.
♻️به این ترتیب، مدل می‌تونه یک مسئله رو به چرخه‌های استدلالی بشکنه و همزمان هم تصویر کلان رو نگه داره، هم جزئیات محلی رو حل کنه.


---

🛠️ یادگیری

مدل با کمک RL یاد می‌گیره که چه زمانی باید متوقف بشه یا ادامه بده. پس می‌تونه بعضی وقت‌ها فقط چند ثانیه فکر کنه و بعضی وقت‌ها چند ساعت!

برای آموزش هم برخلاف مدل‌های RNN کلاسیک، فقط گرادیان حالت نهایی رو نگه می‌دارن و نه همه حالت‌های میانی. نتیجه؟ ساده‌تر، سبک‌تر و در کمال تعجب کاملاً کارآمد.


---

🧠 شباهت به مغز انسان


این معماری خیلی شبیه کارکرد مغزه:

♻️بعضی بخش‌ها مسئول انتزاع و بعضی مسئول واکنش سریع هستن.
♻️ارتباط بین این بخش‌ها از طریق فیدبک‌های سلسله‌مراتبی انجام می‌شه.
♻️حتی مغز هم حالت‌های میانی رو ذخیره نمی‌کنه، بلکه به‌تدریج از چرخه‌های موجی به سمت همگرایی می‌ره.

---

📊 نتیجه

♻️برای مدلی به این کوچکی، عملکردش در حل پازل‌ها، سودوکو، مازها و مسائل استقرایی بی‌سابقه است.
♻️جایی که LLMهای معمولی شکست می‌خورن، HRM موفق ظاهر می‌شه.
♻️و البته اوج ماجرا، رکورد روی ARC-AGI است.


---

📖 مقاله کامل: [Arxiv / HRM Paper]
📌 تحلیل عالی به زبان روسی هم موجوده (لینک در متن اصلی).

@rss_ai_ir

#هوش_مصنوعی #یادگیری_عمیق #AGI #شبکه_عصبی #ARC_AGI
🎉8😁74👍4🥰4🔥2👏2
This media is not supported in your browser
VIEW IN TELEGRAM
فرود ایمن و بدون دردسر پهپادها، حتی در حال حرکت! ✈️ آیا این پایان نیاز به باند فرود است؟

همه ما می‌دانیم که فرود آوردن یک پهپاد، به‌خصوص پهپادهای بال-ثابت (Fixed-wing) که به سرعت و یک مسیر مشخص برای فرود نیاز دارند، چقدر می‌تواند چالش‌برانگیز باشد. حالا تصور کنید بتوانید یک پهپاد را در هر مکانی، حتی از روی یک وسیله نقلیه در حال حرکت، به صورت آنی و ایمن “شکار” کنید!

این ویدیو دقیقاً همین فناوری شگفت‌انگیز را به نمایش می‌گذارد: یک سیستم بازیابی هوایی (Aerial Recovery System).

💡 این سیستم چگونه کار می‌کند؟
این فناوری که توسط شرکت‌هایی مانند Drone Catcher یا Sky-Drones توسعه داده شده، یک راه‌حل مکانیکی-هوشمند برای گرفتن پهپادها در آسمان است:

یک تور غول‌پیکر و هوشمند: سیستم اصلی یک ساختار شبیه به یک دروازه است که یک تور محکم و انعطاف‌پذیر روی آن کشیده شده است. این سیستم می‌تواند ثابت باشد یا روی یک وسیله نقلیه نصب شود.

هدایت دقیق به سمت هدف: پهپاد با استفاده از سیستم‌های ناوبری دقیق خود (مانند GPS یا بینایی کامپیوتر) به سمت مرکز این تور هدایت می‌شود. این فرآیند می‌تواند کاملاً خودکار باشد.

برخورد و قفل شدن: به محض برخورد پهپاد با تور، مکانیزم‌های خاصی (در این ویدیو پین‌هایی دیده می‌شود) فعال شده و بال‌های پهپاد را به تور قفل می‌کنند. این کار از بازگشت (rebound) یا آسیب دیدن پهپاد جلوگیری کرده و آن را بلافاصله متوقف می‌کند


#فناوری #پهپاد #نوآوری #هوافضا #رباتیک #تکنولوژی_نظامی #لجستیک_هوشمند
@rss_ai_ir
#Technology #Drone #Innovation #UAV #Robotics #AerialRecovery
🔥10😁7🥰4🎉4👏32👍1
در روش «یادگیری تقویتی با بازخورد انسانی» (RLHF) برای بهبود مدل‌های زبانی بزرگ، مهم‌ترین مرحله آغازین چیست؟
Anonymous Quiz
23%
آموزش اولیه مدل با داده‌های مصنوعی
69%
جمع‌آوری پاسخ‌های انسانی و امتیازدهی به آن‌ها
8%
کاهش تعداد لایه‌های مدل
0%
استفاده مستقیم از مدل پایه بدون تغییر
📌 عنوان:
چرا دراپ‌اوت فقط یک «خاموش‌کننده تصادفی» نیست؟ 🤔🔍

---

بیشتر متخصصان هوش مصنوعی، دراپ‌اوت را صرفاً روشی برای خاموش کردن تصادفی نرون‌ها می‌دانند، اما پشت این تکنیک ایده‌ای عمیق‌تر وجود دارد که آن را به یکی از مهم‌ترین روش‌های منظم‌سازی (Regularization) تبدیل کرده است.

💡 ایده اصلی
در مراحل آموزش، هر بار درصدی از نرون‌ها (مثلاً ۲۰ تا ۵۰٪) به طور تصادفی غیرفعال می‌شوند. این کار جلوی وابستگی بیش‌ازحد شبکه به مسیرهای خاص پردازش اطلاعات را می‌گیرد.

🌀 اثر پنهان
دراپ‌اوت در عمل شبیه ترکیب‌گیری مدل‌ها (Ensemble) عمل می‌کند. با هر بار غیرفعال شدن بخشی از نرون‌ها، یک زیرمدل جدید ساخته می‌شود و در نهایت، خروجی مدل مانند میانگین‌گیری از هزاران زیرمدل مستقل خواهد بود.

🚀 چرا اهمیت دارد؟
- کاهش شدید بیش‌برازش (Overfitting) بدون نیاز به داده اضافه
- ایجاد تعداد زیادی مدل کوچک در دل یک مدل اصلی بدون هزینه‌ی جداگانه
- سازگاری فوق‌العاده با معماری‌های پیشرفته مثل ترنسفورمرها

⚙️ نکته تخصصی
در هنگام تست، دراپ‌اوت غیرفعال است اما وزن‌ها با توجه به احتمال غیرفعال‌سازی، مقیاس‌بندی (Re-scaling) می‌شوند تا خروجی سازگار باقی بماند.

---

🔖 #هوش_مصنوعی #یادگیری_عمیق #LLM #شبکه_عصبی #دراپ_اوت #DeepLearning #AI #MachineLearning
@rss_ai_ir
📚 پرامپت‌هایی برای یادگیری ۱۰ برابر سریع‌تر
@rss_ai_ir

🔸 اگر می‌خواهی هر موضوعی رو سریع‌تر و عمیق‌تر یاد بگیری، این تکنیک‌های پرسشی رو امتحان کن:

مثل ۵ ساله توضیح بده
موضوع رو ساده کن، انگار برای یه کودک می‌گی.

فرآیند رو تجسم کن
یه نقشه ذهنی یا گام‌به‌گام از نحوه کار موضوع بساز.

تکه‌تکه کن
موضوع رو به ۳–۵ بخش اصلی تقسیم کن و هرکدوم رو جدا توضیح بده.

الگوها رو پیدا کن
فرمول‌ها یا قواعد تکرارشونده‌ای که باعث ماندگاری بهتر در حافظه می‌شن.

تشبیه بساز
موضوع رو با چیزی آشنا یا ملموس مقایسه کن.

باورها رو بشکن
سه تصور غلط رایج درباره موضوع رو بررسی کن و واقعیتش رو بگو.

به زندگی ربط بده
ببین موضوع چطور توی زندگی روزمره یا موقعیت واقعی به کار میاد.

یاد بده
طوری یاد بگیر که بتونی به کسی که هیچ اطلاعی نداره، آموزش بدی.

چرای انتقادی بپرس
این موضوع چرا مهمه؟ پیامدهاش در حوزه مربوطه چیه؟

تمرین یا شبیه‌سازی کن
یه مثال یا سناریوی عملی برای اجراش بساز.

داستانش کن
یه سناریو یا قصه کوتاه درباره کاربرد موضوع بنویس.

به چالش بکش
اشتباهات و سوءبرداشت‌های رایج رو بشناس و راه اجتناب از اون‌ها رو پیدا کن.

اولویت بده
روی ۲ یا ۳ مفهوم کلیدی موضوع تمرکز کن.

شکاف‌ها رو پیدا کن
کدوم بخش‌های موضوع معمولاً نادیده گرفته می‌شن ولی برای فهمیدن ضروری هستن؟


---

🧠 با این ۱۴ تکنیک، هر موضوعی رو سریع‌تر، عمیق‌تر و ماندگارتر یاد می‌گیری.

#یادگیری #مطالعه #روش_یادگیری #پرامپت #هوش_مصنوعی
@rss_ai_ir
3👍1🔥1
📌 معرفی جایگزین‌های رایگان برای ابزارهای پولی
@rss_ai_ir

اگر نمی‌خوای هزینه زیادی برای نرم‌افزارها و سرویس‌های پولی بدی، می‌تونی از این جایگزین‌های رایگان استفاده کنی 👇

🔹 ویرایش تصویر
فتوشاپ → GIMP

🔹 ایده تولید محتوا
BuzzSumo → Answer Socrates

🔹 ویرایش ویدئو
Premiere Pro → DaVinci Resolve

🔹 مدیریت پروژه
ClickUp → Trello

🔹 ایمیل مارکتینگ
Mailchimp → Sender

🔹 تبدیل متن به ویدئو
Pictory → RunwayML

🔹 تولید تصویر با هوش مصنوعی
Midjourney → Adobe Firefly

🔹 چت‌بات هوش مصنوعی
GPT-4 → Hugging Chat

🔹 سلامت و روان
Talkspace → Woebot

🔹 مارکتینگ
HubSpot → Beacons.ai

🔹 وب‌سایت‌سازی
Webflow → Wordpress.org

🔹 سئو (SEO)
SE Ranking → Ubersuggest

🔹 تبدیل متن به صدا (Voice Over)
MurfAI → Speechify

🔹 کمک‌نویسندگی
Grammarly Premium → Quillbot

🔹 مدیریت مالی
Quicken → Mint

🔹 بهره‌وری (Productivity)
Notion → Trello

🔹 فروش و CRM
Salesforce → HubSpot CRM

🔹 طراحی گرافیک
Illustrator → Inkscape


---

💡 با این ابزارها می‌تونی بدون هزینه زیاد، کارایی مشابه نسخه‌های پولی رو تجربه کنی.

#نرم‌افزار #هوش_مصنوعی #رایگان #کاربردی
@rss_ai_ir
4👍1👏1
📌 عنوان:
نقشه حرارتی نقص‌ها در پردازش تصویر صنعتی 🔍📷

---

در سامانه‌های بینایی ماشین صنعتی (Machine Vision)، یکی از روش‌های پیشرفته برای شناسایی نقص‌های بسیار ریز در قطعات، استفاده از نقشه‌های حرارتی (Heatmaps) حاصل از شبکه‌های عصبی کانولوشنی (CNN) است.

این نقشه‌ها نقاطی از تصویر را که بیشترین میزان توجه مدل را جلب کرده‌اند پررنگ‌تر نشان می‌دهند.

⚙️ چرا مهم است؟
- امکان شناسایی نقص‌های بسیار کوچک‌تر از ۱ میلی‌متر 📏
- کمک به اپراتور برای تفسیر تصمیم مدل
- بهبود خط تولید با تعیین دقیق موقعیت مشکل روی قطعه

📌 نکته تخصصی:
در بسیاری از خطوط تولید، از روش Grad-CAM++ برای تولید این نقشه‌های حرارتی استفاده می‌شود، زیرا توانایی بالاتری در محلی‌سازی نقص‌ها حتی در پس‌زمینه‌های پیچیده دارد.

---

🔖 #پردازش_تصویر #بینایی_ماشین #صنعت #هوش_مصنوعی #بینایی_کامپیوتر #Inspection #DeepLearning #AI
@rss_ai_ir
1👍1👏1