VIRSUN
15.6K subscribers
374 photos
225 videos
2 files
230 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
📈 حباب یا تحول واقعی؟

🔹 سم آلتمن، مدیرعامل OpenAI، به‌تازگی گفت ممکنه هوش مصنوعی هم درگیر یک حباب سرمایه‌گذاری شده باشه — درست مثل دات‌کام‌های دهه ۹۰ میلادی. اون زمان بورس نزدک در کمتر از دو سال تقریباً ۸۰٪ سقوط کرد و خیلی از شرکت‌ها هیچ‌وقت به سوددهی نرسیدن.

🧩 به گفته آلتمن:
«حباب وقتی شکل می‌گیره که آدم‌های باهوش بیش‌ازحد مجذوب یک ایده خوب می‌شن. آیا الان در فاز هیجان‌زدگی بیش‌ازحد نسبت به AI هستیم؟ به‌نظرم بله. اما آیا AI همچنان بزرگ‌ترین اتفاق تاریخ معاصر به حساب میاد؟ به‌نظرم باز هم بله.»

📊 طبق گزارش تورستن اسلوک (اقتصاددان مشهور وال‌استریت)، اگر واقعا حبابی باشه، همین حالا هم از حباب اینترنتی بزرگ‌تره. نسبت قیمت به سود مورد انتظار (Forward P/E) برای ۱۰ شرکت برتر AI امروز خیلی بالاتره از اوج دات‌کام‌ها. (نمودار بالا)

🤔 حالا سؤال: اگر واقعا در دل یک حبابیم، کدوم استارتاپ‌ها می‌تونن بعد از ترکیدن حباب هم زنده بمونن؟

@rss_ai_ir

#هوش_مصنوعی #اقتصاد #استارتاپ #سرمایه‌گذاری #بازارهای_مالی
15🔥14👏12👍8🥰8😁8🎉8
🧠 یک نکته مهم در شبکه‌های عصبی گرافی (GNN)

در GNNها، یکی از چالش‌های اساسی پدیده‌ی over-smoothing است. یعنی وقتی تعداد لایه‌ها زیاد می‌شود، بردارهای ویژگی نودها به مرور شبیه هم می‌شوند و گراف اطلاعات تمایزی خود را از دست می‌دهد.

🔹 چرا این اتفاق می‌افتد؟
چون در هر لایه، گره‌ها ویژگی‌های همسایه‌هایشان را جمع می‌کنند. اگر این کار چندین بار تکرار شود، همه گره‌ها به سمت یک نمایش یکنواخت همگرا می‌شوند.

🔹 راهکارها:

1. استفاده از residual connections یا skip connections برای حفظ اطلاعات اولیه.


2. به‌کارگیری attention mechanisms (مثل GAT) تا وزن همسایه‌ها یکسان نباشد.


3. محدود کردن عمق شبکه و استفاده از shallow GNN همراه با تکنیک‌های regularization.


4. استفاده از روش‌های جدید مثل GraphSAGE یا Jumping Knowledge Networks.



📌 پس اگر دیدید مدلتان با افزایش لایه‌ها به جای بهبود، دچار افت عملکرد می‌شود، احتمالاً با over-smoothing طرف هستید.

@rss_ai_ir

#هوش_مصنوعی #شبکه_عصبی #GraphNeuralNetwork #یادگیری_عمیق
🥰13😁13👍12🎉1210👏10🔥7
📌 ۲۰ مفهوم کلیدی برای درک AI Agents

اگر می‌خواهید بهتر بفهمید ایجنت‌های هوش مصنوعی چطور عمل می‌کنند، این ۲۰ مفهوم پایه‌ای ضروری‌اند:

1️⃣ Agent: موجود خودمختار که ادراک می‌کند، تصمیم می‌گیرد و عمل می‌کند.
2️⃣ Environment: محیط یا کانتکستی که ایجنت در آن کار می‌کند.
3️⃣ Perception: دریافت و تفسیر داده‌های محیطی.
4️⃣ State: وضعیت یا نمای داخلی فعلی ایجنت از جهان.
5️⃣ Memory: ذخیره اطلاعات برای یادگیری و تداوم.
6️⃣ Large Language Models: مدل‌های زبانی قدرتمند (مثل GPT، PaLM) برای فهم و تولید زبان.
7️⃣ Reflex Agent: ایجنت واکنشی که بر اساس قوانین شرط-عمل کار می‌کند.
8️⃣ Knowledge Base: پایگاه داده ساختاریافته یا غیرساختاریافته برای تصمیم‌گیری.
9️⃣ Chain of Thought (CoT): روش استدلال مرحله به مرحله.
🔟 ReAct: چارچوبی که استدلال و عمل را ترکیب می‌کند.
1️⃣1️⃣ Tools: ابزارها یا APIها برای افزایش توانایی ایجنت.
1️⃣2️⃣ Action: هر کار یا رفتاری که ایجنت انجام می‌دهد.
1️⃣3️⃣ Planning: طراحی دنباله‌ای از اقدامات برای رسیدن به هدف.
1️⃣4️⃣ Orchestration: هماهنگی بین چند مرحله، ابزار یا ایجنت.
1️⃣5️⃣ Handoffs: انتقال وظایف بین ایجنت‌ها.
1️⃣6️⃣ Multi-Agent System: همکاری چند ایجنت در یک محیط مشترک.
1️⃣7️⃣ Swarm: رفتار هوشمند جمعی بدون مرکز کنترل.
1️⃣8️⃣ Agent Debate: بحث و جدل بین ایجنت‌ها برای رسیدن به پاسخ بهتر.
1️⃣9️⃣ Evaluation: سنجش عملکرد ایجنت.
2️⃣0️⃣ Learning Loop: چرخه یادگیری پیوسته از بازخوردها.

🧩 این مفاهیم پایه درک شما از ایجنت‌های هوشمند نسل جدید را کامل می‌کند و نشان می‌دهد چطور سیستم‌های هوش مصنوعی می‌توانند یاد بگیرند، همکاری کنند و تصمیم بگیرند.

@rss_ai_ir

#هوش_مصنوعی #AI_Agent #یادگیری_عمیق #شبکه_عصبی
🔥12😁12🥰11👏107👍7🎉7
This media is not supported in your browser
VIEW IN TELEGRAM
📌 دامنه‌برداری (Domain Adaptation) در یادگیری ماشین

یکی از چالش‌های اصلی در هوش مصنوعی اینه که مدلی که روی یک دامنه (Domain) آموزش دیده، معمولاً روی دامنه‌های دیگه عملکرد خوبی نداره. به این مشکل می‌گن Domain Shift.

✦ مثلا:
🔹 مدلی که برای تشخیص عیب روی کاتدهای مس در یک کارخانه آموزش دیده، وقتی روی تصاویر کارخانه دیگه استفاده میشه (با نور، زاویه دوربین یا کیفیت متفاوت)، دچار افت دقت میشه.

اینجا Domain Adaptation وارد میشه 👇

🎯 تعریف:

فرآیندی که در اون یک مدل آموزش‌دیده روی دامنه مبدأ (Source Domain)، برای عملکرد بهتر روی دامنه مقصد (Target Domain) تطبیق داده میشه، بدون نیاز به برچسب‌گذاری گسترده روی داده‌های مقصد.

🔑 رویکردهای اصلی:

1. Feature Alignment

تطبیق توزیع ویژگی‌های مبدأ و مقصد با تکنیک‌هایی مثل MMD (Maximum Mean Discrepancy) یا CORAL.



2. Adversarial Learning

استفاده از شبکه‌های خصمانه (GAN) برای یادگیری نمایش مشترک بین دو دامنه.



3. Self-Training / Pseudo-Labeling

مدل روی داده مقصد پیش‌بینی می‌کنه و برچسب‌های احتمالی به‌صورت شبه‌برچسب برای یادگیری دوباره استفاده میشه.



4. Domain-Invariant Features

یادگیری ویژگی‌هایی که به دامنه وابسته نیستن و در هر دو محیط پایدار عمل می‌کنن.




🏭 کاربردهای صنعتی:

♻️پردازش تصویر: تشخیص عیب در خطوط تولید مختلف.
♻️پزشکی: مدلی که روی داده‌های MRI یک دستگاه آموزش دیده، روی دستگاه دیگه هم کار کنه.
♻️خودروهای خودران: انتقال یادگیری از شبیه‌ساز به دنیای واقعی.


خلاصه:
عبارت Domain Adaptation یعنی مدل رو طوری آموزش بدیم که انعطاف‌پذیر بشه و در محیط‌های جدید هم جواب بده، بدون اینکه لازم باشه از صفر دوباره داده‌گذاری کنیم.

@rss_ai_ir

#DomainAdaptation #MachineLearning #TransferLearning #هوش_مصنوعی
👍18🎉1612🥰12🔥11😁11👏10
Media is too big
VIEW IN TELEGRAM
🏁 مسابقه‌ی ۱۰۰ متر، مهم‌ترین رویداد در مسابقات جهانی ربات‌های انسان‌نما بود.

🤖 ربات Tiangong در خط پایان سوم شد، اما چون به‌صورت کاملاً خودمختار (Autonomous) عمل می‌کرد، ضریب ۰.۸ روی زمانش اعمال شد و در نهایت مدال طلا 🥇 گرفت.

در مقابل، ربات Unitree که با کنترل از راه دور تنها ۲۲.۰۸ ثانیه دوید و اول به خط رسید، مدال نقره 🥈 را به‌دست آورد.

🔬 ربات Tiangong توسط یک مرکز نوآوری دولتی در پکن توسعه داده شده است.

@rss_ai_ir
🎉16🔥12👏9😁8👍7🥰74🙏1
در یک لایه کانولوشن (Convolutional Layer) در CNN، استفاده از فیلترهای کوچک‌تر (مثل 3×3 به جای 7×7) چه مزیت اصلی دارد؟
Anonymous Quiz
5%
کاهش Overfitting از طریق Dropout خودکار
41%
افزایش تعداد پارامترها و دقت شبکه.
50%
کاهش تعداد پارامترها و افزایش عمق شبکه برای استخراج ویژگی‌های پیچیده‌تر
5%
حذف نیاز به لایه Pooling.
🔥15👍13👏108🥰8😁8🎉6
🔑 قانون «توقف روی صفر ممنوع»

در پروژه‌های هوش مصنوعی و رباتیک، خیلی وقت‌ها نتیجه‌ی نهایی اون چیزی نیست که انتظار داریم. مثلا:

♻️مدلی که فقط ۵۰٪ دقت داره.
♻️رباتی که تا نیمه‌ی مسیر می‌ره ولی نمی‌تونه کامل برگرده.
♻️الگوریتمی که سرعتش پایینه اما همچنان از حد تصادف بهتره.


اینجا اصل مهم اینه که هیچ‌وقت روی صفر توقف نکنیم. یعنی حتی اگر به هدف کامل نرسیدیم، همون پیشرفت کوچک یک دارایی ارزشمند محسوب میشه.

مدلی که از ۰ به ۵۰٪ دقت رسیده، پایه‌ای برای رسیدن به ۹۰٪ه.
رباتی که نیمه‌ی مسیر رو طی کرده، داده و تجربه‌ی واقعی برای بهبود کنترل ایجاد کرده.
شکست‌ها فقط زمانی بی‌ارزش میشن که روی صفر متوقف بشیم.

پس در علم و صنعت، اصل «توقف روی صفر ممنوع» یعنی: هر حرکت غیر صفر، یک گام به جلوست 🚀

@rss_ai_ir 🪙 | اصل رشد تدریجی
👍17🎉14🥰1311🔥10👏10😁6
🚀 متا با هوش مصنوعی، زبان ویدئوها را حذف می‌کند!

این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفت‌انگیز رونمایی کرد که می‌تواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!

این قابلیت دقیقاً چه کاری انجام می‌دهد؟

تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:

۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه می‌کند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمه‌شده تولید می‌کند که جایگزین صدای اصلی می‌شود.
۳. هماهنگ‌سازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری می‌تواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبله‌شده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت می‌کرده است!

چرا این خبر اینقدر مهم است؟

✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما می‌تواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسی‌پذیری: افرادی که با زبان‌های دیگر مشکل دارند یا کم‌شنوا هستند، می‌توانند از محتوای بیشتری بهره‌مند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوق‌العاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.

⛔️ نگرانی‌ها و چالش‌ها

البته این فناوری چالش‌های خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.

نتیجه‌گیری:
این گام بزرگ متا نشان می‌دهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.

#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync
👏13😁13👍12🔥11🥰10🎉76
🏆 سرویس تازه مبتنی بر هوش مصنوعی برای صعود سایت به رتبه‌های برتر یاندکس

سرویس Seopapa با تکیه بر تحلیل و بهینه‌سازی عوامل رفتاری کاربران، امکان ارتقای جایگاه سایت شما در نتایج جستجوی یاندکس را فراهم می‌کند. در زمان تنظیم، می‌توانید کلیدواژه‌های هدف و موقعیت جغرافیایی (شهر، منطقه یا کل کشور) را انتخاب کنید.

📊 دستاوردهای مورد انتظار:

♻️افزایش رتبه سایت در نتایج جستجو
♻️رشد ترافیک ارگانیک
♻️بالا رفتن تعداد درخواست‌ها و فروش


🎁 پس از ثبت‌نام، یک اعتبار تستی ۱۵۰۰۰ روبلی دریافت می‌کنید تا بدون پیش‌پرداخت، نتایج اولیه را مشاهده کنید.

🔗 سرویس: Seopapa.com

@rss_ai_ir
#SEO #AI #یاندکس #دیجیتال_مارکتینگ #промо
14👏13🎉13😁10🔥9🥰4👍3
🌍 گوگل برای اولین بار آمار دقیقی از اثرات زیست‌محیطی مدل‌های هوش مصنوعی خود منتشر کرد.

🔹 هر درخواست متنی به Gemini مصرف می‌کند:
– حدود ۰.۲۴ وات انرژی (معادل ۹ ثانیه تماشای تلویزیون 📺)
– حدود ۰.۲۶ میلی‌لیتر آب (حدود ۵ قطره 💧)
– حدود ۰.۰۳ گرم CO₂ 🌫

این مقادیر کمتر از برآوردهایی است که پیش‌تر در منابع عمومی منتشر شده بود، زیرا گوگل همه‌چیز را حساب کرده: GPU، CPU، RAM، انرژی حالت آماده‌به‌کار و حتی سیستم‌های خنک‌سازی و زیرساخت دیتاسنتر.

جالب‌تر اینکه فقط در یک سال (مه ۲۰۲۴ تا مه ۲۰۲۵)، ردپای انرژی ۳۳ برابر و ردپای کربن ۴۴ برابر کاهش یافته. این موفقیت بیشتر به لطف طراحی اختصاصی چیپ‌ها، استفاده از انرژی تجدیدپذیر و دیتاسنترهای بهینه به دست آمده است.

📄 متن کامل گزارش (با امضای جف دین) اینجاست:
[PDF Report](https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf)

@rss_ai_ir
#هوش_مصنوعی #Google #پایداری #AI
🥰15👍1211😁11🔥8👏7🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ورود DLSS به بلندر!

در نمایشگاه SIGGRAPH 2025 قابلیت جدیدی معرفی شد: استفاده از DLSS (فناوری آپ‌اسکیلینگ هوشمند انویدیا که معمولا در بازی‌ها به کار می‌رود) حالا در وِیوپورت بلندر (Cycles) هم ممکن است.

🔹 چطور کار می‌کند؟
– صحنه ابتدا در رزولوشن پایین رندر می‌شود.
– سپس DLSS با کمک هوش مصنوعی تصویر را به رزولوشن بالا ارتقا می‌دهد.
– نتیجه نهایی تقریبا مشابه رندر کامل است و حتی در انیمیشن هم بدون پرش و نویز (temporal consistency) دیده می‌شود.

⚡️ مزایا:
– کیفیت بالا با مصرف کمتر منابع پردازشی
– افزایش سرعت و روانی وِیوپورت
– عالی برای پروژه‌های سنگین سه‌بعدی

📌 منبع: [Reddit](https://www.reddit.com/r/blender/comments/1mpqv25/blender_showcases_dlss_upscalingdenoising_at/)

@rss_ai_ir
#Blender #DLSS #هوش_مصنوعی #SIGGRAPH2025 #رندرینگ
👏2118🥰16🎉16🔥14😁13👍11
🚀 چطور AutoGLM-OS توانست از OpenAI و Anthropic جلو بزند؟

ایجاد یک عامل RL که بتواند به‌طور مستقل محیط دسکتاپ را کنترل کند، به‌نوعی جام مقدس در HCI به حساب می‌آید. اما GUIها برای انسان‌ها طراحی شده‌اند، نه ماشین‌ها، و مقیاس‌پذیری RL هم همیشه با مشکلاتی مثل ناکارایی و ناپایداری مواجه بوده است.

🔹 تیم Z.ai با معرفی فریم‌ورک COMPUTERRL توانست عامل AutoGLM-OS را بسازد که روی بِنچمارک OSWorld رکورد زد:
📊 ۴۸/۱٪ موفقیت – بالاتر از OpenAI CUA 03 (۴۲/۹٪)، UI-TARS-1.5 (۴۲/۵٪) و Claude 4.0 Sonnet (۳۰/۷٪).

📌 بنچمارک OSWorld چیست؟
یک بِنچمارک بزرگ با ۳۶۹ تسک روی Ubuntu، ویندوز و macOS.
اینجا هوش مصنوعی باید کارهای واقعی انجام دهد:

* کار با اپلیکیشن‌های دسکتاپ و وب 🌐
* مدیریت فایل‌ها 📂
* اجرای پروسس‌ها ⚙️
هر تسک شرایط اولیه و اسکریپت‌های ارزیابی استاندارد دارد تا نتایج قابل بازتولید باشند.

---

💡 سه نوآوری کلیدی که AutoGLM-OS را به SOTA رساند:

1️⃣ پارادایم جدید API-GUI
عامل می‌تواند بین تعامل GUI و فراخوانی‌های API سوییچ کند. جایی که API سریع‌تر است از آن استفاده می‌شود، و در کارهای عمومی GUI فعال می‌شود.
📈 نتیجه ابلیشن: افزایش نرخ موفقیت از ۱۱/۲٪ (GUI-only) به ۲۶/۲٪ (API-GUI).

2️⃣ زیرساخت RL توزیع‌شده و مقیاس‌پذیر

* استفاده از qemu-in-docker برای VMهای سبک ☁️
* ارتباط بین‌گرهی با gRPC 🔗
* فریم‌ورک کاملاً async به نام AgentRL ⚡️
این یعنی هزاران محیط موازی برای یادگیری آنلاین RL.

3️⃣ استراتژی آموزشی Entropulse

* رفع مشکل *entropy collapse*
* تناوب بین فازهای RL و SFT
* ایجاد دیتاست جدید از *trajectory*های موفق برای بهبود یادگیری اکتشافی
📈 پس از اولین فاز RL: ۴۲٪
📈 بعد از Entropulse: ۴۸/۱٪

---

📑 جزییات بیشتر: [Arxiv: 2508.14040](https://arxiv.org/pdf/2508.14040)
🌐 بِنچمارک: [OSWorld](https://os-world.github.io/)

@rss_ai_ir

#هوش_مصنوعی 🤖 #یادگیری_تقویتی #Agents #AutoGLM #OSWorld #Zai
19👏19🥰18😁17🎉14🔥13👍12
🧠 راز دید وسیع در شبکه‌های عصبی: با کانولوشن‌های اتساعی (Dilated) آشنا شوید!

همه ما می‌دانیم که شبکه‌های کانولوشنی (CNN) با دیدن الگوهای کوچک و ترکیب آن‌ها، ویژگی‌های پیچیده‌تر را یاد می‌گیرند. اما یک چالش بزرگ همیشه وجود دارد:

❇️چالش کلاسیک: چطور می‌توانیم “میدان دید” (Receptive Field) شبکه را بزرگ کنیم تا زمینه‌ی وسیع‌تری از تصویر را ببیند، بدون اینکه ابعاد نقشه ویژگی (Feature Map) را با لایه‌های Pooling کاهش دهیم و جزئیات مکانی را از دست بدهیم؟ 🤔

این مشکل مخصوصاً در کارهایی مثل بخش‌بندی معنایی (Semantic Segmentation) که به دقت پیکسلی نیاز داریم، حیاتی است.

❇️راه حل هوشمندانه: کانولوشن اتساعی (Dilated Convolution) 🕳
اینجا یک تکنیک زیبا و کارآمد به نام کانولوشن اتساعی یا Atrous Convolution (که از واژه فرانسوی “à trous” به معنی “حفره‌دار” گرفته شده) وارد میدان می‌شود.

ایده اصلی چیست؟

یک کانولوشن اتساعی، در واقع یک کانولوشن معمولی است که در فیلتر (Kernel) آن “حفره” ایجاد شده است. یعنی به جای اینکه وزن‌های فیلتر روی پیکسل‌های مجاور هم اعمال شوند، با یک فاصله مشخص (که به آن نرخ اتساع یا dilation rate می‌گویند) از هم قرار می‌گیرند.

Dilation Rate = 1: یک کانولوشن کاملاً معمولی.
Dilation Rate = 2: بین هر دو وزن فیلتر، یک پیکسل فاصله (حفره) وجود دارد.
این کار چه مزیتی دارد؟ 🚀

میدان دید بزرگتر با هزینه صفر: بدون اضافه کردن حتی یک پارامتر جدید به مدل، فیلتر ما می‌تواند ناحیه بسیار بزرگتری از ورودی را پوشش دهد. این یعنی درک بهتر از زمینه (context).
حفظ رزولوشن مکانی: چون از لایه‌های Pooling استفاده نمی‌کنیم، ابعاد نقشه ویژگی ثابت می‌ماند و جزئیات دقیق مکانی حفظ می‌شوند. این برای کارهایی که به مرزهای دقیق اشیاء نیاز دارند، عالی است.
به زبان ساده:

تصور کنید با دستتان به یک عکس نگاه می‌کنید. کانولوشن معمولی مثل نگاه کردن با انگشتان چسبیده به هم است. کانولوشن اتساعی مثل این است که انگشتانتان را از هم باز کنید تا ناحیه بزرگتری را بپوشانید، بدون اینکه تعداد انگشتانتان بیشتر شود! 🖐➡️

کاربرد کلیدی:

این تکنیک ستون فقرات معماری‌های معروفی مثل DeepLab برای بخش‌بندی معنایی تصاویر است. همچنین در مدل‌های تولید صوت مثل WaveNet برای درک وابستگی‌های بلندمدت در سیگنال صوتی استفاده شده است. 🔊🏙

نتیجه‌گیری:

کانولوشن اتساعی یک مثال عالی از تفکر هوشمندانه در طراحی شبکه‌های عمیق است: یک ابزار قدرتمند برای افزایش میدان دید بدون قربانی کردن اطلاعات مکانی و افزایش هزینه‌ی محاسباتی.

#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی_کانولوشنی #بینایی_کامپیوتر #کانولوشن_اتساعی #نکات_تخصصی_AI

@rss_ai_ir
😁1817👍16🎉16🥰14🔥11👏9
🔮 گوی بلورین هوش مصنوعی در کارخانه‌ها: خداحافظی با خرابی‌های ناگهانی!

در صنعت، یکی از بزرگترین کابوس‌ها، توقف خط تولید به خاطر خرابی یک دستگاه است. هر دقیقه توقف، یعنی میلیون‌ها تومان ضرر. به طور سنتی، دو رویکرد برای تعمیرات وجود داشت:

1. تعمیر پس از خرابی (Reactive): 👨‍🚒🔥 دستگاه خراب می‌شود، تولید متوقف می‌شود، تیم تعمیرات سراسیمه وارد عمل می‌شود. (پرهزینه و فاجعه‌بار!)
2. تعمیرات پیشگیرانه (Preventive): 📅🔧 تعویض قطعات بر اساس یک برنامه زمانی ثابت (مثلاً هر ۶ ماه). (بهتر است، اما اغلب قطعات سالم را دور می‌ریزیم و جلوی خرابی‌های غیرمنتظره را هم نمی‌گیرد.)

اما هوش مصنوعی یک راه حل سوم و هوشمندانه‌تر را به ارمغان آورده است: نگهداری و تعمیرات پیش‌بینانه (Predictive Maintenance).

⛔️ این جادو چطور کار می‌کند؟ 🧠⚙️

ایده اصلی: به جای حدس زدن، پیش‌بینی دقیق کنیم که یک دستگاه *دقیقاً کِی* و *چرا* در شرف خرابی است.

این فرآیند در چند مرحله انجام می‌شود:

۱. جمع‌آوری داده‌ها (Data Collection): 📶
سنسورهای اینترنت اشیا (IoT) روی تجهیزات حیاتی نصب می‌شوند. این سنسورها به طور مداوم داده‌هایی مثل:
* دما 🌡
* لرزش (Vibration)
* صدا 🔊
* فشار
* مصرف برق
* و...
را جمع‌آوری می‌کنند.

۲. یادگیری الگوها (Pattern Recognition): 🤖
الگوریتم‌های یادگیری ماشین (Machine Learning) با تحلیل این حجم عظیم از داده‌ها، "امضای عملکرد نرمال" هر دستگاه را یاد می‌گیرند. آن‌ها همچنین الگوهای بسیار ظریفی را که معمولاً قبل از وقوع خرابی رخ می‌دهند، شناسایی می‌کنند. (مثلاً یک تغییر جزئی در الگوی لرزش یا افزایش نامحسوس دما).

۳. پیش‌بینی و هشدار (Prediction & Alert): 🚨
مدل هوش مصنوعی به محض اینکه تشخیص دهد داده‌های لحظه‌ای دستگاه از الگوی نرمال خارج شده و به سمت یک الگوی خرابی در حال حرکت است، یک هشدار به تیم فنی ارسال می‌کند. این هشدار فقط نمی‌گوید "دستگاه در خطر است"، بلکه اغلب می‌تواند نوع خرابی احتمالی و زمان باقی‌مانده تا وقوع آن را نیز تخمین بزند.

مثال واقعی: ✈️
موتورهای جت هواپیما هزاران سنسور دارند. هوش مصنوعی داده‌های این سنسورها را تحلیل کرده و قبل از اینکه یک نقص کوچک به یک مشکل فاجعه‌بار در حین پرواز تبدیل شود، به مهندسان روی زمین هشدار می‌دهد تا تعمیرات لازم را برنامه‌ریزی کنند.

مزایای کلیدی:
کاهش چشمگیر توقف تولید (حتی تا ۵۰٪)
کاهش هزینه‌های تعمیرات (تعویض قطعه در زمان مناسب)
افزایش ایمنی برای کارکنان و محیط زیست
افزایش عمر مفید تجهیزات

نتیجه‌گیری:
نگهداری و تعمیرات پیش‌بینانه فقط یک ابزار نیست؛ بلکه یک تغییر پارادایم از یک رویکرد واکنشی و پرهزینه به یک فرهنگ داده‌محور، هوشمند و پیش‌فعال در قلب صنعت است.

#هوش_مصنوعی #صنعت_هوشمند #نگهداری_و_تعمیرات_پیشبینانه #اینترنت_اشیا #یادگیری_ماشین #صنعت_چهارم #تحول_دیجیتال
#AIinIndustry #PredictiveMaintenance #PdM #Industry40 #IoT #MachineLearning
🥰20👏1915👍15🔥14🎉13😁11🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
یک جهش کوانتومی در حرکت ربات‌ها! 🤖 Boston Dynamics چگونه با شبکه‌های عصبی سرتاسری (End-to-End) راه رفتن را از نو تعریف می‌کند؟

همه ما ویدیوهای شگفت‌انگیز ربات‌های Boston Dynamics را دیده‌ایم که می‌دوند، می‌پرند و حتی پشتک می‌زنند! اما راز این همه چابکی و تعادل شبیه به موجودات زنده چیست؟

❇️اخیراً، این شرکت رویکرد خود را برای کنترل ربات‌هایش متحول کرده است. آن‌ها از روش‌های مهندسی سنتی فاصله گرفته و به سمت شبکه‌های عصبی سرتاسری (End-to-End Neural Networks) حرکت کرده‌اند. بیایید ببینیم این یعنی چه.

💡 نکات کلیدی این تحول بزرگ:

1. رویکرد سنتی (مبتنی بر مدل):
در گذشته، مهندسان باید تمام فیزیک ربات، نحوه حرکت مفاصل، مرکز ثقل و نحوه تعامل با محیط را به صورت معادلات پیچیده ریاضی مدل‌سازی می‌کردند. ربات برای هر حرکتی، این مدل‌ها را محاسبه می‌کرد. این روش قدرتمند اما شکننده بود و در محیط‌های پیش‌بینی‌نشده دچار مشکل می‌شد.

2. رویکرد جدید (یادگیری سرتاسری - End-to-End):
در این روش انقلابی، به جای نوشتن قوانین صریح، یک شبکه عصبی عمیق عظیم ساخته می‌شود.
ورودی: داده‌های خام از حسگرهای ربات (مثل تصاویر دوربین، وضعیت مفاصل، شتاب‌سنج‌ها).
خروجی: دستورات مستقیم برای موتورهای ربات (مثلاً چقدر هر مفصل را حرکت بده).
تمام فرآیند از "دیدن" تا "عمل کردن" در یک شبکه یکپارچه اتفاق می‌افتد.

3. چگونه ربات یاد می‌گیرد؟ از طریق آزمون و خطا در دنیای مجازی!
این شبکه عصبی در یک محیط شبیه‌سازی شده (Simulation) بسیار دقیق، میلیون‌ها بار راه رفتن، دویدن و افتادن را تجربه می‌کند! با هر بار موفقیت یا شکست، شبکه خودش را اصلاح می‌کند (فرآیندی شبیه به یادگیری تقویتی). پس از هزاران سال تجربه مجازی (که در چند ساعت در دنیای واقعی اتفاق می‌افتد)، دانش به دست آمده به ربات واقعی منتقل می‌شود.

4. نتیجه: چابکی و انعطاف‌پذیری باورنکردنی!
نتیجه این است که ربات، مانند یک حیوان، یک "درک شهودی" از حرکت پیدا می‌کند. می‌تواند روی سطوح ناهموار راه برود، از لغزش‌ها به سرعت خودش را بازیابی کند و در موقعیت‌هایی که هرگز برایش برنامه‌ریزی نشده، واکنش مناسب نشان دهد. این دیگر فقط دنبال کردن دستورات نیست؛ بلکه یادگیری یک مهارت است.

🚀 این تغییر از "برنامه‌نویسی ربات" به "آموزش دادن به ربات" یک گام بنیادی به سوی ساخت ماشین‌هایی است که می‌توانند به طور مستقل و ایمن در دنیای پیچیده و غیرقابل پیش‌بینی ما انسان‌ها عمل کنند.


#هوش_مصنوعی #رباتیک #بوستون_داینامیکس #یادگیری_عمیق #شبکه_عصبی #کنترل_ربات #یادگیری_تقویتی #آینده_فناوری
#BostonDynamics #Robotics #DeepLearning #NeuralNetworks #EndToEndLearning #AI
13😁13👏12🎉12👍11🔥11🥰11🙏1
🎮 Mirage 2 — موتور تولید دنیای ژنراتیو

نسخه دوم Mirage تنها یک ماه پس از نسخه اول عرضه شد و حالا به‌صورت آنلاین و قابل بازی در دسترس است.

با Mirage 2 می‌توانید:

♻️تصاویر دلخواه خود (از طراحی‌های سایبرپانک تا نقاشی‌های کودکانه) را بارگذاری کنید.
♻️دنیای بازی بسازید و در همان لحظه در آن بازی کنید.
♻️جهان ساخته‌شده را تغییر دهید و با دوستانتان به اشتراک بگذارید.


🔫 تفاوت مهم با Genie 3 (که در پوستر رسمی هم به آن طعنه زده‌اند) این است که Mirage 2 فقط «راه‌رَوی» نیست، بلکه مکانیک‌های شوتر و تعامل پیچیده‌تر با محیط هم دارد.

📌 به گفته توسعه‌دهندگان:
«اگر Mirage 1 ظرفیت خام یک مدل دنیاساز به سبک GTA را نشان داد، Mirage 2 یک جهش عظیم به جلوست — مدلی برای ساخت جهان‌های عمومی که اجازه می‌دهد همزمان خلق کنید، بازی کنید و در لحظه تغییر دهید.»

🔗 جزئیات بیشتر: Dynamics Lab Blog

@rss_ai_ir
#هوش_مصنوعی #بازی_ژنراتیو #Mirage #AIgaming #GameTech
👍24🔥24👏2219😁17🥰15🎉13
This media is not supported in your browser
VIEW IN TELEGRAM
🎲 دنیای بازی‌های متنی دوباره زنده شد، این بار با کمک Runway Game Worlds و تصویرسازی هوش مصنوعی.

🔹 در این تجربه تازه، کافی است یک پرامپت بنویسید تا بازی نه‌تنها واکنش متنی نشان دهد، بلکه همزمان یک تصویر از همان صحنه بسازد.
🔹 روایت‌ها کاملاً غیرخطی هستند؛ یعنی هر بار داستان، شخصیت‌ها و مسیر متفاوتی خواهید داشت.
🔹 می‌توانید از سناریوهای آماده استفاده کنید یا حتی بازی متنی اختصاصی خودتان را بسازید.

نتیجه چیزی شبیه کمیک تعاملی + بازی رومیزی دیجیتال است، جایی که تخیل شما با تصویرسازی لحظه‌ای جایگزین می‌شود.

🔗 نسخه بتا را می‌توانید اینجا امتحان کنید: Runway Game Worlds

@rss_ai_ir
#هوش_مصنوعی #بازی_ژنراتیو #Runway #GameWorlds #AIgaming
👍14👏13😁10🎉97🔥6🥰5
🔥 پر سر و صداترین مقاله ماه: Hierarchical Reasoning Model (HRM)

بدون مقدمه، بریم سر اصل ماجرا:
محققان مدلی با تنها ۲۷ میلیون پارامتر ساخته‌اند که روی بِنچمارک ARC-AGI-1 حتی از o3-mini بهتر عمل کرده. همین باعث شده کل جامعه تحقیقاتی در موردش صحبت کنن؛ حتی خود تیم ARC-AGI یک تحلیل مفصل از نتایج این مدل منتشر کرده.


---

🧩 ایده اصلی

معماری HRM شامل دو ماژول بازگشتی است:

یک ماژول سریع و سطح پایین → حل محلی و جزیی مسائل.

یک ماژول کندتر و سطح بالا → مدیریت انتزاعی و دادن تسک به ماژول پایین.


🔄 نکته کلیدی اینه که این دو ماژول با فرکانس‌های متفاوت آپدیت می‌شن:

♻️ماژول بالا در هر چرخه فقط یک بار آپدیت می‌شه.
♻️ماژول پایین در همون چرخه چندین بار قدم‌های کوچک محاسباتی برمی‌داره.
♻️به این ترتیب، مدل می‌تونه یک مسئله رو به چرخه‌های استدلالی بشکنه و همزمان هم تصویر کلان رو نگه داره، هم جزئیات محلی رو حل کنه.


---

🛠️ یادگیری

مدل با کمک RL یاد می‌گیره که چه زمانی باید متوقف بشه یا ادامه بده. پس می‌تونه بعضی وقت‌ها فقط چند ثانیه فکر کنه و بعضی وقت‌ها چند ساعت!

برای آموزش هم برخلاف مدل‌های RNN کلاسیک، فقط گرادیان حالت نهایی رو نگه می‌دارن و نه همه حالت‌های میانی. نتیجه؟ ساده‌تر، سبک‌تر و در کمال تعجب کاملاً کارآمد.


---

🧠 شباهت به مغز انسان


این معماری خیلی شبیه کارکرد مغزه:

♻️بعضی بخش‌ها مسئول انتزاع و بعضی مسئول واکنش سریع هستن.
♻️ارتباط بین این بخش‌ها از طریق فیدبک‌های سلسله‌مراتبی انجام می‌شه.
♻️حتی مغز هم حالت‌های میانی رو ذخیره نمی‌کنه، بلکه به‌تدریج از چرخه‌های موجی به سمت همگرایی می‌ره.

---

📊 نتیجه

♻️برای مدلی به این کوچکی، عملکردش در حل پازل‌ها، سودوکو، مازها و مسائل استقرایی بی‌سابقه است.
♻️جایی که LLMهای معمولی شکست می‌خورن، HRM موفق ظاهر می‌شه.
♻️و البته اوج ماجرا، رکورد روی ARC-AGI است.


---

📖 مقاله کامل: [Arxiv / HRM Paper]
📌 تحلیل عالی به زبان روسی هم موجوده (لینک در متن اصلی).

@rss_ai_ir

#هوش_مصنوعی #یادگیری_عمیق #AGI #شبکه_عصبی #ARC_AGI
🎉16😁12🔥109🥰9👏9👍8
This media is not supported in your browser
VIEW IN TELEGRAM
فرود ایمن و بدون دردسر پهپادها، حتی در حال حرکت! ✈️ آیا این پایان نیاز به باند فرود است؟

همه ما می‌دانیم که فرود آوردن یک پهپاد، به‌خصوص پهپادهای بال-ثابت (Fixed-wing) که به سرعت و یک مسیر مشخص برای فرود نیاز دارند، چقدر می‌تواند چالش‌برانگیز باشد. حالا تصور کنید بتوانید یک پهپاد را در هر مکانی، حتی از روی یک وسیله نقلیه در حال حرکت، به صورت آنی و ایمن “شکار” کنید!

این ویدیو دقیقاً همین فناوری شگفت‌انگیز را به نمایش می‌گذارد: یک سیستم بازیابی هوایی (Aerial Recovery System).

💡 این سیستم چگونه کار می‌کند؟
این فناوری که توسط شرکت‌هایی مانند Drone Catcher یا Sky-Drones توسعه داده شده، یک راه‌حل مکانیکی-هوشمند برای گرفتن پهپادها در آسمان است:

یک تور غول‌پیکر و هوشمند: سیستم اصلی یک ساختار شبیه به یک دروازه است که یک تور محکم و انعطاف‌پذیر روی آن کشیده شده است. این سیستم می‌تواند ثابت باشد یا روی یک وسیله نقلیه نصب شود.

هدایت دقیق به سمت هدف: پهپاد با استفاده از سیستم‌های ناوبری دقیق خود (مانند GPS یا بینایی کامپیوتر) به سمت مرکز این تور هدایت می‌شود. این فرآیند می‌تواند کاملاً خودکار باشد.

برخورد و قفل شدن: به محض برخورد پهپاد با تور، مکانیزم‌های خاصی (در این ویدیو پین‌هایی دیده می‌شود) فعال شده و بال‌های پهپاد را به تور قفل می‌کنند. این کار از بازگشت (rebound) یا آسیب دیدن پهپاد جلوگیری کرده و آن را بلافاصله متوقف می‌کند


#فناوری #پهپاد #نوآوری #هوافضا #رباتیک #تکنولوژی_نظامی #لجستیک_هوشمند
@rss_ai_ir
#Technology #Drone #Innovation #UAV #Robotics #AerialRecovery
🔥22😁15👍11🥰117👏7🎉6