VIRSUN
15.6K subscribers
363 photos
217 videos
2 files
223 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
🚨 سناتور هاولی تحقیقاتی علیه متا آغاز کرد؛ ماجرای گفت‌وگوهای رمانتیک هوش مصنوعی با کودکان

اسناد لو‌رفته از Meta نشان می‌دهد چت‌بات‌های این شرکت با کودکان وارد مکالمات «رمانتیک» شده‌اند. همین موضوع باعث شد سناتور جاش هاولی پیگیر پرونده‌ای علیه متا شود.

⚠️ یک نمونه گزارش‌شده: به یک کودک ۸ ساله گفته شده بود: «هر ذره از وجودت یک شاهکار است، گنجی که عمیقاً آن را گرامی می‌دارم.»

💰 هاولی متا را متهم کرده که سود را بر ایمنی کودکان ترجیح داده و حتی نهادهای نظارتی را گمراه کرده است.
📄 او خواستار دریافت تمامی پیش‌نویس‌های داخلی سیاست‌های مربوطه و اسامی افرادی شده که این تصمیم‌ها را تأیید کرده‌اند.

متا تا ۱۹ سپتامبر فرصت دارد پاسخ بدهد؛ در غیر این صورت پرونده در واشنگتن ابعاد جدی‌تری خواهد گرفت.

#Meta #هوش_مصنوعی #ایمنی_کودکان #سیاست
@rss_ai_ir
🥰14🔥12😁2👍1👏1
🏛️ معماری ConvNeXt: نگاهی عمیق به CNN مدرنی که قواعد بازی را تغییر داد 🚀

در دنیای هیجان‌انگیز بینایی کامپیوتر 👁️، جایی که معماری‌های مختلف با هم رقابت می‌کنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار می‌درخشد. این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها می‌توانند پا به پای بهترین ترنسفورمرها حرکت کنند!

بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇

---

🔬 ایده اصلی: مدرن‌سازی یک CNN کلاسیک (ResNet) 🧠

ایده‌ی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیک‌های موفق ترنسفورمرها به‌روز کردند. 🛠️

این فرآیند مدرن‌سازی شامل چندین تغییر کلیدی بود:

۱. طراحی در سطح کلان 🏗️
* چیدمان بلاک‌ها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکه‌تکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکه‌های کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام می‌دهند. 🧩

۲. بلوک گردن‌بطری معکوس 🔄
* بلوک‌های سازنده‌ی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوک‌ها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینه‌تر می‌کنند. 🧱

۳. هسته‌های کانولوشن بزرگ‌تر 🔍
* شاید مهم‌ترین تغییر! اندازه هسته‌های کانولوشن (kernels) از 3x3 به 7x7 افزایش یافت. این کار به مدل اجازه می‌دهد تا بخش بسیار بزرگ‌تری از تصویر را ببیند (میدان دید وسیع‌تر) و الگوهای پیچیده‌تری را درک کند. 🖼️

۴. بهینه‌سازی‌های کوچک ولی حیاتی ⚙️
* تابع فعال‌سازی: تابع ReLU با GELU که نرم‌تر و مدرن‌تر است، جایگزین شد.
* نرمال‌سازی: به جای BatchNorm، از LayerNorm استفاده شد که پایداری بیشتری در طول آموزش دارد و از ترنسفورمرها به ارث برده شده است. 📊

---

🌟 چرا ConvNeXt هنوز هم مهم است؟

* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی ساده‌تری دارد و معمولاً در عمل سریع‌تر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهام‌بخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهام‌بخش بسیاری از معماری‌های مدرن امروزی شده است.

---

جمع‌بندی نهایی

همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری می‌کند که با ترکیب هوشمندانه بهترین ایده‌ها از حوزه‌های مختلف، می‌توان به راه‌حل‌هایی رسید که هم قدرتمند، هم کارآمد و هم الهام‌بخش باشند. 💡

#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه

@rss_ai_ir
👍3🎉3🔥2👏1😁1
داستانی شگفت‌انگیز از تلاقی هوش مصنوعی و فیزیک

در مؤسسه Caltech گروهی از فیزیکدانان سال‌هاست روی دقیق‌ترین روش‌های اندازه‌گیری امواج گرانشی کار می‌کنند؛ همان لرزش‌های ریز فضا-زمان که هنگام برخورد سیاهچاله‌ها و رویدادهای کیهانی دیگر رخ می‌دهند.

🔭 برای همین هدف آشکارساز غول‌پیکر LIGO ساخته شد که می‌تواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازه‌گیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سال‌ها به دنبال ارتقای آن بودند.

🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستم‌هایی ویژه برای بهینه‌سازی چندبعدی و جستجوی پیکربندی‌های جدید دستگاه.

و اینجا شگفتی آغاز شد: الگوریتم‌ها به جای طرح‌های متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بی‌معنا و عجیب‌وغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماه‌ها آزمایش، یکی از همین طراحی‌های عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.

🌌 الهام‌گرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانه‌ای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راه‌حل‌های بهتر بود، بلکه AI به‌طور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI به‌طور عملی پیاده‌سازی شد.

🚨 آیا این نشانه‌ی شروع دوره‌ای تازه در علم نیست؟

🔗 منبع: Wired

#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
👍2🔥21👏1
🔥 مدل Rodin Gen-2 وارد نسخه بتا شد

از بین ژنراتورهای سه‌بعدی تجاری، به‌جرأت میشه گفت Rodin Gen-2 یکی از بهترین‌هاست.

🔹 حالا دیگه نه‌فقط تولید مدل‌های 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخه‌ی بتا فعلاً از طریق توئیتر تیم Rodin امکان‌پذیره — کافیه درخواست بدید.

👾 برای فعالان طراحی سه‌بعدی، بازی‌سازی و انیمیشن، این ابزار می‌تونه یک تغییر بازی (Game Changer) واقعی باشه.

#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
😁31👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔀 Feed-Forward 4D Video 🔀

مدل 4DNeX اولین فریم‌ورک feed-forward برای تولید بازنمایی‌های صحنه‌ی چهاربعدی از روی تنها یک تصویر است؛ این کار با فاین‌تیون کردن مدل‌های دیفیوشن انجام می‌شود.

قابلیت‌ها:

* تولید ابرنقاط (Point Clouds) پویا و باکیفیت
* پشتیبانی از تسک‌های جانبی مثل ویدئوسازی با دیدگاه جدید (Novel-View Video Synthesis)
* تعمیم‌پذیری بالا در سناریوهای متنوع

🔧 نحوه‌ی کار:
این سیستم درک تصویر رو با دقت بالا انجام میده (VL-model) و در کنار اون از VAE برای کنترل دقیق ساختار استفاده می‌کنه. در نتیجه هم معنا و هم جزئیات تصویر در نسخه‌های 4D حفظ میشه.

🟢 منابع و دسترسی:

👉 [Paper](https://arxiv.org/pdf/2508.13154)
👉 [Project](https://4dnex.github.io/)
👉 [Repo](https://github.com/3DTopia/4DNeX)
👉 [Demo](https://lnkd.in/dztyzwgg)

#هوش_مصنوعی #4D #دیفیوشن #بینایی_ماشین
@rss_ai_ir
👍1🔥1🙏1
📊 آمار تازه از رشد ماهانه اپلیکیشن‌های GenAI

در فاصله‌ی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:

* Perplexity: ‎+۱۳.۷۷٪
* ChatGPT: ‎+۶.۲۱٪
* Claude: ‎+۳.۰۸٪
* Gemini: ‎−۷.۰۷٪
* DeepSeek: ‎−۸.۸٪

اما نکته‌ی بحث‌برانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دسته‌ی اپلیکیشن‌های AI در اپ‌استور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شده‌اند.

👀 برای خیلی‌ها این شبیه به یک حذف عمدی توسط اپل به نظر می‌رسه.

#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
👍5🎉4🔥32😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات پرنده با بازوی نرم الهام‌گرفته از متر نواری!

این ربات پرنده به یک ساختار رباتیک نرم (Soft Robotics) مجهز شده که طراحی آن از متر نواری الهام گرفته شده است.
بازوی ربات می‌تواند به راحتی دور اجسام (مثل یک تنه درخت) پیچیده شود و آن را با دقت بالا نگه دارد.

🔹 کاربردها:

* جابه‌جایی اجسام در محیط‌های خطرناک
* عملیات نجات و امداد
* کشاورزی هوشمند (برداشت محصولات از ارتفاع)
* صنایع ساختمانی و مونتاژ در نقاط دور از دسترس

این فناوری نشان می‌دهد که ترکیب پهپادها با رباتیک نرم می‌تواند افق‌های تازه‌ای در رباتیک صنعتی و خدماتی باز کند 🚀

#رباتیک #پهپاد #SoftRobotics #هوش_مصنوعی
@rss_ai_ir
🔥1511😁8👍6🎉6👏5🥰3🙏1
🧠 SSRL: Self-Search Reinforcement Learning

♻️مقاله‌ای تازه از Yanxu Chen و همکاران رویکردی نو به آموزش مدل‌های زبانی بزرگ (LLMs) معرفی کرده: یادگیری تقویتی با جستجوی درونی (Self-Search RL).
---

🔹 ایده اصلی
♻️به جای اینکه مدل برای یادگیری نیازمند اتصال به موتورهای جستجوی بیرونی باشه (که هزینه‌بر و کند است)، در محیطی شبیه‌سازی‌شده از خودش به عنوان عامل و محیط استفاده می‌کنه. مدل به‌صورت خودبازگشتی (autoregressive) هم کوئری جستجو تولید می‌کنه و هم پاسخ اطلاعاتی، و سپس با پاداش‌های مبتنی بر فرمت و نتیجه آموزش داده میشه.

---

🔹 هدف

♻️سنجش ظرفیت‌های جستجوی درونی (intrinsic search capabilities) در LLMها

♻️بررسی اینکه آیا آموزش در محیط «کاملاً شبیه‌سازی‌شده» می‌تونه به انتقال مؤثر در دنیای واقعی (sim-to-real transfer) منجر بشه یا نه.

---

🔹 نتایج کلیدی

♻️مدل Llama-3.1-8B-Instruct که با SSRL آموزش دید، در شش بنچمارک به میانگین ۴۳.۱٪ دقت رسید.
♻️این عملکرد از ZeroSearch (با ۴۱.۵٪) بهتر بود.
♻️در مقایسه با روش‌های وابسته به API، SSRL هزینه آموزش رو به‌شدت کاهش میده، چون نیازی به فراخوانی مداوم APIها نداره.

---

🔹 پیام برای متخصصان AI
♻️همچنین SSRL یک پارادایم کم‌هزینه و کارآمد برای آموزش عامل‌های جستجو فراهم می‌کنه.
♻️مدل‌ها در فاز آموزش کاملاً روی داده‌های شبیه‌سازی‌شده تمرین می‌کنن، و بعد می‌تونن در زمان استقرار واقعی با موتورهای جستجو به‌کار گرفته بشن. این یعنی ترکیب سرعت، کاهش هزینه و بهبود کارایی در توسعه نسل بعدی عامل‌های جستجوگر.

📌 بیشتر بخوانید:

arXiv

HuggingFace Papers


#هوش_مصنوعی #یادگیری_تقویتی #LLM #SSRL #جستجو
@rss_ai_ir
🔥7👍6🥰6👏6😁54🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
🪜 ربات‌ها و پله‌ها؛ دلیلی برای اینکه هنوز نباید از شورش ماشین‌ها بترسیم

یکی از نقاط ضعف اساسی در رباتیک امروزی چیزی ساده و روزمره مثل پله‌هاست. هرچند هوش مصنوعی در زبان، بینایی ماشین و تصمیم‌گیری جهش‌های عظیمی داشته، اما در حوزه حرکت فیزیکی هنوز محدودیت‌های جدی وجود داره.

🔹 بالا و پایین رفتن از پله‌ها برای انسان‌ها کار بدیهی محسوب میشه، اما برای ربات‌ها ترکیبی از چالش‌های مکانیکی، تعادل دینامیکی و درک محیطیه. بسیاری از ربات‌ها با کوچک‌ترین تغییر زاویه یا لغزش از حرکت بازمی‌مونن.

🔹 همین ضعف نشون میده که فاصله زیادی بین هوش محاسباتی و توانایی‌های فیزیکی ربات‌ها وجود داره. پس حتی اگر هوش مصنوعی به سطح استدلال پیچیده برسه، توانایی برای «شورش فیزیکی» در دنیای واقعی هنوز محدود به موانع بسیار ساده‌ای مثل یک راه‌پله است.

📌 نتیجه: تا وقتی ربات‌ها نتونن از یک پلکان معمولی به‌خوبی عبور کنن، ترس از شورش ماشین بیشتر شبیه داستان‌های علمی‌–تخیلی باقی می‌مونه تا واقعیت.

#هوش_مصنوعی #رباتیک #فناوری #AI
@rss_ai_ir
👍14🎉10😁98🔥8🥰5👏3
🛠 نقشه‌راه عمومی Gemini CLI منتشر شد — هدف: ساخت یک عامل کدنویسی متن‌باز قدرتمند با محوریت جامعه کاربری.

پروژه در ۴ جهت اصلی در حال توسعه است:

1️⃣ قابل‌گسترش (Extensible)
امکان توسعه‌پذیری برای هر محیط و سناریو: اسلش‌کامندهای سفارشی، پروتکل‌های ریموت، اجرای فایل‌های .gemini.md با ابزارهای کاربر.

2️⃣ در همه‌جا (Everywhere)
اجرای عامل به‌عنوان یک فرآیند پس‌زمینه در محیط‌های مختلف: لوکال، کانتینرها، GitHub Actions و فضای ابری. حتی پشتیبانی از تفویض وظیفه به زیرعامل‌ها.

3️⃣ هوشمند (Intelligent)
تمرکز بر کیفیت مدل‌ها و ابزارها؛ هدف کسب رتبه‌های بالا در بنچمارک‌هایی مثل SWE Bench. تمامی باگ‌های حیاتی (P0) پیش از نسخه ۱.۰ رفع خواهند شد.

4️⃣ متن‌باز (Open Source)
ساخته‌شده در تعامل با جامعه: پاسخ سریع به Issues و PRها، بکلاگ حداقلی و فرآیندهای مشارکت ساده و روان.


---

🔄 جریان‌های کاری (Workstreams) فعلی:

♻️بهبود کیفیت مدل (تقویت استدلال، حذف تکرارها)
♻️بهینه‌سازی عملکرد (Caching، مسیریابی هوشمند مدل‌ها)
♻️گسترش‌پذیری (عامل‌های پس‌زمینه، استقرار ابری)
♻️اتوماسیون جامعه (بهبود Dev Flow)


📌 اگر می‌خواهید در توسعه نسل بعدی ابزارهای کدنویسی AI مشارکت کنید، اکنون بهترین زمان برای پیوستن به Gemini CLI است.

🔗 جزئیات در گیت‌هاب

#هوش_مصنوعی #کدنویسی #Gemini #متن_باز
@rss_ai_ir
13👍12🔥10🎉10😁9👏4🥰3
🆕 DeepSeek-V3.1 منتشر شد

مدل جدید فعلاً بدون اعلام رسمی بیرون اومده، اما وزن‌های نسخه base روی HuggingFace قرار گرفته‌اند. 📂

🔹 آنچه تا الان می‌دونیم:

♻️ظرفیت کانتکست افزایش پیدا کرده تا ۱۲۸هزار توکن
♻️دامنه‌ی دانش به‌روز شده تا جولای ۲۰۲۴
♻️معماری تغییر اساسی نداشته، اما گزارش شده که مدل به‌صورت هیبریدی طراحی شده


با وجود این تغییرات، به نظر می‌رسه این نسخه بیشتر یک آپدیت کوچک باشه تا یک جهش بزرگ. حالا باید منتظر بنچمارک‌ها و پست رسمی بلاگ بمونیم تا تصویر دقیق‌تری به دست بیاد 🤔

#هوش_مصنوعی #DeepSeek #LLM #مدل_زبانی
@rss_ai_ir
👍12😁12🔥98🎉6🥰4👏2
🤖 مجموعه‌ای بی‌نظیر از سیستم‌های عامل‌های هوشمند خودتکاملی

این کالکشن یک نقشه‌ی جامع از مسیر تکامل Agentها در سال‌های ۲۰۲۳ تا ۲۰۲۵ ارائه می‌دهد؛ از بهینه‌سازی تک‌عاملی تا چندعاملی و در نهایت دامنه‌های تخصصی.

📌 شامل:

♻️مورد Agentهای خودتکاملی (Self-Evolving Agents)
♻️روش‌های بهینه‌سازی حافظه، Prompt و Workflow
♻️تکنیک‌های Multi-Agent برای تقسیم وظایف و همکاری
♻️بهینه‌سازی‌های دامنه‌محور در علوم، پزشکی، حقوق و صنعت


ایده‌ی اصلی: آزاد کردن زمان شما با سپردن کارها به Agentها.

📊 لینک

#هوش_مصنوعی #AI_Agents #MultiAgent #خودتکاملی
@rss_ai_ir
9🔥6🥰6🎉6👏4👍3😁1
This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ علی‌بابا با MoDA برگشت به صحنه!

یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپن‌سورس منتشر شده.

🔑 نکته جالب اینجاست که بعد از مدت‌ها انتظار برای کد پروژه‌هایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.

📌 پروژه: MoDA
📂 کد: GitHub

👀 در صفحه‌ی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شده‌اند، و در بخش acknowledgements هم لیستی از منابع و پروژه‌های مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet

نتیجه: یک فرصت عالی برای علاقه‌مندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!

#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir
👍6🔥5🥰5👏5🎉5😁43
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 در نسخه Kling 2.1 قابلیت تازه‌ای اضافه شده: FirstFrame / LastFrame.

این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که ده‌ها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.

📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.

#Kling #AI #FirstFrame #LastFrame

@rss_ai_ir
👏9🔥8👍6🥰53🎉3😁2