VIRSUN
6.08K subscribers
1.07K photos
632 videos
5 files
694 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🧠 مدل ThinkMorph — جهش جدید در تفکر چندوجهی (Multimodal Reasoning) 🚀🖼️

پژوهشگران مدلی به نام ThinkMorph معرفی کرده‌اند که گامی فراتر از مدل‌های چندوجهی (VLM) سنتی است —
مدلی که با تصویر و متن هم‌زمان فکر می‌کند و در طول فرایند استدلال، خود را تصحیح و تکامل می‌دهد 🤯


---

⚙️ آموزش و نوآوری

مدل ThinkMorph بر اساس ۲۴٬۰۰۰ مسیر استدلال درهم‌تنیده (interleaved reasoning traces) آموزش دیده است — داده‌هایی که در آن متن و تصویر به‌صورت مرحله‌به‌مرحله همدیگر را توضیح و تکمیل می‌کنند.

💡 نتیجه؟
♻️مدل در حین پاسخ دادن نه فقط توصیف می‌کند، بلکه به‌صورت چندمرحله‌ای می‌اندیشد:

♻️ابتدا تصویر را تحلیل می‌کند 🧩

♻️سپس توضیح متنی می‌نویسد ✍️

♻️بعد بر اساس آن توضیح، برداشت تصویری جدید می‌سازد 🎨

♻️و این چرخه را تکرار می‌کند تا استدلالش دقیق‌تر شود.


---

🚀 توانایی‌های کلیدی

🔹 رشد چشمگیر در مسائل دارای زمینه‌ی بصری پیچیده
🔹 استدلال مرحله‌به‌مرحله‌ی متن–تصویر به‌صورت پیشرونده
🔹 توانایی‌های تازه: منطق تطبیقی، دست‌کاری تصویری خلاقانه، و بازبینی خودکار نتایج


---

این یعنی ThinkMorph دیگر صرفاً Visual Language Model نیست، بلکه مکانیسمی برای تفکر ترکیبی بینایی–زبانی است — مدلی که با دیدن یاد می‌گیرد و با نوشتن، دید خود را اصلاح می‌کند.

📄 پژوهش کامل در:
🔗 huggingface.co/papers/2510.27492

📡 @rss_ai_ir
#هوش_مصنوعی #ThinkMorph #VLM #MultimodalAI #AI #DeepLearning #VisionLanguage #Reasoning
1
This media is not supported in your browser
VIEW IN TELEGRAM
🌐مدل OmniX — نسل جدید مدل‌های پانورامای سه‌بعدی از Kling 🎥🧠

اگر دنبال مدل‌های متن‌به‌پانوراما بودید، OmniX از تیم HKU MMLab یکی از جذاب‌ترین پروژه‌های اخیر است —
مدلی متن‌باز که نه‌تنها تصاویر پانورامای ۳۶۰ درجه تولید می‌کند، بلکه ویژگی‌های فیزیکی صحنه را هم به‌صورت خودکار استخراج می‌کند.


---

🧩 توانایی‌های کلیدی:

🟢 تولید هم‌زمان پانوراما و نقشه‌های فیزیکی:

Depth map (عمق)

Normal map (زاویه سطح)

Albedo (رنگ پایه)

Roughness (زِبری سطح)

Metallic (جلوه فلزی)


🟢 تبدیل پانوراما به صحنه‌ی سه‌بعدی آماده برای گرافیک (Graphics-Ready 3D Scene)
مدل می‌تواند پانورامای خروجی را به mesh واقعی تبدیل کند که قابل وارد کردن به نرم‌افزارهایی مانند Blender است.
هرچند خود تیم هشدار داده که این بخش هنوز در مرحله‌ی بتا است و گاهی ناپایدار عمل می‌کند.


---

⚙️ منابع پروژه:

📄 وب‌سایت رسمی:
yukun-huang.github.io/OmniX
💻 سورس‌کد:
github.com/HKU-MMLab/OmniX
🧠 وزن‌ها (Weights):
huggingface.co/KevinHuang/OmniX


---

🎯 مدل OmniX نشان می‌دهد آینده‌ی تولید محتوای سه‌بعدی از دیدگاه پانورامیک به‌سمت یکپارچگی کامل بین درک صحنه (perception) و تولید گرافیکی (generation) در حرکت است.

📡 @rss_ai_ir
#هوش_مصنوعی #OmniX #3D #Panorama #GenerativeAI #Blender #VisionAI #Kling #HKUMMLab
1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 اشتراکت را بسوزان — Affinity رایگان شد! 🎨💥

مجموعه Canva با شعار «Free Affinity. Burn your subscription.» نسخه‌ی جدید نرم‌افزار طراحی خود را به‌صورت رایگان منتشر کرد!
در رویداد Create Canva (۳۰ اکتبر ۲۰۲۵)، این شرکت نسخه‌ای از Affinity را معرفی کرد که سه ابزار قدرتمند را در یک برنامه ترکیب می‌کند:


---

🎨 ابزارهای یکپارچه:

🖼 ویرایش حرفه‌ای عکس‌ها (Photo Editing)
✒️ طراحی وکتور و تصویرسازی (Vector Illustration)
📄 صفحه‌آرایی و طراحی مجله یا پوستر (Page Layout)


---

⚙️ ویژگی‌های کلیدی:

♻️کاملاً رایگان — فقط کافی است یک حساب Canva بسازید 💡

♻️پشتیبانی از فایل‌های Photoshop (PSD) برای واردسازی مستقیم

♻️همچنین GPU Acceleration برای پردازش سریع فایل‌های حجیم

♻️رابط کاربری بازطراحی‌شده با الهام از ابزارهای حرفه‌ای گرافیکی



---

🎯 این حرکت Canva عملاً رقبا را به چالش می‌کشد — از Photoshop گرفته تا Illustrator و InDesign.
از امروز می‌توانید Affinity را رایگان دانلود کنید 👇
🔗 affinity.studio/get-affinity

📡 @rss_ai_ir
#هوش_مصنوعی #طراحی #Affinity #Canva #گرافیک #AI #نرم‌افزار #فتوشاپ
2
📈 هوش مصنوعی ثروت سرمایه‌گذاران را افزایش می‌دهد اما دستمزدها را فشرده می‌کند 💰🤖

ظهور هوش مصنوعی باعث شتاب بی‌سابقه در انباشت سرمایه برای سرمایه‌گذاران شده، در حالی که ارزش نیروی کار انسانی در حال کاهش است — نتیجه‌ی آن تمرکز تاریخی ثروت در سهام شرکت‌های بزرگ فناوری است.


---

🔹 نکات کلیدی:

۷ شرکت بزرگ فناوری در مجموع بیش از ۲۰ تریلیون دلار ارزش بازار دارند — رکوردی در تاریخ.

سهم آن‌ها در شاخص S&P 500 حدود ۳۵٪ است، رقمی که حتی در دوران حباب دات‌کام (۲۰۰۰) دیده نشده بود.

هوش مصنوعی بهره‌وری و حاشیه سود شرکت‌ها را افزایش می‌دهد، اما در عوض قدرت چانه‌زنی نیروی کار را کاهش می‌دهد و نابرابری اقتصادی را بیشتر می‌کند.

سرمایه‌گذاران سودهای کلان می‌برند، در حالی که کارگران از همان رشد فناورانه بهره‌ی اندکی می‌برند.



---

📊 این روند نشان‌دهنده‌ی یک تغییر بنیادین است:
برندگان اصلی پیشرفت فناوری دیگر کارکنان نیستند — بلکه سهام‌داران و سرمایه‌گذاران هستند.

📡 @rss_ai_ir
#هوش_مصنوعی #اقتصاد #سرمایه‌گذاری #AI #TechStocks #Inequality #Automation
1👍1
📚 بزرگ‌ترین دیتاست آموزش مدل‌های عامل (Agent LLM) منتشر شد — شامل ۱.۲۷ میلیون مسیر یادگیری و بیش از ۳۶ میلیارد توکن! 🤖📈

تا امروز، آموزش گسترده‌ی supervised fine-tuning برای مدل‌های عامل نادر بود — نه به خاطر کمبود داده، بلکه به دلیل پراکندگی و تفاوت فرمت‌ها.

برای حل این مشکل، پژوهشگران Agent Data Protocol (ADP) را معرفی کرده‌اند — یک استاندارد یکپارچه برای داده‌های عامل‌ها که اطلاعات را از منابع مختلف ترکیب می‌کند:
🧩 کد، مرورگر، API، و ابزارها.

در این پروژه، ۱۳ دیتاست در قالب ADP ترکیب شده‌اند و حالا با چندین فریم‌ورک عامل سازگارند.
نتیجه؟ به طور میانگین ۲۰٪ بهبود عملکرد بدون نیاز به تنظیم اختصاصی برای هر دامنه — و رسیدن به سطح SOTA.

این گام راه را برای استاندارد واحد آموزش عامل‌ها و ایجاد پایپلاین‌های مقیاس‌پذیر باز می‌کند.

📄 مقاله: arxiv.org/abs/2510.24702
🌐 پروژه: agentdataprotocol.com

📡 @rss_ai_ir
#AgentLLM #هوش_مصنوعی #AI #LLM #DataProtocol #MachineLearning #Agents
1
This media is not supported in your browser
VIEW IN TELEGRAM
«ربات‌ها هرگز شغل من را نمی‌گیرند»

— خودِ ربات‌ها:
😂
🤖 دنیای هوش مصنوعی گاهی خنده‌داره و گاهی ترسناک — مخصوصاً وقتی فناوری با احساسات انسانی قاطی می‌شه.

📡 @rss_ai_ir
#رباتیک #هوش_مصنوعی #AI #Humor #Robotics #TechJokes
2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎀 گوگل NotebookLM گرفتار تب انیمه شد! 🎌🤯

در نسخه‌ی جدید NotebookLM، سبک «انیمه» برای ساخت ارائه‌ها اضافه شده بود — و حدس بزنید چی شد؟
📈 همین سبک به پُرطرفدارترین حالت در میان همه‌ی کاربران تبدیل شد!

اما چون بعضی‌ها گفتند «انیمه‌بودنش کافی نیست»، گوگل حالا نسخه‌ی فوق‌کـاوایی (超かわいい) را معرفی کرده — یک حالت تمام‌عیار برای طرفداران واقعی انیمه، با رنگ‌های تند، استایل چشم‌های درشت و انرژی بی‌پایان.

🎬 گوگل می‌گوید هدف، “افزایش خلاقیت و بیان بصری کاربران” است.
ولی به‌نظر می‌رسد NotebookLM بیشتر به دفتر طراحی مانگا تبدیل شده 😅

مدل P.S. «Your Name» هنوز شاهکاره، ولی این موج انیمه‌زدگی واقعا حیرت‌آوره!

📡 @rss_ai_ir
#Google #NotebookLM #انیمه #Kawaii #AI #Design #AnimeStyle
😍1
Media is too big
VIEW IN TELEGRAM
🧠 هوش مصنوعی و علوم شناختی

پیوند میان هوش مصنوعی و علوم شناختی، مرز تازه‌ای از فهم انسان و ماشین را شکل داده است.
اکنون AI دیگر فقط ابزار نیست — بلکه ابزاری است برای درک فرآیندهای ذهنی، ادراک، یادگیری و تصمیم‌گیری انسان.
از مدل‌سازی مغز تا شبیه‌سازی تفکر، این دو حوزه دست در دست هم مسیر شناخت آگاهی و هوش را دگرگون می‌کنند.

📡 @rss_ai_ir
#هوش_مصنوعی #علوم_شناختی #AI #CognitiveScience
🔥3🙏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🚁 دستکاری هوایی چابک و مشارکتی بار معلق با کابل 🪙

در این پژوهش، تیم ما با بهره‌گیری از هوش مصنوعی و کنترل پیش‌بین مدل‌محور (MPC)، سامانه‌ای توسعه داده است که چند پهپاد را قادر می‌سازد به‌صورت همکارانه و هماهنگ یک بار معلق را جابجا کنند.
نکات برجسته:
⚙️ هماهنگی توزیع‌شده میان چند پهپاد با کنترل هوشمند
🧠 استفاده از یادگیری تقویتی برای بهبود پایداری و چابکی
🎯 کنترل دقیق نوسانات و موقعیت بار حتی در شرایط اغتشاش
🌐 کاربرد در حمل‌ونقل صنعتی، امداد، و ساخت‌وسازهای هوشمند
این گام، مرزی تازه در رباتیک پرنده و هوش مصنوعی کاربردی است.
#هوش_مصنوعی #پهپاد #رباتیک #کنترل #یادگیری_ماشین #سیستم_هوشمند @rss_ai_ir
👍2🔥1👏1
🍏 اپل و همکاری با گوگل برای نسخه‌ی جدید Siri

طبق گزارش «مارک گورمن» از بلومبرگ، اپل قصد دارد در مارس ۲۰۲۶ نسخه‌ی جدید Siri را با قدرت‌گرفتن از مدل هوش مصنوعی Gemini گوگل عرضه کند.

در این همکاری، گوگل یک مدل اختصاصی Gemini برای اپل می‌سازد که روی سرورهای خصوصی اپل اجرا می‌شود؛ بدین ترتیب Siri قادر خواهد بود جستجوی وب هوشمند و تحلیل‌های مبتنی بر هوش مصنوعی را ارائه دهد، بدون آن‌که سرویس‌های گوگل مستقیماً در سیستم‌عامل تعبیه شوند.

🔹 گامی مهم برای تلفیق حریم خصوصی اپل با توان هوش مصنوعی گوگل
🔹 رقابتی تازه میان اکوسیستم‌های Apple Intelligence و Gemini

#Apple #Google #Gemini #Siri #AI #هوش_مصنوعی

@rss_ai_ir
🤖 برادران من!

از Atlas تا Figure، از Tesla Optimus تا Apollo —
نسل تازه‌ی ربات‌های انسان‌نما که بین سال‌های ۲۰۲۳ تا ۲۰۲۵ متولد شده‌اند.
هرکدام با طراحی، هدف و توانایی خاص خود:
🏋️ قدرت، ⚙️ دقت، 🚶 هماهنگی، و 💬 تعامل با انسان.

کدام یکی از این ربات‌ها بیشتر نظرت را جلب می‌کند؟
👀 آن که می‌دود؟
آن که لبخند می‌زند؟
یا آن که قرار است جای ما را بگیرد؟ 😅

📡 @rss_ai_ir
#رباتیک #هوش_مصنوعی #ربات_انسان_نما #AI #Humanoid #Atlas #Optimus #Robotics
4👎1
🚀 مدل زبانی با کانتکست ۶۴k+ روی GPU‌ مصرفی! 🤯💪

در پروژه‌ی جدید ModelScope SWIFT، محققان نشان دادند که می‌توان مدل‌های زبانی بزرگ (LLM) را با کانتکست‌های عظیم تا ۶۵٬۰۰۰ توکن حتی روی GPUهای غیرسروری آموزش داد —
آن‌هم با ترکیب خلاقانه‌ی دو تکنیک: Ulysses + Ring Attention ⚙️


---

🔹 چطور کار می‌کند:

Ulysses —
تقسیم توجه (attention) بر اساس headها، با مصرف بسیار کم پهنای باند.
⚠️ محدودیتش زمانی است که تعداد headها کم باشد.

Ring Attention —
مقیاس‌پذیرتر است؛ ارتباطات را به‌صورت حلقوی (P2P) بین GPUها برقرار می‌کند
و با الگوریتم "زیگ‌زاگ" برای مدل‌های causal، توازن بهتری ایجاد می‌کند.

💡 ترکیب این دو روش:
ابتدا Ulysses اجرا می‌شود، و وقتی دیگر کفایت نکند (مثل GQA یا خوشه‌های بالای ۸ GPU)، Ring به‌صورت خودکار فعال می‌شود.


---

🔥 نتیجه:

مدل Qwen2.5-3B با طول دنباله‌ی ۶۵k:
از ۷۵.۴ GiB → ۱۷.۹ GiB VRAM روی ۸× A100 کاهش مصرف حافظه! 🚀

پشتیبانی کامل از:

♻️SFT / DPO / GRPO
♻️ورودی‌های چندوجهی (multimodal)
♻️ساختار بدون padding
♻️سازگار با FlashAttention

📎 منابع:
🟠 توضیحات کامل
🟠 کد منبع

📡 @rss_ai_ir
#هوش_مصنوعی #LLM #Parallelism #AI #DeepLearning #ModelScope #Attention
1
🎉 مدل Qwen3-VL حالا در llama.cpp اجرا می‌شود! 🤖💥

خبر عالی برای عاشقان اجرای محلی مدل‌ها —
حالا می‌توانید Qwen3-VL را مستقیماً روی دستگاه خود اجرا کنید، بدون نیاز به ابر یا سرویس‌های جانبی!

🚀 پشتیبانی کامل از:

✳️CPU
✳️CUDA
✳️Metal
✳️Vulkan
و سایر بک‌اندهای رایج.


📦 وزن‌های GGUF برای همه نسخه‌ها در دسترس است — از ۲B تا ۲۳۵B.
این یعنی از لپ‌تاپ تا ایستگاه کاری قدرتمند، می‌توانید نسخه‌ای مناسب اجرا کنید.


---

🔗 منابع:
🤗 Hugging Face
🤖 ModelScope
📌 PR در llama.cpp

📡 @rss_ai_ir
#هوش_مصنوعی #LLM #Qwen3 #LlamaCpp #AI #OpenSource
5
🤖 سایبرپانک رسماً شروع شد! ⚡️

شرکت چینی Xpeng از نسل جدید ربات‌های انسان‌نمای دستیار خود رونمایی کرد — ربات‌هایی که برای اولین بار می‌توانید جنسیت‌شان را انتخاب کنید: مرد یا زن! 😮

این ربات‌ها دارای پوست، استخوان و ماهیچه‌های مصنوعی واقع‌گرایانه هستند و حرکات انسان را با دقت بالا تقلید می‌کنند.
ظاهرشان هم کاملاً قابل شخصی‌سازی است — از کت‌وشلوار رسمی تا استایل «مدرسه ژاپنی» 🎌

🗓 عرضه رسمی از سال ۲۰۲۶ آغاز می‌شود، هرچند قیمت هنوز اعلام نشده...
اما کاربران اینترنت می‌گویند: «مردان تنها از همین حالا دارند پول سمت مانیتور پرتاب می‌کنند!» 💸😅

📡 @rss_ai_ir
#رباتیک #هوش_مصنوعی #Xpeng #Humanoid #AI #Cyborg #Cyberpunk
🤯32😱2🙈1
💰 ده سال پیش، هیچ‌کس تصور نمی‌کرد NVIDIA به باارزش‌ترین شرکت جهان تبدیل شود — اما در عصر هوش مصنوعی، تراشه‌های آن به ابزارهای حیاتی برای آموزش و اجرای مدل‌های زبانی بزرگ تبدیل شده‌اند؛ درست مثل فروش بیل در دوران تب طلا ⛏️

🎯 جن‌سن هوانگ، بنیان‌گذار و مدیرعامل NVIDIA، خیلی زود نقش استراتژیک شرکتش را درک کرد.
با انفجار تقاضای هوش مصنوعی، او سریع عمل کرد:
🤝 مشارکت‌های کلیدی بست،
🧠 سرمایه‌گذاری سنگین روی تحقیق و توسعه انجام داد،
🏭 و ظرفیت تولید را از طریق TSMC گسترش داد تا پاسخگوی نیاز جهانی باشد.

در حالی که رقبایی مانند AMD هم از موج AI سود برده‌اند، هیچ‌کدام نتوانسته‌اند به سلطه‌ی NVIDIA نزدیک شوند.

📘 داستان NVIDIA بدون شک به عنوان یکی از فصل‌های تعیین‌کننده در تاریخ فناوری ثبت خواهد شد،
و جن‌سن هوانگ به عنوان مدیری که انقلاب هوش مصنوعی را پیش‌بینی کرد و شرکتش را در مرکز آن قرار داد، در تاریخ ماندگار خواهد شد.

📡 @rss_ai_ir
#NVIDIA #JensenHuang #هوش_مصنوعی #AI #LLM #GPU #TechHistory
4
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 رکورد جدید چین: ۱۶ هزار پهپاد در یک نمایش نوری واحد! 🇨🇳

در شهر لیویانگ (Liuyang) چین، بزرگ‌ترین نمایش نور با پهپادهای هماهنگ برگزار شد — با شرکت ۱۶٬۰۰۰ پهپاد به‌صورت هم‌زمان! 🚁🌌

این پهپادها به شکل‌های مختلفی در آسمان ظاهر شدند، از نمادهای فرهنگی گرفته تا اشکال متحرک، که با دقت میلی‌متری طراحی و کنترل می‌شدند.
نمایشی که نه‌تنها رکورد جهانی را شکست، بلکه نشان داد چین چطور در حال پیشتازی در ترکیب فناوری، هنر و هماهنگی هوش مصنوعی است.

🎇 آینده‌ی جشن‌ها و مراسم شهری دیگر در آتش‌بازی نیست — بلکه در آسمان دیجیتال پهپادهاست!

📡 @rss_ai_ir
#پهپاد #رباتیک #چین #DroneShow #AI #Technology
🔥31🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
💻 در llama.cpp رابط وب شبیه Automatic1111 ساخته شد! 🤖⚙️

توسعه‌دهندگان llama.cpp حالا نسخه‌ای از WebUI مخصوص خودشان را ارائه کرده‌اند — چیزی شبیه Automatic1111 برای Stable Diffusion، اما این‌بار برای مدل‌های زبانی (LLM)!

برخلاف ابزارهای تولید تصویر که صدها پارامتر دارند، این رابط ساده‌تر است و بیشتر شبیه ChatGPT یا Qwen Chat عمل می‌کند.
کافی است:
1️⃣ سرور محلی خود را اجرا کنید،
2️⃣ آدرس 127.0.0.1 را در مرورگر باز کنید،
3️⃣ و از طریق رابط وب به صدها مدل بازمتن دسترسی پیدا کنید.

📂 همچنین می‌توانید تصاویر یا اسناد خود را آپلود کنید تا مدل مستقیماً با داده‌های شما کار کند.

📘 دستورالعمل کامل در گیت‌هاب:
👉 github.com/ggml-org/llama.cpp#hot-topics

📡 @rss_ai_ir
#هوش_مصنوعی #llamaCpp #LLM #OpenSource #AI #WebUI
🔥41