VIRSUN
6.12K subscribers
1.05K photos
608 videos
5 files
674 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
😄 ظاهراً بایدنس هم تصمیم گرفته وارد رقابت مستقیم با OpenAI و Alibaba بشه!

🧠 DreamOmni2 —
مدل جدید چندوجهی (Multimodal) از ByteDance که هم تولید (Generation) و هم ویرایش (Editing) تصویر رو با دستور متنی انجام می‌ده.

در واقع یه چیزی بین Qwen-Edit و Nanabana با چاشنی شتاب چینی

📦 امکاناتش:

♻️تولید و ویرایش تصویر با دستور متنی یا تصویری 🎨

♻️پشتیبانی از ویرایش ناحیه‌ای و تنظیمات سبک

♻️عملکرد چشم‌گیر در مقایسه با Banana, Qwen, GPT-Image 1 و OmniGen

♻️کاملاً اوپن‌سورس با کد، مقاله و دموی آماده برای تست


📎 لینک‌ها:

🔹 GitHub:
github.com/dvlab-research/DreamOmni2
🔹 صفحه پروژه و مقایسه تصاویر:
pbihao.github.io/projects/DreamOmni2

به قول نویسنده پست: «برو تستش کن، من تا دوشنبه توی دیتاکسم» 😅

@rss_ai_ir
#هوش_مصنوعی #DreamOmni2 #ByteDance #AIimage #Multimodal #ویرایش_تصویر #تولید_تصویر #GenerativeAI #AItools #Qwen #Nanabana
1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ کپی صدای شما فقط در ۱۰ ثانیه! 🎙️

سرویسی جدید معرفی شده که می‌تونه صدای هرکسی رو در کمتر از ۱۰ ثانیه ضبط و شبیه‌سازی کنه 😳
بعد از اون، هر متنی رو با همون صدا و لحن طبیعی شما می‌خونه — مستقیم داخل مرورگر، بدون نیاز به نصب هیچ برنامه‌ای.

🎧 ویژگی‌ها:
• فقط ۱۰ ثانیه ضبط صدا برای کپی کامل 🎤
• پشتیبانی از ده‌ها زبان از جمله فارسی 🇮🇷
• صدای طبیعی، دقیق و بدون تأخیر
• مناسب برای ویدیو، پادکست، و پروژه‌های شخصی

🟢 تستش کنید — واقعاً حیرت‌انگیزه!
https://vocloner.com/

@rss_ai_ir
#هوش_مصنوعی #AIvoice #clone #تولید_صدا #VoiceAI #AItools #گویندگی #سنتز_صدا #TextToSpeech
🔥1
🧠 گزارش ۱۵۰ صفحه‌ای گوگل درباره Health AI Agents منتشر شد!

⛔️گوگل در تازه‌ترین پژوهش خود مسیر جدیدی را برای عامل‌های هوش مصنوعی در حوزه سلامت معرفی کرده است — نه یک Doctor-GPT غول‌پیکر، بلکه مجموعه‌ای از عامل‌های تخصصی با همکاری هوشمند.

🔹 ساختار سیستم Personal Health Agent (PHA):
1️⃣ Data Science Agent → تحلیل داده‌های پوشیدنی و نتایج آزمایشگاهی
2️⃣ Domain Expert Agent → بررسی و تأیید دانش و حقایق پزشکی
3️⃣ Health Coach Agent → گفت‌وگو، تعیین هدف و افزودن حس همدلی

🧩 همه این عامل‌ها توسط یک Orchestrator با حافظه فعال به هم متصل می‌شوند که اهداف، محدودیت‌ها و بینش‌های کاربر را درک و به‌روزرسانی می‌کند.

⚡️ نتایج کلیدی:

عملکرد بهتر نسبت به مدل‌های پایه در ۱۰ بنچمارک

کاربران واقعی در آزمایش‌ها PHA را به مدل‌های زبانی معمولی ترجیح دادند

کارشناسان پزشکی کیفیت پاسخ‌ها را بین ۵٫۷ تا ۳۹٪ بهتر ارزیابی کردند


⚙️ اصول طراحی:

تمرکز بر همه نیازهای کاربر، نه فقط پاسخ به سؤال

ترکیب پویا بین عامل‌ها بر اساس زمینه

جلوگیری از درخواست داده‌هایی که از داده‌های موجود قابل استنتاج‌اند

کاهش حداکثری تأخیر و پیچیدگی


🧠 موارد استفاده تست‌شده:

♻️پرسش‌های عمومی سلامت

♻️تفسیر داده‌های دستگاه‌های پوشیدنی و بیومارکرها

♻️توصیه‌های شخصی برای خواب، تغذیه و فعالیت

♻️تحلیل علائم بدون تشخیص نهایی


⚠️ محدودیت‌ها و مسیر آینده:

✳️کندتر از عامل‌های تکی (۲۴۴ ثانیه در برابر ۳۶ ثانیه)

✳️نیاز به ارزیابی سوگیری، حفظ حریم خصوصی و انطباق قانونی

✳️گام بعدی: گفت‌وگوی تطبیقی با تعادل بین همدلی و دقت علمی


💡 جمع‌بندی:
گوگل مسیر آینده هوش مصنوعی را در حوزه سلامت نشان می‌دهد — نه یک پزشک واحد، بلکه تیمی از عامل‌های تخصصی هماهنگ.
پزشکی فقط شروع ماجراست؛ بعد از آن، نوبت به مالی، حقوق، آموزش و علم خواهد رسید.

📄 مطالعه گزارش کامل:
arxiv.org/pdf/2508.20148
@rss_ai_ir
#Google #HealthAI #AgenticAI #هوش_مصنوعی #پزشکی #سلامت #AI #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات پوشیدنی جدید Boston Dynamics با بازوهای ۲۴ درجه آزادی!

این اگزواسکلتون پیشرفته دارای بازوهایی است با ۲۴ درجه آزادی (DoF) که می‌تواند تا ۹۰ کیلوگرم (۲۰۰ پوند) را به‌راحتی بلند کند! 💪

با کمک این بازوهای هوشمند، یک نفر به‌تنهایی می‌تواند کارهایی انجام دهد که قبلاً نیاز به چندین نفر داشت — از جمله حمل موشک‌ها یا تجهیزات سنگین نظامی و صنعتی.

🔩 سیستم حرکتی با دقت بالا و کنترل تطبیقی طراحی شده تا حرکات انسان را به‌صورت طبیعی دنبال کند، بدون ایجاد فشار یا خستگی.

این فناوری می‌تواند انقلابی در حوزه‌های نظامی، امداد و نجات، و حتی صنایع سنگین ایجاد کند — جایی که ترکیب قدرت ربات و دقت انسان حیاتی است. ⚙️

@rss_ai_ir
#BostonDynamics #Exoskeleton #Robotics #AI #هوش_مصنوعی #رباتیک #فناوری #انسان_ربات
👏3🔥2👍1
🇵🇱 استارتاپ لهستانی Pathway معماری جدیدی از شبکه‌های عصبی معرفی کرد —

🧬 Biological Dragon Hatchling (BDH)

هدف از این پروژه، ترکیب دو مسیر اصلی تکامل هوش مصنوعی است: ترنسفورمرها و مدل‌های الهام‌گرفته از مغز انسان.
مطالعات (از جمله پژوهش اخیر DeepMind) نشان داده‌اند که بین ساختار مغز و معماری ترنسفورمر شباهت‌های عمیقی وجود دارد — اما مدل‌های زبانی امروزی هنوز فاقد چند ویژگی کلیدی مغز هستند.

در BDH، پژوهشگران Pathway تصمیم گرفتند این شکاف را پر کنند و برخی ویژگی‌های واقعی مغز را درون ترنسفورمر «پیوند» دهند.
نتیجه، یک شبکه گرافی است که در آن:

نورون‌ها → رأس‌ها (nodes)

سیناپس‌ها → یال‌های وزن‌دار (weighted edges) هستند.
هر نورون فقط با همسایگان خود ارتباط دارد — درست مثل مغز انسان 🧠



---

⚙️ روش یادگیری:

در این مدل از قانون هب (Hebb’s Rule) استفاده شده است — همان قانونی که در مغز واقعی هم برقرار است:

> «نورون‌هایی که با هم فعال می‌شوند، ارتباط‌شان قوی‌تر می‌شود.»



اگر دو نورون A و B بارها همزمان فعال شوند، وزن سیناپس بین آنها افزایش می‌یابد.
در عمل، این مکانیزم مشابه نوعی توجه (attention) است.


---

🧠 حافظه کوتاه‌مدت و بلندمدت:

وزن‌ها در این مدل به دو بخش تقسیم می‌شوند:

ثابت (Fixed weights): حافظه بلندمدت؛ فقط در مرحله آموزش به‌روز می‌شوند.

پویا (Dynamic weights): حافظه کوتاه‌مدت؛ در طول فرایند استدلال تغییر می‌کنند.
هر گام استدلال، در واقع نوعی «به‌روزرسانی محلی» در شبکه سیناپسی است.



---

💻 نسخه‌ی تانسوری (BDH-GPU):

✳️برای آموزش سریع‌تر، نسخه‌ای از BDH به‌صورت تانسوری بازنویسی شده که با ماتریس‌ها و وکتورها کار می‌کند — یعنی می‌توان آن را مثل ترنسفورمر معمولی آموزش داد.
✳️ساختار شامل لایه‌های Attention، MLP، ReLU و اکتیواسیون‌های اختصاصی است.


---

📊 نتایج جالب:

1️⃣ قابلیت تفسیر بالا:
هر جفت نورون (i, j) سیناپس مخصوص به خود را دارد و وضعیت آن قابل مشاهده است.
هر نورون معنای مشخصی دارد — واقعاً یک مفهوم واحد را نمایش می‌دهد.

2️⃣ ادغام ساده مدل‌ها:
دو مدل BDH را می‌توان با یک کنکات ساده (concatenation) به هم متصل کرد — فوق‌العاده برای مقیاس‌پذیری.

3️⃣ قانون مقیاس (Scaling Laws):
همچنین BDH همان رفتار مقیاس‌پذیری GPT-2 را نشان می‌دهد، و در تعداد پارامتر برابر، به دقت مشابهی در چندین وظیفه دست یافته است.
این یعنی هسته اصلی توان ترنسفورمر حفظ شده است


---

🔗 کد منبع در GitHub
📄 مقاله در arXiv

@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #Pathway #BDH #AI #DeepLearning #Neuroscience #Transformers
👏2🙏1👌1
⚡️ معماری Mamba-3 بی‌سروصدا در کنفرانس ICLR منتشر شد — و شاید این آغاز پایان عصر ترنسفورمرها باشد.

معماری Mamba-3 نسل جدیدی از معماری‌های مبتنی بر State Space Models (SSM) است که مدل‌ها را هنگام کار با کانتکست‌های طولانی‌تر، سریع‌تر، پایدارتر و کارآمدتر می‌کند.

در این معماری دیگر خبری از Attention Layers نیست — مدل به‌جای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و به‌روزرسانی می‌کند.


---

📘 مروری کوتاه بر تکامل مامبا:

🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل می‌توانست به‌صورت هوشمند فقط بخش‌های مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.

🔹 Mamba-2:
✳️نشان داد که به‌روزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکه‌اند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریع‌تر شود.

🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل به‌صورت پیوسته و نرم‌تر تغییر می‌کند، زیرا به‌جای گام ساده اویلر (Euler Step) از انتگرال‌گیری ذوزنقه‌ای (Trapezoidal Integration) استفاده می‌کند.

✳️در این روش، به‌جای محاسبه‌ی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ می‌کند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعی‌تر حافظه.


---

🧠 چه چیزهایی زیر کاپوت تغییر کرده؟

♻️حافظه به‌صورت ریتمیک (Rhythmic Memory) عمل می‌کند — یعنی می‌تواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) به‌خوبی یاد بگیرد.

♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.



---

⚙️ مزایا در عمل:

مدیریت کارآمد توالی‌های طولانی (متن، ژنوم، داده‌های زمانی)
سرعت خطی و تأخیر ثابت — مناسب برای چت‌بات‌ها، ترجمه زنده، و گفتار به گفتار (real-time)
بهره‌وری انرژی بالا و مقیاس‌پذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار می‌کند.


---

🚀 معماری Mamba-3 فقط جایگزینی سریع‌تر برای ترنسفورمر نیست — بلکه معماری‌ای تازه است که عمق درک متنی، سرعت و پایداری را هم‌زمان در خود دارد.
از سرورهای عظیم تا گوشی‌های هوشمند.

🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj

@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
2👍1
🧩 Segment Anything 3 –
نسل سوم سام از Meta به‌صورت بی‌سر و صدا در ICLR منتشر شد!

📍 اگر SAM 1 فقط اجازه می‌داد با یک کلیک روی تصویر، شیء مورد نظر را بخش‌بندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،

حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی می‌خواهید — مثلاً:

> «اتوبوس زرد مدرسه»، «گربه راه‌راه»، «سیب قرمز» 🍎



مدل خودش همه نمونه‌های آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم می‌کند.
به زبان ساده: بخش‌بندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---

💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسم‌های کوتاه، نمونه‌های تصویری یا ترکیبی از هر دو استفاده کنید.
شما فقط مفهوم را بیان می‌کنید، مدل خودش تشخیص می‌دهد و مرزها را ترسیم می‌کند.
---

🧠 زیرساخت داده‌ای عظیم پشت این مدل:

♻️۴ میلیون مفهوم منحصربه‌فرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسان‌ها و LLMها (که کار یکدیگر را ارزیابی کرده‌اند)
---

⚙️ نتیجه:

✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً هم‌سطح با انسان در آزمون‌های Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)

---

📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw

@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Mesh2Motion — نسخه‌ی اپن‌سورس Mixamo در مرورگر!

اگر با Mixamo کار کرده‌اید، حالا می‌توانید نسخه‌ی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇

💡 کافی است مدل سه‌بعدی خود را آپلود کنید —
سیستم به‌صورت خودکار ریگ (Rig) را ایجاد می‌کند، با قابلیت ویرایش دستی،
و سپس می‌توانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:

♻️رینگ خودکار با کنترل‌های دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرم‌افزاری
♻️خروجی سازگار با تمامی موتورهای سه‌بعدی (Blender, Unity, Unreal و غیره)

---

🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app

@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🥋 Unitree G1 Kungfu Kid V6.0 —
وقتی ربات‌ها واقعاً “هنرهای رزمی” یاد می‌گیرند!

عنوان را همان‌طور می‌گذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عده‌ای هنوز در کامنت‌ها می‌نوشتند
«این فقط رندر کامپیوتری است!» 😏

اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخه‌ی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام می‌دهد که حتی برای انسان‌ها سخت است.
چرخش، پرش، عقب‌گرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.

🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفس‌گیر است —
و حالا دیگر شوخی نیست، این نسل جدید روبات‌های رزمی واقعی است.

⚠️ هنوز می‌خواهید به این موجودات لگد بزنید؟
به‌زودی شاید جواب بدهند. 😄

@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
1👏1
⚡️ گوگل سامانه‌ای ساخت که خودش سازمان می‌یابد — و شاید مسیر ساخت مدل‌ها را عوض کند!

پروژه‌ای به نام TUMIX از تیم Google، به‌گفته‌ی بسیاری، یکی از هیجان‌انگیزترین کارهای هوش مصنوعی امسال است.


---

💡 به‌جای آموزش یک مدل غول‌پیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) هم‌زمان و هماهنگ کار می‌کنند.
هر کدام نقش مخصوص خود را دارند:

یکی کد می‌نویسد 💻

دیگری جست‌وجو می‌کند 🔍

سومی با زبان طبیعی استدلال می‌کند 🧠


همگی به‌صورت مستقل روی یک مسئله کار می‌کنند، سپس پاسخ‌ها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی می‌رسند.


---

📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمون‌های استدلالی تا 17.4٪ بهتر از همه سیستم‌های دیگر عمل کرد،
در حالی که هزینه‌ی استنتاج تقریباً نصف شد!

بدون داده‌ی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.


---

نکته‌ی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخه‌ی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عامل‌های جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!


---

🧩 این پژوهش نشان می‌دهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکه‌ای از مدل‌های کوچک و هماهنگ بیاید که یاد می‌گیرند با هم فکر کنند.

📄 جزئیات کامل:
arxiv.org/pdf/2510.01279

@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
3👏1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
🚛🤖 یک ویدئوی دیگر که ثابت می‌کند خودکارسازی حمل‌ونقل خیلی نزدیک‌تر از آن چیزی‌ست که فکر می‌کردیم.

@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
👏4🤯2👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت Guangnian Innovation در شنژن از ربات پیشرفته‌ی M1 رونمایی کرد.

این ربات از یک سامانه‌ی ماژولار مفصلی با درایو موازی استفاده می‌کند که بازده نیرویی را تا ۴۰٪ نسبت به طراحی‌های سنتی افزایش می‌دهد. بدنه‌ی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.

🛞 ربات M1 ترکیبی از حرکت خارج‌جاده‌ای و حرکت سریع در مسیرهای صاف است، به‌علاوه از نورپردازی هوشمند و ناوبری خودکار بهره می‌برد تا بتواند به‌راحتی از میان چمن، سنگ‌ریزه و شیب‌های تند عبور کند.

این ربات گامی بزرگ در مسیر ربات‌های خودران و کاربردی در صنعت حمل‌ونقل و عملیات میدانی است.

#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
👍2
🧩 LightReasoner —
زمانی که مدل‌های کوچک، مدل‌های بزرگ را در استدلال بهتر آموزش می‌دهند

پژوهشگران روشی به نام LightReasoner معرفی کرده‌اند که به مدل‌های کوچک اجازه می‌دهد به مدل‌های بزرگ‌تر بیاموزند کجا و چگونه باید استدلال کنند.

💡 ایده‌ی اصلی این است که:
به‌جای آموزش مدل روی کل متن، فقط روی توکن‌هایی تمرکز شود که واقعاً مسیر استدلال را تغییر می‌دهند.

🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا می‌کند و نقاطی را پیدا می‌کند که در آن‌ها پیش‌بینی‌هایشان تفاوت زیادی دارد.
این نقاط همان گام‌های بحرانی هستند که مسیر پاسخ درست را تعیین می‌کنند.

سپس مدل:

فقط همین گام‌های دشوار را نگه می‌دارد،

تفاوت استاد را به هدف آموزشی نرم تبدیل می‌کند،

توکن‌های ساده و بدیهی را نادیده می‌گیرد.


📉 نتیجه:

♻️سرعت آموزش تا ۹۰٪ بیشتر،

♻️تعداد توکن‌های آموزشی تا ۹۹٪ کمتر،

♻️اما دقت در بنچمارک‌های ریاضی برابر یا حتی بالاتر از فاین‌تیونینگ سنتی است.


♻️اثر این روش زمانی بیشتر است که مدل شاگرد نه‌تنها کوچک‌تر، بلکه در حوزه‌ی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفه‌ها — انتخاب گام‌ها یا اهداف متضاد — باعث افت عملکرد می‌شود.

📄 مقاله: arxiv.org/abs/2510.07962

#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 باورکردنی نیست اگر این درز اطلاعات واقعیت داشته باشه!

🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!

گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین می‌بره.
مدل نه‌تنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زنده‌ی موسیقی رو هم تولید می‌کنه.

🎹 اگه درست باشه، یعنی وارد دوره‌ای شدیم که مدل‌های مولد چندوجهی (multimodal) واقعاً می‌تونن خلاقیت انسانی رو شبیه‌سازی کنن.

@rss_ai_ir

#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
😶‍🌫️ رندر؟ ویدیو؟ یا تولید مصنوعی؟

🎢 دیزنی‌لند چینی وارد صحنه شده...

از یه طرف، تولیدات تصویری‌ای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، ربات‌هایی که از همین تولیدات مصنوعی هم واقعی‌تر به‌نظر میان.

🔻 «راهروی واقعیت چرمی» داره تنگ‌تر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.

و جالبه که Unitree چطور با سگ‌های رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگ‌ترِ پشت حصار، بیان و روی چمن‌ها قدم بزنن…

@rss_ai_ir

#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🔥2