This media is not supported in your browser
VIEW IN TELEGRAM
😄 ظاهراً بایدنس هم تصمیم گرفته وارد رقابت مستقیم با OpenAI و Alibaba بشه!
🧠 DreamOmni2 —
مدل جدید چندوجهی (Multimodal) از ByteDance که هم تولید (Generation) و هم ویرایش (Editing) تصویر رو با دستور متنی انجام میده.
در واقع یه چیزی بین Qwen-Edit و Nanabana با چاشنی شتاب چینی ⚡
📦 امکاناتش:
♻️تولید و ویرایش تصویر با دستور متنی یا تصویری 🎨
♻️پشتیبانی از ویرایش ناحیهای و تنظیمات سبک
♻️عملکرد چشمگیر در مقایسه با Banana, Qwen, GPT-Image 1 و OmniGen
♻️کاملاً اوپنسورس با کد، مقاله و دموی آماده برای تست
📎 لینکها:
🔹 GitHub:
github.com/dvlab-research/DreamOmni2
🔹 صفحه پروژه و مقایسه تصاویر:
pbihao.github.io/projects/DreamOmni2
به قول نویسنده پست: «برو تستش کن، من تا دوشنبه توی دیتاکسم» 😅
@rss_ai_ir
#هوش_مصنوعی #DreamOmni2 #ByteDance #AIimage #Multimodal #ویرایش_تصویر #تولید_تصویر #GenerativeAI #AItools #Qwen #Nanabana
🧠 DreamOmni2 —
مدل جدید چندوجهی (Multimodal) از ByteDance که هم تولید (Generation) و هم ویرایش (Editing) تصویر رو با دستور متنی انجام میده.
در واقع یه چیزی بین Qwen-Edit و Nanabana با چاشنی شتاب چینی ⚡
📦 امکاناتش:
♻️تولید و ویرایش تصویر با دستور متنی یا تصویری 🎨
♻️پشتیبانی از ویرایش ناحیهای و تنظیمات سبک
♻️عملکرد چشمگیر در مقایسه با Banana, Qwen, GPT-Image 1 و OmniGen
♻️کاملاً اوپنسورس با کد، مقاله و دموی آماده برای تست
📎 لینکها:
🔹 GitHub:
github.com/dvlab-research/DreamOmni2
🔹 صفحه پروژه و مقایسه تصاویر:
pbihao.github.io/projects/DreamOmni2
به قول نویسنده پست: «برو تستش کن، من تا دوشنبه توی دیتاکسم» 😅
@rss_ai_ir
#هوش_مصنوعی #DreamOmni2 #ByteDance #AIimage #Multimodal #ویرایش_تصویر #تولید_تصویر #GenerativeAI #AItools #Qwen #Nanabana
❤1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ کپی صدای شما فقط در ۱۰ ثانیه! 🎙️
سرویسی جدید معرفی شده که میتونه صدای هرکسی رو در کمتر از ۱۰ ثانیه ضبط و شبیهسازی کنه 😳
بعد از اون، هر متنی رو با همون صدا و لحن طبیعی شما میخونه — مستقیم داخل مرورگر، بدون نیاز به نصب هیچ برنامهای.
🎧 ویژگیها:
• فقط ۱۰ ثانیه ضبط صدا برای کپی کامل 🎤
• پشتیبانی از دهها زبان از جمله فارسی 🇮🇷
• صدای طبیعی، دقیق و بدون تأخیر
• مناسب برای ویدیو، پادکست، و پروژههای شخصی
🟢 تستش کنید — واقعاً حیرتانگیزه!
https://vocloner.com/
@rss_ai_ir
#هوش_مصنوعی #AIvoice #clone #تولید_صدا #VoiceAI #AItools #گویندگی #سنتز_صدا #TextToSpeech
سرویسی جدید معرفی شده که میتونه صدای هرکسی رو در کمتر از ۱۰ ثانیه ضبط و شبیهسازی کنه 😳
بعد از اون، هر متنی رو با همون صدا و لحن طبیعی شما میخونه — مستقیم داخل مرورگر، بدون نیاز به نصب هیچ برنامهای.
🎧 ویژگیها:
• فقط ۱۰ ثانیه ضبط صدا برای کپی کامل 🎤
• پشتیبانی از دهها زبان از جمله فارسی 🇮🇷
• صدای طبیعی، دقیق و بدون تأخیر
• مناسب برای ویدیو، پادکست، و پروژههای شخصی
🟢 تستش کنید — واقعاً حیرتانگیزه!
https://vocloner.com/
@rss_ai_ir
#هوش_مصنوعی #AIvoice #clone #تولید_صدا #VoiceAI #AItools #گویندگی #سنتز_صدا #TextToSpeech
🔥1
🧠 گزارش ۱۵۰ صفحهای گوگل درباره Health AI Agents منتشر شد!
⛔️گوگل در تازهترین پژوهش خود مسیر جدیدی را برای عاملهای هوش مصنوعی در حوزه سلامت معرفی کرده است — نه یک Doctor-GPT غولپیکر، بلکه مجموعهای از عاملهای تخصصی با همکاری هوشمند.
🔹 ساختار سیستم Personal Health Agent (PHA):
1️⃣ Data Science Agent → تحلیل دادههای پوشیدنی و نتایج آزمایشگاهی
2️⃣ Domain Expert Agent → بررسی و تأیید دانش و حقایق پزشکی
3️⃣ Health Coach Agent → گفتوگو، تعیین هدف و افزودن حس همدلی
🧩 همه این عاملها توسط یک Orchestrator با حافظه فعال به هم متصل میشوند که اهداف، محدودیتها و بینشهای کاربر را درک و بهروزرسانی میکند.
⚡️ نتایج کلیدی:
✅عملکرد بهتر نسبت به مدلهای پایه در ۱۰ بنچمارک
✅کاربران واقعی در آزمایشها PHA را به مدلهای زبانی معمولی ترجیح دادند
✅کارشناسان پزشکی کیفیت پاسخها را بین ۵٫۷ تا ۳۹٪ بهتر ارزیابی کردند
⚙️ اصول طراحی:
❌تمرکز بر همه نیازهای کاربر، نه فقط پاسخ به سؤال
❌ترکیب پویا بین عاملها بر اساس زمینه
❌جلوگیری از درخواست دادههایی که از دادههای موجود قابل استنتاجاند
❌کاهش حداکثری تأخیر و پیچیدگی
🧠 موارد استفاده تستشده:
♻️پرسشهای عمومی سلامت
♻️تفسیر دادههای دستگاههای پوشیدنی و بیومارکرها
♻️توصیههای شخصی برای خواب، تغذیه و فعالیت
♻️تحلیل علائم بدون تشخیص نهایی
⚠️ محدودیتها و مسیر آینده:
✳️کندتر از عاملهای تکی (۲۴۴ ثانیه در برابر ۳۶ ثانیه)
✳️نیاز به ارزیابی سوگیری، حفظ حریم خصوصی و انطباق قانونی
✳️گام بعدی: گفتوگوی تطبیقی با تعادل بین همدلی و دقت علمی
💡 جمعبندی:
گوگل مسیر آینده هوش مصنوعی را در حوزه سلامت نشان میدهد — نه یک پزشک واحد، بلکه تیمی از عاملهای تخصصی هماهنگ.
پزشکی فقط شروع ماجراست؛ بعد از آن، نوبت به مالی، حقوق، آموزش و علم خواهد رسید.
📄 مطالعه گزارش کامل:
arxiv.org/pdf/2508.20148
@rss_ai_ir
#Google #HealthAI #AgenticAI #هوش_مصنوعی #پزشکی #سلامت #AI #LLM
⛔️گوگل در تازهترین پژوهش خود مسیر جدیدی را برای عاملهای هوش مصنوعی در حوزه سلامت معرفی کرده است — نه یک Doctor-GPT غولپیکر، بلکه مجموعهای از عاملهای تخصصی با همکاری هوشمند.
🔹 ساختار سیستم Personal Health Agent (PHA):
1️⃣ Data Science Agent → تحلیل دادههای پوشیدنی و نتایج آزمایشگاهی
2️⃣ Domain Expert Agent → بررسی و تأیید دانش و حقایق پزشکی
3️⃣ Health Coach Agent → گفتوگو، تعیین هدف و افزودن حس همدلی
🧩 همه این عاملها توسط یک Orchestrator با حافظه فعال به هم متصل میشوند که اهداف، محدودیتها و بینشهای کاربر را درک و بهروزرسانی میکند.
⚡️ نتایج کلیدی:
✅عملکرد بهتر نسبت به مدلهای پایه در ۱۰ بنچمارک
✅کاربران واقعی در آزمایشها PHA را به مدلهای زبانی معمولی ترجیح دادند
✅کارشناسان پزشکی کیفیت پاسخها را بین ۵٫۷ تا ۳۹٪ بهتر ارزیابی کردند
⚙️ اصول طراحی:
❌تمرکز بر همه نیازهای کاربر، نه فقط پاسخ به سؤال
❌ترکیب پویا بین عاملها بر اساس زمینه
❌جلوگیری از درخواست دادههایی که از دادههای موجود قابل استنتاجاند
❌کاهش حداکثری تأخیر و پیچیدگی
🧠 موارد استفاده تستشده:
♻️پرسشهای عمومی سلامت
♻️تفسیر دادههای دستگاههای پوشیدنی و بیومارکرها
♻️توصیههای شخصی برای خواب، تغذیه و فعالیت
♻️تحلیل علائم بدون تشخیص نهایی
⚠️ محدودیتها و مسیر آینده:
✳️کندتر از عاملهای تکی (۲۴۴ ثانیه در برابر ۳۶ ثانیه)
✳️نیاز به ارزیابی سوگیری، حفظ حریم خصوصی و انطباق قانونی
✳️گام بعدی: گفتوگوی تطبیقی با تعادل بین همدلی و دقت علمی
💡 جمعبندی:
گوگل مسیر آینده هوش مصنوعی را در حوزه سلامت نشان میدهد — نه یک پزشک واحد، بلکه تیمی از عاملهای تخصصی هماهنگ.
پزشکی فقط شروع ماجراست؛ بعد از آن، نوبت به مالی، حقوق، آموزش و علم خواهد رسید.
📄 مطالعه گزارش کامل:
arxiv.org/pdf/2508.20148
@rss_ai_ir
#Google #HealthAI #AgenticAI #هوش_مصنوعی #پزشکی #سلامت #AI #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات پوشیدنی جدید Boston Dynamics با بازوهای ۲۴ درجه آزادی!
این اگزواسکلتون پیشرفته دارای بازوهایی است با ۲۴ درجه آزادی (DoF) که میتواند تا ۹۰ کیلوگرم (۲۰۰ پوند) را بهراحتی بلند کند! 💪
با کمک این بازوهای هوشمند، یک نفر بهتنهایی میتواند کارهایی انجام دهد که قبلاً نیاز به چندین نفر داشت — از جمله حمل موشکها یا تجهیزات سنگین نظامی و صنعتی.
🔩 سیستم حرکتی با دقت بالا و کنترل تطبیقی طراحی شده تا حرکات انسان را بهصورت طبیعی دنبال کند، بدون ایجاد فشار یا خستگی.
این فناوری میتواند انقلابی در حوزههای نظامی، امداد و نجات، و حتی صنایع سنگین ایجاد کند — جایی که ترکیب قدرت ربات و دقت انسان حیاتی است. ⚙️
@rss_ai_ir
#BostonDynamics #Exoskeleton #Robotics #AI #هوش_مصنوعی #رباتیک #فناوری #انسان_ربات
این اگزواسکلتون پیشرفته دارای بازوهایی است با ۲۴ درجه آزادی (DoF) که میتواند تا ۹۰ کیلوگرم (۲۰۰ پوند) را بهراحتی بلند کند! 💪
با کمک این بازوهای هوشمند، یک نفر بهتنهایی میتواند کارهایی انجام دهد که قبلاً نیاز به چندین نفر داشت — از جمله حمل موشکها یا تجهیزات سنگین نظامی و صنعتی.
🔩 سیستم حرکتی با دقت بالا و کنترل تطبیقی طراحی شده تا حرکات انسان را بهصورت طبیعی دنبال کند، بدون ایجاد فشار یا خستگی.
این فناوری میتواند انقلابی در حوزههای نظامی، امداد و نجات، و حتی صنایع سنگین ایجاد کند — جایی که ترکیب قدرت ربات و دقت انسان حیاتی است. ⚙️
@rss_ai_ir
#BostonDynamics #Exoskeleton #Robotics #AI #هوش_مصنوعی #رباتیک #فناوری #انسان_ربات
👏3🔥2👍1
🇵🇱 استارتاپ لهستانی Pathway معماری جدیدی از شبکههای عصبی معرفی کرد —
🧬 Biological Dragon Hatchling (BDH)
هدف از این پروژه، ترکیب دو مسیر اصلی تکامل هوش مصنوعی است: ترنسفورمرها و مدلهای الهامگرفته از مغز انسان.
مطالعات (از جمله پژوهش اخیر DeepMind) نشان دادهاند که بین ساختار مغز و معماری ترنسفورمر شباهتهای عمیقی وجود دارد — اما مدلهای زبانی امروزی هنوز فاقد چند ویژگی کلیدی مغز هستند.
در BDH، پژوهشگران Pathway تصمیم گرفتند این شکاف را پر کنند و برخی ویژگیهای واقعی مغز را درون ترنسفورمر «پیوند» دهند.
نتیجه، یک شبکه گرافی است که در آن:
نورونها → رأسها (nodes)
سیناپسها → یالهای وزندار (weighted edges) هستند.
هر نورون فقط با همسایگان خود ارتباط دارد — درست مثل مغز انسان 🧠
---
⚙️ روش یادگیری:
در این مدل از قانون هب (Hebb’s Rule) استفاده شده است — همان قانونی که در مغز واقعی هم برقرار است:
> «نورونهایی که با هم فعال میشوند، ارتباطشان قویتر میشود.»
اگر دو نورون A و B بارها همزمان فعال شوند، وزن سیناپس بین آنها افزایش مییابد.
در عمل، این مکانیزم مشابه نوعی توجه (attention) است.
---
🧠 حافظه کوتاهمدت و بلندمدت:
وزنها در این مدل به دو بخش تقسیم میشوند:
ثابت (Fixed weights): حافظه بلندمدت؛ فقط در مرحله آموزش بهروز میشوند.
پویا (Dynamic weights): حافظه کوتاهمدت؛ در طول فرایند استدلال تغییر میکنند.
هر گام استدلال، در واقع نوعی «بهروزرسانی محلی» در شبکه سیناپسی است.
---
💻 نسخهی تانسوری (BDH-GPU):
✳️برای آموزش سریعتر، نسخهای از BDH بهصورت تانسوری بازنویسی شده که با ماتریسها و وکتورها کار میکند — یعنی میتوان آن را مثل ترنسفورمر معمولی آموزش داد.
✳️ساختار شامل لایههای Attention، MLP، ReLU و اکتیواسیونهای اختصاصی است.
---
📊 نتایج جالب:
1️⃣ قابلیت تفسیر بالا:
هر جفت نورون (i, j) سیناپس مخصوص به خود را دارد و وضعیت آن قابل مشاهده است.
هر نورون معنای مشخصی دارد — واقعاً یک مفهوم واحد را نمایش میدهد.
2️⃣ ادغام ساده مدلها:
دو مدل BDH را میتوان با یک کنکات ساده (concatenation) به هم متصل کرد — فوقالعاده برای مقیاسپذیری.
3️⃣ قانون مقیاس (Scaling Laws):
همچنین BDH همان رفتار مقیاسپذیری GPT-2 را نشان میدهد، و در تعداد پارامتر برابر، به دقت مشابهی در چندین وظیفه دست یافته است.
این یعنی هسته اصلی توان ترنسفورمر حفظ شده است ⚡
---
🔗 کد منبع در GitHub
📄 مقاله در arXiv
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #Pathway #BDH #AI #DeepLearning #Neuroscience #Transformers
🧬 Biological Dragon Hatchling (BDH)
هدف از این پروژه، ترکیب دو مسیر اصلی تکامل هوش مصنوعی است: ترنسفورمرها و مدلهای الهامگرفته از مغز انسان.
مطالعات (از جمله پژوهش اخیر DeepMind) نشان دادهاند که بین ساختار مغز و معماری ترنسفورمر شباهتهای عمیقی وجود دارد — اما مدلهای زبانی امروزی هنوز فاقد چند ویژگی کلیدی مغز هستند.
در BDH، پژوهشگران Pathway تصمیم گرفتند این شکاف را پر کنند و برخی ویژگیهای واقعی مغز را درون ترنسفورمر «پیوند» دهند.
نتیجه، یک شبکه گرافی است که در آن:
نورونها → رأسها (nodes)
سیناپسها → یالهای وزندار (weighted edges) هستند.
هر نورون فقط با همسایگان خود ارتباط دارد — درست مثل مغز انسان 🧠
---
⚙️ روش یادگیری:
در این مدل از قانون هب (Hebb’s Rule) استفاده شده است — همان قانونی که در مغز واقعی هم برقرار است:
> «نورونهایی که با هم فعال میشوند، ارتباطشان قویتر میشود.»
اگر دو نورون A و B بارها همزمان فعال شوند، وزن سیناپس بین آنها افزایش مییابد.
در عمل، این مکانیزم مشابه نوعی توجه (attention) است.
---
🧠 حافظه کوتاهمدت و بلندمدت:
وزنها در این مدل به دو بخش تقسیم میشوند:
ثابت (Fixed weights): حافظه بلندمدت؛ فقط در مرحله آموزش بهروز میشوند.
پویا (Dynamic weights): حافظه کوتاهمدت؛ در طول فرایند استدلال تغییر میکنند.
هر گام استدلال، در واقع نوعی «بهروزرسانی محلی» در شبکه سیناپسی است.
---
💻 نسخهی تانسوری (BDH-GPU):
✳️برای آموزش سریعتر، نسخهای از BDH بهصورت تانسوری بازنویسی شده که با ماتریسها و وکتورها کار میکند — یعنی میتوان آن را مثل ترنسفورمر معمولی آموزش داد.
✳️ساختار شامل لایههای Attention، MLP، ReLU و اکتیواسیونهای اختصاصی است.
---
📊 نتایج جالب:
1️⃣ قابلیت تفسیر بالا:
هر جفت نورون (i, j) سیناپس مخصوص به خود را دارد و وضعیت آن قابل مشاهده است.
هر نورون معنای مشخصی دارد — واقعاً یک مفهوم واحد را نمایش میدهد.
2️⃣ ادغام ساده مدلها:
دو مدل BDH را میتوان با یک کنکات ساده (concatenation) به هم متصل کرد — فوقالعاده برای مقیاسپذیری.
3️⃣ قانون مقیاس (Scaling Laws):
همچنین BDH همان رفتار مقیاسپذیری GPT-2 را نشان میدهد، و در تعداد پارامتر برابر، به دقت مشابهی در چندین وظیفه دست یافته است.
این یعنی هسته اصلی توان ترنسفورمر حفظ شده است ⚡
---
🔗 کد منبع در GitHub
📄 مقاله در arXiv
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #Pathway #BDH #AI #DeepLearning #Neuroscience #Transformers
👏2🙏1👌1
⚡️ معماری Mamba-3 بیسروصدا در کنفرانس ICLR منتشر شد — و شاید این آغاز پایان عصر ترنسفورمرها باشد.
✅معماری Mamba-3 نسل جدیدی از معماریهای مبتنی بر State Space Models (SSM) است که مدلها را هنگام کار با کانتکستهای طولانیتر، سریعتر، پایدارتر و کارآمدتر میکند.
✅در این معماری دیگر خبری از Attention Layers نیست — مدل بهجای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و بهروزرسانی میکند.
---
📘 مروری کوتاه بر تکامل مامبا:
🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل میتوانست بهصورت هوشمند فقط بخشهای مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.
🔹 Mamba-2:
✳️نشان داد که بهروزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکهاند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریعتر شود.
🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل بهصورت پیوسته و نرمتر تغییر میکند، زیرا بهجای گام ساده اویلر (Euler Step) از انتگرالگیری ذوزنقهای (Trapezoidal Integration) استفاده میکند.
✳️در این روش، بهجای محاسبهی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ میکند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعیتر حافظه.
---
🧠 چه چیزهایی زیر کاپوت تغییر کرده؟
♻️حافظه بهصورت ریتمیک (Rhythmic Memory) عمل میکند — یعنی میتواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) بهخوبی یاد بگیرد.
♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.
---
⚙️ مزایا در عمل:
✅ مدیریت کارآمد توالیهای طولانی (متن، ژنوم، دادههای زمانی)
✅ سرعت خطی و تأخیر ثابت — مناسب برای چتباتها، ترجمه زنده، و گفتار به گفتار (real-time)
✅ بهرهوری انرژی بالا و مقیاسپذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار میکند.
---
🚀 معماری Mamba-3 فقط جایگزینی سریعتر برای ترنسفورمر نیست — بلکه معماریای تازه است که عمق درک متنی، سرعت و پایداری را همزمان در خود دارد.
از سرورهای عظیم تا گوشیهای هوشمند.
🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj
@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
✅معماری Mamba-3 نسل جدیدی از معماریهای مبتنی بر State Space Models (SSM) است که مدلها را هنگام کار با کانتکستهای طولانیتر، سریعتر، پایدارتر و کارآمدتر میکند.
✅در این معماری دیگر خبری از Attention Layers نیست — مدل بهجای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و بهروزرسانی میکند.
---
📘 مروری کوتاه بر تکامل مامبا:
🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل میتوانست بهصورت هوشمند فقط بخشهای مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.
🔹 Mamba-2:
✳️نشان داد که بهروزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکهاند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریعتر شود.
🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل بهصورت پیوسته و نرمتر تغییر میکند، زیرا بهجای گام ساده اویلر (Euler Step) از انتگرالگیری ذوزنقهای (Trapezoidal Integration) استفاده میکند.
✳️در این روش، بهجای محاسبهی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ میکند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعیتر حافظه.
---
🧠 چه چیزهایی زیر کاپوت تغییر کرده؟
♻️حافظه بهصورت ریتمیک (Rhythmic Memory) عمل میکند — یعنی میتواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) بهخوبی یاد بگیرد.
♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.
---
⚙️ مزایا در عمل:
✅ مدیریت کارآمد توالیهای طولانی (متن، ژنوم، دادههای زمانی)
✅ سرعت خطی و تأخیر ثابت — مناسب برای چتباتها، ترجمه زنده، و گفتار به گفتار (real-time)
✅ بهرهوری انرژی بالا و مقیاسپذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار میکند.
---
🚀 معماری Mamba-3 فقط جایگزینی سریعتر برای ترنسفورمر نیست — بلکه معماریای تازه است که عمق درک متنی، سرعت و پایداری را همزمان در خود دارد.
از سرورهای عظیم تا گوشیهای هوشمند.
🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj
@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
❤2👍1
🧩 Segment Anything 3 –
نسل سوم سام از Meta بهصورت بیسر و صدا در ICLR منتشر شد!
📍 اگر SAM 1 فقط اجازه میداد با یک کلیک روی تصویر، شیء مورد نظر را بخشبندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،
حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی میخواهید — مثلاً:
> «اتوبوس زرد مدرسه»، «گربه راهراه»، «سیب قرمز» 🍎
مدل خودش همه نمونههای آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم میکند.
به زبان ساده: بخشبندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---
💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسمهای کوتاه، نمونههای تصویری یا ترکیبی از هر دو استفاده کنید.
❌شما فقط مفهوم را بیان میکنید، مدل خودش تشخیص میدهد و مرزها را ترسیم میکند.
---
🧠 زیرساخت دادهای عظیم پشت این مدل:
♻️۴ میلیون مفهوم منحصربهفرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسانها و LLMها (که کار یکدیگر را ارزیابی کردهاند)
---
⚙️ نتیجه:
✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً همسطح با انسان در آزمونهای Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)
---
📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw
@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
نسل سوم سام از Meta بهصورت بیسر و صدا در ICLR منتشر شد!
📍 اگر SAM 1 فقط اجازه میداد با یک کلیک روی تصویر، شیء مورد نظر را بخشبندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،
حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی میخواهید — مثلاً:
> «اتوبوس زرد مدرسه»، «گربه راهراه»، «سیب قرمز» 🍎
مدل خودش همه نمونههای آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم میکند.
به زبان ساده: بخشبندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---
💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسمهای کوتاه، نمونههای تصویری یا ترکیبی از هر دو استفاده کنید.
❌شما فقط مفهوم را بیان میکنید، مدل خودش تشخیص میدهد و مرزها را ترسیم میکند.
---
🧠 زیرساخت دادهای عظیم پشت این مدل:
♻️۴ میلیون مفهوم منحصربهفرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسانها و LLMها (که کار یکدیگر را ارزیابی کردهاند)
---
⚙️ نتیجه:
✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً همسطح با انسان در آزمونهای Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)
---
📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw
@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Mesh2Motion — نسخهی اپنسورس Mixamo در مرورگر!
اگر با Mixamo کار کردهاید، حالا میتوانید نسخهی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇
💡 کافی است مدل سهبعدی خود را آپلود کنید —
سیستم بهصورت خودکار ریگ (Rig) را ایجاد میکند، با قابلیت ویرایش دستی،
و سپس میتوانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:
♻️رینگ خودکار با کنترلهای دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرمافزاری
♻️خروجی سازگار با تمامی موتورهای سهبعدی (Blender, Unity, Unreal و غیره)
---
🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app
@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
اگر با Mixamo کار کردهاید، حالا میتوانید نسخهی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇
💡 کافی است مدل سهبعدی خود را آپلود کنید —
سیستم بهصورت خودکار ریگ (Rig) را ایجاد میکند، با قابلیت ویرایش دستی،
و سپس میتوانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:
♻️رینگ خودکار با کنترلهای دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرمافزاری
♻️خروجی سازگار با تمامی موتورهای سهبعدی (Blender, Unity, Unreal و غیره)
---
🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app
@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🥋 Unitree G1 Kungfu Kid V6.0 —
وقتی رباتها واقعاً “هنرهای رزمی” یاد میگیرند!
عنوان را همانطور میگذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عدهای هنوز در کامنتها مینوشتند
«این فقط رندر کامپیوتری است!» 😏
اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخهی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام میدهد که حتی برای انسانها سخت است.
چرخش، پرش، عقبگرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.
🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفسگیر است —
و حالا دیگر شوخی نیست، این نسل جدید روباتهای رزمی واقعی است.
⚠️ هنوز میخواهید به این موجودات لگد بزنید؟
بهزودی شاید جواب بدهند. 😄
@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
وقتی رباتها واقعاً “هنرهای رزمی” یاد میگیرند!
عنوان را همانطور میگذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عدهای هنوز در کامنتها مینوشتند
«این فقط رندر کامپیوتری است!» 😏
اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخهی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام میدهد که حتی برای انسانها سخت است.
چرخش، پرش، عقبگرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.
🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفسگیر است —
و حالا دیگر شوخی نیست، این نسل جدید روباتهای رزمی واقعی است.
⚠️ هنوز میخواهید به این موجودات لگد بزنید؟
بهزودی شاید جواب بدهند. 😄
@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
❤1👏1
⚡️ گوگل سامانهای ساخت که خودش سازمان مییابد — و شاید مسیر ساخت مدلها را عوض کند!
پروژهای به نام TUMIX از تیم Google، بهگفتهی بسیاری، یکی از هیجانانگیزترین کارهای هوش مصنوعی امسال است.
---
💡 بهجای آموزش یک مدل غولپیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) همزمان و هماهنگ کار میکنند.
هر کدام نقش مخصوص خود را دارند:
یکی کد مینویسد 💻
دیگری جستوجو میکند 🔍
سومی با زبان طبیعی استدلال میکند 🧠
همگی بهصورت مستقل روی یک مسئله کار میکنند، سپس پاسخها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی میرسند.
---
📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمونهای استدلالی تا 17.4٪ بهتر از همه سیستمهای دیگر عمل کرد،
در حالی که هزینهی استنتاج تقریباً نصف شد!
بدون دادهی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.
---
✨ نکتهی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخهی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عاملهای جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!
---
🧩 این پژوهش نشان میدهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکهای از مدلهای کوچک و هماهنگ بیاید که یاد میگیرند با هم فکر کنند.
📄 جزئیات کامل:
arxiv.org/pdf/2510.01279
@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
پروژهای به نام TUMIX از تیم Google، بهگفتهی بسیاری، یکی از هیجانانگیزترین کارهای هوش مصنوعی امسال است.
---
💡 بهجای آموزش یک مدل غولپیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) همزمان و هماهنگ کار میکنند.
هر کدام نقش مخصوص خود را دارند:
یکی کد مینویسد 💻
دیگری جستوجو میکند 🔍
سومی با زبان طبیعی استدلال میکند 🧠
همگی بهصورت مستقل روی یک مسئله کار میکنند، سپس پاسخها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی میرسند.
---
📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمونهای استدلالی تا 17.4٪ بهتر از همه سیستمهای دیگر عمل کرد،
در حالی که هزینهی استنتاج تقریباً نصف شد!
بدون دادهی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.
---
✨ نکتهی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخهی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عاملهای جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!
---
🧩 این پژوهش نشان میدهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکهای از مدلهای کوچک و هماهنگ بیاید که یاد میگیرند با هم فکر کنند.
📄 جزئیات کامل:
arxiv.org/pdf/2510.01279
@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
❤3👏1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
🚛🤖 یک ویدئوی دیگر که ثابت میکند خودکارسازی حملونقل خیلی نزدیکتر از آن چیزیست که فکر میکردیم.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
👏4🤯2👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖✨ شرکت Guangnian Innovation در شنژن از ربات پیشرفتهی M1 رونمایی کرد.
این ربات از یک سامانهی ماژولار مفصلی با درایو موازی استفاده میکند که بازده نیرویی را تا ۴۰٪ نسبت به طراحیهای سنتی افزایش میدهد. بدنهی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.
🛞 ربات M1 ترکیبی از حرکت خارججادهای و حرکت سریع در مسیرهای صاف است، بهعلاوه از نورپردازی هوشمند و ناوبری خودکار بهره میبرد تا بتواند بهراحتی از میان چمن، سنگریزه و شیبهای تند عبور کند.
این ربات گامی بزرگ در مسیر رباتهای خودران و کاربردی در صنعت حملونقل و عملیات میدانی است.
#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
این ربات از یک سامانهی ماژولار مفصلی با درایو موازی استفاده میکند که بازده نیرویی را تا ۴۰٪ نسبت به طراحیهای سنتی افزایش میدهد. بدنهی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.
🛞 ربات M1 ترکیبی از حرکت خارججادهای و حرکت سریع در مسیرهای صاف است، بهعلاوه از نورپردازی هوشمند و ناوبری خودکار بهره میبرد تا بتواند بهراحتی از میان چمن، سنگریزه و شیبهای تند عبور کند.
این ربات گامی بزرگ در مسیر رباتهای خودران و کاربردی در صنعت حملونقل و عملیات میدانی است.
#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
👍2
🧩 LightReasoner —
زمانی که مدلهای کوچک، مدلهای بزرگ را در استدلال بهتر آموزش میدهند
پژوهشگران روشی به نام LightReasoner معرفی کردهاند که به مدلهای کوچک اجازه میدهد به مدلهای بزرگتر بیاموزند کجا و چگونه باید استدلال کنند.
💡 ایدهی اصلی این است که:
بهجای آموزش مدل روی کل متن، فقط روی توکنهایی تمرکز شود که واقعاً مسیر استدلال را تغییر میدهند.
🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا میکند و نقاطی را پیدا میکند که در آنها پیشبینیهایشان تفاوت زیادی دارد.
این نقاط همان گامهای بحرانی هستند که مسیر پاسخ درست را تعیین میکنند.
سپس مدل:
❌فقط همین گامهای دشوار را نگه میدارد،
❌تفاوت استاد را به هدف آموزشی نرم تبدیل میکند،
❌توکنهای ساده و بدیهی را نادیده میگیرد.
📉 نتیجه:
♻️سرعت آموزش تا ۹۰٪ بیشتر،
♻️تعداد توکنهای آموزشی تا ۹۹٪ کمتر،
♻️اما دقت در بنچمارکهای ریاضی برابر یا حتی بالاتر از فاینتیونینگ سنتی است.
♻️اثر این روش زمانی بیشتر است که مدل شاگرد نهتنها کوچکتر، بلکه در حوزهی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفهها — انتخاب گامها یا اهداف متضاد — باعث افت عملکرد میشود.
📄 مقاله: arxiv.org/abs/2510.07962
#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
زمانی که مدلهای کوچک، مدلهای بزرگ را در استدلال بهتر آموزش میدهند
پژوهشگران روشی به نام LightReasoner معرفی کردهاند که به مدلهای کوچک اجازه میدهد به مدلهای بزرگتر بیاموزند کجا و چگونه باید استدلال کنند.
💡 ایدهی اصلی این است که:
بهجای آموزش مدل روی کل متن، فقط روی توکنهایی تمرکز شود که واقعاً مسیر استدلال را تغییر میدهند.
🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا میکند و نقاطی را پیدا میکند که در آنها پیشبینیهایشان تفاوت زیادی دارد.
این نقاط همان گامهای بحرانی هستند که مسیر پاسخ درست را تعیین میکنند.
سپس مدل:
❌فقط همین گامهای دشوار را نگه میدارد،
❌تفاوت استاد را به هدف آموزشی نرم تبدیل میکند،
❌توکنهای ساده و بدیهی را نادیده میگیرد.
📉 نتیجه:
♻️سرعت آموزش تا ۹۰٪ بیشتر،
♻️تعداد توکنهای آموزشی تا ۹۹٪ کمتر،
♻️اما دقت در بنچمارکهای ریاضی برابر یا حتی بالاتر از فاینتیونینگ سنتی است.
♻️اثر این روش زمانی بیشتر است که مدل شاگرد نهتنها کوچکتر، بلکه در حوزهی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفهها — انتخاب گامها یا اهداف متضاد — باعث افت عملکرد میشود.
📄 مقاله: arxiv.org/abs/2510.07962
#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 باورکردنی نیست اگر این درز اطلاعات واقعیت داشته باشه!
🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!
گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین میبره.
مدل نهتنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زندهی موسیقی رو هم تولید میکنه.
🎹 اگه درست باشه، یعنی وارد دورهای شدیم که مدلهای مولد چندوجهی (multimodal) واقعاً میتونن خلاقیت انسانی رو شبیهسازی کنن.
@rss_ai_ir
#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!
گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین میبره.
مدل نهتنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زندهی موسیقی رو هم تولید میکنه.
🎹 اگه درست باشه، یعنی وارد دورهای شدیم که مدلهای مولد چندوجهی (multimodal) واقعاً میتونن خلاقیت انسانی رو شبیهسازی کنن.
@rss_ai_ir
#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
😶🌫️ رندر؟ ویدیو؟ یا تولید مصنوعی؟
🎢 دیزنیلند چینی وارد صحنه شده...
از یه طرف، تولیدات تصویریای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، رباتهایی که از همین تولیدات مصنوعی هم واقعیتر بهنظر میان.
🔻 «راهروی واقعیت چرمی» داره تنگتر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.
و جالبه که Unitree چطور با سگهای رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگترِ پشت حصار، بیان و روی چمنها قدم بزنن…
@rss_ai_ir
#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🎢 دیزنیلند چینی وارد صحنه شده...
از یه طرف، تولیدات تصویریای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، رباتهایی که از همین تولیدات مصنوعی هم واقعیتر بهنظر میان.
🔻 «راهروی واقعیت چرمی» داره تنگتر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.
و جالبه که Unitree چطور با سگهای رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگترِ پشت حصار، بیان و روی چمنها قدم بزنن…
@rss_ai_ir
#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🔥2