🚀🤖 MagicDog-W:
انقلابی در رباتیک متحرک!
❌ استارتاپ چینی MagicLab از ربات جدید خود با نام MagicDog-W رونمایی کرده؛ ترکیبی هوشمندانه از انعطافپذیری رباتهای چهارپا و سرعت حرکت چرخدار.
✨ ویژگیها و تواناییها:
♻️اجرای حرکات آکروباتیک مثل سالتو و فرود نرم
♻️بازیابی سریع پس از افتادن و ادامهی حرکت
♻️صعود از پلهها، شیبهای ۴۰ درجه و موانع ۶۰ سانتیمتری
♻️جابجایی سریع بین حالت چهارپا و چرخدار
♻️حفظ تعادل روی سطوح لغزنده و ناهموار
♻️توانایی حمل ۱۰ کیلوگرم بار برای مأموریتهای صنعتی و امدادی
⚙️ مشخصات کلیدی:
♻️۱۷ موتور-گیربکس برای کنترل دقیق هر محور و چرخ
♻️سرعت تا ۳ متر بر ثانیه
♻️باتری با دوام ۲ تا ۴ ساعت
♻️سیستم پیشرفته ناوبری و کنترل حرکت
🎯 کاربردها:
♻️بازرسی صنعتی و مأموریتهای امنیتی
♻️عملیات جستوجو و نجات
♻️حمل بار در زمینهای دشوار
♻️استفاده در پژوهشهای علمی و نظامی
📌 کارشناسان میگویند MagicDog-W یکی از پلتفرمهای آیندهدار رباتیک هیبریدی است که مرز بین «چرخ» و «پا» را از بین برده.
⛔️چین بار دیگر نشان داد که در زمینهی رباتهای چندمنظوره، آمادهی تسخیر صحنههای واقعی و حتی شرایط سخت و خطرناک است. 🌍💪
#رباتیک #هوش_مصنوعی #MagicDog #ChinaTech #Robotics
انقلابی در رباتیک متحرک!
❌ استارتاپ چینی MagicLab از ربات جدید خود با نام MagicDog-W رونمایی کرده؛ ترکیبی هوشمندانه از انعطافپذیری رباتهای چهارپا و سرعت حرکت چرخدار.
✨ ویژگیها و تواناییها:
♻️اجرای حرکات آکروباتیک مثل سالتو و فرود نرم
♻️بازیابی سریع پس از افتادن و ادامهی حرکت
♻️صعود از پلهها، شیبهای ۴۰ درجه و موانع ۶۰ سانتیمتری
♻️جابجایی سریع بین حالت چهارپا و چرخدار
♻️حفظ تعادل روی سطوح لغزنده و ناهموار
♻️توانایی حمل ۱۰ کیلوگرم بار برای مأموریتهای صنعتی و امدادی
⚙️ مشخصات کلیدی:
♻️۱۷ موتور-گیربکس برای کنترل دقیق هر محور و چرخ
♻️سرعت تا ۳ متر بر ثانیه
♻️باتری با دوام ۲ تا ۴ ساعت
♻️سیستم پیشرفته ناوبری و کنترل حرکت
🎯 کاربردها:
♻️بازرسی صنعتی و مأموریتهای امنیتی
♻️عملیات جستوجو و نجات
♻️حمل بار در زمینهای دشوار
♻️استفاده در پژوهشهای علمی و نظامی
📌 کارشناسان میگویند MagicDog-W یکی از پلتفرمهای آیندهدار رباتیک هیبریدی است که مرز بین «چرخ» و «پا» را از بین برده.
⛔️چین بار دیگر نشان داد که در زمینهی رباتهای چندمنظوره، آمادهی تسخیر صحنههای واقعی و حتی شرایط سخت و خطرناک است. 🌍💪
#رباتیک #هوش_مصنوعی #MagicDog #ChinaTech #Robotics
🔥1
📢 ShinkaEvolve
؛ جایگزین متنباز AlphaEvolve از Sakana AI
⛔️شرکت Sakana AI چارچوبی متنباز با نام ShinkaEvolve معرفی کرده که برای بهینهسازی و توسعه الگوریتمها و معماریهای پیچیده طراحی شده است. «Shinka» (進化) در ژاپنی به معنای تکامل است و این رویکرد هم بر پایهی اصول تکاملی بنا شده.
🔹 چطور کار میکند؟
1️⃣ ورودی شامل یک Seed-program و یک Verifier (محاسبه متریک کیفیت/fitness) است. کدهای جدید در یک «آرشیو والدین» ذخیره میشوند.
2️⃣ همچنین LLM به عنوان اپراتور جهش عمل میکند: میتواند کد را با روشهای مختلف تغییر دهد (diff-patch، بازنویسی کامل، crossover). انتخاب LLM بهینه توسط الگوریتم multi-armed bandit انجام میشود.
3️⃣ کاندیداها ابتدا از فیلتر novelty-rejection (بر اساس شباهت تع嵌 embeddings) عبور میکنند تا ایدههای تکراری حذف شوند. سپس بهترینها به آرشیو اضافه میشوند.
4️⃣ برای تنوع، از مفهوم «جزیرهها» (populationهای مستقل) استفاده شده و در مواقع بنبست، مهاجرت بین آنها انجام میشود.
🔹 نتایج تستها
✅ در بهینهسازی ریاضی: تنها با 150 نمونه، راهحل جدیدی برای مسئلهی Circle Packing پیدا کرد.
✅ در طراحی ایجنت هوش مصنوعی: بعد از ~75 نسل، معماری سهبخشی جدیدی ایجاد کرد که baseline را در AIME شکست داد.
✅ در برنامهنویسی رقابتی: با بهبودهای متعدد، به سطح مدال نقره رسید.
✅ در آموزش LLM: پس از ~30 نسل، تابع خطای جدیدی برای MoE کشف شد که عملکردی بهتر از بسیاری روشهای رایج داشت.
⚡️ تفاوت اصلی با AlphaEvolve این است که ShinkaEvolve همین حالا و رایگان قابل استفاده است. کافیست فایل evaluate.py را برای مسئلهی خود بازنویسی کنید، initial.py را آماده کرده و اجرا کنید:
📎 کد و راهنمای کامل:
GitHub
#هوش_مصنوعی #الگوریتم_تکاملی #SakanaAI #ShinkaEvolve #AIResearch
؛ جایگزین متنباز AlphaEvolve از Sakana AI
⛔️شرکت Sakana AI چارچوبی متنباز با نام ShinkaEvolve معرفی کرده که برای بهینهسازی و توسعه الگوریتمها و معماریهای پیچیده طراحی شده است. «Shinka» (進化) در ژاپنی به معنای تکامل است و این رویکرد هم بر پایهی اصول تکاملی بنا شده.
🔹 چطور کار میکند؟
1️⃣ ورودی شامل یک Seed-program و یک Verifier (محاسبه متریک کیفیت/fitness) است. کدهای جدید در یک «آرشیو والدین» ذخیره میشوند.
2️⃣ همچنین LLM به عنوان اپراتور جهش عمل میکند: میتواند کد را با روشهای مختلف تغییر دهد (diff-patch، بازنویسی کامل، crossover). انتخاب LLM بهینه توسط الگوریتم multi-armed bandit انجام میشود.
3️⃣ کاندیداها ابتدا از فیلتر novelty-rejection (بر اساس شباهت تع嵌 embeddings) عبور میکنند تا ایدههای تکراری حذف شوند. سپس بهترینها به آرشیو اضافه میشوند.
4️⃣ برای تنوع، از مفهوم «جزیرهها» (populationهای مستقل) استفاده شده و در مواقع بنبست، مهاجرت بین آنها انجام میشود.
🔹 نتایج تستها
✅ در بهینهسازی ریاضی: تنها با 150 نمونه، راهحل جدیدی برای مسئلهی Circle Packing پیدا کرد.
✅ در طراحی ایجنت هوش مصنوعی: بعد از ~75 نسل، معماری سهبخشی جدیدی ایجاد کرد که baseline را در AIME شکست داد.
✅ در برنامهنویسی رقابتی: با بهبودهای متعدد، به سطح مدال نقره رسید.
✅ در آموزش LLM: پس از ~30 نسل، تابع خطای جدیدی برای MoE کشف شد که عملکردی بهتر از بسیاری روشهای رایج داشت.
⚡️ تفاوت اصلی با AlphaEvolve این است که ShinkaEvolve همین حالا و رایگان قابل استفاده است. کافیست فایل evaluate.py را برای مسئلهی خود بازنویسی کنید، initial.py را آماده کرده و اجرا کنید:
shinka_launch variant=experiment_name
📎 کد و راهنمای کامل:
GitHub
#هوش_مصنوعی #الگوریتم_تکاملی #SakanaAI #ShinkaEvolve #AIResearch
📊 K2 Vendor Verifier
؛ تست شفافیت عملکرد وندورها
تیم Kimi ابزاری با نام K2 Vendor Verifier معرفی کرده که هدفش بررسی دقت سرویسدهندههای مختلف برای مدل K2 است.
🔎 روش تست:
هر وندور روی ۲۰۰۰ درخواست یکسان امتحان میشود و نتایج با API رسمی مقایسه میگردد.
📉 نتیجه:
همهی ارائهدهندگان 3rd party مشکلات جدی در خروجی داشتند. متأسفانه جذابترین گزینه، Groq، در این تست حضور نداشت.
این حرکت یادآور تستهای تیم Artificial Analysis روی gpt-oss است، جایی که اختلاف فاحشی بین سرویسدهندگان مشاهده شد.
⚠️ پیام مهم: اگر چنین تستهایی عمومی و استاندارد نشوند، باگهای inference بیسروصدا ادامه خواهند داشت و کیفیت مدلها را پایین میآورند.
📎 گیتهاب: K2 Vendor Verifier
#هوش_مصنوعی #K2 #LLM #AI #Kimi #VendorVerifier
؛ تست شفافیت عملکرد وندورها
تیم Kimi ابزاری با نام K2 Vendor Verifier معرفی کرده که هدفش بررسی دقت سرویسدهندههای مختلف برای مدل K2 است.
🔎 روش تست:
هر وندور روی ۲۰۰۰ درخواست یکسان امتحان میشود و نتایج با API رسمی مقایسه میگردد.
📉 نتیجه:
همهی ارائهدهندگان 3rd party مشکلات جدی در خروجی داشتند. متأسفانه جذابترین گزینه، Groq، در این تست حضور نداشت.
این حرکت یادآور تستهای تیم Artificial Analysis روی gpt-oss است، جایی که اختلاف فاحشی بین سرویسدهندگان مشاهده شد.
⚠️ پیام مهم: اگر چنین تستهایی عمومی و استاندارد نشوند، باگهای inference بیسروصدا ادامه خواهند داشت و کیفیت مدلها را پایین میآورند.
📎 گیتهاب: K2 Vendor Verifier
#هوش_مصنوعی #K2 #LLM #AI #Kimi #VendorVerifier
This media is not supported in your browser
VIEW IN TELEGRAM
🔔 متا معرفی کرد: Vibes — تیکتاکی با ویدئوهای ساختهشده توسط هوش مصنوعی 🎥✨
پلتفرم جدید متا با نام Vibes امکان ساخت ویدئوهای کوتاه و سرگرمکننده توسط هوش مصنوعی را فراهم میکند؛ چیزی شبیه تیکتاک، اما بدون نیاز به دوربین یا ضبط واقعی.
📌 هر کاربر میتواند فقط با یک پرامپت یا ایده، ویدئوی اختصاصی خودش را تولید و منتشر کند.
این گام تازه متا نشان میدهد آیندهی محتوای کوتاه به سمت AI-native platforms پیش میرود.
@rss_ai_ir 🤖
#Meta #Vibes #AI #ویدئو #هوش_مصنوعی
پلتفرم جدید متا با نام Vibes امکان ساخت ویدئوهای کوتاه و سرگرمکننده توسط هوش مصنوعی را فراهم میکند؛ چیزی شبیه تیکتاک، اما بدون نیاز به دوربین یا ضبط واقعی.
📌 هر کاربر میتواند فقط با یک پرامپت یا ایده، ویدئوی اختصاصی خودش را تولید و منتشر کند.
این گام تازه متا نشان میدهد آیندهی محتوای کوتاه به سمت AI-native platforms پیش میرود.
@rss_ai_ir 🤖
#Meta #Vibes #AI #ویدئو #هوش_مصنوعی
📊 آیا به استاندارد برای ارزیابی کیفیت مدلها و محصولات LLM نیاز داریم؟
⛔️امروز تقریباً در هر محصولی قابلیت RAG وجود دارد و سناریوهای agentic هم به یک روند عادی تبدیل شدهاند. اما هرچه پایپلاین پیچیدهتر شود، کنترل و ارزیابی آن هم سختتر و حیاتیتر میشود.
🔹 در پایپلاینهای ساده میتوان:
♻️متریکهای مشخصی انتخاب کرد
♻️تستهای واحد و یکپارچه نوشت
♻️یک بنچمارک کوچک آماده و مرتباً اجرا کرد
♻️پایداری و تکرارپذیری نتایج را بررسی کرد
🔹 اما وقتی پایپلاین شامل چندین ماژول مختلف باشد، ماجرا شبیه ساختن هزارچهره فالکون از لگو میشود 🧱🦧
در مقاله Apollo Research "We Need A Science of Evals" (۲۰۲۴) گفته شد:
ارزیابی کیفیت بیشتر شبیه هنر است تا علم (مثلاً فقط تغییر در فرمت پرامپت میتواند دقت را ۷۰+ درصد جابجا کند 😱)
بلوغ ارزیابی (Eval) سه مرحله دارد:
1️⃣ Nascent —
مرحله ابتدایی و پراکنده، بدون استاندارد
2️⃣ Maturation —
ظهور بهترینروشها ولی بدون مقررات رسمی
3️⃣ Mature —
وجود استانداردها، استناد آماری و نتایج قابلتفسیر
ما فعلاً در مرحله دوم هستیم و رسیدن به مرحله سوم نیازمند تعریف متریکهای روشن، پوشش کامل تست، تکرارپذیری و تحلیل آماری است.
⚡️ اخیراً استاندارد جدیدی معرفی شده: STREAM (A Standard for Transparently Reporting Evaluations in AI Model Reports). این چارچوب به شفافسازی تستها و گزارشدهی نتایج کمک میکند. هرچند بیشتر برای بنچمارکهای حوزه ChemBio طراحی شده، اما قابلاستفاده در دیگر زمینهها هم هست.
🔮 آیندهی ارزیابی LLMها در گرو Eval علمی و استاندارد است. در غیر این صورت، محصولات غیرایمن و مبهم خواهیم داشت.
@rss_ai_ir 🤖
https://www.arxiv.org/pdf/2508.09853
#هوش_مصنوعی #LLM #استاندارد #Eval #STREAM #AI
⛔️امروز تقریباً در هر محصولی قابلیت RAG وجود دارد و سناریوهای agentic هم به یک روند عادی تبدیل شدهاند. اما هرچه پایپلاین پیچیدهتر شود، کنترل و ارزیابی آن هم سختتر و حیاتیتر میشود.
🔹 در پایپلاینهای ساده میتوان:
♻️متریکهای مشخصی انتخاب کرد
♻️تستهای واحد و یکپارچه نوشت
♻️یک بنچمارک کوچک آماده و مرتباً اجرا کرد
♻️پایداری و تکرارپذیری نتایج را بررسی کرد
🔹 اما وقتی پایپلاین شامل چندین ماژول مختلف باشد، ماجرا شبیه ساختن هزارچهره فالکون از لگو میشود 🧱🦧
در مقاله Apollo Research "We Need A Science of Evals" (۲۰۲۴) گفته شد:
ارزیابی کیفیت بیشتر شبیه هنر است تا علم (مثلاً فقط تغییر در فرمت پرامپت میتواند دقت را ۷۰+ درصد جابجا کند 😱)
بلوغ ارزیابی (Eval) سه مرحله دارد:
1️⃣ Nascent —
مرحله ابتدایی و پراکنده، بدون استاندارد
2️⃣ Maturation —
ظهور بهترینروشها ولی بدون مقررات رسمی
3️⃣ Mature —
وجود استانداردها، استناد آماری و نتایج قابلتفسیر
ما فعلاً در مرحله دوم هستیم و رسیدن به مرحله سوم نیازمند تعریف متریکهای روشن، پوشش کامل تست، تکرارپذیری و تحلیل آماری است.
⚡️ اخیراً استاندارد جدیدی معرفی شده: STREAM (A Standard for Transparently Reporting Evaluations in AI Model Reports). این چارچوب به شفافسازی تستها و گزارشدهی نتایج کمک میکند. هرچند بیشتر برای بنچمارکهای حوزه ChemBio طراحی شده، اما قابلاستفاده در دیگر زمینهها هم هست.
🔮 آیندهی ارزیابی LLMها در گرو Eval علمی و استاندارد است. در غیر این صورت، محصولات غیرایمن و مبهم خواهیم داشت.
@rss_ai_ir 🤖
https://www.arxiv.org/pdf/2508.09853
#هوش_مصنوعی #LLM #استاندارد #Eval #STREAM #AI
🔴 رباتهای Unitree به ویروس «زامبی» مبتلا شدند — همهاش به خاطر یک حفره امنیتی در Bluetooth!
🔓 آسیبپذیری UniPwn به هکرها اجازه میدهد خود را جای صاحب ربات جا بزنند و کد مخرب اجرا کنند.
🤖 ماجرا ترسناکتر میشود: ربات فقط دستورات مهاجم را اجرا نمیکند، بلکه از طریق بلوتوث بقیه رباتها را هم آلوده کرده و یک باتنت میسازد!
⚠️ شرکت هنوز این مشکل را برطرف نکرده و هشدار پژوهشگران را نادیده گرفته است.
📌 وقتشه که «آرنولد» وارد عمل بشه... 🔫
@rss_ai_ir
#امنیت #رباتیک #Unitree #IoT #Bluetooth
🔓 آسیبپذیری UniPwn به هکرها اجازه میدهد خود را جای صاحب ربات جا بزنند و کد مخرب اجرا کنند.
🤖 ماجرا ترسناکتر میشود: ربات فقط دستورات مهاجم را اجرا نمیکند، بلکه از طریق بلوتوث بقیه رباتها را هم آلوده کرده و یک باتنت میسازد!
⚠️ شرکت هنوز این مشکل را برطرف نکرده و هشدار پژوهشگران را نادیده گرفته است.
📌 وقتشه که «آرنولد» وارد عمل بشه... 🔫
@rss_ai_ir
#امنیت #رباتیک #Unitree #IoT #Bluetooth
👍1
فراخوان نهمین جشنواره اندیشمندان و دانشمندان جوان، آخرین فرصت ثبت نام نهمین جشنواره اندیشمندان و دانشمندان جوان 15 مهرماه 1404 https://ysf-persia.com/
🧠 شرکت Thinking Machines روشی نوین برای آموزش شبکههای عصبی معرفی کرده است: manifold Muon ✨ که وزنها را پایدارتر و قابل پیشبینیتر میکند.
🔑 ایده اصلی:
✳️وزنها روی یک سطح ریاضی خاص (مجموعه Stiefel manifold) محدود میشوند تا از «واپاشی» آنها جلوگیری شود.
✳️اندازه بهروزرسانیها با نورم طیفی کنترل میشود تا گامهای یادگیری شبکه را دچار اعوجاج نکنند.
✳️بهروزرسانیها ابتدا در فضای مماس محاسبه و سپس دوباره به روی همان سطح برگردانده میشوند.
📊 در تستهای CIFAR-10 این روش دقت بیشتری نسبت به AdamW داشت و وزنها را در محدوده پایدار نگه داشت، هرچند محاسبات زمانبرتر شدند.
🎯 نکته مهم: چیزی که امروز بهعنوان «تصادفی بودن» پاسخهای مدلها شناخته میشود، در این نگاه یک باگ قابلرفع است.
این رویکرد میتواند پایهای برای توسعهی AGI ایمن باشد؛ جایی که رفتارهای پیشبینیناپذیر غیرقابلقبولاند.
🔗 جزئیات بیشتر: ThinkingMachines.ai
#هوش_مصنوعی #یادگیری_عمیق #پژوهش #AGI #امنیت
🔑 ایده اصلی:
✳️وزنها روی یک سطح ریاضی خاص (مجموعه Stiefel manifold) محدود میشوند تا از «واپاشی» آنها جلوگیری شود.
✳️اندازه بهروزرسانیها با نورم طیفی کنترل میشود تا گامهای یادگیری شبکه را دچار اعوجاج نکنند.
✳️بهروزرسانیها ابتدا در فضای مماس محاسبه و سپس دوباره به روی همان سطح برگردانده میشوند.
📊 در تستهای CIFAR-10 این روش دقت بیشتری نسبت به AdamW داشت و وزنها را در محدوده پایدار نگه داشت، هرچند محاسبات زمانبرتر شدند.
🎯 نکته مهم: چیزی که امروز بهعنوان «تصادفی بودن» پاسخهای مدلها شناخته میشود، در این نگاه یک باگ قابلرفع است.
این رویکرد میتواند پایهای برای توسعهی AGI ایمن باشد؛ جایی که رفتارهای پیشبینیناپذیر غیرقابلقبولاند.
🔗 جزئیات بیشتر: ThinkingMachines.ai
#هوش_مصنوعی #یادگیری_عمیق #پژوهش #AGI #امنیت
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🧮 وقتی حافظه مهمتر از دقت است: ساختارهای داده تقریبی
⛔️در عصر دادههای عظیم، حتی بهینهترین الگوریتمها با مصرف خطی حافظه از پس حجم دادهها برنمیآیند. راهحل چیست؟
❌ استفاده از ساختارهای داده تقریبی 📊 که کمی از دقت میکاهند اما سرعت و فشردگی فوقالعادهای دارند.
✅در این مقاله سه ابزار کلیدی بررسی میشوند:
HyperLogLog —
برای تخمین تعداد عناصر یکتا 🔢
فیلتر بلوم (Bloom Filter) —
برای بررسی تعلق یک عضو به مجموعه 🌐
Count-Min Sketch —
برای شمارش فراوانی عناصر 📈
✅ درست است که این روشها دقیق نیستند، اما امکان تحلیل مجموعههای عظیم داده را فراهم میکنند، جایی که روشهای دقیق عملاً از کار میافتند.
📌 جزئیات و نمونههای کاربردی را اینجا بخوانید:
👉 https://blog.deepschool.ru/math/kogda-pamyat-dorozhe-tochnosti-priblizhyonnye-struktury-dannyh/
#BigData #علومداده #الگوریتم #HyperLogLog #BloomFilter #CountMinSketch
⛔️در عصر دادههای عظیم، حتی بهینهترین الگوریتمها با مصرف خطی حافظه از پس حجم دادهها برنمیآیند. راهحل چیست؟
❌ استفاده از ساختارهای داده تقریبی 📊 که کمی از دقت میکاهند اما سرعت و فشردگی فوقالعادهای دارند.
✅در این مقاله سه ابزار کلیدی بررسی میشوند:
HyperLogLog —
برای تخمین تعداد عناصر یکتا 🔢
فیلتر بلوم (Bloom Filter) —
برای بررسی تعلق یک عضو به مجموعه 🌐
Count-Min Sketch —
برای شمارش فراوانی عناصر 📈
✅ درست است که این روشها دقیق نیستند، اما امکان تحلیل مجموعههای عظیم داده را فراهم میکنند، جایی که روشهای دقیق عملاً از کار میافتند.
📌 جزئیات و نمونههای کاربردی را اینجا بخوانید:
👉 https://blog.deepschool.ru/math/kogda-pamyat-dorozhe-tochnosti-priblizhyonnye-struktury-dannyh/
#BigData #علومداده #الگوریتم #HyperLogLog #BloomFilter #CountMinSketch
DeepSchool
Когда память дороже точности: приближённые структуры данных - DeepSchool
HyperLogLog, Bloom/Cuckoo, Count-Min Sketch: что выбрать, если данные огромные, а память ограничена. Алгоритмы, точность и подбор параметров.
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 گوگل نسخه جدید Gemini Robotics 1.5 را معرفی کرد – یک سیستم عامل عاملمحور پیشرفته برای کنترل رباتها.
🔹 این سیستم حالا توانایی بیشتری در استدلال، برنامهریزی، تعامل با انسان و حتی استفاده از ابزارهایی مثل جستجوی وب دارد.
✅در واقع، دو مدل به صورت همزمان درون آن به کار گرفته شده است:
1️⃣ Gemini Robotics-ER 1.5 –
بهعنوان «مغز سطح بالا»، محیط و دستورات انسانی را تحلیل میکند، برنامهریزی دقیق انجام میدهد و در صورت نیاز ابزارها را فراخوانی میکند.
2️⃣ Gemini Robotics 1.5 –
بهعنوان «اجراکننده»، دستورات را به حرکات دقیق و کنترلشده تبدیل میکند.
📌 مثال: وقتی به ربات میگویید «زبالهها را طبق قوانین محلی دستهبندی کن»:
❌قابل ذکر است که ER 1.5 ابتدا قوانین کشور شما را بررسی کرده و نوع زبالهها را شناسایی میکند.
❌سپس دستوراتی مثل «بطری در سمت چپ، دستمال در سمت راست» صادر میکند.
❌مدل دوم این دستورات را به مسیرهای حرکتی دقیق تبدیل میکند. اگر محیط تغییر کند (مثل اضافه شدن زباله جدید)، ER دوباره برنامه را اصلاح میکند.
✅ مزیت مهم: اگر شکل یا نوع ربات تغییر کند، نیازی به بازطراحی کل سیستم نیست، فقط کافی است بخش اجرایی (مدل دوم) تنظیم شود.
🔑 خبر خوب اینکه Gemini Robotics-ER 1.5 همین حالا از طریق API در دسترس است.
🌍 جزئیات بیشتر: لینک وبلاگ گوگل
#Google #Gemini #AI #رباتیک #عامل_هوشمند
🔹 این سیستم حالا توانایی بیشتری در استدلال، برنامهریزی، تعامل با انسان و حتی استفاده از ابزارهایی مثل جستجوی وب دارد.
✅در واقع، دو مدل به صورت همزمان درون آن به کار گرفته شده است:
1️⃣ Gemini Robotics-ER 1.5 –
بهعنوان «مغز سطح بالا»، محیط و دستورات انسانی را تحلیل میکند، برنامهریزی دقیق انجام میدهد و در صورت نیاز ابزارها را فراخوانی میکند.
2️⃣ Gemini Robotics 1.5 –
بهعنوان «اجراکننده»، دستورات را به حرکات دقیق و کنترلشده تبدیل میکند.
📌 مثال: وقتی به ربات میگویید «زبالهها را طبق قوانین محلی دستهبندی کن»:
❌قابل ذکر است که ER 1.5 ابتدا قوانین کشور شما را بررسی کرده و نوع زبالهها را شناسایی میکند.
❌سپس دستوراتی مثل «بطری در سمت چپ، دستمال در سمت راست» صادر میکند.
❌مدل دوم این دستورات را به مسیرهای حرکتی دقیق تبدیل میکند. اگر محیط تغییر کند (مثل اضافه شدن زباله جدید)، ER دوباره برنامه را اصلاح میکند.
✅ مزیت مهم: اگر شکل یا نوع ربات تغییر کند، نیازی به بازطراحی کل سیستم نیست، فقط کافی است بخش اجرایی (مدل دوم) تنظیم شود.
🔑 خبر خوب اینکه Gemini Robotics-ER 1.5 همین حالا از طریق API در دسترس است.
🌍 جزئیات بیشتر: لینک وبلاگ گوگل
#Google #Gemini #AI #رباتیک #عامل_هوشمند
❤1
🧪 هوش مصنوعی مولد در خدمت شیمی؛ ساخت مولکولها گامبهگام
انویدیا مدل جدیدی به نام ReaSyn معرفی کرده که مسیرهای سنتز مولکولها را پیشبینی میکند – از سادهترین مواد اولیه تا ترکیبات نهایی.
🔹 چطور کار میکند؟
✳️بهجای ارائه یک فرمول نهایی، زنجیرهای از واکنشها (Chain of Reactions) پیشنهاد میشود.
✳️هر مرحله قابل بررسی و اصلاح است.
✳️با کمک یادگیری تقویتی و جستجوی مسیرها، بهترین روش سنتز پیدا میشود.
🔹 مزایا:
✨ شیمیدانها نه تنها مولکولهای جدید، بلکه دستورالعمل واقعی برای ساخت آنها در آزمایشگاه دریافت میکنند.
✨ اگر سنتز مستقیم ممکن نباشد، میتوان مسیرهای جایگزین و آنالوگها را پیدا کرد.
✨ سرعت توسعه داروها، مواد جدید و ترکیبات نوآورانه بهطور چشمگیری افزایش مییابد.
هوش مصنوعی حالا تنها به طراحی مولکولها بسنده نمیکند، بلکه توضیح میدهد چگونه آنها را در دنیای واقعی ساخت.
🔗 جزئیات در وبلاگ انویدیا
@rss_ai_ir
#NVIDIA #AI #DrugDiscovery #شیمی #مولکول #هوش_مصنوعی
انویدیا مدل جدیدی به نام ReaSyn معرفی کرده که مسیرهای سنتز مولکولها را پیشبینی میکند – از سادهترین مواد اولیه تا ترکیبات نهایی.
🔹 چطور کار میکند؟
✳️بهجای ارائه یک فرمول نهایی، زنجیرهای از واکنشها (Chain of Reactions) پیشنهاد میشود.
✳️هر مرحله قابل بررسی و اصلاح است.
✳️با کمک یادگیری تقویتی و جستجوی مسیرها، بهترین روش سنتز پیدا میشود.
🔹 مزایا:
✨ شیمیدانها نه تنها مولکولهای جدید، بلکه دستورالعمل واقعی برای ساخت آنها در آزمایشگاه دریافت میکنند.
✨ اگر سنتز مستقیم ممکن نباشد، میتوان مسیرهای جایگزین و آنالوگها را پیدا کرد.
✨ سرعت توسعه داروها، مواد جدید و ترکیبات نوآورانه بهطور چشمگیری افزایش مییابد.
هوش مصنوعی حالا تنها به طراحی مولکولها بسنده نمیکند، بلکه توضیح میدهد چگونه آنها را در دنیای واقعی ساخت.
🔗 جزئیات در وبلاگ انویدیا
@rss_ai_ir
#NVIDIA #AI #DrugDiscovery #شیمی #مولکول #هوش_مصنوعی
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ سم آلتمن: OpenAI به دنبال ساخت "خانوادهای کوچک از دستگاهها" برای بازتعریف تعامل انسان و کامپیوتر
آلتمن خبر داد که OpenAI در حال برنامهریزی برای عرضه مجموعهای محدود از دستگاههای نوآورانه است که شیوه تعامل ما با رایانهها را دگرگون خواهد کرد. 🎯
🔹 این دستگاهها قرار نیست به زودی عرضه شوند، اما هدف آنها فراتر رفتن از رابطهای کاربری فعلی است؛ جایی که بتوانید دستورات طولانی و پیچیده بدهید و مطمئن باشید سیستم آنها را بهطور کامل و درست اجرا میکند.
به نظر میرسد آینده تعامل انسان و ماشین نه فقط در نرمافزار، بلکه در سختافزارهای اختصاصی هوش مصنوعی هم رقم خواهد خورد. 🤖✨
📌 @rss_ai_ir
#OpenAI #SamAltman #AI #Interface #هوش_مصنوعی
آلتمن خبر داد که OpenAI در حال برنامهریزی برای عرضه مجموعهای محدود از دستگاههای نوآورانه است که شیوه تعامل ما با رایانهها را دگرگون خواهد کرد. 🎯
🔹 این دستگاهها قرار نیست به زودی عرضه شوند، اما هدف آنها فراتر رفتن از رابطهای کاربری فعلی است؛ جایی که بتوانید دستورات طولانی و پیچیده بدهید و مطمئن باشید سیستم آنها را بهطور کامل و درست اجرا میکند.
به نظر میرسد آینده تعامل انسان و ماشین نه فقط در نرمافزار، بلکه در سختافزارهای اختصاصی هوش مصنوعی هم رقم خواهد خورد. 🤖✨
📌 @rss_ai_ir
#OpenAI #SamAltman #AI #Interface #هوش_مصنوعی
🚀 گوگل دیپمایند معرفی کرد: EmbeddingGemma
⛔️مدلی فشرده برای تبدیل متن به بردار (Embedding) با تنها 308M پارامتر که کیفیتی در حد بهترین مدلهای تا 500M پارامتر دارد، اما سریعتر و سبکتر است. ⚡
🔑 چطور کار میکند:
♻️بر پایه نسخه سادهشده Gemma 3 (فقط بخش Encoder باقی مانده)
♻️آموزش با distillation: دانشآموز خروجیهای مدل معلم را کپی میکند
♻️همچنین Regularizer باعث توزیع یکنواخت بردارها میشود → بهبود جستجو و پایداری در کوانتیزاسیون
♻️دو مرحله آموزش: اول روی دادههای پرسش–پاسخ نویزی، سپس روی دادههای تمیز با «منفیهای سخت» و پرامپتها
♻️خروجی نهایی با میانگین چند چکپوینت بهینهشده ساخته میشود
📊 نتایج:
✳️بهترین عملکرد در بین مدلهای زیر 500M پارامتر
✳️قوی در وظایف چندزبانه، انگلیسی و حتی کدنویسی
✳️پشتیبانی از وزنهای 4-bit و بردارهای 128 بُعدی → قابل اجرا روی دستگاههای سبک
📄 مقاله:
arxiv.org/abs/2509.20354
#Google #DeepMind #EmbeddingGemma #AI #NLP #هوش_مصنوعی
@rss_ai_ir
⛔️مدلی فشرده برای تبدیل متن به بردار (Embedding) با تنها 308M پارامتر که کیفیتی در حد بهترین مدلهای تا 500M پارامتر دارد، اما سریعتر و سبکتر است. ⚡
🔑 چطور کار میکند:
♻️بر پایه نسخه سادهشده Gemma 3 (فقط بخش Encoder باقی مانده)
♻️آموزش با distillation: دانشآموز خروجیهای مدل معلم را کپی میکند
♻️همچنین Regularizer باعث توزیع یکنواخت بردارها میشود → بهبود جستجو و پایداری در کوانتیزاسیون
♻️دو مرحله آموزش: اول روی دادههای پرسش–پاسخ نویزی، سپس روی دادههای تمیز با «منفیهای سخت» و پرامپتها
♻️خروجی نهایی با میانگین چند چکپوینت بهینهشده ساخته میشود
📊 نتایج:
✳️بهترین عملکرد در بین مدلهای زیر 500M پارامتر
✳️قوی در وظایف چندزبانه، انگلیسی و حتی کدنویسی
✳️پشتیبانی از وزنهای 4-bit و بردارهای 128 بُعدی → قابل اجرا روی دستگاههای سبک
📄 مقاله:
arxiv.org/abs/2509.20354
#Google #DeepMind #EmbeddingGemma #AI #NLP #هوش_مصنوعی
@rss_ai_ir
❤2👏1🙏1
🎥🧠 ویدئو-مدلها وارد دنیای Chain-of-Frames شدند!
مدلهای مولد ویدئو (مثل Veo 3) حالا فقط تصویر نمیسازند – آنها میتوانند مستقیماً روی فریمها فکر کنند و پاسخ را رسم کنند.
🔹 پژوهش جدید نشان داد که حتی بدون فاینتیونینگ، یک مدل ویدئویی بزرگ میتواند:
✳️مسائل کلاسیک بینایی ماشین (مرزبندی، سگمنتیشن، بهبود تصویر)
✳️و حتی پازلهای بصری ساده (مثل ماز و تقارن)
را فقط با یک پرامپت درست حل کند.
📌 نکته طلایی: به مدل نقش بدهید و فرمت خروجی را مشخص کنید.
مثالها:
🌀 Maze:
مسیر کوتاه از START به GOAL را قرمز با ضخامت ۳ پیکسل بکش.
👤 Segmentation:
فقط فرد را با لایه نیمهشفاف پر کن.
🎬 Background removal:
پسزمینه خاکستری یکنواخت، بدون هاله دور مو.
🌍🌙 Physics:
دو نسخه زمین (9.81 m/s²) و ماه (1.62 m/s²) کنار هم نشان بده.
🔧 Deblur/Denoise:
وضوح را زیاد کن، بدون صافکردن بیشازحد.
✨ نتیجه: ویدئو-مدلها مثل LLMها میتوانند zero-shot کار کنند، کافی است بگویید: «حل کن و روی فریم رسم کن».
📎 سایت مقاله با مثالهای تصویری پر از دموهای خفن است.
https://video-zero-shot.github.io/
@rss_ai_ir
#AI #VideoAI #GenerativeAI #ChainOfFrames #ComputerVision
مدلهای مولد ویدئو (مثل Veo 3) حالا فقط تصویر نمیسازند – آنها میتوانند مستقیماً روی فریمها فکر کنند و پاسخ را رسم کنند.
🔹 پژوهش جدید نشان داد که حتی بدون فاینتیونینگ، یک مدل ویدئویی بزرگ میتواند:
✳️مسائل کلاسیک بینایی ماشین (مرزبندی، سگمنتیشن، بهبود تصویر)
✳️و حتی پازلهای بصری ساده (مثل ماز و تقارن)
را فقط با یک پرامپت درست حل کند.
📌 نکته طلایی: به مدل نقش بدهید و فرمت خروجی را مشخص کنید.
مثالها:
🌀 Maze:
مسیر کوتاه از START به GOAL را قرمز با ضخامت ۳ پیکسل بکش.
👤 Segmentation:
فقط فرد را با لایه نیمهشفاف پر کن.
🎬 Background removal:
پسزمینه خاکستری یکنواخت، بدون هاله دور مو.
🌍🌙 Physics:
دو نسخه زمین (9.81 m/s²) و ماه (1.62 m/s²) کنار هم نشان بده.
🔧 Deblur/Denoise:
وضوح را زیاد کن، بدون صافکردن بیشازحد.
You are a video analyst. Solve the task and DRAW the answer ON TOP of frames.
Maze: draw the shortest valid path in RED, thickness 3 px, unbroken line from START to GOAL.
Segmentation: fill ONLY the person with a semi-transparent overlay; keep everything else unchanged.
Background removal: keep the subject; replace background with uniform gray; avoid halos around hair.
Physics: render two variants side-by-side labeled “Earth (9.81 m/s^2)” and “Moon (1.62 m/s^2)”; show motion difference.
Deblur/denoise: increase sharpness while preserving faces; avoid over-smoothing and ringing artifacts.
✨ نتیجه: ویدئو-مدلها مثل LLMها میتوانند zero-shot کار کنند، کافی است بگویید: «حل کن و روی فریم رسم کن».
📎 سایت مقاله با مثالهای تصویری پر از دموهای خفن است.
https://video-zero-shot.github.io/
@rss_ai_ir
#AI #VideoAI #GenerativeAI #ChainOfFrames #ComputerVision
❤1👍1🙏1
🚀 DeepSeek-V3.2-Exp —
نسخهی آزمایشی جدید منتشر شد!
⚡ ویژگیهای کلیدی:
✳️ساختهشده بر پایه V3.1-Terminus
✳️بهرهگیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینهی کمتر در پردازش کانتکستهای طولانی
✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1
💰 هزینهی API بیش از ۵۰٪ کاهش یافته
📊 نسخهی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.
🔗 Hugging Face
🔗 Tech Report
🔗 GitHub
@rss_ai_ir
#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
نسخهی آزمایشی جدید منتشر شد!
⚡ ویژگیهای کلیدی:
✳️ساختهشده بر پایه V3.1-Terminus
✳️بهرهگیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینهی کمتر در پردازش کانتکستهای طولانی
✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1
💰 هزینهی API بیش از ۵۰٪ کاهش یافته
📊 نسخهی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.
🔗 Hugging Face
🔗 Tech Report
🔗 GitHub
@rss_ai_ir
#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
👍3❤1🙏1