VIRSUN
7.75K subscribers
786 photos
457 videos
3 files
504 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🚀🤖 MagicDog-W:
انقلابی در رباتیک متحرک!

استارتاپ چینی MagicLab از ربات جدید خود با نام MagicDog-W رونمایی کرده؛ ترکیبی هوشمندانه از انعطاف‌پذیری ربات‌های چهارپا و سرعت حرکت چرخ‌دار.

ویژگی‌ها و توانایی‌ها:

♻️اجرای حرکات آکروباتیک مثل سالتو و فرود نرم
♻️بازیابی سریع پس از افتادن و ادامه‌ی حرکت
♻️صعود از پله‌ها، شیب‌های ۴۰ درجه و موانع ۶۰ سانتی‌متری
♻️جابجایی سریع بین حالت چهارپا و چرخ‌دار
♻️حفظ تعادل روی سطوح لغزنده و ناهموار
♻️توانایی حمل ۱۰ کیلوگرم بار برای مأموریت‌های صنعتی و امدادی


⚙️ مشخصات کلیدی:

♻️۱۷ موتور-گیربکس برای کنترل دقیق هر محور و چرخ
♻️سرعت تا ۳ متر بر ثانیه
♻️باتری با دوام ۲ تا ۴ ساعت
♻️سیستم پیشرفته ناوبری و کنترل حرکت


🎯 کاربردها:

♻️بازرسی صنعتی و مأموریت‌های امنیتی
♻️عملیات جست‌وجو و نجات
♻️حمل بار در زمین‌های دشوار
♻️استفاده در پژوهش‌های علمی و نظامی


📌 کارشناسان می‌گویند MagicDog-W یکی از پلتفرم‌های آینده‌دار رباتیک هیبریدی است که مرز بین «چرخ» و «پا» را از بین برده.

⛔️چین بار دیگر نشان داد که در زمینه‌ی ربات‌های چندمنظوره، آماده‌ی تسخیر صحنه‌های واقعی و حتی شرایط سخت و خطرناک است. 🌍💪

#رباتیک #هوش_مصنوعی #MagicDog #ChinaTech #Robotics
🔥1
📢 ShinkaEvolve
؛ جایگزین متن‌باز AlphaEvolve از Sakana AI

⛔️شرکت Sakana AI چارچوبی متن‌باز با نام ShinkaEvolve معرفی کرده که برای بهینه‌سازی و توسعه الگوریتم‌ها و معماری‌های پیچیده طراحی شده است. «Shinka» (進化) در ژاپنی به معنای تکامل است و این رویکرد هم بر پایه‌ی اصول تکاملی بنا شده.

🔹 چطور کار می‌کند؟
1️⃣ ورودی شامل یک Seed-program و یک Verifier (محاسبه متریک کیفیت/fitness) است. کدهای جدید در یک «آرشیو والدین» ذخیره می‌شوند.
2️⃣ همچنین LLM به عنوان اپراتور جهش عمل می‌کند: می‌تواند کد را با روش‌های مختلف تغییر دهد (diff-patch، بازنویسی کامل، crossover). انتخاب LLM بهینه توسط الگوریتم multi-armed bandit انجام می‌شود.
3️⃣ کاندیداها ابتدا از فیلتر novelty-rejection (بر اساس شباهت تع嵌 embeddings) عبور می‌کنند تا ایده‌های تکراری حذف شوند. سپس بهترین‌ها به آرشیو اضافه می‌شوند.
4️⃣ برای تنوع، از مفهوم «جزیره‌ها» (population‌های مستقل) استفاده شده و در مواقع بن‌بست، مهاجرت بین آنها انجام می‌شود.

🔹 نتایج تست‌ها
در بهینه‌سازی ریاضی: تنها با 150 نمونه، راه‌حل جدیدی برای مسئله‌ی Circle Packing پیدا کرد.
در طراحی ایجنت هوش مصنوعی: بعد از ~75 نسل، معماری سه‌بخشی جدیدی ایجاد کرد که baseline را در AIME شکست داد.
در برنامه‌نویسی رقابتی: با بهبودهای متعدد، به سطح مدال نقره رسید.
در آموزش LLM: پس از ~30 نسل، تابع خطای جدیدی برای MoE کشف شد که عملکردی بهتر از بسیاری روش‌های رایج داشت.

⚡️ تفاوت اصلی با AlphaEvolve این است که ShinkaEvolve همین حالا و رایگان قابل استفاده است. کافیست فایل evaluate.py را برای مسئله‌ی خود بازنویسی کنید، initial.py را آماده کرده و اجرا کنید:

shinka_launch variant=experiment_name

📎 کد و راهنمای کامل:
GitHub

#هوش_مصنوعی #الگوریتم_تکاملی #SakanaAI #ShinkaEvolve #AIResearch
📊 K2 Vendor Verifier
؛ تست شفافیت عملکرد وندورها

تیم Kimi ابزاری با نام K2 Vendor Verifier معرفی کرده که هدفش بررسی دقت سرویس‌دهنده‌های مختلف برای مدل K2 است.

🔎 روش تست:
هر وندور روی ۲۰۰۰ درخواست یکسان امتحان می‌شود و نتایج با API رسمی مقایسه می‌گردد.

📉 نتیجه:
همه‌ی ارائه‌دهندگان 3rd party مشکلات جدی در خروجی داشتند. متأسفانه جذاب‌ترین گزینه، Groq، در این تست حضور نداشت.

این حرکت یادآور تست‌های تیم Artificial Analysis روی gpt-oss است، جایی که اختلاف فاحشی بین سرویس‌دهندگان مشاهده شد.

⚠️ پیام مهم: اگر چنین تست‌هایی عمومی و استاندارد نشوند، باگ‌های inference بی‌سروصدا ادامه خواهند داشت و کیفیت مدل‌ها را پایین می‌آورند.

📎 گیت‌هاب: K2 Vendor Verifier

#هوش_مصنوعی #K2 #LLM #AI #Kimi #VendorVerifier
This media is not supported in your browser
VIEW IN TELEGRAM
🔔 متا معرفی کرد: Vibes — تیک‌تاکی با ویدئوهای ساخته‌شده توسط هوش مصنوعی 🎥

پلتفرم جدید متا با نام Vibes امکان ساخت ویدئوهای کوتاه و سرگرم‌کننده توسط هوش مصنوعی را فراهم می‌کند؛ چیزی شبیه تیک‌تاک، اما بدون نیاز به دوربین یا ضبط واقعی.

📌 هر کاربر می‌تواند فقط با یک پرامپت یا ایده، ویدئوی اختصاصی خودش را تولید و منتشر کند.

این گام تازه متا نشان می‌دهد آینده‌ی محتوای کوتاه به سمت AI-native platforms پیش می‌رود.

@rss_ai_ir 🤖

#Meta #Vibes #AI #ویدئو #هوش_مصنوعی
📊 آیا به استاندارد برای ارزیابی کیفیت مدل‌ها و محصولات LLM نیاز داریم؟

⛔️امروز تقریباً در هر محصولی قابلیت RAG وجود دارد و سناریوهای agentic هم به یک روند عادی تبدیل شده‌اند. اما هرچه پایپ‌لاین پیچیده‌تر شود، کنترل و ارزیابی آن هم سخت‌تر و حیاتی‌تر می‌شود.

🔹 در پایپ‌لاین‌های ساده می‌توان:

♻️متریک‌های مشخصی انتخاب کرد
♻️تست‌های واحد و یکپارچه نوشت
♻️یک بنچمارک کوچک آماده و مرتباً اجرا کرد
♻️پایداری و تکرارپذیری نتایج را بررسی کرد


🔹 اما وقتی پایپ‌لاین شامل چندین ماژول مختلف باشد، ماجرا شبیه ساختن هزارچهره فالکون از لگو می‌شود 🧱🦧

در مقاله Apollo Research "We Need A Science of Evals" (۲۰۲۴) گفته شد:

ارزیابی کیفیت بیشتر شبیه هنر است تا علم (مثلاً فقط تغییر در فرمت پرامپت می‌تواند دقت را ۷۰+ درصد جابجا کند 😱)

بلوغ ارزیابی (Eval) سه مرحله دارد:
1️⃣ Nascent —
مرحله ابتدایی و پراکنده، بدون استاندارد
2️⃣ Maturation —
ظهور بهترین‌روش‌ها ولی بدون مقررات رسمی
3️⃣ Mature —
وجود استانداردها، استناد آماری و نتایج قابل‌تفسیر

ما فعلاً در مرحله دوم هستیم و رسیدن به مرحله سوم نیازمند تعریف متریک‌های روشن، پوشش کامل تست، تکرارپذیری و تحلیل آماری است.


⚡️ اخیراً استاندارد جدیدی معرفی شده: STREAM (A Standard for Transparently Reporting Evaluations in AI Model Reports). این چارچوب به شفاف‌سازی تست‌ها و گزارش‌دهی نتایج کمک می‌کند. هرچند بیشتر برای بنچمارک‌های حوزه ChemBio طراحی شده، اما قابل‌استفاده در دیگر زمینه‌ها هم هست.

🔮 آینده‌ی ارزیابی LLMها در گرو Eval علمی و استاندارد است. در غیر این صورت، محصولات غیرایمن و مبهم خواهیم داشت.

@rss_ai_ir 🤖

https://www.arxiv.org/pdf/2508.09853

#هوش_مصنوعی #LLM #استاندارد #Eval #STREAM #AI
🔴 ربات‌های Unitree به ویروس «زامبی» مبتلا شدند — همه‌اش به خاطر یک حفره امنیتی در Bluetooth!

🔓 آسیب‌پذیری UniPwn به هکرها اجازه می‌دهد خود را جای صاحب ربات جا بزنند و کد مخرب اجرا کنند.
🤖 ماجرا ترسناک‌تر می‌شود: ربات فقط دستورات مهاجم را اجرا نمی‌کند، بلکه از طریق بلوتوث بقیه ربات‌ها را هم آلوده کرده و یک بات‌نت می‌سازد!

⚠️ شرکت هنوز این مشکل را برطرف نکرده و هشدار پژوهشگران را نادیده گرفته است.

📌 وقتشه که «آرنولد» وارد عمل بشه... 🔫

@rss_ai_ir

#امنیت #رباتیک #Unitree #IoT #Bluetooth
👍1
فراخوان نهمین جشنواره اندیشمندان و دانشمندان جوان، آخرین فرصت ثبت نام نهمین جشنواره اندیشمندان و دانشمندان جوان 15 مهرماه 1404 https://ysf-persia.com/
🧠 شرکت Thinking Machines روشی نوین برای آموزش شبکه‌های عصبی معرفی کرده است: manifold Muon که وزن‌ها را پایدارتر و قابل پیش‌بینی‌تر می‌کند.

🔑 ایده اصلی:

✳️وزن‌ها روی یک سطح ریاضی خاص (مجموعه Stiefel manifold) محدود می‌شوند تا از «واپاشی» آن‌ها جلوگیری شود.

✳️اندازه به‌روزرسانی‌ها با نورم طیفی کنترل می‌شود تا گام‌های یادگیری شبکه را دچار اعوجاج نکنند.

✳️به‌روزرسانی‌ها ابتدا در فضای مماس محاسبه و سپس دوباره به روی همان سطح برگردانده می‌شوند.


📊 در تست‌های CIFAR-10 این روش دقت بیشتری نسبت به AdamW داشت و وزن‌ها را در محدوده پایدار نگه داشت، هرچند محاسبات زمان‌برتر شدند.

🎯 نکته مهم: چیزی که امروز به‌عنوان «تصادفی بودن» پاسخ‌های مدل‌ها شناخته می‌شود، در این نگاه یک باگ قابل‌رفع است.
این رویکرد می‌تواند پایه‌ای برای توسعه‌ی AGI ایمن باشد؛ جایی که رفتارهای پیش‌بینی‌ناپذیر غیرقابل‌قبول‌اند.

🔗 جزئیات بیشتر: ThinkingMachines.ai

#هوش_مصنوعی #یادگیری_عمیق #پژوهش #AGI #امنیت
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🧮 وقتی حافظه مهم‌تر از دقت است: ساختارهای داده تقریبی

⛔️در عصر داده‌های عظیم، حتی بهینه‌ترین الگوریتم‌ها با مصرف خطی حافظه از پس حجم داده‌ها برنمی‌آیند. راه‌حل چیست؟

استفاده از ساختارهای داده تقریبی 📊 که کمی از دقت می‌کاهند اما سرعت و فشردگی فوق‌العاده‌ای دارند.

در این مقاله سه ابزار کلیدی بررسی می‌شوند:

HyperLogLog —
برای تخمین تعداد عناصر یکتا 🔢

فیلتر بلوم (Bloom Filter) —
برای بررسی تعلق یک عضو به مجموعه 🌐

Count-Min Sketch —
برای شمارش فراوانی عناصر 📈


درست است که این روش‌ها دقیق نیستند، اما امکان تحلیل مجموعه‌های عظیم داده را فراهم می‌کنند، جایی که روش‌های دقیق عملاً از کار می‌افتند.

📌 جزئیات و نمونه‌های کاربردی را اینجا بخوانید:
👉 https://blog.deepschool.ru/math/kogda-pamyat-dorozhe-tochnosti-priblizhyonnye-struktury-dannyh/

#BigData #علوم‌داده #الگوریتم #HyperLogLog #BloomFilter #CountMinSketch
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 گوگل نسخه جدید Gemini Robotics 1.5 را معرفی کرد – یک سیستم عامل عامل‌محور پیشرفته برای کنترل ربات‌ها.

🔹 این سیستم حالا توانایی بیشتری در استدلال، برنامه‌ریزی، تعامل با انسان و حتی استفاده از ابزارهایی مثل جستجوی وب دارد.

در واقع، دو مدل به صورت همزمان درون آن به کار گرفته شده است:

1️⃣ Gemini Robotics-ER 1.5 –
به‌عنوان «مغز سطح بالا»، محیط و دستورات انسانی را تحلیل می‌کند، برنامه‌ریزی دقیق انجام می‌دهد و در صورت نیاز ابزارها را فراخوانی می‌کند.

2️⃣ Gemini Robotics 1.5 –
به‌عنوان «اجراکننده»، دستورات را به حرکات دقیق و کنترل‌شده تبدیل می‌کند.

📌 مثال: وقتی به ربات می‌گویید «زباله‌ها را طبق قوانین محلی دسته‌بندی کن»:

قابل ذکر است که ER 1.5 ابتدا قوانین کشور شما را بررسی کرده و نوع زباله‌ها را شناسایی می‌کند.

سپس دستوراتی مثل «بطری در سمت چپ، دستمال در سمت راست» صادر می‌کند.

مدل دوم این دستورات را به مسیرهای حرکتی دقیق تبدیل می‌کند. اگر محیط تغییر کند (مثل اضافه شدن زباله جدید)، ER دوباره برنامه را اصلاح می‌کند.


مزیت مهم: اگر شکل یا نوع ربات تغییر کند، نیازی به بازطراحی کل سیستم نیست، فقط کافی است بخش اجرایی (مدل دوم) تنظیم شود.

🔑 خبر خوب این‌که Gemini Robotics-ER 1.5 همین حالا از طریق API در دسترس است.

🌍 جزئیات بیشتر: لینک وبلاگ گوگل

#Google #Gemini #AI #رباتیک #عامل_هوشمند
1
🧪 هوش مصنوعی مولد در خدمت شیمی؛ ساخت مولکول‌ها گام‌به‌گام

انویدیا مدل جدیدی به نام ReaSyn معرفی کرده که مسیرهای سنتز مولکول‌ها را پیش‌بینی می‌کند – از ساده‌ترین مواد اولیه تا ترکیبات نهایی.

🔹 چطور کار می‌کند؟

✳️به‌جای ارائه یک فرمول نهایی، زنجیره‌ای از واکنش‌ها (Chain of Reactions) پیشنهاد می‌شود.
✳️هر مرحله قابل بررسی و اصلاح است.
✳️با کمک یادگیری تقویتی و جستجوی مسیرها، بهترین روش سنتز پیدا می‌شود.


🔹 مزایا:
شیمی‌دان‌ها نه تنها مولکول‌های جدید، بلکه دستورالعمل واقعی برای ساخت آن‌ها در آزمایشگاه دریافت می‌کنند.
اگر سنتز مستقیم ممکن نباشد، می‌توان مسیرهای جایگزین و آنالوگ‌ها را پیدا کرد.
سرعت توسعه داروها، مواد جدید و ترکیبات نوآورانه به‌طور چشمگیری افزایش می‌یابد.

هوش مصنوعی حالا تنها به طراحی مولکول‌ها بسنده نمی‌کند، بلکه توضیح می‌دهد چگونه آن‌ها را در دنیای واقعی ساخت.

🔗 جزئیات در وبلاگ انویدیا

@rss_ai_ir

#NVIDIA #AI #DrugDiscovery #شیمی #مولکول #هوش_مصنوعی
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ سم آلتمن: OpenAI به دنبال ساخت "خانواده‌ای کوچک از دستگاه‌ها" برای بازتعریف تعامل انسان و کامپیوتر

آلتمن خبر داد که OpenAI در حال برنامه‌ریزی برای عرضه مجموعه‌ای محدود از دستگاه‌های نوآورانه است که شیوه تعامل ما با رایانه‌ها را دگرگون خواهد کرد. 🎯

🔹 این دستگاه‌ها قرار نیست به زودی عرضه شوند، اما هدف آن‌ها فراتر رفتن از رابط‌های کاربری فعلی است؛ جایی که بتوانید دستورات طولانی و پیچیده بدهید و مطمئن باشید سیستم آن‌ها را به‌طور کامل و درست اجرا می‌کند.

به نظر می‌رسد آینده تعامل انسان و ماشین نه فقط در نرم‌افزار، بلکه در سخت‌افزارهای اختصاصی هوش مصنوعی هم رقم خواهد خورد. 🤖

📌 @rss_ai_ir

#OpenAI #SamAltman #AI #Interface #هوش_مصنوعی
🚀 گوگل دیپ‌مایند معرفی کرد: EmbeddingGemma

⛔️مدلی فشرده برای تبدیل متن به بردار (Embedding) با تنها 308M پارامتر که کیفیتی در حد بهترین مدل‌های تا 500M پارامتر دارد، اما سریع‌تر و سبک‌تر است.

🔑 چطور کار می‌کند:

♻️بر پایه نسخه ساده‌شده Gemma 3 (فقط بخش Encoder باقی مانده)

♻️آموزش با distillation: دانش‌آموز خروجی‌های مدل معلم را کپی می‌کند

♻️همچنین Regularizer باعث توزیع یکنواخت بردارها می‌شود → بهبود جستجو و پایداری در کوانتیزاسیون

♻️دو مرحله آموزش: اول روی داده‌های پرسش–پاسخ نویزی، سپس روی داده‌های تمیز با «منفی‌های سخت» و پرامپت‌ها

♻️خروجی نهایی با میانگین چند چک‌پوینت بهینه‌شده ساخته می‌شود


📊 نتایج:

✳️بهترین عملکرد در بین مدل‌های زیر 500M پارامتر

✳️قوی در وظایف چندزبانه، انگلیسی و حتی کدنویسی

✳️پشتیبانی از وزن‌های 4-bit و بردارهای 128 بُعدی → قابل اجرا روی دستگاه‌های سبک


📄 مقاله:
arxiv.org/abs/2509.20354

#Google #DeepMind #EmbeddingGemma #AI #NLP #هوش_مصنوعی

@rss_ai_ir
2👏1🙏1
🎥🧠 ویدئو-مدل‌ها وارد دنیای Chain-of-Frames شدند!

مدل‌های مولد ویدئو (مثل Veo 3) حالا فقط تصویر نمی‌سازند – آن‌ها می‌توانند مستقیماً روی فریم‌ها فکر کنند و پاسخ را رسم کنند.

🔹 پژوهش جدید نشان داد که حتی بدون فاین‌تیونینگ، یک مدل ویدئویی بزرگ می‌تواند:

✳️مسائل کلاسیک بینایی ماشین (مرزبندی، سگمنتیشن، بهبود تصویر)
✳️و حتی پازل‌های بصری ساده (مثل ماز و تقارن)
را فقط با یک پرامپت درست حل کند.


📌 نکته طلایی: به مدل نقش بدهید و فرمت خروجی را مشخص کنید.
مثال‌ها:

🌀 Maze:
مسیر کوتاه از START به GOAL را قرمز با ضخامت ۳ پیکسل بکش.

👤 Segmentation:
فقط فرد را با لایه نیمه‌شفاف پر کن.

🎬 Background removal:
پس‌زمینه خاکستری یکنواخت، بدون هاله دور مو.

🌍🌙 Physics:
دو نسخه زمین (9.81 m/s²) و ماه (1.62 m/s²) کنار هم نشان بده.

🔧 Deblur/Denoise:
وضوح را زیاد کن، بدون صاف‌کردن بیش‌ازحد.
You are a video analyst. Solve the task and DRAW the answer ON TOP of frames.

Maze: draw the shortest valid path in RED, thickness 3 px, unbroken line from START to GOAL.

Segmentation: fill ONLY the person with a semi-transparent overlay; keep everything else unchanged.

Background removal: keep the subject; replace background with uniform gray; avoid halos around hair.

Physics: render two variants side-by-side labeled “Earth (9.81 m/s^2)” and “Moon (1.62 m/s^2)”; show motion difference.

Deblur/denoise: increase sharpness while preserving faces; avoid over-smoothing and ringing artifacts.

نتیجه: ویدئو-مدل‌ها مثل LLMها می‌توانند zero-shot کار کنند، کافی است بگویید: «حل کن و روی فریم رسم کن».

📎 سایت مقاله با مثال‌های تصویری پر از دموهای خفن است.
https://video-zero-shot.github.io/

@rss_ai_ir

#AI #VideoAI #GenerativeAI #ChainOfFrames #ComputerVision
1👍1🙏1
🚀 DeepSeek-V3.2-Exp —
نسخه‌ی آزمایشی جدید منتشر شد!

ویژگی‌های کلیدی:

✳️ساخته‌شده بر پایه V3.1-Terminus

✳️بهره‌گیری از مکانیزم جدید Sparse Attention (DSA) → سرعت بیشتر و هزینه‌ی کمتر در پردازش کانتکست‌های طولانی

✳️کیفیت تقریباً بدون افت، با همان کارایی نسخه V3.1

💰 هزینه‌ی API بیش از ۵۰٪ کاهش یافته


📊 نسخه‌ی V3.1 همچنان تا ۱۵ اکتبر ۲۰۲۵ در دسترس خواهد بود.

🔗 Hugging Face
🔗 Tech Report
🔗 GitHub

@rss_ai_ir

#DeepSeek #هوش_مصنوعی #SparseAttention #مدل_زبان #LLM
👍31🙏1