VIRSUN
7.43K subscribers
792 photos
461 videos
3 files
507 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔹🚀 معرفی OK Computer از Kimi AI
هوش مصنوعی جدیدی که مثل یک تیم کامل محصول عمل می‌کند!

---
چه کاری انجام می‌دهد؟

🖥 با یک پرامپت ساده، وب‌سایت‌ها و اپلیکیشن‌های چندصفحه‌ای می‌سازد.

🎨 طراحی، دیاگرام و پرزنتیشن کامل را خودش تولید می‌کند.

📊 قابلیت پردازش دیتاست‌های عظیم (تا ۱ میلیون ردیف داده).

📑 تحقیق انجام می‌دهد و گزارش تحلیلی با راهکارهای عملی می‌نویسد.

👨‍💻 در نقش مدیر محصول، استراتژیست، طراح و مهندس همزمان ظاهر می‌شود.

---
🔑 اهمیت ماجرا

با OK Computer، دیگر برای ساخت یک محصول دیجیتال نیاز به تیم چندنفره نیست. کافی است یک پرامپت بنویسید تا تمام فرایند از ایده تا کدنویسی و ارائه انجام شود. این یعنی یک تحول بزرگ در اتوماسیون توسعه وب و نرم‌افزار.

https://www.kimi.com/
---

📌 @rss_ai_ir

#هوش_مصنوعی #KimiAI #OKComputer #توسعه_وب #اتوماسیون #استارتاپ #دیجیتال
👏2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
😂 این دیگه خیلی بامزه‌ست!
آدم وقتی می‌بینه همچین چیزی ممکنه ساخته‌ی هوش مصنوعی باشه، باز هم نمی‌تونه جلوی خنده‌ش رو بگیره. چون مهم نیست واقعی باشه یا تولیدشده؛ مهم اینه که حال آدم رو خوب می‌کنه.

📌 @rss_ai_ir

#ویدیو #خنده #هوش_مصنوعی #سرگرمی
🤣4👍1😁1🍌1
🚦 یادگیری ماشین در نقشه‌برداری: تشخیص علائم جاده‌ای در Yandex Maps 🚦

یکی از کیس‌های جالب ML در دنیای واقعی مربوط به توسعه‌ی دتکتور علائم جاده‌ای در سرویس نقشه یاندکس است. این سیستم از یک کلاس‌بند دودویی ساده شروع شد و امروز با شبکه‌های عصبی پیچیده توانایی شناسایی تقریباً تمام علائم جاده‌ای در روسیه را دارد.

📌 مسیر تکامل:

🔹 نسخه ۲۰۱۶ → مدل کلاسیک با ACFFeatures + WaldBoost، ولی مشکل اصلی «نزدیک‌بینی» بود (فقط علائم رو‌به‌رو را می‌دید).

🔹 مهاجرت به Faster R-CNN → امکان شناسایی علائم در زوایای مختلف.


🧠 راهکارهای معماری غیرمعمول:

تمام علائم محدودیت سرعت در یک کلاس → شبکه دوم روی تصویر برش‌خورده عدد را تشخیص می‌دهد.

برای علائم جهت خطوط هم همین رویکرد → یک مدل اضافی خروجی باینری بردار جهت‌ها را می‌دهد.

علائم چندخطی (multi-lane) → مدل اختصاصی جداگانه برای پردازش.


🟢 چالش اصلی → دیتاست
به جای برچسب‌گذاری دستی ترابایت‌ها عکس خیابانی، ابتدا با مدل‌های اولیه عکس‌های دارای علائم جدا شدند، سپس برای برچسب‌گذاری دقیق به آسنسرها داده شدند.

📊 اعداد نهایی:

✳️۳۰۰ هزار عکس در دیتاست
✳️۱.۵ میلیون علامت برچسب‌خورده
✳️۲۰۰+ کلاس مختلف علائم
✳️رایج‌ترین علامت → عبور عابر پیاده


🎯 نتیجه عملی:
این سیستم باعث می‌شود داده‌های نقشه به‌صورت خودکار به‌روز شوند. در سال بیش از ۲۰۰ هزار به‌روزرسانی اتوماتیک انجام می‌گیرد، که روی مسیریابی و راهنمای صوتی محدودیت سرعت تأثیر مستقیم دارد.

📄 مقاله کامل: Habr

@rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #نقشه #بینایی_ماشین 🚀
🚀 Physics با Sora 2
… و کمی انیمه 🎬

⛔️مجموعه OpenAI در نسخه‌ی جدید Sora 2 نه‌تنها کیفیت و واقع‌گرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیه‌سازی دقیق‌تر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا می‌توانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.

و برای علاقه‌مندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمه‌ای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.

این یعنی آینده‌ی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت می‌کند:

1. دقت علمی و فیزیکی برای شبیه‌سازی‌های جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥



به نظر شما، کدام بخش زودتر به بلوغ می‌رسد: شبیه‌سازی‌های فیزیکی برای صنعت یا استایل‌های هنری برای سرگرمی؟ 🤔

@rss_ai_ir

#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀
🧠 معرفی AlphaEvolve توسط Google/DeepMind: هوش مصنوعی در خدمت کشف نتایج جدید در ریاضیات و علوم کامپیوتر تئوری

🔍 چطور کار می‌کند؟
مدل‌های زبانی معمولاً سعی می‌کنند کل اثبات را یک‌جا بنویسند، اما این کار بسیار پیچیده و غیرقابل‌اعتماد است.

⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
به جای نوشتن اثبات کامل، اجزای کوچک‌تری به نام gadget تولید می‌کند.
این تکه‌ها به‌سرعت و به‌صورت خودکار قابل‌بررسی‌اند و اگر درست باشند، می‌توان آن‌ها را در کنار هم قرار داد و به قضایای بزرگ‌تر رسید.

📈 چه چیزهایی پیدا شده است؟

یک نتیجه‌ی جدید برای مسئله‌ی MAX-4-CUT (یکی از مسائل نظریه الگوریتم‌ها و بهینه‌سازی ترکیبیاتی، نسخه‌ای از MAX-CUT کلاسیک).

کران‌های پایینی قوی‌تر برای مسائل روی گراف‌های تصادفی، از جمله کار روی گراف‌های رامانوجان.

سرعت بررسی قضایا نسبت به روش‌های سنتی ۱۰٬۰۰۰ برابر سریع‌تر شده است.


🧩 چرا مهم است؟

ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی می‌ماند.

این رویکرد می‌تواند سال‌ها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتم‌های جدید باز کند.


📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/

@rss_ai_ir

#هوش_مصنوعی #ریاضیات #دیپ‌مایند #پژوهش #LLM
1👍1🔥1
⚡️ تغییر اتو‌انکودر در مدل‌های latent diffusion ساده‌تر از آن چیزی است که فکر می‌کنید!

🚀 اDC-Gen یک فریم‌ورک جدید برای شتاب‌بخشی مدل‌های دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفته‌ی فشرده منتقل می‌کند و هم هزینه را کاهش می‌دهد و هم سرعت تولید را چندین برابر می‌کند.

🔑 ویژگی‌های کلیدی:

🎯 وضوح بالا بدون افت کیفیت
نسخه‌ی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریع‌تر روی H100 در حالت 4K اجرا می‌شود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول می‌کشد.

💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.


📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدل‌ها:
huggingface.co/dc-ai/dc-gen

@rss_ai_ir

#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI
👍1🔥1👏1
🔥 خسته شدید از RLHF و RLVR؟ حالا روش جدیدی معرفی شده به نام Critique Reinforcement Learning (CRL)!

🧠 ایده اصلی:
در الگوریتم‌های معمولی RL، مدل یاد می‌گیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد می‌گیرد راه‌حل موجود را نقد و بررسی کند و مرحله‌به‌مرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازنده‌ای داده می‌شود که در نهایت به قضاوت درست (True/False) منجر شود.

🚀 نتایج آزمایش‌ها:

مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.

این آموزش روی rStar-Coder با روش GRPO انجام شده است.

مدل‌های 4B و 8B در سایز خودشان به بهترین‌ها تبدیل شدند.


📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدل‌ها:
HuggingFace Collection

@rss_ai_ir

#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
👍1🔥1👏1
Media is too big
VIEW IN TELEGRAM
🏫 Leju Robotics
مرکز عظیم آموزش ربات‌ها را در پکن افتتاح کرد
🇨🇳


شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمع‌آوری داده‌های آموزشی ربات‌ها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیه‌سازی می‌شوند:
کار در فروشگاه 🛒
فعالیت در محیط‌های صنعتی 🏭
وظایف خانگی 🏠


🔹 داده‌ها به کمک لباس‌های موشن کپچر و کنترلرها ثبت می‌شوند تا حرکت‌ها و تعاملات انسانی دقیقاً به ربات‌ها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راه‌اندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدل‌های رباتیک است.
به نظر می‌رسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحله‌ای داغ‌تر شده است 🔥


@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔩 آموزش عامل‌محور با محوریت کد 🔩

👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عامل‌محور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده می‌کند.

برخلاف مدل‌های سنتی Text-to-Video که بر پایه پیکسل کار می‌کنند،

این رویکرد با تکیه بر کد Manim (ابزار شبیه‌سازی ریاضی) تضمین می‌کند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.

📌 مزایا:

✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد


📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video

@rss_ai_ir

#AI #Education #AgenticAI #Manim #Code2Video
1👍1👏1👌1
🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL

🔍 مشکل در RL کلاسیک:

در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان


💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کوله‌پشتی (Knapsack) روی مواردی صرف می‌شود که واقعاً سیگنال آموزشی می‌دهند.

نتایج:

🔼 ‌+20–40% گرادیان‌های غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 ‌+2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 ‌حدوداً دو برابر ارزان‌تر از روش توزیع یکنواخت


📄 جزییات بیشتر:
huggingface.co/papers/2509.25849

@rss_ai_ir 🤖

#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning