VIRSUN
9.37K subscribers
1.28K photos
738 videos
5 files
826 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🖥️ من اسمش را «بنچمارک پرولتری» می‌گذارم 😄

کاربری یک تست جذاب انجام داده:
او فقط یک پرامپت برای ساخت بازی قدیمی Pinball داد و از چهار مدل برترِ فعلی خواست همین بازی را در قالب یک فایل HTML تولید کنند.

نتیجه؟
به نظر من، Opus-4.5 از بقیه عملکرد بهتری داشت — هم از نظر ساختار کد، هم اجرای روان، هم میزان خطاهای کمتر در منطق بازی.

این سبک تست‌ها خیلی خوب نشان می‌دهد که قدرت واقعی مدل‌ها در «vibecoding» چقدر با هم متفاوت است.

#vibecoding #AI #Opus45 #ChatGPT #Coding #Benchmark
3👍3🔥1👏1
🏠 یک پیمانکار در مهمانی روز شکرگزاری با Nano Banana Pro شگفت‌زده شد!

وقتی برای تست، فقط یک درخواست ساده درباره‌ی خانه‌ای که روی آن کار می‌کرد وارد کرد، مدل در کمتر از یک دقیقه نقشه‌های کامل معماری برای او تولید کرد — دقیق، تمیز و کاملاً قابل استفاده.

🔹 محتوای درخواست:

Draw me architectural plans for a 1600 square foot 3 bedroom house that is two stories in torrance, california

#هوش_مصنوعی #NanoBananaPro #معماری #طراحی_سه‌بعدی #نسل_جدید_AI @rss_ai_ir
3👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات OLi از شرکت LimX Dynamics چین روی زمین‌های ناهموار

این ربات نمونه‌ای از Whole-Body Loco-Manipulation with Active Perception را نشان می‌دهد؛
یعنی OLi می‌تواند با دقت بالا راه برود، خم شود و با تکیه بر حسگرهای خود و بینایی مبتنی بر هوش مصنوعی، در لحظه نسبت به محیط واکنش پویا نشان دهد.

عملکرد کاملاً هماهنگ بین حرکت کل بدن و درک فعال، این ربات را برای عملیات صنعتی و محیط‌های پیچیده به گزینه‌ای بسیار قدرتمند تبدیل کرده است. 🔥

#رباتیک #هوش_مصنوعی #چین #LimXDynamics #روبات_انسان‌نما #روباتیک_صنعتی
🔥2🥰2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌵 Instance-Level Video Generation 🌵

👉 فریمورک InstanceV اولین فریم‌ورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه می‌دهد هر شیء در ویدئو به‌صورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شده‌اند 💙


🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: به‌زودی

#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👍2
🤖 استک GELab-Zero؛ نخستین استک کاملاً متن‌باز برای GUI-Agent ها

یک خبر مهم برای دنیای ایجنت‌ها: استک GELab-Zero منتشر شد؛ ترکیبی کامل از مدل + زیرساخت که جایگزین متن‌باز برای سیستم‌های سطح بالایی مثل GUI-Agent MCP محسوب می‌شود. نسخه‌ای سبک، سریع و قابل اجرا به‌صورت کامل روی سیستم شخصی شما 🚀

🔧 چه چیزهایی داخلش هست؟

مدل ۴B در سطح SOTA؛ سریع، کم‌هزینه و قابل اجرا روی GPUهای سبک

زیرساخت راه‌اندازی «تک‌کلیک» بدون دردسرهای ADB

بنچمارک AndroidDaily بر اساس سناریوهای واقعی کاربران


📊 نتایج و عملکرد

دقت ۷۳.۴٪ روی AndroidDaily

عملکرد بهتر از مدل‌های بزرگ‌تری مثل GUI-Owl-32B

بالاتر از Gemini-2.5-pro-thinking و GPT-4o در تست‌های GUI

برتری قابل توجه روی ScreenSpot، AndroidWorld و OSWorld


🎯 هدف استک مشخص است:
نصب کن، اجرا کن، شخصی‌سازی کن، و توسعه بده — بالاخره یک گزینهٔ متن‌باز واقعی برای GUI-Agent ها در دسترس است.

🔗 لینک‌ها:
HuggingFace:
https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
GitHub:
https://github.com/stepfun-ai/gelab-zero
Blog:
https://opengelab.github.io/index.html

#GELabZero #AI #Agents #GUIAgents #MachineLearning #OpenSource #DeepLearning @rss_ai_ir
1
Simple cartoon line drawing of a [character description], [action]. Clean full-body view, no outline around the edges, no shadow. Clipart-style for children's book, soft lighting, solid [background color], clear lines, no internal shadows. Minimalist and playful cartoon aesthetic.
👍1🔥1👌1
🏗️ ورود گوگل به رقابت مستقیم با انویدیا با TPUv7

گوگل در حال تبدیل TPUv7 به یک رقیب واقعی برای پلتفرم‌های انویدیا است؛ آن‌هم نه فقط در داخل دیتاسنترهای خود، بلکه با فروش کلاسترهای عظیم TPUv7 به مشتریان خارجی.
در همین مسیر، شرکت Anthropic سفارش عددی باورنکردنی ثبت کرده: حدود یک میلیون TPUv7 برای آموزش مدل‌های آیندهٔ Claude.

🔹 چرا TPUv7 یک ضربهٔ جدی به سلطهٔ انویدیا است؟
اینکه TPUv7 از نظر توان خام به سری GB200/GB300 نزدیک شده، اما مزیت اصلی در هزینهٔ کل مالکیت (TCO) است؛ چون گوگل و Broadcom کل زنجیرهٔ تولید—from چیپ تا شبکه—را کنترل می‌کنند و مجبور به خرید پلتفرم‌های آمادهٔ انویدیا نیستند.

💰 استراتژی Anthropic چیست؟

حدود ۴۰۰ هزار TPUv7 را به‌صورت سخت‌افزار واقعی برای دیتاسنترهای خود می‌خرد

حدود ۶۰۰ هزار TPUv7 را از Google Cloud اجاره می‌کند

بار ریسک را بین زیرساخت شخصی و گوگل توزیع می‌کند

با حجم خرید عظیم، قیمت GPU را در سایر قراردادهایش تحت فشار قرار می‌دهد


🧮 اهمیت FLOPs واقعی
در مدل‌های بزرگ، FLOPs تئوری مهم نیست؛ فقط FLOPs مؤثر اهمیت دارد.
همچنین TPUv7 با هسته‌های بهینه‌شده، حدود ۲ برابر FLOPs مؤثر ارزان‌تر نسبت به Nvidia GB300 NVL72 ارائه می‌دهد.

🔗 برتری شبکه‌ای
قدرت واقعی TPUv7 در معماری شبکهٔ ICI 3D-torus است:

ارتباط مستقیم بین چیپ‌ها

استفاده از سوییچ‌های نوری

امکان مونتاژ شفافِ کلاسترهای بسیار بزرگ


و مهم‌تر اینکه گوگل در حال ارائهٔ پشتیبانی بومی PyTorch برای TPU است؛
یعنی دیگر نیازی نیست مدل‌ها برای JAX بازنویسی شوند.

📌 نتیجهٔ این ترکیب چیست؟
همکاری گوگل و Anthropic با نزدیک به یک میلیون TPUv7 سقف قیمتی جدیدی برای بازار تعیین می‌کند و عملاً مانع از حفظ حاشیهٔ سود بالای انویدیا خواهد شد.
گام بعدی گوگل می‌تواند باز کردن XLA و runtime باشد؛
مسیر مستقیم برای تبدیل TPU به یک پلتفرم گسترده و در دسترس برای همهٔ جهان.

#هوش_مصنوعی #TPUv7 #گوگل #Anthropic #دیتاسنتر #GPU #Nvidia #AI
@rss_ai_ir 🚀
2🔥2👏1
🚀 مدل‌های تازه DeepSeek-V3.2 و DeepSeek-V3.2-Speciale منتشر شدند
این نسل جدید، دقیقاً برای حل مسائل پیچیده، ریـزنینگ چندمرحله‌ای و سناریوهای عامل‌محور طراحی شده است.

🧠 ویژگی‌های کلیدی

اینکه DeepSeek-V3.2 نسخه اصلی و جایگزین رسمی سری Exp است؛ روی وب، اپ و API فعال شده.

اینکه DeepSeek-V3.2-Speciale نسخه ویژه با تمرکز بر استدلال عمیق و طراحی‌شده برای سیستم‌های عامل‌محور؛ فقط از طریق API در دسترس است.


📊 سطح عملکرد

اینکه V3.2 سرعت و کیفیت متعادل دارد و تقریباً هم‌رده‌ی GPT-5 ارزیابی می‌شود.

نسخه Speciale در ریـزنینگ پیشرفته با Gemini-3.0-Pro رقابت می‌کند.

و Speciale در IMO و CMO و ICPC امتیازهای پیشرو دارد.


🛠️ نوآوری در آموزش عامل‌ها

تولید داده‌ی مصنوعی برای بیش از ۱۸۰۰ محیط و ۸۵ هزار دستور پیچیده.

فکر کردن و reasoning این بار داخل سازوکار tool-use مدل تعبیه شده است.


🔌 دسترسی و API

و V3.2 با همان API نسل قبلی کار می‌کند.

نسخه Speciale تا تاریخ ۱۵ دسامبر ۲۰۲۵ از طریق endpoint موقت فعال است.


📦 مدل‌ها
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale

📄 گزارش فنی
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf

@rss_ai_ir
#DeepSeek #LLM #AI #Reasoning #Agent #MachineLearning 🤖🔥
👍21🔥1👏1