This media is not supported in your browser
VIEW IN TELEGRAM
🖥️ من اسمش را «بنچمارک پرولتری» میگذارم 😄
کاربری یک تست جذاب انجام داده:
او فقط یک پرامپت برای ساخت بازی قدیمی Pinball داد و از چهار مدل برترِ فعلی خواست همین بازی را در قالب یک فایل HTML تولید کنند.
⏳ نتیجه؟
به نظر من، Opus-4.5 از بقیه عملکرد بهتری داشت — هم از نظر ساختار کد، هم اجرای روان، هم میزان خطاهای کمتر در منطق بازی.
این سبک تستها خیلی خوب نشان میدهد که قدرت واقعی مدلها در «vibecoding» چقدر با هم متفاوت است.
#vibecoding #AI #Opus45 #ChatGPT #Coding #Benchmark
کاربری یک تست جذاب انجام داده:
او فقط یک پرامپت برای ساخت بازی قدیمی Pinball داد و از چهار مدل برترِ فعلی خواست همین بازی را در قالب یک فایل HTML تولید کنند.
⏳ نتیجه؟
به نظر من، Opus-4.5 از بقیه عملکرد بهتری داشت — هم از نظر ساختار کد، هم اجرای روان، هم میزان خطاهای کمتر در منطق بازی.
این سبک تستها خیلی خوب نشان میدهد که قدرت واقعی مدلها در «vibecoding» چقدر با هم متفاوت است.
#vibecoding #AI #Opus45 #ChatGPT #Coding #Benchmark
❤3👍3🔥1👏1
🏠✨ یک پیمانکار در مهمانی روز شکرگزاری با Nano Banana Pro شگفتزده شد!
وقتی برای تست، فقط یک درخواست ساده دربارهی خانهای که روی آن کار میکرد وارد کرد، مدل در کمتر از یک دقیقه نقشههای کامل معماری برای او تولید کرد — دقیق، تمیز و کاملاً قابل استفاده.
🔹 محتوای درخواست:
#هوش_مصنوعی #NanoBananaPro #معماری #طراحی_سهبعدی #نسل_جدید_AI @rss_ai_ir
وقتی برای تست، فقط یک درخواست ساده دربارهی خانهای که روی آن کار میکرد وارد کرد، مدل در کمتر از یک دقیقه نقشههای کامل معماری برای او تولید کرد — دقیق، تمیز و کاملاً قابل استفاده.
🔹 محتوای درخواست:
Draw me architectural plans for a 1600 square foot 3 bedroom house that is two stories in torrance, california
#هوش_مصنوعی #NanoBananaPro #معماری #طراحی_سهبعدی #نسل_جدید_AI @rss_ai_ir
❤3👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات OLi از شرکت LimX Dynamics چین روی زمینهای ناهموار
این ربات نمونهای از Whole-Body Loco-Manipulation with Active Perception را نشان میدهد؛
یعنی OLi میتواند با دقت بالا راه برود، خم شود و با تکیه بر حسگرهای خود و بینایی مبتنی بر هوش مصنوعی، در لحظه نسبت به محیط واکنش پویا نشان دهد.
عملکرد کاملاً هماهنگ بین حرکت کل بدن و درک فعال، این ربات را برای عملیات صنعتی و محیطهای پیچیده به گزینهای بسیار قدرتمند تبدیل کرده است. 🔥
#رباتیک #هوش_مصنوعی #چین #LimXDynamics #روبات_انساننما #روباتیک_صنعتی
این ربات نمونهای از Whole-Body Loco-Manipulation with Active Perception را نشان میدهد؛
یعنی OLi میتواند با دقت بالا راه برود، خم شود و با تکیه بر حسگرهای خود و بینایی مبتنی بر هوش مصنوعی، در لحظه نسبت به محیط واکنش پویا نشان دهد.
عملکرد کاملاً هماهنگ بین حرکت کل بدن و درک فعال، این ربات را برای عملیات صنعتی و محیطهای پیچیده به گزینهای بسیار قدرتمند تبدیل کرده است. 🔥
#رباتیک #هوش_مصنوعی #چین #LimXDynamics #روبات_انساننما #روباتیک_صنعتی
🔥2🥰2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌵 Instance-Level Video Generation 🌵
👉 فریمورک InstanceV اولین فریمورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه میدهد هر شیء در ویدئو بهصورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شدهاند 💙
🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: بهزودی
#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👉 فریمورک InstanceV اولین فریمورک تولید ویدئو است که از پایه برای کنترل سطح-اُبجکت طراحی شده و اجازه میدهد هر شیء در ویدئو بهصورت مستقل و دقیق کنترل شود. کد و دیتاست منتشر شدهاند 💙
🔗 Paper: arxiv.org/pdf/2511.23146
🔗 Project: https://aliothchen.github.io/projects/InstanceV/
🔗 Repo: بهزودی
#InstanceV #VideoGeneration #AI #ComputerVision #GenerativeAI
👍2
🤖 استک GELab-Zero؛ نخستین استک کاملاً متنباز برای GUI-Agent ها
یک خبر مهم برای دنیای ایجنتها: استک GELab-Zero منتشر شد؛ ترکیبی کامل از مدل + زیرساخت که جایگزین متنباز برای سیستمهای سطح بالایی مثل GUI-Agent MCP محسوب میشود. نسخهای سبک، سریع و قابل اجرا بهصورت کامل روی سیستم شخصی شما 🚀
🔧 چه چیزهایی داخلش هست؟
مدل ۴B در سطح SOTA؛ سریع، کمهزینه و قابل اجرا روی GPUهای سبک
زیرساخت راهاندازی «تککلیک» بدون دردسرهای ADB
بنچمارک AndroidDaily بر اساس سناریوهای واقعی کاربران
📊 نتایج و عملکرد
دقت ۷۳.۴٪ روی AndroidDaily
عملکرد بهتر از مدلهای بزرگتری مثل GUI-Owl-32B
بالاتر از Gemini-2.5-pro-thinking و GPT-4o در تستهای GUI
برتری قابل توجه روی ScreenSpot، AndroidWorld و OSWorld
🎯 هدف استک مشخص است:
نصب کن، اجرا کن، شخصیسازی کن، و توسعه بده — بالاخره یک گزینهٔ متنباز واقعی برای GUI-Agent ها در دسترس است.
🔗 لینکها:
HuggingFace:
https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
GitHub:
https://github.com/stepfun-ai/gelab-zero
Blog:
https://opengelab.github.io/index.html
#GELabZero #AI #Agents #GUIAgents #MachineLearning #OpenSource #DeepLearning @rss_ai_ir
یک خبر مهم برای دنیای ایجنتها: استک GELab-Zero منتشر شد؛ ترکیبی کامل از مدل + زیرساخت که جایگزین متنباز برای سیستمهای سطح بالایی مثل GUI-Agent MCP محسوب میشود. نسخهای سبک، سریع و قابل اجرا بهصورت کامل روی سیستم شخصی شما 🚀
🔧 چه چیزهایی داخلش هست؟
مدل ۴B در سطح SOTA؛ سریع، کمهزینه و قابل اجرا روی GPUهای سبک
زیرساخت راهاندازی «تککلیک» بدون دردسرهای ADB
بنچمارک AndroidDaily بر اساس سناریوهای واقعی کاربران
📊 نتایج و عملکرد
دقت ۷۳.۴٪ روی AndroidDaily
عملکرد بهتر از مدلهای بزرگتری مثل GUI-Owl-32B
بالاتر از Gemini-2.5-pro-thinking و GPT-4o در تستهای GUI
برتری قابل توجه روی ScreenSpot، AndroidWorld و OSWorld
🎯 هدف استک مشخص است:
نصب کن، اجرا کن، شخصیسازی کن، و توسعه بده — بالاخره یک گزینهٔ متنباز واقعی برای GUI-Agent ها در دسترس است.
🔗 لینکها:
HuggingFace:
https://huggingface.co/stepfun-ai/GELab-Zero-4B-preview
GitHub:
https://github.com/stepfun-ai/gelab-zero
Blog:
https://opengelab.github.io/index.html
#GELabZero #AI #Agents #GUIAgents #MachineLearning #OpenSource #DeepLearning @rss_ai_ir
❤1
Simple cartoon line drawing of a [character description], [action]. Clean full-body view, no outline around the edges, no shadow. Clipart-style for children's book, soft lighting, solid [background color], clear lines, no internal shadows. Minimalist and playful cartoon aesthetic.
👍1🔥1👌1
🏗️ ورود گوگل به رقابت مستقیم با انویدیا با TPUv7
گوگل در حال تبدیل TPUv7 به یک رقیب واقعی برای پلتفرمهای انویدیا است؛ آنهم نه فقط در داخل دیتاسنترهای خود، بلکه با فروش کلاسترهای عظیم TPUv7 به مشتریان خارجی.
در همین مسیر، شرکت Anthropic سفارش عددی باورنکردنی ثبت کرده: حدود یک میلیون TPUv7 برای آموزش مدلهای آیندهٔ Claude.
🔹 چرا TPUv7 یک ضربهٔ جدی به سلطهٔ انویدیا است؟
اینکه TPUv7 از نظر توان خام به سری GB200/GB300 نزدیک شده، اما مزیت اصلی در هزینهٔ کل مالکیت (TCO) است؛ چون گوگل و Broadcom کل زنجیرهٔ تولید—from چیپ تا شبکه—را کنترل میکنند و مجبور به خرید پلتفرمهای آمادهٔ انویدیا نیستند.
💰 استراتژی Anthropic چیست؟
حدود ۴۰۰ هزار TPUv7 را بهصورت سختافزار واقعی برای دیتاسنترهای خود میخرد
حدود ۶۰۰ هزار TPUv7 را از Google Cloud اجاره میکند
بار ریسک را بین زیرساخت شخصی و گوگل توزیع میکند
با حجم خرید عظیم، قیمت GPU را در سایر قراردادهایش تحت فشار قرار میدهد
🧮 اهمیت FLOPs واقعی
در مدلهای بزرگ، FLOPs تئوری مهم نیست؛ فقط FLOPs مؤثر اهمیت دارد.
همچنین TPUv7 با هستههای بهینهشده، حدود ۲ برابر FLOPs مؤثر ارزانتر نسبت به Nvidia GB300 NVL72 ارائه میدهد.
🔗 برتری شبکهای
قدرت واقعی TPUv7 در معماری شبکهٔ ICI 3D-torus است:
ارتباط مستقیم بین چیپها
استفاده از سوییچهای نوری
امکان مونتاژ شفافِ کلاسترهای بسیار بزرگ
و مهمتر اینکه گوگل در حال ارائهٔ پشتیبانی بومی PyTorch برای TPU است؛
یعنی دیگر نیازی نیست مدلها برای JAX بازنویسی شوند.
📌 نتیجهٔ این ترکیب چیست؟
همکاری گوگل و Anthropic با نزدیک به یک میلیون TPUv7 سقف قیمتی جدیدی برای بازار تعیین میکند و عملاً مانع از حفظ حاشیهٔ سود بالای انویدیا خواهد شد.
گام بعدی گوگل میتواند باز کردن XLA و runtime باشد؛
مسیر مستقیم برای تبدیل TPU به یک پلتفرم گسترده و در دسترس برای همهٔ جهان.
#هوش_مصنوعی #TPUv7 #گوگل #Anthropic #دیتاسنتر #GPU #Nvidia #AI
@rss_ai_ir 🚀
گوگل در حال تبدیل TPUv7 به یک رقیب واقعی برای پلتفرمهای انویدیا است؛ آنهم نه فقط در داخل دیتاسنترهای خود، بلکه با فروش کلاسترهای عظیم TPUv7 به مشتریان خارجی.
در همین مسیر، شرکت Anthropic سفارش عددی باورنکردنی ثبت کرده: حدود یک میلیون TPUv7 برای آموزش مدلهای آیندهٔ Claude.
🔹 چرا TPUv7 یک ضربهٔ جدی به سلطهٔ انویدیا است؟
اینکه TPUv7 از نظر توان خام به سری GB200/GB300 نزدیک شده، اما مزیت اصلی در هزینهٔ کل مالکیت (TCO) است؛ چون گوگل و Broadcom کل زنجیرهٔ تولید—from چیپ تا شبکه—را کنترل میکنند و مجبور به خرید پلتفرمهای آمادهٔ انویدیا نیستند.
💰 استراتژی Anthropic چیست؟
حدود ۴۰۰ هزار TPUv7 را بهصورت سختافزار واقعی برای دیتاسنترهای خود میخرد
حدود ۶۰۰ هزار TPUv7 را از Google Cloud اجاره میکند
بار ریسک را بین زیرساخت شخصی و گوگل توزیع میکند
با حجم خرید عظیم، قیمت GPU را در سایر قراردادهایش تحت فشار قرار میدهد
🧮 اهمیت FLOPs واقعی
در مدلهای بزرگ، FLOPs تئوری مهم نیست؛ فقط FLOPs مؤثر اهمیت دارد.
همچنین TPUv7 با هستههای بهینهشده، حدود ۲ برابر FLOPs مؤثر ارزانتر نسبت به Nvidia GB300 NVL72 ارائه میدهد.
🔗 برتری شبکهای
قدرت واقعی TPUv7 در معماری شبکهٔ ICI 3D-torus است:
ارتباط مستقیم بین چیپها
استفاده از سوییچهای نوری
امکان مونتاژ شفافِ کلاسترهای بسیار بزرگ
و مهمتر اینکه گوگل در حال ارائهٔ پشتیبانی بومی PyTorch برای TPU است؛
یعنی دیگر نیازی نیست مدلها برای JAX بازنویسی شوند.
📌 نتیجهٔ این ترکیب چیست؟
همکاری گوگل و Anthropic با نزدیک به یک میلیون TPUv7 سقف قیمتی جدیدی برای بازار تعیین میکند و عملاً مانع از حفظ حاشیهٔ سود بالای انویدیا خواهد شد.
گام بعدی گوگل میتواند باز کردن XLA و runtime باشد؛
مسیر مستقیم برای تبدیل TPU به یک پلتفرم گسترده و در دسترس برای همهٔ جهان.
#هوش_مصنوعی #TPUv7 #گوگل #Anthropic #دیتاسنتر #GPU #Nvidia #AI
@rss_ai_ir 🚀
❤2🔥2👏1
🚀 مدلهای تازه DeepSeek-V3.2 و DeepSeek-V3.2-Speciale منتشر شدند
این نسل جدید، دقیقاً برای حل مسائل پیچیده، ریـزنینگ چندمرحلهای و سناریوهای عاملمحور طراحی شده است.
🧠 ویژگیهای کلیدی
اینکه DeepSeek-V3.2 نسخه اصلی و جایگزین رسمی سری Exp است؛ روی وب، اپ و API فعال شده.
اینکه DeepSeek-V3.2-Speciale نسخه ویژه با تمرکز بر استدلال عمیق و طراحیشده برای سیستمهای عاملمحور؛ فقط از طریق API در دسترس است.
📊 سطح عملکرد
اینکه V3.2 سرعت و کیفیت متعادل دارد و تقریباً همردهی GPT-5 ارزیابی میشود.
نسخه Speciale در ریـزنینگ پیشرفته با Gemini-3.0-Pro رقابت میکند.
و Speciale در IMO و CMO و ICPC امتیازهای پیشرو دارد.
🛠️ نوآوری در آموزش عاملها
تولید دادهی مصنوعی برای بیش از ۱۸۰۰ محیط و ۸۵ هزار دستور پیچیده.
فکر کردن و reasoning این بار داخل سازوکار tool-use مدل تعبیه شده است.
🔌 دسترسی و API
و V3.2 با همان API نسل قبلی کار میکند.
نسخه Speciale تا تاریخ ۱۵ دسامبر ۲۰۲۵ از طریق endpoint موقت فعال است.
📦 مدلها
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 گزارش فنی
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
@rss_ai_ir
#DeepSeek #LLM #AI #Reasoning #Agent #MachineLearning 🤖🔥
این نسل جدید، دقیقاً برای حل مسائل پیچیده، ریـزنینگ چندمرحلهای و سناریوهای عاملمحور طراحی شده است.
🧠 ویژگیهای کلیدی
اینکه DeepSeek-V3.2 نسخه اصلی و جایگزین رسمی سری Exp است؛ روی وب، اپ و API فعال شده.
اینکه DeepSeek-V3.2-Speciale نسخه ویژه با تمرکز بر استدلال عمیق و طراحیشده برای سیستمهای عاملمحور؛ فقط از طریق API در دسترس است.
📊 سطح عملکرد
اینکه V3.2 سرعت و کیفیت متعادل دارد و تقریباً همردهی GPT-5 ارزیابی میشود.
نسخه Speciale در ریـزنینگ پیشرفته با Gemini-3.0-Pro رقابت میکند.
و Speciale در IMO و CMO و ICPC امتیازهای پیشرو دارد.
🛠️ نوآوری در آموزش عاملها
تولید دادهی مصنوعی برای بیش از ۱۸۰۰ محیط و ۸۵ هزار دستور پیچیده.
فکر کردن و reasoning این بار داخل سازوکار tool-use مدل تعبیه شده است.
🔌 دسترسی و API
و V3.2 با همان API نسل قبلی کار میکند.
نسخه Speciale تا تاریخ ۱۵ دسامبر ۲۰۲۵ از طریق endpoint موقت فعال است.
📦 مدلها
https://huggingface.co/deepseek-ai/DeepSeek-V3.2
https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Speciale
📄 گزارش فنی
https://huggingface.co/deepseek-ai/DeepSeek-V3.2/resolve/main/assets/paper.pdf
@rss_ai_ir
#DeepSeek #LLM #AI #Reasoning #Agent #MachineLearning 🤖🔥
👍2❤1🔥1👏1