VIRSUN
7.68K subscribers
1.37K photos
788 videos
5 files
872 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
مجموعه Disney Research الگوریتمی ساخت که به روبات‌های انسان‌نما یاد می‌دهد «بی‌خطر و نرم» زمین بخورند!
@rss_ai_ir 🤖🟡

دیزنی روباتی را آموزش داده که مثل یک بدل‌کار حرفه‌ای سقوط کند؛ بدون آسیب، کنترل‌شده و حتی با حرکات زیبای فرود!

💥 چطور کار می‌کند؟
هزاران نسخهٔ دیجیتالی روبات در شبیه‌ساز میلیون‌ها بار زمین خوردند و الگوریتم برای هر سقوط کم‌خطر امتیاز گرفت. سپس بهترین استراتژی‌ها به روبات واقعی منتقل شد.

🦾 نتیجه؟
روبات در آزمایش‌ها بارها هل داده شد و افتاد، اما هیچ آسیبی ندید — هر بار با حرکتی نرم و کنترل‌شده فرود آمد.

این فناوری مسیر را برای نسل جدیدی از گومانویدهای مقاوم، ایمن و طولانی‌عمر باز می‌کند.

https://robotunion.ru/media/news/tpost/xbezl9zkf1-disney-prokachal-dvunogih-robotov-chtobi


#DisneyResearch #Robotics #ReinforcementLearning #HumanoidRobots #AI @rss_ai_ir
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️مدل Gemini حالا می‌تواند اینفوگرافیک تعاملی بسازد!

یکی از خفن‌ترین آپدیت‌ها:
چت‌بات می‌تواند اینفوگرافیک‌های پیچیده و کاملاً تعاملی تولید کند — از ساختار یک سلول تا اجزای یک هواپیما ✈️🧬

🔹 روی هر بخش می‌توان کلیک کرد و توضیح کامل گرفت
🔹 مناسب آموزش، تحلیل، ارائه و یادگیری عمیق
🔹 برای همه کاربران در حال فعال‌سازی است

همین حالا تست کنید — فوق‌العاده است!
🔗 Try it here

#Gemini #GoogleAI #Infographics #InteractiveLearning #AI #TechNews @rss_ai_ir
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
STARFlow-V:
نسل تازه مدل‌های ویدئو با Normalizing Flow
@rss_ai_ir 🎥

مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایه‌ی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده می‌شود، اما حالا نتایج فوق‌العاده‌ای نشان داده است.

🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیش‌بینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen

📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow

#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
🥰1
🖥 مجموعه OpenAI و جانی آیو؛ تولد نسل جدید دستگاه‌های شخصی هوش مصنوعی
@rss_ai_ir 🤖📱

اینکهOpenAI نخستین پروتотип‌های دستگاه هوش مصنوعی همیشه‌فعال خود را با همکاری جانی آیو — طراح افسانه‌ای iPhone — تکمیل کرده است. محصول نهایی طی دو سال آینده عرضه می‌شود.

ایده چیست؟
یک دستیار شخصی دائماً حاضر که بین انسان و دنیای شلوغ گوشی‌های هوشمند قرار می‌گیرد. نه اپلیکیشن‌ها، نه اعلان‌های بی‌پایان — فقط یک تعامل طبیعی با یک عامل هوشمند که همه چیز را درباره شما می‌داند و یادتان می‌ماند.

🎨 نقش جانی آیو
او مسئول طراحی فرم، متریال و تجربه کاربری دستگاه است؛ همان کاری که روزی با iPhone انجام داد و یک دوران جدید ساخت.

🤖 توانایی‌های دستگاه

♻️درک کامل زمینه و سابقه کاربر
♻️فیلتر کردن نویز دیجیتال و اعلان‌ها
♻️گفت‌وگوی طبیعی به‌جای جابه‌جایی بین ده‌ها اپ
♻️ادغام عمیق با پیام‌ها، اسناد، صداها و حتی افکار قبلی کاربر


⚙️ زیرساخت
اینکه OpenAI این محصول را با همکاری Foxconn توسعه می‌دهد — همان شرکتی که از سرور تا تجهیزات خنک‌سازی را برای دیتاسنترهای غول‌آسا می‌سازد.
ترکیب سخت‌افزار شخصی + زیرساخت عظیم یک اکوسیستم کامل را ایجاد می‌کند.

📉 فشار بر اپل
در حالی که iPhone و Siri درگیر مدل‌های قدیمی هستند، OpenAI می‌خواهد هویت جدیدی برای دستگاه‌های محاسبات شخصی بسازد؛ جایی که مدل زبانی مرکز همه‌چیز است.
https://cnbc.com/2025/11/24/openai-hardware-jony-ive-sam-altman-emerson-collective.html

#OpenAI #ChatGPT #AIdevice #JonyIve #FutureComputing #AIRevolution @rss_ai_ir
🔥1
🌟 یک خبر تاریخی در دنیای AGI!
برای اولین‌بار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.

آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را به‌صورت ترکیبی و هماهنگ کنار هم قرار می‌دهد تا توانایی reasoning آن‌ها چند برابر شود.

۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.

⚠️ اما نکته مهم:

این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمه‌خصوصی (semi-private) احتمالاً امتیاز پایین‌تر خواهد شد.

با این حال، این پیشرفت شگفت‌انگیز است؛ چون:

♻️به‌تنهایی Gemini 3 حدود ۴۵٪ می‌گیرد

♻️وGPT-5.1 فقط حدود ۲۰٪

♻️و تا چند ماه پیش بهترین مدل‌ها ۱ تا ۲٪ بودند!

♻️اینکه ARC-AGI-2 عملاً غیرقابل‌حل به‌نظر می‌رسید


اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.

لینک‌ها:
🔗 بلاگ‌پست
🔗 کد

#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
👍3
⚡️ ارزیابی Anthropic از اثر کمک‌یارهای هوش مصنوعی بر بهره‌وری واقعی

اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش می‌دهد — نه در تست‌های آزمایشگاهی، بلکه در وظایف واقعی کاربران.

🔍 نتایج کلیدی

رشد بهره‌وری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.

روش اندازه‌گیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصص‌ها ↔️ زمان انجام همان کار در چت.

میانگین صرفه‌جویی زمانی: ۸۰٪ در هر کار.

بیشترین سود برای نقش‌های با دستمزد بالا:
👨‍💻 توسعه‌دهندگان
⚖️ وکلا
👔 مدیران

کارهای پیچیده‌ی ۲ساعته بیشترین کاهش زمان را تجربه کردند.

مشاغل کم‌درآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.

اعتبارسنجی با داده‌های واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعه‌دهندگان انسانی.


⚠️ محدودیت‌ها

فقط زمان داخل چت اندازه‌گیری شده.

اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.

بنابراین بهره‌وری واقعی احتمالاً کمتر از عدد اعلام‌شده است.


📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains

#هوش_مصنوعی #Claude #Anthropic #بهره‌وری #AI #اتوماسیون
👍1
⚡️ Qwen3-VL:
انتشار گزارش فنی نسل جدید مدل‌های چندموداله ویژن–لنگویج

گزارش فنی (Tech Report) مدل‌های Qwen3-VL منتشر شد؛ خانواده‌ای از VLMهایی که تصویر و متن را همزمان پردازش می‌کنند و در یک ماه گذشته رکوردشکنی کرده‌اند.

🔍 نکات کلیدی

سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.

مدل Qwen3-VL-8B به‌تنهایی ۲ میلیون دانلود را رد کرده.

این خانواده ادامه‌دهنده‌ی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.


📘 محتویات گزارش فنی

در این Tech Report توضیح داده شده:

معماری کامل vision–language در نسل Qwen3-VL

فرآیند آموزش:
• Pretraining
روی داده‌های عظیم چندموداله

• و Post-training شامل alignment و RL

♻️منابع داده و روش‌های دقیق فیلتر کردن دیتاست

♻️مقایسه با VLMهای رقیب روی ده‌ها بنچمارک

♻️پیشرفت‌ها در دقت، فهم بصری، OCR و ریاضیات تصویری


🔗 لینک‌ها

PDF گزارش:
https://arxiv.org/pdf/2511.21631

ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ

#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🇨🇳 چین و نسل جدید «مراقب درس‌خواندن» با هوش مصنوعی

در چین، والدین یک استفاده عجیب‌وغریب اما رو‌به‌گسترش از هوش مصنوعی پیدا کرده‌اند: ناظر لحظه‌ای درس‌خواندن بچه‌ها.

آن‌ها اپ Doubao (محصول ByteDance) را باز می‌کنند، دوربین را به سمت کودک می‌گیرند و فقط یک دستور می‌دهند:

«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»

از همان لحظه، دستیار هوشمند کنترل را به‌دست می‌گیرد و پشت‌سرهم اخطار می‌دهد:

🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»

یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلم‌های علمی‌تخیلی می‌دیدیم.

📌 هشتگ‌ها

#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
😁4🤣21🤡1
🎨 راهنمای رسمیِ پرامپت‌نویسی FLUX.2
این مدل تازه‌نفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجی‌ها دقیق‌تر و قابل‌کنترل‌تر می‌شوند:

🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپت‌های JSON پشتیبانی می‌کند. یعنی می‌توانید ترکیب‌بندی، اشیا، رنگ‌ها، سبک و جزئیات صحنه را شفاف و خط‌به‌خط مشخص کنید.

🔹 پشتیبانی از HEX برای رنگ‌ها
اگر رنگ دقیق می‌خواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت می‌کنید.

🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمی‌شود.
باید فقط بگویید چه می‌خواهید، نه چه نمی‌خواهید.

🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را می‌فهمد. همین باعث می‌شود خروجی‌ها از نظر فرهنگی طبیعی‌تر باشند.

🔹 پشتیبانی از تنظیمات دوربین
برای کار فتو‌رئال می‌توانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.

https://docs.bfl.ai/guides/prompting_guide_flux2

#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
👍4🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 اسپلت‌های مصنوعی؛ یک تکنیک خلاقانه برای شبیه‌سازی سه‌بعدی

یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:

1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیه‌سازی و رندر می‌شود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه می‌شود.
3️⃣ این ویدئو وارد Postshot می‌شود تا از آن یک Gaussian Splat سه‌بعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلات‌شده که می‌توانید در هر موتور یا ابزار سازگار با splats به‌صورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.

⚡️ نتیجه چشم‌گیر است:
نه‌تنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سه‌بعدی سبک، تعاملی و قابل‌استفاده در پروژه‌های گرافیکی و ریل‌تایم.

🔗 Embergen:
jangafx.com/software/embergen

🔗 Postshot:
jawset.com

@cgevent
👍2🔥1👏1
🔥 نسل جدید «دانشمند هوش مصنوعی» از اندرو اَن (Andrew Ng) منتشر شد — همان استاد افسانه‌ای استنفورد و هم‌بنیان‌گذار Coursera.

این ابزار، یک AI محقق و داور سطح PhD است که می‌تواند کیفیت پژوهش‌های شما را چند برابر کند.

🎓 چه کار می‌کند؟

• پایان‌نامه یا مقاله را در چند ثانیه مثل یک استاد سخت‌گیر بررسی می‌کند
اشتباهات، ضعف‌ها، منابع ناقص، استدلال‌های سست و حتی ایرادات ساختاری را پیدا می‌کند.

• فکت‌ها، ارجاعات و استانداردهای دانشگاهی را چک می‌کند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .

• مثل یک استاد واقعی رفتار می‌کند
نه تعریف بی‌خود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش می‌کشد.

• باعث می‌شود سریع‌تر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماه‌ها منتظر داوری مجلات باشید.

🔗 لینک ابزار

https://paperreview.ai/

اگر کار پژوهشی دارید، پایان‌نامه می‌نویسید، یا دانشجوهای شما مقاله می‌نویسند — این ابزار واقعاً یک انقلاب است.
@rss_ai_ir
👍2🔥21
✔️ INTELLECT-3

مدلی تازه و قدرتمند از Prime Intellect که به‌عنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحله‌ی SFT و RL مقیاس‌بالا آموزش دیده است.

🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.

🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیره‌های طولانیِ اقدامات و وظایف مبتنی بر عامل‌ها (Agents) طراحی شده، نه صرفاً تولید متن.


---

⭐️ ویژگی‌های کلیدی

بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدل‌هایی با این اندازه

آموزش روی 512×H200 برای حدود ۲ ماه

استفاده از استک اختصاصی Prime Intellect شامل:

✳️PRIME-RL

✳️Verifiers

✳️Environments Hub

✳️زیرساخت sandbox برای اجرای امن

✳️کاملاً اوپن‌سورس: از مدل تا ابزارها و محیط‌ها



---

📎 لینک‌های مهم

🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf

🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3

🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl

🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers

🔸 Environments Hub
https://hub.primeintellect.ai


---

🏷 هشتگ‌ها

#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
🔥32
🔥 مدل جدید Z-Image منتشر شد — نسل تازه‌ی مدل‌های سریع و سبک T2I

تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدل‌های سنگین‌تر ارائه می‌دهد.

ویژگی‌های کلیدی Z-Image:

🚀 سرعت خارق‌العاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی می‌سازد

کمتر از یک ثانیه تأخیر روی کارت‌های H800

🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست

🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر


این مدل برای کسانی که سرعت، دقت و اجرای لوکال هم‌زمان می‌خواهند— یک گزینه‌ی جدی است.

🔗 دمو
https://modelscope.cn/aigc/imageGeneration

🔗 وِیت‌ها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

@rss_ai_ir

#AI #GenAI #Tongyi #TextToImage #Prompting #ML
5🔥2👏1