VIRSUN
10.6K subscribers
1.22K photos
722 videos
5 files
802 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Smell Like Vision Spirit 🔥
@rss_ai_ir

👉 دیتاست New York Smells یک دیتاست بزرگ و جدید از ترکیب همزمان تصویر و داده‌های بویایی است که امکان یادگیری کراس‌مودال بین بو و بینایی را فراهم می‌کند.
👉 با چراغ خاموش هم شاید «کم‌خطرتر» باشد، اما حالا AI می‌تواند بو را هم بفهمد!
👉 دیتاست در دسترس است.


🔗 Paper:
https://arxiv.org/pdf/2511.20544
🔗 Project:
https://smell.cs.columbia.edu/

#AI #Multimodal #Dataset #SmellAI #DeepLearning @rss_ai_ir
👍3🔥1👏1
⚡️مجموعه NVIDIA نسخه FP4 مدل DeepSeek V3.1 را روی HuggingFace منتشر کرد

@rss_ai_ir

انویدیا نسخه‌ی کوانت‌شده FP4 از مدل DeepSeek V3.1 را منتشر کرد — و این یعنی سرعت بالاتر، مصرف حافظه کمتر، و همچنان کیفیت بسیار خوب متن.

🔹 مزیت اصلی FP4:
کمترین سطح کوانتیزاسیون بدون افت جدی کیفیت،
به‌خصوص وقتی با TensorRT-LLM اجرا شود.

🔹 نتیجه؟
• حافظه کمتر 🟢
• سرعت بیشتر 🟢
• عملکرد تقریباً هم‌سطح نسخه کامل 🟢

Hugging Face:

https://huggingface.co/nvidia/DeepSeek-V3.1-NVFP4

#NVIDIA #DeepSeek #LLM #FP4 #TensorRT @rss_ai_ir
🔥4👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
ویسِ چت‌جی‌پی‌تی مستقیم داخل همان چت فعال شد!
@rss_ai_ir 🎤🤖

از حالا می‌توانید بدون هیچ سوییچ یا مود جداگانه، فقط شروع کنید به صحبت‌کردن — چت‌جی‌پی‌تی هم‌زمان با حرف‌زدن شما پاسخ می‌دهد!

ویژگی‌های نسخه جدید:
🔹 ویس مستقیماً داخل همان پنجرهٔ چت
🔹 پاسخ‌ها در لحظه روی متن ظاهر می‌شوند
🔹 می‌توانید هم‌زمان اسکرول کنید، پیام‌های قبلی را ببینید
🔹 تصاویر، نقشه‌ها و ویژوال‌ها در لحظه نمایش داده می‌شوند
🔹 روی موبایل و وب فعال می‌شود
🔹 فقط کافی‌ست اپ را آپدیت کنید

این دقیقاً همان تجربهٔ یک دستیار شخصی لحظه‌ای است.
هوش مصنوعی که هم می‌بیند، هم می‌شنود، هم حرف می‌زند — و همه‌چیز در یک پنجره.

#ChatGPT #VoiceAI #AIUX #AIAssistant @rss_ai_ir
👍32🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Seeing without Pixels —
دیدن بدون پیکسل‌ها! 🔥
@rss_ai_ir 👁️‍🗨️🤖

⛔️آیا می‌شود محتوای یک ویدئو را بدون دیدن حتی یک پیکسل فقط از مسیر حرکت دوربین حدس زد؟
پژوهش تازهٔ DeepMind و دانشگاه تگزاس برای اولین بار این سؤال غیرممکن‌به‌نظر را به‌صورت علمی بررسی کرده است.
🔗 Paper: arxiv.org/pdf/2511.21681
🔗 Project: sites.google.com/view/seeing-without-pixels

#AI #Deepmind #ComputerVision #Research @rss_ai_ir
مجموعه Disney Research الگوریتمی ساخت که به روبات‌های انسان‌نما یاد می‌دهد «بی‌خطر و نرم» زمین بخورند!
@rss_ai_ir 🤖🟡

دیزنی روباتی را آموزش داده که مثل یک بدل‌کار حرفه‌ای سقوط کند؛ بدون آسیب، کنترل‌شده و حتی با حرکات زیبای فرود!

💥 چطور کار می‌کند؟
هزاران نسخهٔ دیجیتالی روبات در شبیه‌ساز میلیون‌ها بار زمین خوردند و الگوریتم برای هر سقوط کم‌خطر امتیاز گرفت. سپس بهترین استراتژی‌ها به روبات واقعی منتقل شد.

🦾 نتیجه؟
روبات در آزمایش‌ها بارها هل داده شد و افتاد، اما هیچ آسیبی ندید — هر بار با حرکتی نرم و کنترل‌شده فرود آمد.

این فناوری مسیر را برای نسل جدیدی از گومانویدهای مقاوم، ایمن و طولانی‌عمر باز می‌کند.

https://robotunion.ru/media/news/tpost/xbezl9zkf1-disney-prokachal-dvunogih-robotov-chtobi


#DisneyResearch #Robotics #ReinforcementLearning #HumanoidRobots #AI @rss_ai_ir
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️مدل Gemini حالا می‌تواند اینفوگرافیک تعاملی بسازد!

یکی از خفن‌ترین آپدیت‌ها:
چت‌بات می‌تواند اینفوگرافیک‌های پیچیده و کاملاً تعاملی تولید کند — از ساختار یک سلول تا اجزای یک هواپیما ✈️🧬

🔹 روی هر بخش می‌توان کلیک کرد و توضیح کامل گرفت
🔹 مناسب آموزش، تحلیل، ارائه و یادگیری عمیق
🔹 برای همه کاربران در حال فعال‌سازی است

همین حالا تست کنید — فوق‌العاده است!
🔗 Try it here

#Gemini #GoogleAI #Infographics #InteractiveLearning #AI #TechNews @rss_ai_ir
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
STARFlow-V:
نسل تازه مدل‌های ویدئو با Normalizing Flow
@rss_ai_ir 🎥

مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایه‌ی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده می‌شود، اما حالا نتایج فوق‌العاده‌ای نشان داده است.

🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیش‌بینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen

📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow

#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
🖥 مجموعه OpenAI و جانی آیو؛ تولد نسل جدید دستگاه‌های شخصی هوش مصنوعی
@rss_ai_ir 🤖📱

اینکهOpenAI نخستین پروتотип‌های دستگاه هوش مصنوعی همیشه‌فعال خود را با همکاری جانی آیو — طراح افسانه‌ای iPhone — تکمیل کرده است. محصول نهایی طی دو سال آینده عرضه می‌شود.

ایده چیست؟
یک دستیار شخصی دائماً حاضر که بین انسان و دنیای شلوغ گوشی‌های هوشمند قرار می‌گیرد. نه اپلیکیشن‌ها، نه اعلان‌های بی‌پایان — فقط یک تعامل طبیعی با یک عامل هوشمند که همه چیز را درباره شما می‌داند و یادتان می‌ماند.

🎨 نقش جانی آیو
او مسئول طراحی فرم، متریال و تجربه کاربری دستگاه است؛ همان کاری که روزی با iPhone انجام داد و یک دوران جدید ساخت.

🤖 توانایی‌های دستگاه

♻️درک کامل زمینه و سابقه کاربر
♻️فیلتر کردن نویز دیجیتال و اعلان‌ها
♻️گفت‌وگوی طبیعی به‌جای جابه‌جایی بین ده‌ها اپ
♻️ادغام عمیق با پیام‌ها، اسناد، صداها و حتی افکار قبلی کاربر


⚙️ زیرساخت
اینکه OpenAI این محصول را با همکاری Foxconn توسعه می‌دهد — همان شرکتی که از سرور تا تجهیزات خنک‌سازی را برای دیتاسنترهای غول‌آسا می‌سازد.
ترکیب سخت‌افزار شخصی + زیرساخت عظیم یک اکوسیستم کامل را ایجاد می‌کند.

📉 فشار بر اپل
در حالی که iPhone و Siri درگیر مدل‌های قدیمی هستند، OpenAI می‌خواهد هویت جدیدی برای دستگاه‌های محاسبات شخصی بسازد؛ جایی که مدل زبانی مرکز همه‌چیز است.
https://cnbc.com/2025/11/24/openai-hardware-jony-ive-sam-altman-emerson-collective.html

#OpenAI #ChatGPT #AIdevice #JonyIve #FutureComputing #AIRevolution @rss_ai_ir
🌟 یک خبر تاریخی در دنیای AGI!
برای اولین‌بار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.

آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را به‌صورت ترکیبی و هماهنگ کنار هم قرار می‌دهد تا توانایی reasoning آن‌ها چند برابر شود.

۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.

⚠️ اما نکته مهم:

این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمه‌خصوصی (semi-private) احتمالاً امتیاز پایین‌تر خواهد شد.

با این حال، این پیشرفت شگفت‌انگیز است؛ چون:

♻️به‌تنهایی Gemini 3 حدود ۴۵٪ می‌گیرد

♻️وGPT-5.1 فقط حدود ۲۰٪

♻️و تا چند ماه پیش بهترین مدل‌ها ۱ تا ۲٪ بودند!

♻️اینکه ARC-AGI-2 عملاً غیرقابل‌حل به‌نظر می‌رسید


اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.

لینک‌ها:
🔗 بلاگ‌پست
🔗 کد

#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
👍1
⚡️ ارزیابی Anthropic از اثر کمک‌یارهای هوش مصنوعی بر بهره‌وری واقعی

اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش می‌دهد — نه در تست‌های آزمایشگاهی، بلکه در وظایف واقعی کاربران.

🔍 نتایج کلیدی

رشد بهره‌وری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.

روش اندازه‌گیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصص‌ها ↔️ زمان انجام همان کار در چت.

میانگین صرفه‌جویی زمانی: ۸۰٪ در هر کار.

بیشترین سود برای نقش‌های با دستمزد بالا:
👨‍💻 توسعه‌دهندگان
⚖️ وکلا
👔 مدیران

کارهای پیچیده‌ی ۲ساعته بیشترین کاهش زمان را تجربه کردند.

مشاغل کم‌درآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.

اعتبارسنجی با داده‌های واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعه‌دهندگان انسانی.


⚠️ محدودیت‌ها

فقط زمان داخل چت اندازه‌گیری شده.

اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.

بنابراین بهره‌وری واقعی احتمالاً کمتر از عدد اعلام‌شده است.


📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains

#هوش_مصنوعی #Claude #Anthropic #بهره‌وری #AI #اتوماسیون
⚡️ Qwen3-VL:
انتشار گزارش فنی نسل جدید مدل‌های چندموداله ویژن–لنگویج

گزارش فنی (Tech Report) مدل‌های Qwen3-VL منتشر شد؛ خانواده‌ای از VLMهایی که تصویر و متن را همزمان پردازش می‌کنند و در یک ماه گذشته رکوردشکنی کرده‌اند.

🔍 نکات کلیدی

سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.

مدل Qwen3-VL-8B به‌تنهایی ۲ میلیون دانلود را رد کرده.

این خانواده ادامه‌دهنده‌ی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.


📘 محتویات گزارش فنی

در این Tech Report توضیح داده شده:

معماری کامل vision–language در نسل Qwen3-VL

فرآیند آموزش:
• Pretraining
روی داده‌های عظیم چندموداله

• و Post-training شامل alignment و RL

♻️منابع داده و روش‌های دقیق فیلتر کردن دیتاست

♻️مقایسه با VLMهای رقیب روی ده‌ها بنچمارک

♻️پیشرفت‌ها در دقت، فهم بصری، OCR و ریاضیات تصویری


🔗 لینک‌ها

PDF گزارش:
https://arxiv.org/pdf/2511.21631

ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ

#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🇨🇳 چین و نسل جدید «مراقب درس‌خواندن» با هوش مصنوعی

در چین، والدین یک استفاده عجیب‌وغریب اما رو‌به‌گسترش از هوش مصنوعی پیدا کرده‌اند: ناظر لحظه‌ای درس‌خواندن بچه‌ها.

آن‌ها اپ Doubao (محصول ByteDance) را باز می‌کنند، دوربین را به سمت کودک می‌گیرند و فقط یک دستور می‌دهند:

«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»

از همان لحظه، دستیار هوشمند کنترل را به‌دست می‌گیرد و پشت‌سرهم اخطار می‌دهد:

🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»

یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلم‌های علمی‌تخیلی می‌دیدیم.

📌 هشتگ‌ها

#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
😁3🤣21🤡1
🎨 راهنمای رسمیِ پرامپت‌نویسی FLUX.2
این مدل تازه‌نفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجی‌ها دقیق‌تر و قابل‌کنترل‌تر می‌شوند:

🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپت‌های JSON پشتیبانی می‌کند. یعنی می‌توانید ترکیب‌بندی، اشیا، رنگ‌ها، سبک و جزئیات صحنه را شفاف و خط‌به‌خط مشخص کنید.

🔹 پشتیبانی از HEX برای رنگ‌ها
اگر رنگ دقیق می‌خواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت می‌کنید.

🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمی‌شود.
باید فقط بگویید چه می‌خواهید، نه چه نمی‌خواهید.

🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را می‌فهمد. همین باعث می‌شود خروجی‌ها از نظر فرهنگی طبیعی‌تر باشند.

🔹 پشتیبانی از تنظیمات دوربین
برای کار فتو‌رئال می‌توانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.

https://docs.bfl.ai/guides/prompting_guide_flux2

#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
👍3🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 اسپلت‌های مصنوعی؛ یک تکنیک خلاقانه برای شبیه‌سازی سه‌بعدی

یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:

1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیه‌سازی و رندر می‌شود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه می‌شود.
3️⃣ این ویدئو وارد Postshot می‌شود تا از آن یک Gaussian Splat سه‌بعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلات‌شده که می‌توانید در هر موتور یا ابزار سازگار با splats به‌صورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.

⚡️ نتیجه چشم‌گیر است:
نه‌تنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سه‌بعدی سبک، تعاملی و قابل‌استفاده در پروژه‌های گرافیکی و ریل‌تایم.

🔗 Embergen:
jangafx.com/software/embergen

🔗 Postshot:
jawset.com

@cgevent
👍1🔥1👏1
🔥 نسل جدید «دانشمند هوش مصنوعی» از اندرو اَن (Andrew Ng) منتشر شد — همان استاد افسانه‌ای استنفورد و هم‌بنیان‌گذار Coursera.

این ابزار، یک AI محقق و داور سطح PhD است که می‌تواند کیفیت پژوهش‌های شما را چند برابر کند.

🎓 چه کار می‌کند؟

• پایان‌نامه یا مقاله را در چند ثانیه مثل یک استاد سخت‌گیر بررسی می‌کند
اشتباهات، ضعف‌ها، منابع ناقص، استدلال‌های سست و حتی ایرادات ساختاری را پیدا می‌کند.

• فکت‌ها، ارجاعات و استانداردهای دانشگاهی را چک می‌کند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .

• مثل یک استاد واقعی رفتار می‌کند
نه تعریف بی‌خود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش می‌کشد.

• باعث می‌شود سریع‌تر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماه‌ها منتظر داوری مجلات باشید.

🔗 لینک ابزار

https://paperreview.ai/

اگر کار پژوهشی دارید، پایان‌نامه می‌نویسید، یا دانشجوهای شما مقاله می‌نویسند — این ابزار واقعاً یک انقلاب است.
👍21🔥1
✔️ INTELLECT-3

مدلی تازه و قدرتمند از Prime Intellect که به‌عنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحله‌ی SFT و RL مقیاس‌بالا آموزش دیده است.

🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.

🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیره‌های طولانیِ اقدامات و وظایف مبتنی بر عامل‌ها (Agents) طراحی شده، نه صرفاً تولید متن.


---

⭐️ ویژگی‌های کلیدی

بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدل‌هایی با این اندازه

آموزش روی 512×H200 برای حدود ۲ ماه

استفاده از استک اختصاصی Prime Intellect شامل:

✳️PRIME-RL

✳️Verifiers

✳️Environments Hub

✳️زیرساخت sandbox برای اجرای امن

✳️کاملاً اوپن‌سورس: از مدل تا ابزارها و محیط‌ها



---

📎 لینک‌های مهم

🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf

🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3

🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl

🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers

🔸 Environments Hub
https://hub.primeintellect.ai


---

🏷 هشتگ‌ها

#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
🔥31