This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Smell Like Vision Spirit 🔥
@rss_ai_ir
👉 دیتاست New York Smells یک دیتاست بزرگ و جدید از ترکیب همزمان تصویر و دادههای بویایی است که امکان یادگیری کراسمودال بین بو و بینایی را فراهم میکند.
👉 با چراغ خاموش هم شاید «کمخطرتر» باشد، اما حالا AI میتواند بو را هم بفهمد!
👉 دیتاست در دسترس است.
🔗 Paper:
https://arxiv.org/pdf/2511.20544
🔗 Project:
https://smell.cs.columbia.edu/
#AI #Multimodal #Dataset #SmellAI #DeepLearning @rss_ai_ir
@rss_ai_ir
👉 دیتاست New York Smells یک دیتاست بزرگ و جدید از ترکیب همزمان تصویر و دادههای بویایی است که امکان یادگیری کراسمودال بین بو و بینایی را فراهم میکند.
👉 با چراغ خاموش هم شاید «کمخطرتر» باشد، اما حالا AI میتواند بو را هم بفهمد!
👉 دیتاست در دسترس است.
🔗 Paper:
https://arxiv.org/pdf/2511.20544
🔗 Project:
https://smell.cs.columbia.edu/
#AI #Multimodal #Dataset #SmellAI #DeepLearning @rss_ai_ir
👍3🔥1👏1
⚡️مجموعه NVIDIA نسخه FP4 مدل DeepSeek V3.1 را روی HuggingFace منتشر کرد
@rss_ai_ir
انویدیا نسخهی کوانتشده FP4 از مدل DeepSeek V3.1 را منتشر کرد — و این یعنی سرعت بالاتر، مصرف حافظه کمتر، و همچنان کیفیت بسیار خوب متن.
🔹 مزیت اصلی FP4:
کمترین سطح کوانتیزاسیون بدون افت جدی کیفیت،
بهخصوص وقتی با TensorRT-LLM اجرا شود.
🔹 نتیجه؟
• حافظه کمتر 🟢
• سرعت بیشتر 🟢
• عملکرد تقریباً همسطح نسخه کامل 🟢
Hugging Face:
https://huggingface.co/nvidia/DeepSeek-V3.1-NVFP4
#NVIDIA #DeepSeek #LLM #FP4 #TensorRT @rss_ai_ir
@rss_ai_ir
انویدیا نسخهی کوانتشده FP4 از مدل DeepSeek V3.1 را منتشر کرد — و این یعنی سرعت بالاتر، مصرف حافظه کمتر، و همچنان کیفیت بسیار خوب متن.
🔹 مزیت اصلی FP4:
کمترین سطح کوانتیزاسیون بدون افت جدی کیفیت،
بهخصوص وقتی با TensorRT-LLM اجرا شود.
🔹 نتیجه؟
• حافظه کمتر 🟢
• سرعت بیشتر 🟢
• عملکرد تقریباً همسطح نسخه کامل 🟢
Hugging Face:
https://huggingface.co/nvidia/DeepSeek-V3.1-NVFP4
#NVIDIA #DeepSeek #LLM #FP4 #TensorRT @rss_ai_ir
🔥4👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ ویسِ چتجیپیتی مستقیم داخل همان چت فعال شد!
@rss_ai_ir 🎤🤖
از حالا میتوانید بدون هیچ سوییچ یا مود جداگانه، فقط شروع کنید به صحبتکردن — چتجیپیتی همزمان با حرفزدن شما پاسخ میدهد!
ویژگیهای نسخه جدید:
🔹 ویس مستقیماً داخل همان پنجرهٔ چت
🔹 پاسخها در لحظه روی متن ظاهر میشوند
🔹 میتوانید همزمان اسکرول کنید، پیامهای قبلی را ببینید
🔹 تصاویر، نقشهها و ویژوالها در لحظه نمایش داده میشوند
🔹 روی موبایل و وب فعال میشود
🔹 فقط کافیست اپ را آپدیت کنید
این دقیقاً همان تجربهٔ یک دستیار شخصی لحظهای است.
هوش مصنوعی که هم میبیند، هم میشنود، هم حرف میزند — و همهچیز در یک پنجره.
#ChatGPT #VoiceAI #AIUX #AIAssistant @rss_ai_ir
@rss_ai_ir 🎤🤖
از حالا میتوانید بدون هیچ سوییچ یا مود جداگانه، فقط شروع کنید به صحبتکردن — چتجیپیتی همزمان با حرفزدن شما پاسخ میدهد!
ویژگیهای نسخه جدید:
🔹 ویس مستقیماً داخل همان پنجرهٔ چت
🔹 پاسخها در لحظه روی متن ظاهر میشوند
🔹 میتوانید همزمان اسکرول کنید، پیامهای قبلی را ببینید
🔹 تصاویر، نقشهها و ویژوالها در لحظه نمایش داده میشوند
🔹 روی موبایل و وب فعال میشود
🔹 فقط کافیست اپ را آپدیت کنید
این دقیقاً همان تجربهٔ یک دستیار شخصی لحظهای است.
هوش مصنوعی که هم میبیند، هم میشنود، هم حرف میزند — و همهچیز در یک پنجره.
#ChatGPT #VoiceAI #AIUX #AIAssistant @rss_ai_ir
👍3❤2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Seeing without Pixels —
دیدن بدون پیکسلها! 🔥
@rss_ai_ir 👁️🗨️🤖
⛔️آیا میشود محتوای یک ویدئو را بدون دیدن حتی یک پیکسل فقط از مسیر حرکت دوربین حدس زد؟
پژوهش تازهٔ DeepMind و دانشگاه تگزاس برای اولین بار این سؤال غیرممکنبهنظر را بهصورت علمی بررسی کرده است.
🔗 Paper: arxiv.org/pdf/2511.21681
🔗 Project: sites.google.com/view/seeing-without-pixels
#AI #Deepmind #ComputerVision #Research @rss_ai_ir
دیدن بدون پیکسلها! 🔥
@rss_ai_ir 👁️🗨️🤖
⛔️آیا میشود محتوای یک ویدئو را بدون دیدن حتی یک پیکسل فقط از مسیر حرکت دوربین حدس زد؟
پژوهش تازهٔ DeepMind و دانشگاه تگزاس برای اولین بار این سؤال غیرممکنبهنظر را بهصورت علمی بررسی کرده است.
🔗 Paper: arxiv.org/pdf/2511.21681
🔗 Project: sites.google.com/view/seeing-without-pixels
#AI #Deepmind #ComputerVision #Research @rss_ai_ir
⚡مجموعه Disney Research الگوریتمی ساخت که به روباتهای انساننما یاد میدهد «بیخطر و نرم» زمین بخورند!
@rss_ai_ir 🤖🟡
دیزنی روباتی را آموزش داده که مثل یک بدلکار حرفهای سقوط کند؛ بدون آسیب، کنترلشده و حتی با حرکات زیبای فرود!
💥 چطور کار میکند؟
هزاران نسخهٔ دیجیتالی روبات در شبیهساز میلیونها بار زمین خوردند و الگوریتم برای هر سقوط کمخطر امتیاز گرفت. سپس بهترین استراتژیها به روبات واقعی منتقل شد.
🦾 نتیجه؟
روبات در آزمایشها بارها هل داده شد و افتاد، اما هیچ آسیبی ندید — هر بار با حرکتی نرم و کنترلشده فرود آمد.
این فناوری مسیر را برای نسل جدیدی از گومانویدهای مقاوم، ایمن و طولانیعمر باز میکند.
https://robotunion.ru/media/news/tpost/xbezl9zkf1-disney-prokachal-dvunogih-robotov-chtobi
#DisneyResearch #Robotics #ReinforcementLearning #HumanoidRobots #AI @rss_ai_ir
@rss_ai_ir 🤖🟡
دیزنی روباتی را آموزش داده که مثل یک بدلکار حرفهای سقوط کند؛ بدون آسیب، کنترلشده و حتی با حرکات زیبای فرود!
💥 چطور کار میکند؟
هزاران نسخهٔ دیجیتالی روبات در شبیهساز میلیونها بار زمین خوردند و الگوریتم برای هر سقوط کمخطر امتیاز گرفت. سپس بهترین استراتژیها به روبات واقعی منتقل شد.
🦾 نتیجه؟
روبات در آزمایشها بارها هل داده شد و افتاد، اما هیچ آسیبی ندید — هر بار با حرکتی نرم و کنترلشده فرود آمد.
این فناوری مسیر را برای نسل جدیدی از گومانویدهای مقاوم، ایمن و طولانیعمر باز میکند.
https://robotunion.ru/media/news/tpost/xbezl9zkf1-disney-prokachal-dvunogih-robotov-chtobi
#DisneyResearch #Robotics #ReinforcementLearning #HumanoidRobots #AI @rss_ai_ir
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️مدل Gemini حالا میتواند اینفوگرافیک تعاملی بسازد!
یکی از خفنترین آپدیتها:
چتبات میتواند اینفوگرافیکهای پیچیده و کاملاً تعاملی تولید کند — از ساختار یک سلول تا اجزای یک هواپیما ✈️🧬
🔹 روی هر بخش میتوان کلیک کرد و توضیح کامل گرفت
🔹 مناسب آموزش، تحلیل، ارائه و یادگیری عمیق
🔹 برای همه کاربران در حال فعالسازی است
همین حالا تست کنید — فوقالعاده است!
🔗 Try it here
#Gemini #GoogleAI #Infographics #InteractiveLearning #AI #TechNews @rss_ai_ir
یکی از خفنترین آپدیتها:
چتبات میتواند اینفوگرافیکهای پیچیده و کاملاً تعاملی تولید کند — از ساختار یک سلول تا اجزای یک هواپیما ✈️🧬
🔹 روی هر بخش میتوان کلیک کرد و توضیح کامل گرفت
🔹 مناسب آموزش، تحلیل، ارائه و یادگیری عمیق
🔹 برای همه کاربران در حال فعالسازی است
همین حالا تست کنید — فوقالعاده است!
🔗 Try it here
#Gemini #GoogleAI #Infographics #InteractiveLearning #AI #TechNews @rss_ai_ir
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ STARFlow-V:
نسل تازه مدلهای ویدئو با Normalizing Flow
@rss_ai_ir 🎥⚡
مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایهی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده میشود، اما حالا نتایج فوقالعادهای نشان داده است.
🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیشبینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen
📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow
#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
نسل تازه مدلهای ویدئو با Normalizing Flow
@rss_ai_ir 🎥⚡
مدل STARFlow-V یک مدل کاملاً End-to-End برای تولید ویدئو است که بر پایهی Normalizing Flow ساخته شده — رویکردی که معمولاً کمتر در ویدئو استفاده میشود، اما حالا نتایج فوقالعادهای نشان داده است.
🔹 کیفیت بصری بالا + پیوستگی زمانی عالی
🔹 پیشبینی علّی (causal prediction) پایدار
🔹 معماری Global–Local Latent
🔹 استفاده از Flow-Score Matching
🔹 قدمی مهم برای ورود Flow Models به دنیای Video Gen
📄 Paper: arxiv.org/abs/2511.20462
🌐 Project: starflow-v.github.io
💻 Code: github.com/apple/ml-starflow
#VideoGeneration #NormalizingFlow #GenerativeAI #DeepLearning #ML @rss_ai_ir
🖥✨ مجموعه OpenAI و جانی آیو؛ تولد نسل جدید دستگاههای شخصی هوش مصنوعی
@rss_ai_ir 🤖📱
اینکهOpenAI نخستین پروتотипهای دستگاه هوش مصنوعی همیشهفعال خود را با همکاری جانی آیو — طراح افسانهای iPhone — تکمیل کرده است. محصول نهایی طی دو سال آینده عرضه میشود.
ایده چیست؟
یک دستیار شخصی دائماً حاضر که بین انسان و دنیای شلوغ گوشیهای هوشمند قرار میگیرد. نه اپلیکیشنها، نه اعلانهای بیپایان — فقط یک تعامل طبیعی با یک عامل هوشمند که همه چیز را درباره شما میداند و یادتان میماند.
🎨 نقش جانی آیو
او مسئول طراحی فرم، متریال و تجربه کاربری دستگاه است؛ همان کاری که روزی با iPhone انجام داد و یک دوران جدید ساخت.
🤖 تواناییهای دستگاه
♻️درک کامل زمینه و سابقه کاربر
♻️فیلتر کردن نویز دیجیتال و اعلانها
♻️گفتوگوی طبیعی بهجای جابهجایی بین دهها اپ
♻️ادغام عمیق با پیامها، اسناد، صداها و حتی افکار قبلی کاربر
⚙️ زیرساخت
اینکه OpenAI این محصول را با همکاری Foxconn توسعه میدهد — همان شرکتی که از سرور تا تجهیزات خنکسازی را برای دیتاسنترهای غولآسا میسازد.
ترکیب سختافزار شخصی + زیرساخت عظیم یک اکوسیستم کامل را ایجاد میکند.
📉 فشار بر اپل
در حالی که iPhone و Siri درگیر مدلهای قدیمی هستند، OpenAI میخواهد هویت جدیدی برای دستگاههای محاسبات شخصی بسازد؛ جایی که مدل زبانی مرکز همهچیز است.
https://cnbc.com/2025/11/24/openai-hardware-jony-ive-sam-altman-emerson-collective.html
#OpenAI #ChatGPT #AIdevice #JonyIve #FutureComputing #AIRevolution @rss_ai_ir
@rss_ai_ir 🤖📱
اینکهOpenAI نخستین پروتотипهای دستگاه هوش مصنوعی همیشهفعال خود را با همکاری جانی آیو — طراح افسانهای iPhone — تکمیل کرده است. محصول نهایی طی دو سال آینده عرضه میشود.
ایده چیست؟
یک دستیار شخصی دائماً حاضر که بین انسان و دنیای شلوغ گوشیهای هوشمند قرار میگیرد. نه اپلیکیشنها، نه اعلانهای بیپایان — فقط یک تعامل طبیعی با یک عامل هوشمند که همه چیز را درباره شما میداند و یادتان میماند.
🎨 نقش جانی آیو
او مسئول طراحی فرم، متریال و تجربه کاربری دستگاه است؛ همان کاری که روزی با iPhone انجام داد و یک دوران جدید ساخت.
🤖 تواناییهای دستگاه
♻️درک کامل زمینه و سابقه کاربر
♻️فیلتر کردن نویز دیجیتال و اعلانها
♻️گفتوگوی طبیعی بهجای جابهجایی بین دهها اپ
♻️ادغام عمیق با پیامها، اسناد، صداها و حتی افکار قبلی کاربر
⚙️ زیرساخت
اینکه OpenAI این محصول را با همکاری Foxconn توسعه میدهد — همان شرکتی که از سرور تا تجهیزات خنکسازی را برای دیتاسنترهای غولآسا میسازد.
ترکیب سختافزار شخصی + زیرساخت عظیم یک اکوسیستم کامل را ایجاد میکند.
📉 فشار بر اپل
در حالی که iPhone و Siri درگیر مدلهای قدیمی هستند، OpenAI میخواهد هویت جدیدی برای دستگاههای محاسبات شخصی بسازد؛ جایی که مدل زبانی مرکز همهچیز است.
https://cnbc.com/2025/11/24/openai-hardware-jony-ive-sam-altman-emerson-collective.html
#OpenAI #ChatGPT #AIdevice #JonyIve #FutureComputing #AIRevolution @rss_ai_ir
🌟 یک خبر تاریخی در دنیای AGI!
برای اولینبار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.
آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را بهصورت ترکیبی و هماهنگ کنار هم قرار میدهد تا توانایی reasoning آنها چند برابر شود.
۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.
⚠️ اما نکته مهم:
این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمهخصوصی (semi-private) احتمالاً امتیاز پایینتر خواهد شد.
با این حال، این پیشرفت شگفتانگیز است؛ چون:
♻️بهتنهایی Gemini 3 حدود ۴۵٪ میگیرد
♻️وGPT-5.1 فقط حدود ۲۰٪
♻️و تا چند ماه پیش بهترین مدلها ۱ تا ۲٪ بودند!
♻️اینکه ARC-AGI-2 عملاً غیرقابلحل بهنظر میرسید
اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.
لینکها:
🔗 بلاگپست
🔗 کد
#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
برای اولینبار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.
آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را بهصورت ترکیبی و هماهنگ کنار هم قرار میدهد تا توانایی reasoning آنها چند برابر شود.
۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.
⚠️ اما نکته مهم:
این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمهخصوصی (semi-private) احتمالاً امتیاز پایینتر خواهد شد.
با این حال، این پیشرفت شگفتانگیز است؛ چون:
♻️بهتنهایی Gemini 3 حدود ۴۵٪ میگیرد
♻️وGPT-5.1 فقط حدود ۲۰٪
♻️و تا چند ماه پیش بهترین مدلها ۱ تا ۲٪ بودند!
♻️اینکه ARC-AGI-2 عملاً غیرقابلحل بهنظر میرسید
اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.
لینکها:
🔗 بلاگپست
🔗 کد
#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
👍1
⚡️ ارزیابی Anthropic از اثر کمکیارهای هوش مصنوعی بر بهرهوری واقعی
اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش میدهد — نه در تستهای آزمایشگاهی، بلکه در وظایف واقعی کاربران.
🔍 نتایج کلیدی
رشد بهرهوری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.
روش اندازهگیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصصها ↔️ زمان انجام همان کار در چت.
میانگین صرفهجویی زمانی: ۸۰٪ در هر کار.
بیشترین سود برای نقشهای با دستمزد بالا:
👨💻 توسعهدهندگان
⚖️ وکلا
👔 مدیران
کارهای پیچیدهی ۲ساعته بیشترین کاهش زمان را تجربه کردند.
مشاغل کمدرآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.
اعتبارسنجی با دادههای واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعهدهندگان انسانی.
⚠️ محدودیتها
فقط زمان داخل چت اندازهگیری شده.
اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.
بنابراین بهرهوری واقعی احتمالاً کمتر از عدد اعلامشده است.
📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains
#هوش_مصنوعی #Claude #Anthropic #بهرهوری #AI #اتوماسیون
اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش میدهد — نه در تستهای آزمایشگاهی، بلکه در وظایف واقعی کاربران.
🔍 نتایج کلیدی
رشد بهرهوری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.
روش اندازهگیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصصها ↔️ زمان انجام همان کار در چت.
میانگین صرفهجویی زمانی: ۸۰٪ در هر کار.
بیشترین سود برای نقشهای با دستمزد بالا:
👨💻 توسعهدهندگان
⚖️ وکلا
👔 مدیران
کارهای پیچیدهی ۲ساعته بیشترین کاهش زمان را تجربه کردند.
مشاغل کمدرآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.
اعتبارسنجی با دادههای واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعهدهندگان انسانی.
⚠️ محدودیتها
فقط زمان داخل چت اندازهگیری شده.
اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.
بنابراین بهرهوری واقعی احتمالاً کمتر از عدد اعلامشده است.
📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains
#هوش_مصنوعی #Claude #Anthropic #بهرهوری #AI #اتوماسیون
⚡️ Qwen3-VL:
انتشار گزارش فنی نسل جدید مدلهای چندموداله ویژن–لنگویج
✅گزارش فنی (Tech Report) مدلهای Qwen3-VL منتشر شد؛ خانوادهای از VLMهایی که تصویر و متن را همزمان پردازش میکنند و در یک ماه گذشته رکوردشکنی کردهاند.
🔍 نکات کلیدی
سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.
مدل Qwen3-VL-8B بهتنهایی ۲ میلیون دانلود را رد کرده.
❌این خانواده ادامهدهندهی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.
📘 محتویات گزارش فنی
در این Tech Report توضیح داده شده:
معماری کامل vision–language در نسل Qwen3-VL
فرآیند آموزش:
• Pretraining
روی دادههای عظیم چندموداله
• و Post-training شامل alignment و RL
♻️منابع داده و روشهای دقیق فیلتر کردن دیتاست
♻️مقایسه با VLMهای رقیب روی دهها بنچمارک
♻️پیشرفتها در دقت، فهم بصری، OCR و ریاضیات تصویری
🔗 لینکها
PDF گزارش:
https://arxiv.org/pdf/2511.21631
ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ
#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
انتشار گزارش فنی نسل جدید مدلهای چندموداله ویژن–لنگویج
✅گزارش فنی (Tech Report) مدلهای Qwen3-VL منتشر شد؛ خانوادهای از VLMهایی که تصویر و متن را همزمان پردازش میکنند و در یک ماه گذشته رکوردشکنی کردهاند.
🔍 نکات کلیدی
سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.
مدل Qwen3-VL-8B بهتنهایی ۲ میلیون دانلود را رد کرده.
❌این خانواده ادامهدهندهی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.
📘 محتویات گزارش فنی
در این Tech Report توضیح داده شده:
معماری کامل vision–language در نسل Qwen3-VL
فرآیند آموزش:
• Pretraining
روی دادههای عظیم چندموداله
• و Post-training شامل alignment و RL
♻️منابع داده و روشهای دقیق فیلتر کردن دیتاست
♻️مقایسه با VLMهای رقیب روی دهها بنچمارک
♻️پیشرفتها در دقت، فهم بصری، OCR و ریاضیات تصویری
🔗 لینکها
PDF گزارش:
https://arxiv.org/pdf/2511.21631
ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ
#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
❤1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🇨🇳 چین و نسل جدید «مراقب درسخواندن» با هوش مصنوعی
در چین، والدین یک استفاده عجیبوغریب اما روبهگسترش از هوش مصنوعی پیدا کردهاند: ناظر لحظهای درسخواندن بچهها.
آنها اپ Doubao (محصول ByteDance) را باز میکنند، دوربین را به سمت کودک میگیرند و فقط یک دستور میدهند:
«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»
از همان لحظه، دستیار هوشمند کنترل را بهدست میگیرد و پشتسرهم اخطار میدهد:
🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»
یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلمهای علمیتخیلی میدیدیم.
📌 هشتگها
#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
در چین، والدین یک استفاده عجیبوغریب اما روبهگسترش از هوش مصنوعی پیدا کردهاند: ناظر لحظهای درسخواندن بچهها.
آنها اپ Doubao (محصول ByteDance) را باز میکنند، دوربین را به سمت کودک میگیرند و فقط یک دستور میدهند:
«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»
از همان لحظه، دستیار هوشمند کنترل را بهدست میگیرد و پشتسرهم اخطار میدهد:
🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»
یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلمهای علمیتخیلی میدیدیم.
📌 هشتگها
#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
😁3🤣2❤1🤡1
🎨 راهنمای رسمیِ پرامپتنویسی FLUX.2
این مدل تازهنفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجیها دقیقتر و قابلکنترلتر میشوند:
🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپتهای JSON پشتیبانی میکند. یعنی میتوانید ترکیببندی، اشیا، رنگها، سبک و جزئیات صحنه را شفاف و خطبهخط مشخص کنید.
🔹 پشتیبانی از HEX برای رنگها
اگر رنگ دقیق میخواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت میکنید.
🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمیشود.
باید فقط بگویید چه میخواهید، نه چه نمیخواهید.
🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را میفهمد. همین باعث میشود خروجیها از نظر فرهنگی طبیعیتر باشند.
🔹 پشتیبانی از تنظیمات دوربین
برای کار فتورئال میتوانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.
https://docs.bfl.ai/guides/prompting_guide_flux2
#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
این مدل تازهنفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجیها دقیقتر و قابلکنترلتر میشوند:
🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپتهای JSON پشتیبانی میکند. یعنی میتوانید ترکیببندی، اشیا، رنگها، سبک و جزئیات صحنه را شفاف و خطبهخط مشخص کنید.
🔹 پشتیبانی از HEX برای رنگها
اگر رنگ دقیق میخواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت میکنید.
🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمیشود.
باید فقط بگویید چه میخواهید، نه چه نمیخواهید.
🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را میفهمد. همین باعث میشود خروجیها از نظر فرهنگی طبیعیتر باشند.
🔹 پشتیبانی از تنظیمات دوربین
برای کار فتورئال میتوانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.
https://docs.bfl.ai/guides/prompting_guide_flux2
#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
👍3🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 اسپلتهای مصنوعی؛ یک تکنیک خلاقانه برای شبیهسازی سهبعدی
یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:
1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیهسازی و رندر میشود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه میشود.
3️⃣ این ویدئو وارد Postshot میشود تا از آن یک Gaussian Splat سهبعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلاتشده که میتوانید در هر موتور یا ابزار سازگار با splats بهصورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.
⚡️ نتیجه چشمگیر است:
نهتنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سهبعدی سبک، تعاملی و قابلاستفاده در پروژههای گرافیکی و ریلتایم.
🔗 Embergen:
jangafx.com/software/embergen
🔗 Postshot:
jawset.com
@cgevent
یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:
1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیهسازی و رندر میشود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه میشود.
3️⃣ این ویدئو وارد Postshot میشود تا از آن یک Gaussian Splat سهبعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلاتشده که میتوانید در هر موتور یا ابزار سازگار با splats بهصورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.
⚡️ نتیجه چشمگیر است:
نهتنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سهبعدی سبک، تعاملی و قابلاستفاده در پروژههای گرافیکی و ریلتایم.
🔗 Embergen:
jangafx.com/software/embergen
🔗 Postshot:
jawset.com
@cgevent
👍1🔥1👏1
🔥 نسل جدید «دانشمند هوش مصنوعی» از اندرو اَن (Andrew Ng) منتشر شد — همان استاد افسانهای استنفورد و همبنیانگذار Coursera.
این ابزار، یک AI محقق و داور سطح PhD است که میتواند کیفیت پژوهشهای شما را چند برابر کند.
🎓 چه کار میکند؟
• پایاننامه یا مقاله را در چند ثانیه مثل یک استاد سختگیر بررسی میکند
اشتباهات، ضعفها، منابع ناقص، استدلالهای سست و حتی ایرادات ساختاری را پیدا میکند.
• فکتها، ارجاعات و استانداردهای دانشگاهی را چک میکند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .
• مثل یک استاد واقعی رفتار میکند
نه تعریف بیخود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش میکشد.
• باعث میشود سریعتر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماهها منتظر داوری مجلات باشید.
🔗 لینک ابزار
https://paperreview.ai/
اگر کار پژوهشی دارید، پایاننامه مینویسید، یا دانشجوهای شما مقاله مینویسند — این ابزار واقعاً یک انقلاب است.
این ابزار، یک AI محقق و داور سطح PhD است که میتواند کیفیت پژوهشهای شما را چند برابر کند.
🎓 چه کار میکند؟
• پایاننامه یا مقاله را در چند ثانیه مثل یک استاد سختگیر بررسی میکند
اشتباهات، ضعفها، منابع ناقص، استدلالهای سست و حتی ایرادات ساختاری را پیدا میکند.
• فکتها، ارجاعات و استانداردهای دانشگاهی را چک میکند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .
• مثل یک استاد واقعی رفتار میکند
نه تعریف بیخود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش میکشد.
• باعث میشود سریعتر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماهها منتظر داوری مجلات باشید.
🔗 لینک ابزار
https://paperreview.ai/
اگر کار پژوهشی دارید، پایاننامه مینویسید، یا دانشجوهای شما مقاله مینویسند — این ابزار واقعاً یک انقلاب است.
👍2❤1🔥1
✔️ INTELLECT-3
مدلی تازه و قدرتمند از Prime Intellect که بهعنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحلهی SFT و RL مقیاسبالا آموزش دیده است.
🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.
🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیرههای طولانیِ اقدامات و وظایف مبتنی بر عاملها (Agents) طراحی شده، نه صرفاً تولید متن.
---
⭐️ ویژگیهای کلیدی
بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدلهایی با این اندازه
✅آموزش روی 512×H200 برای حدود ۲ ماه
استفاده از استک اختصاصی Prime Intellect شامل:
✳️PRIME-RL
✳️Verifiers
✳️Environments Hub
✳️زیرساخت sandbox برای اجرای امن
✳️کاملاً اوپنسورس: از مدل تا ابزارها و محیطها
---
📎 لینکهای مهم
🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf
🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3
🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl
🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers
🔸 Environments Hub
https://hub.primeintellect.ai
---
🏷 هشتگها
#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
مدلی تازه و قدرتمند از Prime Intellect که بهعنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحلهی SFT و RL مقیاسبالا آموزش دیده است.
🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.
🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیرههای طولانیِ اقدامات و وظایف مبتنی بر عاملها (Agents) طراحی شده، نه صرفاً تولید متن.
---
⭐️ ویژگیهای کلیدی
بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدلهایی با این اندازه
✅آموزش روی 512×H200 برای حدود ۲ ماه
استفاده از استک اختصاصی Prime Intellect شامل:
✳️PRIME-RL
✳️Verifiers
✳️Environments Hub
✳️زیرساخت sandbox برای اجرای امن
✳️کاملاً اوپنسورس: از مدل تا ابزارها و محیطها
---
📎 لینکهای مهم
🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf
🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3
🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl
🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers
🔸 Environments Hub
https://hub.primeintellect.ai
---
🏷 هشتگها
#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
🔥3❤1