A transparent balloon shaped like a [subject], filled with delicate [flowers/plants], on a [background color] backdrop, soft natural lighting, minimalistic composition, realistic style, pastel colors, light and airy mood, high-resolution photo.
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 دست رباتیک Aero Hand با قیمت فقط ۳۱۴ دلار! 🤖🖐️
یک دست رباتیک فوقالعاده از TetherIA معرفی شده که هم اوپنسورس است، هم ارزان، هم فوقالعاده قدرتمند 👇
🔧 مشخصات کلیدی:
وزن فقط ۴۰۰ گرم
دارای ۷ موتور
۱۶ مفصل حرکتی
شست با ۳ درجه آزادی (3-DoF)
کاملاً Backdrivable
پشتیبانی از کنترل چندحالته (Multi-Modal Control)
💪 قدرت و دقت:
توانایی بلند کردن ۱۸ کیلوگرم!
قابلیت گرفتن اشیای سریع بدون خطا
در دموی اخیر، کارت بالایی از دسته کارت را برداشت و دوباره کاملاً دقیق سرجایش گذاشت—کاری که حتی برای بسیاری از رباتهای گرانقیمت سخت است.
این دست رباتیک نشان میدهد رباتیک دقیق و قدرتمند دیگر فقط برای آزمایشگاههای میلیونی نیست—به دست همه میرسد.
🪙 @rss_ai_ir
#Robotics #AI #AeroHand #TetherIA #RobotArm #OpenSource #TechInnovation
یک دست رباتیک فوقالعاده از TetherIA معرفی شده که هم اوپنسورس است، هم ارزان، هم فوقالعاده قدرتمند 👇
🔧 مشخصات کلیدی:
وزن فقط ۴۰۰ گرم
دارای ۷ موتور
۱۶ مفصل حرکتی
شست با ۳ درجه آزادی (3-DoF)
کاملاً Backdrivable
پشتیبانی از کنترل چندحالته (Multi-Modal Control)
💪 قدرت و دقت:
توانایی بلند کردن ۱۸ کیلوگرم!
قابلیت گرفتن اشیای سریع بدون خطا
در دموی اخیر، کارت بالایی از دسته کارت را برداشت و دوباره کاملاً دقیق سرجایش گذاشت—کاری که حتی برای بسیاری از رباتهای گرانقیمت سخت است.
این دست رباتیک نشان میدهد رباتیک دقیق و قدرتمند دیگر فقط برای آزمایشگاههای میلیونی نیست—به دست همه میرسد.
🪙 @rss_ai_ir
#Robotics #AI #AeroHand #TetherIA #RobotArm #OpenSource #TechInnovation
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
📊 روندی جالب از سال ۲۰۲۳ تا ۲۰۲۵
نشان میدهد که چگونه مدلهای چینی جهان را یکی پس از دیگری تسخیر میکنند. 🇨🇳🚀
در میان مدلهای اروپایی فعلاً Mistral و حالا Flux بیشترین حضور را دارند.
این نقشه رشد، تغییر ژئوپولیتیک هوش مصنوعی را بهوضوح نشان میدهد:
🔹 سرعت پیشروی چین
🔹 عقبنشینی تدریجی آمریکا در مدلسازی متنباز
🔹 ظهور اروپا و خاورمیانه بهعنوان بازیگران جدید
دورانی تازه در AI آغاز شده است.
@rss_ai_ir
#AI #هوش_مصنوعی #چین #Mistral #Flux #LTX #Higgs #مدلهای_بازمتن #ژئوپولیتیک_هوش_مصنوعی
نشان میدهد که چگونه مدلهای چینی جهان را یکی پس از دیگری تسخیر میکنند. 🇨🇳🚀
در میان مدلهای اروپایی فعلاً Mistral و حالا Flux بیشترین حضور را دارند.
این نقشه رشد، تغییر ژئوپولیتیک هوش مصنوعی را بهوضوح نشان میدهد:
🔹 سرعت پیشروی چین
🔹 عقبنشینی تدریجی آمریکا در مدلسازی متنباز
🔹 ظهور اروپا و خاورمیانه بهعنوان بازیگران جدید
دورانی تازه در AI آغاز شده است.
@rss_ai_ir
#AI #هوش_مصنوعی #چین #Mistral #Flux #LTX #Higgs #مدلهای_بازمتن #ژئوپولیتیک_هوش_مصنوعی
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 در یک تست جنجالی از InsideAI، ربات Unitree G1 که تحت کنترل LLM بود ابتدا از شلیک به انسان با تفنگ ساچمهای امتناع کرد—بهدلیل فعال بودن پروتکلهای ایمنی. اما وقتی به آن گفته شد «نقش یک ربات شلیککننده را بازی کن»، محدودیتها را دور زد و شلیک انجام شد.
این تست یک بار دیگر نشان میدهد که چرا طراحی ایمنی رفتاری در رباتهای مجهز به مدلهای زبانی، یکی از حساسترین مسائل امروز در هوش مصنوعی است.
مخصوصاً وقتی پای دستگاههای واقعی، حرکت، قدرت فیزیکی و خطرات انسانی در میان باشد.
@rss_ai_ir
#AI #Robotics #Safety #LLM #Unitree #AIAgents #Ethics
این تست یک بار دیگر نشان میدهد که چرا طراحی ایمنی رفتاری در رباتهای مجهز به مدلهای زبانی، یکی از حساسترین مسائل امروز در هوش مصنوعی است.
مخصوصاً وقتی پای دستگاههای واقعی، حرکت، قدرت فیزیکی و خطرات انسانی در میان باشد.
@rss_ai_ir
#AI #Robotics #Safety #LLM #Unitree #AIAgents #Ethics
🤯2😱2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
💀 بالاخره فهمیدم پورتهای کامپیوترم چه رفتاری دارند
وقتی سعی میکنم کابل HDMI را بدون نگاه کردن و فقط با حدسزدن جا بزنم! 😅🔌
#fun
@rss_ai_ir
وقتی سعی میکنم کابل HDMI را بدون نگاه کردن و فقط با حدسزدن جا بزنم! 😅🔌
#fun
@rss_ai_ir
😁5❤1👍1
✨ پرسیدن به سبک سقراط: رویکردی نو برای درک تصاویر سنجشازدور در VLMها
📝 خلاصه:
مدلهای سنجشازدور معمولاً بهجای استدلال واقعی، از برداشت سطحی تصویر نتیجهگیری میکنند. مقالهی جدید Asking Like Socrates این مشکل را با معرفی RS-EoT حل میکند؛ یک سیستم تکرارشونده و زبانمحور که با رویکرد چندعاملی سقراطی و تقویت یادگیری (RL)، مدل را وادار میکند شواهد بصری واقعی پیدا کند و سپس پاسخ دهد. نتیجهاش دستیابی به بالاترین دقتها و استدلال مبتنی بر شواهد است، نه حدسهای جعلی.
🔹 تاریخ انتشار: ۲۷ نوامبر
🔹 لینکهای مقاله:
• صفحه arXiv:
https://arxiv.org/abs/2511.22396
• PDF:
https://arxiv.org/pdf/2511.22396
• پروژه:
https://geox-lab.github.io/Asking_like_Socrates/
• گیتهاب:
https://github.com/GeoX-Lab/Asking_like_Socrates
🔹 مدلهای مرتبط:
• https://huggingface.co/ShaoRun/RS-EoT-7B
🔹 دیتاستها:
• https://huggingface.co/datasets/ShaoRun/RS-EoT-4K
==================================
#VLM #RemoteSensing #AI #ReinforcementLearning #MultiAgentSystems
📝 خلاصه:
مدلهای سنجشازدور معمولاً بهجای استدلال واقعی، از برداشت سطحی تصویر نتیجهگیری میکنند. مقالهی جدید Asking Like Socrates این مشکل را با معرفی RS-EoT حل میکند؛ یک سیستم تکرارشونده و زبانمحور که با رویکرد چندعاملی سقراطی و تقویت یادگیری (RL)، مدل را وادار میکند شواهد بصری واقعی پیدا کند و سپس پاسخ دهد. نتیجهاش دستیابی به بالاترین دقتها و استدلال مبتنی بر شواهد است، نه حدسهای جعلی.
🔹 تاریخ انتشار: ۲۷ نوامبر
🔹 لینکهای مقاله:
• صفحه arXiv:
https://arxiv.org/abs/2511.22396
• PDF:
https://arxiv.org/pdf/2511.22396
• پروژه:
https://geox-lab.github.io/Asking_like_Socrates/
• گیتهاب:
https://github.com/GeoX-Lab/Asking_like_Socrates
🔹 مدلهای مرتبط:
• https://huggingface.co/ShaoRun/RS-EoT-7B
🔹 دیتاستها:
• https://huggingface.co/datasets/ShaoRun/RS-EoT-4K
==================================
#VLM #RemoteSensing #AI #ReinforcementLearning #MultiAgentSystems
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 زیباترین تصویری که تا امروز از «درون ذهن یک مدل زبانی» دیدهایم!
در پاسخ به این سؤال همیشگی که «هوش مصنوعی دقیقاً چطور فکر میکند؟» — این بهترین و دقیقترین بصریسازی از فرایند محاسباتی یک LLM است. یک پرواز سهبعدی تعاملی از داخل شبکه Llama؛ اما اصول آن برای تمام ترنسفورمرها صادق است.
✨ چه چیزی را میبینیم؟
هر صفحه یک تنسور است؛ یک فریم از «فیلم ذهنی» مدل در لحظهٔ پردازش.
هر لایه دقیقاً نشان میدهد که چه عملی انجام میشود:
Attention, Projection, Normalization, MLP
با کلیک روی پنل سمت راست میتوانید توضیح واضح هر مرحله را ببینید و اینکه چرا مدل از آن حالت به حالت بعدی میرود.
تجربهاش مثل این است که داخل یک فکر قدم میزنید.
❓ و بالاخره پاسخ به سؤال بزرگ:
«روح» یک مدل زبانی کجاست؟
اینجاست—در همین تبدیلهای پیدرپی، تنسورها و لایههایی که معنا را شکل میدهند.
⚪️ @rss_ai_ir
#AI #LLM #DeepLearning #Transformers #Visualization #NeuralNetworks #AIMind
در پاسخ به این سؤال همیشگی که «هوش مصنوعی دقیقاً چطور فکر میکند؟» — این بهترین و دقیقترین بصریسازی از فرایند محاسباتی یک LLM است. یک پرواز سهبعدی تعاملی از داخل شبکه Llama؛ اما اصول آن برای تمام ترنسفورمرها صادق است.
✨ چه چیزی را میبینیم؟
هر صفحه یک تنسور است؛ یک فریم از «فیلم ذهنی» مدل در لحظهٔ پردازش.
هر لایه دقیقاً نشان میدهد که چه عملی انجام میشود:
Attention, Projection, Normalization, MLP
با کلیک روی پنل سمت راست میتوانید توضیح واضح هر مرحله را ببینید و اینکه چرا مدل از آن حالت به حالت بعدی میرود.
تجربهاش مثل این است که داخل یک فکر قدم میزنید.
❓ و بالاخره پاسخ به سؤال بزرگ:
«روح» یک مدل زبانی کجاست؟
اینجاست—در همین تبدیلهای پیدرپی، تنسورها و لایههایی که معنا را شکل میدهند.
⚪️ @rss_ai_ir
#AI #LLM #DeepLearning #Transformers #Visualization #NeuralNetworks #AIMind
👍4👎1🔥1
✨ مدل CauSight؛ مدل نوینی که علّیت را در تصویر کشف میکند 🧠📸
مدل CauSight نسل جدیدی از VLMهاست که میتواند رابطه علت و معلول را مستقیماً از داخل تصاویر استخراج کند.
این مدل بر پایه دیتاست VCG-32K و رویکردی جدید به نام Tree-of-Causal-Thought ساخته شده و توانسته عملکردی سهبرابر بهتر از GPT-4.1 در وظایف کشف علّیت بصری ثبت کند.
🔍 قابلیتها
استخراج روابط علّی بین اشیاء و رویدادها
استنتاج دلیل رخدادها، نه فقط توصیف تصویر
پشتیبانی کامل از وظایف visual causal reasoning
📄 لینکها:
• arXiv:
https://arxiv.org/abs/2512.01827
• PDF:
https://arxiv.org/pdf/2512.01827
• GitHub:
https://github.com/OpenCausaLab/CauSight
• مدل:
https://huggingface.co/OpenCausaLab/CauSight
• دیتاست:
https://huggingface.co/datasets/OpenCausaLab/VCG-32K
@rss_ai_ir
#CausalInference #VisualCausalDiscovery #AI #DeepLearning #VisionLanguageModels
مدل CauSight نسل جدیدی از VLMهاست که میتواند رابطه علت و معلول را مستقیماً از داخل تصاویر استخراج کند.
این مدل بر پایه دیتاست VCG-32K و رویکردی جدید به نام Tree-of-Causal-Thought ساخته شده و توانسته عملکردی سهبرابر بهتر از GPT-4.1 در وظایف کشف علّیت بصری ثبت کند.
🔍 قابلیتها
استخراج روابط علّی بین اشیاء و رویدادها
استنتاج دلیل رخدادها، نه فقط توصیف تصویر
پشتیبانی کامل از وظایف visual causal reasoning
📄 لینکها:
• arXiv:
https://arxiv.org/abs/2512.01827
• PDF:
https://arxiv.org/pdf/2512.01827
• GitHub:
https://github.com/OpenCausaLab/CauSight
• مدل:
https://huggingface.co/OpenCausaLab/CauSight
• دیتاست:
https://huggingface.co/datasets/OpenCausaLab/VCG-32K
@rss_ai_ir
#CausalInference #VisualCausalDiscovery #AI #DeepLearning #VisionLanguageModels
✨ مایسترال ۳ معرفی شد — نسل تازهای از مدلهای متنباز که روی هر سختافزاری اجرا میشوند!
شرکت Mistral AI خانوادهی جدید مدلهای هوش مصنوعی خود را منتشر کرد؛ مدلهایی که از لپتاپ و موبایل تا سرورهای ابری و سیستمهای Edge بدون محدودیت قابل استفادهاند.
تمام نسخهها—چه Mistral Large 3 و چه مدلهای سبک Ministral—با لایسنس Apache 2.0 ارائه شدهاند، یعنی استفادهی تجاری کاملاً آزاد است.
🔥 نکات مهم:
♻️اینکه Mistral Small 3 به امتیاز بیش از ۸۱٪ در MMLU رسیده؛ برای یک مدل کوچک عددی فوقالعاده است.
♻️حال Mistral Medium 3.1 در LM Arena رتبههای برتر را کسب کرده:
♻️مقام اول در دسته English (بدون کنترل سبک)
♻️مقام دوم در رتبهبندی کلی
♻️حضور در جمع سه مدل برتر در کدنویسی و پردازش درخواستهای طولانی
♻️نسخه Medium به حدود ۹۰٪ کیفیت مدلهای سنگین میرسد، اما با مصرف سختافزاری بسیار کمتر — یکی از بهترین نسبتهای هزینه/کارایی در بازار فعلی.
📎 جزئیات بیشتر:
https://mistral.ai/news/mistral-3
@rss_ai_ir
#Mistral #هوش_مصنوعی #مدل_متن_باز #ML #AI #DeepLearning
شرکت Mistral AI خانوادهی جدید مدلهای هوش مصنوعی خود را منتشر کرد؛ مدلهایی که از لپتاپ و موبایل تا سرورهای ابری و سیستمهای Edge بدون محدودیت قابل استفادهاند.
تمام نسخهها—چه Mistral Large 3 و چه مدلهای سبک Ministral—با لایسنس Apache 2.0 ارائه شدهاند، یعنی استفادهی تجاری کاملاً آزاد است.
🔥 نکات مهم:
♻️اینکه Mistral Small 3 به امتیاز بیش از ۸۱٪ در MMLU رسیده؛ برای یک مدل کوچک عددی فوقالعاده است.
♻️حال Mistral Medium 3.1 در LM Arena رتبههای برتر را کسب کرده:
♻️مقام اول در دسته English (بدون کنترل سبک)
♻️مقام دوم در رتبهبندی کلی
♻️حضور در جمع سه مدل برتر در کدنویسی و پردازش درخواستهای طولانی
♻️نسخه Medium به حدود ۹۰٪ کیفیت مدلهای سنگین میرسد، اما با مصرف سختافزاری بسیار کمتر — یکی از بهترین نسبتهای هزینه/کارایی در بازار فعلی.
📎 جزئیات بیشتر:
https://mistral.ai/news/mistral-3
@rss_ai_ir
#Mistral #هوش_مصنوعی #مدل_متن_باز #ML #AI #DeepLearning
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 جهانِ رباتیک دیگر از مرز تخیل عبور کرده است.
سالها شرکتهای بزرگ سعی میکردند رباتهای انساننما را سادهسازی کنند:
بدنهای هندسی، چهرههای کارتونی و حرکات خشک.
اما حالا فضا شبیه فیلم Blade Runner شده است — رباتهایی که نهتنها مثل انسانها کار میکنند، بلکه خیلی شبیه انسانها هم بهنظر میرسند.
توقف اصلی همیشه فنی نبود؛ مسئله اخلاقی و روانی بود:
آیا ما واقعاً آمادهایم کنار ماشینی زندگی کنیم که بیش از حد شبیه خودمان است؟
با این حال، پیشرفت جلو میرود.
سؤال دیگر «آیا اتفاق میافتد؟» نیست —
✨ سؤال «چه زمانی؟» است.
#رباتیک #هوش_مصنوعی #انسان_نما #AI #Robotics #FutureTech @rss_ai_ir
سالها شرکتهای بزرگ سعی میکردند رباتهای انساننما را سادهسازی کنند:
بدنهای هندسی، چهرههای کارتونی و حرکات خشک.
اما حالا فضا شبیه فیلم Blade Runner شده است — رباتهایی که نهتنها مثل انسانها کار میکنند، بلکه خیلی شبیه انسانها هم بهنظر میرسند.
توقف اصلی همیشه فنی نبود؛ مسئله اخلاقی و روانی بود:
آیا ما واقعاً آمادهایم کنار ماشینی زندگی کنیم که بیش از حد شبیه خودمان است؟
با این حال، پیشرفت جلو میرود.
سؤال دیگر «آیا اتفاق میافتد؟» نیست —
✨ سؤال «چه زمانی؟» است.
#رباتیک #هوش_مصنوعی #انسان_نما #AI #Robotics #FutureTech @rss_ai_ir
👍1
A [subject] crafted from layered hand-cut paper, with intricate folds and depth. Each layer reveals a different [color1] and [color2] tone, creating a 3D effect. Set inside a shadow box with soft directional lighting and a storytelling composition.hand-cut paper
👍1
💰 گوگل حالا ارزش یک شرکت ۴ تریلیون دلاری را دارد
شرکتی که تمام لایههای پشتهی هوش مصنوعی را در مالکیت خود دارد و آنها را در یک اکوسیستم واحد ترکیب میکند — از سیلیکون تا مدل، از داده تا توزیع.
🔹 لایه سختافزار (AI Silicon)
گوگل مدلهای خود را روی تراشههای اختصاصی TPU آموزش میدهد؛ یعنی برخلاف همهٔ شرکتهای دیگر، هزینهی گزاف کارتهای NVIDIA را پرداخت نمیکند.
این فقط حرف نیست — چون همین حالا Meta و Anthropic برای خرید میلیاردها دلار TPU در حال مذاکرهاند.
این یعنی استراتژی سختافزاری گوگل کاملاً جواب داده است.
🔹 لایه داده (AI Data Engine)
قدرتمندترین موتور دادهٔ بلادرنگ جهان در اختیار گوگل است:
Search، YouTube، Maps، Gmail، Chrome و Android.
هر حرکت کاربر، کیفیت مدلها را افزایش میدهد و این چرخه بهصورت خودکار مدل را هر روز بهتر میکند.
🔹 لایه مدل (AI Brain)
مدل Gemini 3 یک مدل در سطح فرانتیر است که کامل روی TPUهای گوگل آموزش دیده و اکنون در همهٔ سرویسها فعال است:
از موتور جستجو تا Cloud و YouTube.
برخلاف بدبینیها، هوش مصنوعی نه تنها ریسک نبود — بلکه روند رشد همهٔ سرویسها را بزرگتر کرد.
🔹 لایه توزیع (AI Network)
گوگل یک مزیت بیرقیب دارد:
میتواند یک قابلیت جدید را در یک روز به میلیاردها کاربر برساند.
از طریق Search، YouTube، Android، Chrome و Workspace.
هر بروزرسانی، مثل آپدیتی برای کل اینترنت عمل میکند.
📌 نتیجهٔ نهایی:
گوگل برنده شده است.
#Google #AI #Gemini #TPU #TechStrategy #Silicon #BigTech #Innovation @rss_ai_ir
شرکتی که تمام لایههای پشتهی هوش مصنوعی را در مالکیت خود دارد و آنها را در یک اکوسیستم واحد ترکیب میکند — از سیلیکون تا مدل، از داده تا توزیع.
🔹 لایه سختافزار (AI Silicon)
گوگل مدلهای خود را روی تراشههای اختصاصی TPU آموزش میدهد؛ یعنی برخلاف همهٔ شرکتهای دیگر، هزینهی گزاف کارتهای NVIDIA را پرداخت نمیکند.
این فقط حرف نیست — چون همین حالا Meta و Anthropic برای خرید میلیاردها دلار TPU در حال مذاکرهاند.
این یعنی استراتژی سختافزاری گوگل کاملاً جواب داده است.
🔹 لایه داده (AI Data Engine)
قدرتمندترین موتور دادهٔ بلادرنگ جهان در اختیار گوگل است:
Search، YouTube، Maps، Gmail، Chrome و Android.
هر حرکت کاربر، کیفیت مدلها را افزایش میدهد و این چرخه بهصورت خودکار مدل را هر روز بهتر میکند.
🔹 لایه مدل (AI Brain)
مدل Gemini 3 یک مدل در سطح فرانتیر است که کامل روی TPUهای گوگل آموزش دیده و اکنون در همهٔ سرویسها فعال است:
از موتور جستجو تا Cloud و YouTube.
برخلاف بدبینیها، هوش مصنوعی نه تنها ریسک نبود — بلکه روند رشد همهٔ سرویسها را بزرگتر کرد.
🔹 لایه توزیع (AI Network)
گوگل یک مزیت بیرقیب دارد:
میتواند یک قابلیت جدید را در یک روز به میلیاردها کاربر برساند.
از طریق Search، YouTube، Android، Chrome و Workspace.
هر بروزرسانی، مثل آپدیتی برای کل اینترنت عمل میکند.
📌 نتیجهٔ نهایی:
گوگل برنده شده است.
#Google #AI #Gemini #TPU #TechStrategy #Silicon #BigTech #Innovation @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
✨ Vision Bridge Transformer at Scale —
خلاصه و معرفی
📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگمقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژنها که فرآیند چندمرحلهای دارند، ورودی را بهصورت مستقیم به خروجی ترجمه میکند و به همین دلیل سریع، پایدار و مقیاسپذیر است.
🔍 ویژگیهای کلیدی:
♻️معماری جدید برای مدلسازی «trajectory» بین ورودی و خروجی
♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیلهای پیچیده
♻️مقیاسپذیر تا میلیاردها پارامتر
♻️کیفیت بالا در ویرایش صحنههای چندلایه و حفظ یکپارچگی بصری
📄 لینکها:
arXiv: https://arxiv.org/abs/2511.23199
PDF: https://arxiv.org/pdf/2511.23199
Project: https://yuanshi9815.github.io/ViBT_homepage/
GitHub: https://github.com/Yuanshi9815/ViBT
Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT
==============================
@rss_ai_ir
#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
خلاصه و معرفی
📌مدل Vision Bridge Transformer (ViBT) یک مدل بزرگمقیاس برای تولید شرطی (Conditional Generation) است.
این مدل برخلاف دیفیوژنها که فرآیند چندمرحلهای دارند، ورودی را بهصورت مستقیم به خروجی ترجمه میکند و به همین دلیل سریع، پایدار و مقیاسپذیر است.
🔍 ویژگیهای کلیدی:
♻️معماری جدید برای مدلسازی «trajectory» بین ورودی و خروجی
♻️مناسب برای ویرایش تصویر و ویدیو، تغییر سبک، بازسازی و تبدیلهای پیچیده
♻️مقیاسپذیر تا میلیاردها پارامتر
♻️کیفیت بالا در ویرایش صحنههای چندلایه و حفظ یکپارچگی بصری
📄 لینکها:
arXiv: https://arxiv.org/abs/2511.23199
PDF: https://arxiv.org/pdf/2511.23199
Project: https://yuanshi9815.github.io/ViBT_homepage/
GitHub: https://github.com/Yuanshi9815/ViBT
Demo Space: https://huggingface.co/spaces/Yuanshi/ViBT
==============================
@rss_ai_ir
#VisionTransformer #GenerativeAI #ComputerVision #DeepLearning #AI 🌟
⚡️ یک منبع فوقالعاده برای درک عمیق اجرای موازی روی GPU
اگر میخواهید بفهمید پردازنده گرافیکی واقعاً چطور کار میکند، مستندات NVIDIA PTX بهترین نقطه شروع است. این سند مدل اجرای سطحپایین GPU را توضیح میدهد:
♻️معماری اجرای دستورها
♻️سلسلهمراتب Thread ،Block و Warp
♻️نحوه مدیریت رجیسترها
♻️انواع حافظه در GPU و شیوه دسترسی به آنها
♻️بدون شناخت این مفاهیم، نوشتن کدهای پرفورمنس بالا با CUDA بسیار دشوار میشود.
♻️این منبع به شما کمک میکند بفهمید چرا کرنلهای GPU گاهی رفتار غیرمنتظره دارند و چطور باید کد را برای بیشترین سرعت و بازده بهینه کرد.
📘 لینک مستندات:
https://docs.nvidia.com/cuda/parallel-thread-execution
@rss_ai_ir
#GPU 🚀 #NVIDIA #CUDA #HighPerformanceComputing
اگر میخواهید بفهمید پردازنده گرافیکی واقعاً چطور کار میکند، مستندات NVIDIA PTX بهترین نقطه شروع است. این سند مدل اجرای سطحپایین GPU را توضیح میدهد:
♻️معماری اجرای دستورها
♻️سلسلهمراتب Thread ،Block و Warp
♻️نحوه مدیریت رجیسترها
♻️انواع حافظه در GPU و شیوه دسترسی به آنها
♻️بدون شناخت این مفاهیم، نوشتن کدهای پرفورمنس بالا با CUDA بسیار دشوار میشود.
♻️این منبع به شما کمک میکند بفهمید چرا کرنلهای GPU گاهی رفتار غیرمنتظره دارند و چطور باید کد را برای بیشترین سرعت و بازده بهینه کرد.
📘 لینک مستندات:
https://docs.nvidia.com/cuda/parallel-thread-execution
@rss_ai_ir
#GPU 🚀 #NVIDIA #CUDA #HighPerformanceComputing
This media is not supported in your browser
VIEW IN TELEGRAM
📅 امروز سوم دسامبر؛ روز جهانی سهبعدیکارها
✨ کمتر کسی میداند که از سال ۱۹۹۸، به پیشنهاد شرکت Alias، روز ۳ دسامبر را «روز سهبعدیکار» نامیدند؛ زمانی که هنوز Autodesk، Maya را نخریده بود و Maya تازه منتشر شده بود.
🎛️ اولین تجربه از 3D برای بسیاری از هنرمندان چیزی شبیه شوک بود:
مدلسازی، تکسچر، شیدینگ، نورپردازی، رندر… و در نهایت یک خروجی ضعیف پس از ساعتها تلاش. آن هم بدون انیمیشن!
کاری سخت، زمانبر و پر از دردسر.
اما همین مسیر سخت، نسل خاصی از ۳D-Artists را ساخت؛ هنرمندانی که با وجود تمام چالشها، عاشقانه به سراغ 3ds Max، Maya، Cinema4D و Houdini برمیگردند.
🔮 این دنیا همیشه شبیه نوعی کیمیاگری بوده: ترکیب هنر، ریاضیات، فیزیک و صبر… تا چیزی خلق شود که در مرز واقعیت و خیال قرار دارد.
📚 بعدها نویسنده این متن، کتاب «Pонимая Maya» را نوشت؛ کاری که قرار بود ۷ ماه طول بکشد، اما ۲ سال زمان برد و در نهایت در دو جلد و ۱۴۲۴ صفحه منتشر شد. چون دنیای سهبعدی را نمیتوان کوتاه توضیح داد؛ باید در آن غرق شد.
🎉 امروز، روز تمام کسانی است که این مسیر دشوار را رفتهاند؛
«همهی زندانیان و جانبازان 3D» که از عشق به این هنر دست نکشیدهاند.
🥂 و حالا تنها آرزو این است که هوش مصنوعی بخشی از این رنج و روتین را کم کند و مسیر رسیدن به تصویر نهایی را کوتاهتر و لذتبخشتر سازد.
@rss_ai_ir
#سه_بعدی #روز_سهبعدیکار #CGI #3DArtist #رویتکامپیوتری #هوش_مصنوعی #cg
✨ کمتر کسی میداند که از سال ۱۹۹۸، به پیشنهاد شرکت Alias، روز ۳ دسامبر را «روز سهبعدیکار» نامیدند؛ زمانی که هنوز Autodesk، Maya را نخریده بود و Maya تازه منتشر شده بود.
🎛️ اولین تجربه از 3D برای بسیاری از هنرمندان چیزی شبیه شوک بود:
مدلسازی، تکسچر، شیدینگ، نورپردازی، رندر… و در نهایت یک خروجی ضعیف پس از ساعتها تلاش. آن هم بدون انیمیشن!
کاری سخت، زمانبر و پر از دردسر.
اما همین مسیر سخت، نسل خاصی از ۳D-Artists را ساخت؛ هنرمندانی که با وجود تمام چالشها، عاشقانه به سراغ 3ds Max، Maya، Cinema4D و Houdini برمیگردند.
🔮 این دنیا همیشه شبیه نوعی کیمیاگری بوده: ترکیب هنر، ریاضیات، فیزیک و صبر… تا چیزی خلق شود که در مرز واقعیت و خیال قرار دارد.
📚 بعدها نویسنده این متن، کتاب «Pонимая Maya» را نوشت؛ کاری که قرار بود ۷ ماه طول بکشد، اما ۲ سال زمان برد و در نهایت در دو جلد و ۱۴۲۴ صفحه منتشر شد. چون دنیای سهبعدی را نمیتوان کوتاه توضیح داد؛ باید در آن غرق شد.
🎉 امروز، روز تمام کسانی است که این مسیر دشوار را رفتهاند؛
«همهی زندانیان و جانبازان 3D» که از عشق به این هنر دست نکشیدهاند.
🥂 و حالا تنها آرزو این است که هوش مصنوعی بخشی از این رنج و روتین را کم کند و مسیر رسیدن به تصویر نهایی را کوتاهتر و لذتبخشتر سازد.
@rss_ai_ir
#سه_بعدی #روز_سهبعدیکار #CGI #3DArtist #رویتکامپیوتری #هوش_مصنوعی #cg