💡 لپتاپ خود را به یک سیستم قدرتمند RAG تبدیل کنید!
📘 پروژهی LEANN این امکان را فراهم کرده که بتوانید روی لپتاپ شخصی خود میلیونها سند را ایندکس و جستوجو کنید — آن هم با ۹۷٪ مصرف فضای کمتر نسبت به روشهای سنتی، بدون افت دقت!
🔬 راز این عملکرد:
این هست که ، LEANN بهجای ذخیرهی تمام embeddingها، از بازمحاسبهی انتخابی بر پایهی گراف (graph-based selective recomputation) استفاده میکند و فقط در صورت نیاز embeddingها را تولید میکند.
⚙️ ویژگیهای کلیدی:
🛡 حفظ حریم خصوصی:
تمام دادهها روی لپتاپ شما باقی میمانند — بدون فضای ابری یا شرایط پنهان.
💯 سبک و بهینه:
استفاده از گرافهای فشرده (CSR) و حذف هوشمند گرهها باعث صرفهجویی چشمگیر در حافظه و فضای ذخیرهسازی میشود.
💢 قابلحمل:
میتوانید پایگاه دانش خود را بهراحتی بین دستگاهها منتقل یا با دیگران به اشتراک بگذارید.
☀️ مقیاسپذیر و مقاوم:
با دادههای نامنظم شخصی یا حافظهی تولیدشده توسط ایجنتها که معمولاً باعث کرش در پایگاههای برداری (Vector DBs) میشوند، بهخوبی کار میکند.
📈 دقیق و قابل اعتماد:
با وجود سبک بودن، همان کیفیت جستوجوی سیستمهای سنگین را ارائه میدهد.
🧠 کاملاً متنباز (Open Source)
📎 GitHub:
github.com/yichuan-w/LEANN
📱 @rss_ai_ir
#RAG #AI #Python #هوش_مصنوعی #داده #جستجو #سیستم_دانش #متن_باز
📘 پروژهی LEANN این امکان را فراهم کرده که بتوانید روی لپتاپ شخصی خود میلیونها سند را ایندکس و جستوجو کنید — آن هم با ۹۷٪ مصرف فضای کمتر نسبت به روشهای سنتی، بدون افت دقت!
🔬 راز این عملکرد:
این هست که ، LEANN بهجای ذخیرهی تمام embeddingها، از بازمحاسبهی انتخابی بر پایهی گراف (graph-based selective recomputation) استفاده میکند و فقط در صورت نیاز embeddingها را تولید میکند.
⚙️ ویژگیهای کلیدی:
🛡 حفظ حریم خصوصی:
تمام دادهها روی لپتاپ شما باقی میمانند — بدون فضای ابری یا شرایط پنهان.
💯 سبک و بهینه:
استفاده از گرافهای فشرده (CSR) و حذف هوشمند گرهها باعث صرفهجویی چشمگیر در حافظه و فضای ذخیرهسازی میشود.
💢 قابلحمل:
میتوانید پایگاه دانش خود را بهراحتی بین دستگاهها منتقل یا با دیگران به اشتراک بگذارید.
☀️ مقیاسپذیر و مقاوم:
با دادههای نامنظم شخصی یا حافظهی تولیدشده توسط ایجنتها که معمولاً باعث کرش در پایگاههای برداری (Vector DBs) میشوند، بهخوبی کار میکند.
📈 دقیق و قابل اعتماد:
با وجود سبک بودن، همان کیفیت جستوجوی سیستمهای سنگین را ارائه میدهد.
🧠 کاملاً متنباز (Open Source)
📎 GitHub:
github.com/yichuan-w/LEANN
📱 @rss_ai_ir
#RAG #AI #Python #هوش_مصنوعی #داده #جستجو #سیستم_دانش #متن_باز
❤2
Media is too big
VIEW IN TELEGRAM
🤖 امروز قدمی تاریخی برداشته شد — روبات انساننمای IRON آزمون نهایی خود را با موفقیت پشت سر گذاشت: او ثابت کرد که انسان نیست!
در صحنهی نمایش، هِه شیاوپِنگ (مدیر XPENG) دوباره IRON را فعال کرد و با بریدن پای آن، ماهیت واقعی مکانیکیاش را آشکار ساخت.
در XPENG، شفافیت الهامبخش نوآوری است — حتی وقتی تردیدها باقی میمانند، پیشرفت متوقف نمیشود.
@rss_ai_ir
————————
#روبات #هوش_مصنوعی #فناوری #XPENG #Humanoid #IRON
در صحنهی نمایش، هِه شیاوپِنگ (مدیر XPENG) دوباره IRON را فعال کرد و با بریدن پای آن، ماهیت واقعی مکانیکیاش را آشکار ساخت.
در XPENG، شفافیت الهامبخش نوآوری است — حتی وقتی تردیدها باقی میمانند، پیشرفت متوقف نمیشود.
@rss_ai_ir
————————
#روبات #هوش_مصنوعی #فناوری #XPENG #Humanoid #IRON
❤2👍1🔥1😁1
⚠️ تغییر بزرگ در دنیای بدافزارها — هوش مصنوعی وارد میدان اجرا شد!
گزارش جدید گروه امنیتی Google Threat Intelligence نشان میدهد که تاکتیکهای تهدید سایبری وارد مرحلهای تازه شدهاند:
بدافزارها اکنون در هنگام اجرا از مدلهای زبانی بزرگ (LLM) استفاده میکنند تا رفتار خود را بهصورت پویا تغییر دهند، کد را مبهم کنند و از سیستمهای شناسایی فرار کنند.
💀 این یعنی بدافزارهای امروزی دیگر فقط با کمک AI نوشته نمیشوند — بلکه در زمان اجرا از آن برای تفکر و تطبیق زنده استفاده میکنند.
🧠 آیندهی امنیت سایبری وارد نبردی با حریفانی شده که یاد میگیرند، تغییر میکنند و پنهان میمانند.
@rss_ai_ir
#امنیت_سایبری #بدافزار #هوش_مصنوعی #Google #LLM #AI #سایبر
گزارش جدید گروه امنیتی Google Threat Intelligence نشان میدهد که تاکتیکهای تهدید سایبری وارد مرحلهای تازه شدهاند:
بدافزارها اکنون در هنگام اجرا از مدلهای زبانی بزرگ (LLM) استفاده میکنند تا رفتار خود را بهصورت پویا تغییر دهند، کد را مبهم کنند و از سیستمهای شناسایی فرار کنند.
💀 این یعنی بدافزارهای امروزی دیگر فقط با کمک AI نوشته نمیشوند — بلکه در زمان اجرا از آن برای تفکر و تطبیق زنده استفاده میکنند.
🧠 آیندهی امنیت سایبری وارد نبردی با حریفانی شده که یاد میگیرند، تغییر میکنند و پنهان میمانند.
@rss_ai_ir
#امنیت_سایبری #بدافزار #هوش_مصنوعی #Google #LLM #AI #سایبر
👍5🔥1👏1
🎸 Another BRIXEL in the Wall 🎸
🧠 پروژهی BRIXEL به کاربران اجازه میدهد تا با استفاده از backbone مدل DINOv3، نقشههای ویژگی (feature maps) با وضوح بالا تولید کنند — بدون نیاز به منابع محاسباتی سنگین!
🔹 طراحی شده برای کارایی بالا در بینایی کامپیوتری
🔹 کاهش مصرف GPU بدون افت کیفیت
🔹 مناسب برای پژوهشگران و توسعهدهندگان در حوزهی Vision Transformers
📄 مقاله:
arxiv.org/pdf/2511.05168
💙 مخزن GitHub:
github.com/alexanderlappe/BRIXEL
#AI #ComputerVision #DINOv3 #DeepLearning #BRIXEL
@rss_ai_ir
🧠 پروژهی BRIXEL به کاربران اجازه میدهد تا با استفاده از backbone مدل DINOv3، نقشههای ویژگی (feature maps) با وضوح بالا تولید کنند — بدون نیاز به منابع محاسباتی سنگین!
🔹 طراحی شده برای کارایی بالا در بینایی کامپیوتری
🔹 کاهش مصرف GPU بدون افت کیفیت
🔹 مناسب برای پژوهشگران و توسعهدهندگان در حوزهی Vision Transformers
📄 مقاله:
arxiv.org/pdf/2511.05168
💙 مخزن GitHub:
github.com/alexanderlappe/BRIXEL
#AI #ComputerVision #DINOv3 #DeepLearning #BRIXEL
@rss_ai_ir
⚡️ چرا مدلهای زبانی مدرن (LLM) نمیتوانند نقش «شرور» را درست بازی کنند؟
گزارش جدید Tencent نشان میدهد که مدلهایی که روی امنیت و اخلاق آموزش دیدهاند، در ایفای نقشهای منفی مثل شرور، فریبکار یا خودخواه تقریباً شکست میخورند.
دلیل ساده است: آموزشهای ایمنی آنها را مجبور میکند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگیهای یک ضدقهرمان است.
🧩 پژوهشگران تستی به نام Moral RolePlay ساختهاند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.
📊 نتایج جالب بودند:
♻️هرچه شخصیت «تاریکتر» میشود، کیفیت بازی مدل بهشدت افت میکند.
♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد بهطور ناگهانی سقوط میکند.
♻️مدلها بهجای برنامهریزی فریبکارانه، معمولاً دچار "انفجار عصبی" میشوند و فضای نقش را میشکنند.
♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.
♻️تنظیمات ایمنی قویتر، اوضاع را حتی بدتر میکنند.
🎭 نتیجه: متدهای فعلی ایمنی با حوزههایی مثل بازی، فیلمنامهنویسی و داستانپردازی واقعی در تضاد هستند، چون این حوزهها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.
📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural
گزارش جدید Tencent نشان میدهد که مدلهایی که روی امنیت و اخلاق آموزش دیدهاند، در ایفای نقشهای منفی مثل شرور، فریبکار یا خودخواه تقریباً شکست میخورند.
دلیل ساده است: آموزشهای ایمنی آنها را مجبور میکند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگیهای یک ضدقهرمان است.
🧩 پژوهشگران تستی به نام Moral RolePlay ساختهاند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.
📊 نتایج جالب بودند:
♻️هرچه شخصیت «تاریکتر» میشود، کیفیت بازی مدل بهشدت افت میکند.
♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد بهطور ناگهانی سقوط میکند.
♻️مدلها بهجای برنامهریزی فریبکارانه، معمولاً دچار "انفجار عصبی" میشوند و فضای نقش را میشکنند.
♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.
♻️تنظیمات ایمنی قویتر، اوضاع را حتی بدتر میکنند.
🎭 نتیجه: متدهای فعلی ایمنی با حوزههایی مثل بازی، فیلمنامهنویسی و داستانپردازی واقعی در تضاد هستند، چون این حوزهها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.
📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural
❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🐼مدل Pixel-Dense Embedding در مدل FlowFeat 🐼
محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کردهاند — یک نمایش ویژگی چندوظیفهای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را بهصورت بردارهای فشرده (Embedding) نمایش دهد.
🧠 ایدهی کلیدی:
بهجای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل میکند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنههای پویا میشود.
💡 ویژگیها:
♻️دقت بالا در پیشبینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone
📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat
#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI
محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کردهاند — یک نمایش ویژگی چندوظیفهای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را بهصورت بردارهای فشرده (Embedding) نمایش دهد.
🧠 ایدهی کلیدی:
بهجای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل میکند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنههای پویا میشود.
💡 ویژگیها:
♻️دقت بالا در پیشبینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone
📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat
#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت Unitree از پلتفرم جدید خود برای کنترل از راه دور رباتها با کپی کامل حرکات انسان رونمایی کرد.
این سیستم به کاربر اجازه میدهد حرکات خود را در زمان واقعی به ربات منتقل کند، در حالی که دادههای حسگرهای ربات همزمان جمعآوری میشوند.
به این ترتیب، ربات میتواند حرکات انسانی را با دقت بالا تقلید کند — گامی مهم در جهت همگرایی انسان و ماشین در محیطهای صنعتی و خدماتی.
—————————
✔️ @rss_ai_ir
#ربات #Unitree #هوش_مصنوعی #رباتیک #کنترل_از_راه_دور #RobotControl #AI #Robotics
این سیستم به کاربر اجازه میدهد حرکات خود را در زمان واقعی به ربات منتقل کند، در حالی که دادههای حسگرهای ربات همزمان جمعآوری میشوند.
به این ترتیب، ربات میتواند حرکات انسانی را با دقت بالا تقلید کند — گامی مهم در جهت همگرایی انسان و ماشین در محیطهای صنعتی و خدماتی.
—————————
✔️ @rss_ai_ir
#ربات #Unitree #هوش_مصنوعی #رباتیک #کنترل_از_راه_دور #RobotControl #AI #Robotics
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Gamma.app —
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
🧠 بایدو مدل جدید ERNIE-4.5-VL-28B-A3B-Thinking را منتشر کرد
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
🚚 در حالیکه همه سرگرم «رونمایی رباتتاکسی» از Tesla هستند، در چین پارکهای کامل خودروهای خودران برای تحویل کالا در حال راهاندازیاند!
در چین، شرکتها در حال پیادهسازی اتحادیهای از ناوگانهای خودران هستند که بدون راننده، محمولهها را در مقیاس وسیع بین مراکز توزیع و نقاط مصرف جابهجا میکنند.
📌 نکات مهم این روند:
✅ تمرکز بر تحویل بسته و لوجستیک نه سواری مسافر — یعنی ورود به بازاری متفاوت و احتمالاً با موانع مقرراتی کمتر
🏞 ایجاد «پارکهای خودران» یا مناطق آزاد برای تست و بهرهبرداری تجاری
🌐 چین با سرعت بیشتری به سمت استقرار عملیاتی خودروهای خودران حرکت میکند، در حالیکه تمرکز عمومی بر خودروی سواری است
🔍 نتیجه؟
رباتتاکسیها شگفتانگیز هستند، اما خودروهای تحویل خودران شاید اولین دستاورد بزرگ در مقیاس واقعی باشند — و چین در این مسیر جلوتر از بسیاری از رقباست.
#خودرو_خودران #تکنولوژی #چین #لجستیک #AUTONOMOUS #AI #رسانه_هوش_مصنوعی
در چین، شرکتها در حال پیادهسازی اتحادیهای از ناوگانهای خودران هستند که بدون راننده، محمولهها را در مقیاس وسیع بین مراکز توزیع و نقاط مصرف جابهجا میکنند.
📌 نکات مهم این روند:
✅ تمرکز بر تحویل بسته و لوجستیک نه سواری مسافر — یعنی ورود به بازاری متفاوت و احتمالاً با موانع مقرراتی کمتر
🏞 ایجاد «پارکهای خودران» یا مناطق آزاد برای تست و بهرهبرداری تجاری
🌐 چین با سرعت بیشتری به سمت استقرار عملیاتی خودروهای خودران حرکت میکند، در حالیکه تمرکز عمومی بر خودروی سواری است
🔍 نتیجه؟
رباتتاکسیها شگفتانگیز هستند، اما خودروهای تحویل خودران شاید اولین دستاورد بزرگ در مقیاس واقعی باشند — و چین در این مسیر جلوتر از بسیاری از رقباست.
#خودرو_خودران #تکنولوژی #چین #لجستیک #AUTONOMOUS #AI #رسانه_هوش_مصنوعی
🧠 HierarchicalTopK —
رویکردی تازه برای تفسیرپذیری شبکههای عصبی
در کنفرانس EMNLP 2025 روشی با نام HierarchicalTopK معرفی شد — رویکردی که امکان آموزش شبکههای عصبی را در چندین سطح پراکندگی (sparsity) بهصورت همزمان فراهم میکند، بدون آنکه تفسیرپذیری یا کیفیت مدل از بین برود.
🔹 مسئله اصلی:
در روشهای سنتی، سطح پراکندگی باید پیش از آموزش تعیین شود و تغییر آن بعداً ممکن نیست.
پراکندگی کم → مدل دقیق ولی غیرتفسیرپذیر.
پراکندگی زیاد → تفسیرپذیر ولی با افت عملکرد.
🔹 نوآوری HierarchicalTopK:
بهجای آموزش چند مدل جداگانه برای هر سطح، این روش یک فضای واحد میسازد که تمام سطوح پراکندگی را در خود جای میدهد.
در نتیجه:
♻️میتوان بهصورت پویا بین سطوح پراکندگی جابهجا شد؛
♻️ارتباط معنایی بین سطوح حفظ میشود؛
♻️مدل حتی در سطوح بالا تفسیرپذیری خود را حفظ میکند.
🔹 مزیتهای کلیدی:
✅ فقط یک مدل لازم است، نه دهها مدل جداگانه
✅ کاهش هزینه محاسباتی و زمان آموزش
✅ مناسب برای حسابرسی و تحلیل رفتار مدلها
✅ گامی مهم بهسوی هوش مصنوعی تفسیرپذیر در صنعت
📦 مدل و کد در Hugging Face:
🔗 https://huggingface.co/t-tech/flex-sae
#AI #ML #EMNLP2025 #ExplainableAI #SparseModeling #Interpretability #هوش_مصنوعی #یادگیری_ماشینی
رویکردی تازه برای تفسیرپذیری شبکههای عصبی
در کنفرانس EMNLP 2025 روشی با نام HierarchicalTopK معرفی شد — رویکردی که امکان آموزش شبکههای عصبی را در چندین سطح پراکندگی (sparsity) بهصورت همزمان فراهم میکند، بدون آنکه تفسیرپذیری یا کیفیت مدل از بین برود.
🔹 مسئله اصلی:
در روشهای سنتی، سطح پراکندگی باید پیش از آموزش تعیین شود و تغییر آن بعداً ممکن نیست.
پراکندگی کم → مدل دقیق ولی غیرتفسیرپذیر.
پراکندگی زیاد → تفسیرپذیر ولی با افت عملکرد.
🔹 نوآوری HierarchicalTopK:
بهجای آموزش چند مدل جداگانه برای هر سطح، این روش یک فضای واحد میسازد که تمام سطوح پراکندگی را در خود جای میدهد.
در نتیجه:
♻️میتوان بهصورت پویا بین سطوح پراکندگی جابهجا شد؛
♻️ارتباط معنایی بین سطوح حفظ میشود؛
♻️مدل حتی در سطوح بالا تفسیرپذیری خود را حفظ میکند.
🔹 مزیتهای کلیدی:
✅ فقط یک مدل لازم است، نه دهها مدل جداگانه
✅ کاهش هزینه محاسباتی و زمان آموزش
✅ مناسب برای حسابرسی و تحلیل رفتار مدلها
✅ گامی مهم بهسوی هوش مصنوعی تفسیرپذیر در صنعت
📦 مدل و کد در Hugging Face:
🔗 https://huggingface.co/t-tech/flex-sae
#AI #ML #EMNLP2025 #ExplainableAI #SparseModeling #Interpretability #هوش_مصنوعی #یادگیری_ماشینی
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 دموی زندهی کونگفو با ربات Unitree G1 — واقعاً چشمگیر!
ربات انساننمای Unitree G1 در جدیدترین نمایش خود، مهارتهای فیزیکی و هماهنگی بدنی در سطح بسیار بالایی را نشان داد — از حرکات رزمی گرفته تا تعادل دقیق و واکنش سریع در محیط واقعی.
این نسخه از G1 بهلطف موتور کنترل حرکتی بهبودیافته و الگوریتمهای یادگیری تقویتی جدید میتواند حرکات دینامیکی مانند لگد، چرخش و دفاع را با تعادل کامل انجام دهد.
📍 با چنین دقت و پایداری، G1 نهتنها یک ربات نمایشی نیست، بلکه گامی جدی بهسمت روباتهای انساننمای کاربردی در محیطهای واقعی محسوب میشود.
📹 ویدیو دموی زنده را ببینید:
#Unitree #Humanoid #Robot #AI #Robotics #هوش_مصنوعی #رباتیک #ربات_انساننما #تکنولوژی
ربات انساننمای Unitree G1 در جدیدترین نمایش خود، مهارتهای فیزیکی و هماهنگی بدنی در سطح بسیار بالایی را نشان داد — از حرکات رزمی گرفته تا تعادل دقیق و واکنش سریع در محیط واقعی.
این نسخه از G1 بهلطف موتور کنترل حرکتی بهبودیافته و الگوریتمهای یادگیری تقویتی جدید میتواند حرکات دینامیکی مانند لگد، چرخش و دفاع را با تعادل کامل انجام دهد.
📍 با چنین دقت و پایداری، G1 نهتنها یک ربات نمایشی نیست، بلکه گامی جدی بهسمت روباتهای انساننمای کاربردی در محیطهای واقعی محسوب میشود.
📹 ویدیو دموی زنده را ببینید:
#Unitree #Humanoid #Robot #AI #Robotics #هوش_مصنوعی #رباتیک #ربات_انساننما #تکنولوژی
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
📚 پروژهای متنباز برای در دسترسکردن ۱۰۰ میلیون مقاله علمی با کمک خلاصههای ساختاریافته تولیدشده توسط LLM
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
💯1
⭐ مدل VibeThinker-1.5B؛ مدل کوچک اما رکوردشکن در استدلال
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
⚡️مدل ChatGPT-5.1 منتشر شد
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مجموعه Freepik قابلیت Camera Angle را به فضای نودی Spaces اضافه کرد
در Freepik Spaces حالا میتوانید زاویهٔ دوربین را بهصورت سهبعدی کنترل کنید:
🟦 تصویر خود را آپلود میکنید
🟧 آن را به نود Camera Angle وصل میکنید
🟩 تصویر روی یکی از وجههای یک مکعب مجازی قرار میگیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید میشود
میتوانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.
🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.
🌐 سایت
#neural #ai #image_editing
@rss_ai_ir
در Freepik Spaces حالا میتوانید زاویهٔ دوربین را بهصورت سهبعدی کنترل کنید:
🟦 تصویر خود را آپلود میکنید
🟧 آن را به نود Camera Angle وصل میکنید
🟩 تصویر روی یکی از وجههای یک مکعب مجازی قرار میگیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید میشود
میتوانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.
🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.
🌐 سایت
#neural #ai #image_editing
@rss_ai_ir
🔥2