📊 چارچوب EfficientLLM به ما یادآوری میکنه که در دنیای مدلهای بزرگ، فقط کیفیت مهم نیست؛ کارایی هم بهاندازه کافی حیاتیست.
پژوهشگران بیش از ۱۰۰ پیکربندی LLM/VLM رو بررسی کردن و بهجای تمرکز روی FLOPs تئوریک، معیارهای واقعی مثل مصرف حافظه (VRAM)، تأخیر (Latency) و انرژی رو سنجیدن.
🔑 چند نکته کلیدی:
وقتی حافظه یا سرعت گلوگاه باشه → مکانیزمهای توجه (Attention) با تعداد کلید/هد کمتر، مصرف VRAM و زمان پاسخ رو بهشدت کاهش میدن.
اگر دقت حرف اول رو میزنه → توجه کامل (Full Attention) و موقعیتدهی RoPE بهترین انتخاب هستن، اما هزینهی منابع بالاتر خواهد بود.
✳️همچنین MoE (Mixture of Experts) کیفیت رو بدون افزایش زیاد هزینهی محاسباتی بالا میبره، ولی VRAM بیشتری نیاز داره و دیپلوی سختتر میشه.
در فاینتیونینگ:
✳️ مدلهای کوچک (≈۱–۳B) → LoRA و خانوادهاش بهترین بازدهی رو دارن.
✳️ مدلهای بزرگتر (≈۱۴B+) → RSLoRA معمولا برتره.
✳️ اگر چرخههای سریع مهم باشه → Freeze لایهها سرعت رو چندبرابر میکنه.
در استنتاج:
♻️ کوانتیزهسازی تا int4 جهش بزرگی در صرفهجویی هزینه/وات/گیگابایت میده، با اندکی افت دقت.
♻️ برای حفظ دقت بالا → bf16 معمولا بهتر از fp16 روی GPUهای مدرن عمل میکنه.
📌 جمعبندی:
کمبود VRAM → توجه بهینه + موقعیت نسبی + LoRA + int4
نیاز به حداکثر دقت → توجه کامل + RoPE + RSLoRA + bf16
محدودیت Compute → سراغ MoE بروید، اما VRAM رو حساب کنید
چرخههای سریع توسعه → Freeze موقت، بعد LoRA/RSLoRA
❓شما بیشتر کجا گیر میکنید؟ حافظه، سرعت، انرژی یا دقت؟
@rss_ai_ir
#هوش_مصنوعی #مدل_زبان_بزرگ #بهینهسازی #LLM #کارایی
پژوهشگران بیش از ۱۰۰ پیکربندی LLM/VLM رو بررسی کردن و بهجای تمرکز روی FLOPs تئوریک، معیارهای واقعی مثل مصرف حافظه (VRAM)، تأخیر (Latency) و انرژی رو سنجیدن.
🔑 چند نکته کلیدی:
وقتی حافظه یا سرعت گلوگاه باشه → مکانیزمهای توجه (Attention) با تعداد کلید/هد کمتر، مصرف VRAM و زمان پاسخ رو بهشدت کاهش میدن.
اگر دقت حرف اول رو میزنه → توجه کامل (Full Attention) و موقعیتدهی RoPE بهترین انتخاب هستن، اما هزینهی منابع بالاتر خواهد بود.
✳️همچنین MoE (Mixture of Experts) کیفیت رو بدون افزایش زیاد هزینهی محاسباتی بالا میبره، ولی VRAM بیشتری نیاز داره و دیپلوی سختتر میشه.
در فاینتیونینگ:
✳️ مدلهای کوچک (≈۱–۳B) → LoRA و خانوادهاش بهترین بازدهی رو دارن.
✳️ مدلهای بزرگتر (≈۱۴B+) → RSLoRA معمولا برتره.
✳️ اگر چرخههای سریع مهم باشه → Freeze لایهها سرعت رو چندبرابر میکنه.
در استنتاج:
♻️ کوانتیزهسازی تا int4 جهش بزرگی در صرفهجویی هزینه/وات/گیگابایت میده، با اندکی افت دقت.
♻️ برای حفظ دقت بالا → bf16 معمولا بهتر از fp16 روی GPUهای مدرن عمل میکنه.
📌 جمعبندی:
کمبود VRAM → توجه بهینه + موقعیت نسبی + LoRA + int4
نیاز به حداکثر دقت → توجه کامل + RoPE + RSLoRA + bf16
محدودیت Compute → سراغ MoE بروید، اما VRAM رو حساب کنید
چرخههای سریع توسعه → Freeze موقت، بعد LoRA/RSLoRA
❓شما بیشتر کجا گیر میکنید؟ حافظه، سرعت، انرژی یا دقت؟
@rss_ai_ir
#هوش_مصنوعی #مدل_زبان_بزرگ #بهینهسازی #LLM #کارایی
😁7🔥6❤5👍5👏4🎉4🥰2
🔴 در پروژههای صنعتی هوش مصنوعی، حضور بعضی افراد میتواند پروژه را به شکست بکشاند.
🚫 این افراد را در تیم خود استفاده نکنید:
1️⃣ تئوریزدههای صرف: کسانی که فقط مقاله میخوانند و مدل میسازند، بدون توجه به محدودیتهای واقعی صنعت مثل سختافزار یا هزینه.
2️⃣ کدنویسهای بیخبر از صنعت: برنامهنویسهایی که صرفاً به کد نگاه میکنند و فرآیند واقعی تولید یا محدودیت سنسورها را نمیشناسند.
3️⃣ فریلنسرهای بدون تعهد: افرادی که فقط برای دریافت پول وارد پروژه میشوند و بعد از تحویل، سیستم را بدون پشتیبانی رها میکنند.
4️⃣ مدیران غیر فنی با توقعات غیرواقعی: کسانی که فقط برای مد بودن به سراغ AI میآیند و انتظار دارند ظرف یک ماه کل خط تولید خودکار شود.
5️⃣ افراد تکبعدی و منزوی: کسانی که حاضر به تعامل بینرشتهای نیستند (مثلاً فقط دیتا ساینتیست یا فقط IT).
6️⃣ بیتوجه به تست و مانیتورینگ: افرادی که فکر میکنند پروژه با آموزش مدل تمام میشود و نگهداری و پایش در عمل را نادیده میگیرند.
✅ بهترین تیم صنعتی ترکیبی است از دیتاساینتیستهای آشنا به صنعت، مهندسان نرمافزار و DevOps، متخصصان صنعتی (Domain Experts) و مدیر پروژه واقعبین.
#هوش_مصنوعی #پروژه_صنعتی #مدیریت_پروژه #AI_industrial
🆔 @rss_ai_ir
🚫 این افراد را در تیم خود استفاده نکنید:
1️⃣ تئوریزدههای صرف: کسانی که فقط مقاله میخوانند و مدل میسازند، بدون توجه به محدودیتهای واقعی صنعت مثل سختافزار یا هزینه.
2️⃣ کدنویسهای بیخبر از صنعت: برنامهنویسهایی که صرفاً به کد نگاه میکنند و فرآیند واقعی تولید یا محدودیت سنسورها را نمیشناسند.
3️⃣ فریلنسرهای بدون تعهد: افرادی که فقط برای دریافت پول وارد پروژه میشوند و بعد از تحویل، سیستم را بدون پشتیبانی رها میکنند.
4️⃣ مدیران غیر فنی با توقعات غیرواقعی: کسانی که فقط برای مد بودن به سراغ AI میآیند و انتظار دارند ظرف یک ماه کل خط تولید خودکار شود.
5️⃣ افراد تکبعدی و منزوی: کسانی که حاضر به تعامل بینرشتهای نیستند (مثلاً فقط دیتا ساینتیست یا فقط IT).
6️⃣ بیتوجه به تست و مانیتورینگ: افرادی که فکر میکنند پروژه با آموزش مدل تمام میشود و نگهداری و پایش در عمل را نادیده میگیرند.
✅ بهترین تیم صنعتی ترکیبی است از دیتاساینتیستهای آشنا به صنعت، مهندسان نرمافزار و DevOps، متخصصان صنعتی (Domain Experts) و مدیر پروژه واقعبین.
#هوش_مصنوعی #پروژه_صنعتی #مدیریت_پروژه #AI_industrial
🆔 @rss_ai_ir
😁8🔥5👏5🎉5👍4🥰4❤3
⚙️ وقتی اتوماسیون شکست میخورد و دوباره به انسانها نیاز میشود
📉 اجرای هوش مصنوعی در شرکتهای آمریکا باعث تعدیل نیرو بسیار کمتر از پیشبینیها شده است. بر اساس گزارش «روسکنگرس»، تنها ۱۴٪ کارکنان شغل خود را از دست دادهاند، اما ۴۷٪ همچنان از خطر بیکاری به دلیل اتوماسیون نگران هستند.
🤖 تجربه نشان داده است که جایگزینی کامل انسان با هوش مصنوعی همیشه نتیجه مطلوبی ندارد. برای مثال در شرکت Klarna، چتباتها نتوانستند خدمات مشتری را بهخوبی ارائه دهند و شرکت مجبور شد بخشی از کارکنان را بازگرداند. همچنین IBM با معرفی AskHR تقریباً بخش منابع انسانی را حذف کرد، اما بعدها دوباره متخصصانی را برای وظایفی که نیازمند همدلی و تعامل انسانی بودند، استخدام کرد.
#هوش_مصنوعی #اتوماسیون #فناوری #تحول_دیجیتال #صنعتی
🆔 @rss_ai_ir
📉 اجرای هوش مصنوعی در شرکتهای آمریکا باعث تعدیل نیرو بسیار کمتر از پیشبینیها شده است. بر اساس گزارش «روسکنگرس»، تنها ۱۴٪ کارکنان شغل خود را از دست دادهاند، اما ۴۷٪ همچنان از خطر بیکاری به دلیل اتوماسیون نگران هستند.
🤖 تجربه نشان داده است که جایگزینی کامل انسان با هوش مصنوعی همیشه نتیجه مطلوبی ندارد. برای مثال در شرکت Klarna، چتباتها نتوانستند خدمات مشتری را بهخوبی ارائه دهند و شرکت مجبور شد بخشی از کارکنان را بازگرداند. همچنین IBM با معرفی AskHR تقریباً بخش منابع انسانی را حذف کرد، اما بعدها دوباره متخصصانی را برای وظایفی که نیازمند همدلی و تعامل انسانی بودند، استخدام کرد.
#هوش_مصنوعی #اتوماسیون #فناوری #تحول_دیجیتال #صنعتی
🆔 @rss_ai_ir
😁8👍6🔥5👏5🎉5❤4🥰4
📌 دیپسیک نسخه V3.1
♻️مدل جدید با ۶۸۵ میلیارد پارامتر بهعنوان یک مدل متنباز ترکیبی برای استدلال معرفی شده است. این نسخه علاوه بر بهبودهای کیفی، تمرکز ویژهای روی تواناییهای عاملمحور (agentic capabilities) دارد.
📊 نتایج بنچمارکها نشان میدهد:
♻️در SWE-bench Verified امتیاز 66.0 در برابر 44.6 نسخه R1
♻️در SWE-bench Multilingual امتیاز 54.5 (تقریباً دو برابر نسخههای قبلی)
♻️در Terminal-Bench جهش بزرگ تا 31.3 (مقایسه با 5.7 نسخه R1)
همچنین در حوزههای کاربردی دیگر:
SimpleQA → دقت 93.4%
Frames → امتیاز 83.7
xBench-DeepSearch → امتیاز 71.2
و در Browsecomp نیز برتری قابل توجه نسبت به نسخه قبلی.
🚀 این نتایج نشان میدهد که DeepSeek-V3.1 یکی از قویترین مدلهای متنباز حال حاضر است، مخصوصاً در وظایف چندزبانه، QA و محیطهای پویا مثل ترمینال.
🔗 این حرکت، رقابت متنبازها با مدلهای کلوزد مثل GPT-5 و Claude را وارد مرحله تازهای میکند.
#AI #LLM #DeepSeek #opensource #benchmark
@rss_ai_ir
♻️مدل جدید با ۶۸۵ میلیارد پارامتر بهعنوان یک مدل متنباز ترکیبی برای استدلال معرفی شده است. این نسخه علاوه بر بهبودهای کیفی، تمرکز ویژهای روی تواناییهای عاملمحور (agentic capabilities) دارد.
📊 نتایج بنچمارکها نشان میدهد:
♻️در SWE-bench Verified امتیاز 66.0 در برابر 44.6 نسخه R1
♻️در SWE-bench Multilingual امتیاز 54.5 (تقریباً دو برابر نسخههای قبلی)
♻️در Terminal-Bench جهش بزرگ تا 31.3 (مقایسه با 5.7 نسخه R1)
همچنین در حوزههای کاربردی دیگر:
SimpleQA → دقت 93.4%
Frames → امتیاز 83.7
xBench-DeepSearch → امتیاز 71.2
و در Browsecomp نیز برتری قابل توجه نسبت به نسخه قبلی.
🚀 این نتایج نشان میدهد که DeepSeek-V3.1 یکی از قویترین مدلهای متنباز حال حاضر است، مخصوصاً در وظایف چندزبانه، QA و محیطهای پویا مثل ترمینال.
🔗 این حرکت، رقابت متنبازها با مدلهای کلوزد مثل GPT-5 و Claude را وارد مرحله تازهای میکند.
#AI #LLM #DeepSeek #opensource #benchmark
@rss_ai_ir
📸 یک بیلبورد جالب در سانفرانسیسکو:
«هوش مصنوعی نمیتواند یک فیشتاکو را گریل کند»
شرکت Pacific Catch با این شعار تبلیغ کرده که هرچقدر هم AI پیشرفت کند، هنوز بعضی چیزها مثل طعم و مهارت آشپزی انسانی جایگزینپذیر نیستند.
ولی خب، سؤال اصلی اینجاست:
⏳ واقعاً کی اولین «ربات تاکو» را خواهیم دید که بتواند همزمان هم ماهی را گریل کند، هم تاکو بپیچد، هم لبخند بزند؟
به نظر شما، رباتهای آشپزخانه چقدر تا تسخیر فستفودها فاصله دارند؟ 🌮🤖
#AI #رباتیک #هوش_مصنوعی #آشپزخانه_هوشمند
@rss_ai_ir
«هوش مصنوعی نمیتواند یک فیشتاکو را گریل کند»
شرکت Pacific Catch با این شعار تبلیغ کرده که هرچقدر هم AI پیشرفت کند، هنوز بعضی چیزها مثل طعم و مهارت آشپزی انسانی جایگزینپذیر نیستند.
ولی خب، سؤال اصلی اینجاست:
⏳ واقعاً کی اولین «ربات تاکو» را خواهیم دید که بتواند همزمان هم ماهی را گریل کند، هم تاکو بپیچد، هم لبخند بزند؟
به نظر شما، رباتهای آشپزخانه چقدر تا تسخیر فستفودها فاصله دارند؟ 🌮🤖
#AI #رباتیک #هوش_مصنوعی #آشپزخانه_هوشمند
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات انساننمای ALLEX معرفی شد
شرکت کرهای WIRobotics از ربات انساننمای همهمنظوره خود رونمایی کرد. این ربات دارای بازوهایی با اصطکاک بسیار پایین و قابلیت بازگردانی نیرو (backdrivable) و همچنین دستهایی شبیه انسان است.
🔹 مشخصات فنی چشمگیر:
♻️هر دست دارای ۱۵ درجه آزادی (DOF)
♻️توانایی بلند کردن اجسام بالای ۳۰ کیلوگرم
♻️قدرت بیش از ۴۰ نیوتن در نوک انگشتان
⚡ کرهجنوبی با این دستاورد نشان داد که نهتنها در حوزه ضدپیری، بلکه در رباتیک، بیوتک و تحقیقات سرطان نیز جایگاهی فراتر از انتظار خود پیدا کرده است.
#Humanoid #Robotics #AI #WIRobotics #SouthKorea
شرکت کرهای WIRobotics از ربات انساننمای همهمنظوره خود رونمایی کرد. این ربات دارای بازوهایی با اصطکاک بسیار پایین و قابلیت بازگردانی نیرو (backdrivable) و همچنین دستهایی شبیه انسان است.
🔹 مشخصات فنی چشمگیر:
♻️هر دست دارای ۱۵ درجه آزادی (DOF)
♻️توانایی بلند کردن اجسام بالای ۳۰ کیلوگرم
♻️قدرت بیش از ۴۰ نیوتن در نوک انگشتان
⚡ کرهجنوبی با این دستاورد نشان داد که نهتنها در حوزه ضدپیری، بلکه در رباتیک، بیوتک و تحقیقات سرطان نیز جایگاهی فراتر از انتظار خود پیدا کرده است.
#Humanoid #Robotics #AI #WIRobotics #SouthKorea
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
⛔️ تازه یک مدل جدید برای ساخت دنیا معرفی شده!
🔗 همچنین WorldLabs ابزاری ساخته که فقط با یک تصویر، یک دنیا کامل سهبعدی میسازد.
✨ ویژگیها:
♻️جهانها برای همیشه در حافظه ذخیره میشوند و جزئیات از بین نمیرود.
♻️مبتنی بر 3D Gaussian Splatting (3DGS) است، پس میتوان صحنهها را با هم ترکیب یا تغییر داد.
♻️برخلاف روشهای قدیمی، دنیاها مقیاسپذیر و قابل ویرایش در زمان واقعی هستند.
📌 فعلاً در حالت بتای خصوصی قرار دارد.
بهنظرتان آیندهی بازیسازی و متاورس دقیقاً همین مسیر نیست؟ 🎮🌍
#AI #3D #WorldModel #GenerativeAI #Metaverse #GameTech
@rss_ai_ir
🔗 همچنین WorldLabs ابزاری ساخته که فقط با یک تصویر، یک دنیا کامل سهبعدی میسازد.
✨ ویژگیها:
♻️جهانها برای همیشه در حافظه ذخیره میشوند و جزئیات از بین نمیرود.
♻️مبتنی بر 3D Gaussian Splatting (3DGS) است، پس میتوان صحنهها را با هم ترکیب یا تغییر داد.
♻️برخلاف روشهای قدیمی، دنیاها مقیاسپذیر و قابل ویرایش در زمان واقعی هستند.
📌 فعلاً در حالت بتای خصوصی قرار دارد.
بهنظرتان آیندهی بازیسازی و متاورس دقیقاً همین مسیر نیست؟ 🎮🌍
#AI #3D #WorldModel #GenerativeAI #Metaverse #GameTech
@rss_ai_ir
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔹 شرکت Anthropic دسترسی Claude Code را برای کاربران Team و Enterprise فعال کرد.
این نسخه شامل قابلیتهای مدیریتی تازه است:
⚙️ کنترلهای ادمین برای مدیریت هزینه
⚙️ تنظیم سیاستها
⚙️ امکانات بیشتر برای مقیاسپذیری همراه با رشد مصرف
این تغییر به تیمها کمک میکند راحتتر کدنویسی مبتنی بر Claude را در مقیاس سازمانی استفاده کنند.
#AI #Claude #Anthropic #Enterprise #Coding
@rss_ai_ir 🪙
این نسخه شامل قابلیتهای مدیریتی تازه است:
⚙️ کنترلهای ادمین برای مدیریت هزینه
⚙️ تنظیم سیاستها
⚙️ امکانات بیشتر برای مقیاسپذیری همراه با رشد مصرف
این تغییر به تیمها کمک میکند راحتتر کدنویسی مبتنی بر Claude را در مقیاس سازمانی استفاده کنند.
#AI #Claude #Anthropic #Enterprise #Coding
@rss_ai_ir 🪙
👍1🔥1👏1