📢 برای کسانی که از شخصیت جدید GPT-5 راضی نیستند، خبر خوب اینکه OpenAI امکان تغییر شخصیت مدل را برای همه فعال کرده است.
برای تغییر کافیست:
1️⃣ از منوی پایین سمت چپ در ChatGPT گزینه Customize ChatGPT را انتخاب کنید.
2️⃣ در پنجره باز شده، Enable for new chats را فعال کنید.
3️⃣ روی گزینه Default کلیک کنید تا ۴ شخصیت دیگر را ببینید و انتخاب کنید.
💡 شخصیتها به شرح زیر هستند:
🔹 بدبین (Cynic) – طعنهآمیز و صریح، گاهی شوخطبع و دستانداختن، اما با پاسخهای کاربردی.
🔹 ربات (Robot) – دقیق، سریع و بدون حاشیه، فقط اصل مطلب.
🔹 شنونده (Listener) – آرام و حمایتگر، بازتابدهنده افکار شما با کمی شوخطبعی.
🔹 خرخوان / Nerd – کنجکاو و هیجانزده، توضیحدهنده شفاف مفاهیم و عاشق یادگیری.
@rss_ai_ir 🤖✨
برای تغییر کافیست:
1️⃣ از منوی پایین سمت چپ در ChatGPT گزینه Customize ChatGPT را انتخاب کنید.
2️⃣ در پنجره باز شده، Enable for new chats را فعال کنید.
3️⃣ روی گزینه Default کلیک کنید تا ۴ شخصیت دیگر را ببینید و انتخاب کنید.
💡 شخصیتها به شرح زیر هستند:
🔹 بدبین (Cynic) – طعنهآمیز و صریح، گاهی شوخطبع و دستانداختن، اما با پاسخهای کاربردی.
🔹 ربات (Robot) – دقیق، سریع و بدون حاشیه، فقط اصل مطلب.
🔹 شنونده (Listener) – آرام و حمایتگر، بازتابدهنده افکار شما با کمی شوخطبعی.
🔹 خرخوان / Nerd – کنجکاو و هیجانزده، توضیحدهنده شفاف مفاهیم و عاشق یادگیری.
@rss_ai_ir 🤖✨
👍21❤20👏18🎉17🥰16😁13🔥10🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 مدل KumoRFM؛ پیشبینی لحظهای روی دادههای سازمانی
@rss_ai_ir
به عنوان اولین Relational Foundation Model در جهان، KumoRFM مخصوص دادههای رابطهای (جداول پایگاهداده سازمانی) طراحی شده است.
بدون نیاز به آموزش یا تنظیمات پیچیده، کافیست به دیتابیس متصل شود تا در لحظه پیشبینیهایی دقیق ارائه دهد، مانند:
🔹 پیشبینی خروج مشتری (Churn)
🔹 تشخیص تقلب
🔹 پیشنهاد محصولات مرتبط
🔹 پیشبینی فروش یا نیاز انبار
---
✨ ویژگیهای کلیدی:
1️⃣ یادگیری درونمتنی – بدون آموزش جداگانه، با استفاده از دادههای تاریخی شما پیشبینی میکند.
2️⃣ معماری Relational Graph Transformer – جداول را به گراف تبدیل کرده و با مکانیزم Attention تحلیل میکند.
3️⃣ سرعت و دقت بالا – تا ۲۰ برابر سریعتر و ۳۰–۵۰٪ دقیقتر از روشهای سنتی.
4️⃣ کاهش هزینه – بدون نیاز به مهندسی ویژگیهای دستی یا تیم بزرگ علم داده.
---
💡 نتیجه این رویکرد آن است که مدلسازی پیشبینی که قبلاً هفتهها زمان میبرد، اکنون در کمتر از یک ثانیه انجام میشود.
برای سازمانهایی با حجم زیاد داده ساختاریافته، این گام بزرگی در مسیر هوش مصنوعی عملیاتی است.
#هوش_مصنوعی #داده_رابطهای #KumoRFM #پیشبینی_داده
@rss_ai_ir
@rss_ai_ir
به عنوان اولین Relational Foundation Model در جهان، KumoRFM مخصوص دادههای رابطهای (جداول پایگاهداده سازمانی) طراحی شده است.
بدون نیاز به آموزش یا تنظیمات پیچیده، کافیست به دیتابیس متصل شود تا در لحظه پیشبینیهایی دقیق ارائه دهد، مانند:
🔹 پیشبینی خروج مشتری (Churn)
🔹 تشخیص تقلب
🔹 پیشنهاد محصولات مرتبط
🔹 پیشبینی فروش یا نیاز انبار
---
✨ ویژگیهای کلیدی:
1️⃣ یادگیری درونمتنی – بدون آموزش جداگانه، با استفاده از دادههای تاریخی شما پیشبینی میکند.
2️⃣ معماری Relational Graph Transformer – جداول را به گراف تبدیل کرده و با مکانیزم Attention تحلیل میکند.
3️⃣ سرعت و دقت بالا – تا ۲۰ برابر سریعتر و ۳۰–۵۰٪ دقیقتر از روشهای سنتی.
4️⃣ کاهش هزینه – بدون نیاز به مهندسی ویژگیهای دستی یا تیم بزرگ علم داده.
---
💡 نتیجه این رویکرد آن است که مدلسازی پیشبینی که قبلاً هفتهها زمان میبرد، اکنون در کمتر از یک ثانیه انجام میشود.
برای سازمانهایی با حجم زیاد داده ساختاریافته، این گام بزرگی در مسیر هوش مصنوعی عملیاتی است.
#هوش_مصنوعی #داده_رابطهای #KumoRFM #پیشبینی_داده
@rss_ai_ir
😁14🎉13❤12👍9👏9🔥8🥰8🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 رونمایی xAI از قابلیت ساخت ویدیو Grok Imagine
@rss_ai_ir
شرکت xAI قابلیت جدید Grok Imagine را معرفی کرده که امکان ساخت ویدیوهای ۵ ثانیهای را فراهم میکند.
🔹 سرعت بالا — گرچه کیفیت آن به پای Veo 3 نمیرسد، اما در ساخت ویدیو بسیار سریع است.
🔹 سانسور کمتر — یکی از مزیتهای بزرگ آن، محدودیت کمتر در تولید محتواست؛ .
🔹 افزودن صدا — قابلیت اضافه کردن صدا دارد، اما در حد صداهای پسزمینه و نه در سطح Veo 3.
🔹 فرآیند کار — ابتدا تصویر را بر اساس پرامپت تولید میکند، سپس با یک دکمه امکان متحرکسازی آن را میدهد؛ این روش کنترل جزئیات حرکتی را محدود میکند.
📱 این قابلیت تا چند روز بهصورت رایگان برای کاربران اندروید و iOS فعال است (تب Imagine). در صورت نیاز به اشتراک، با IP آمریکا اپ را باز کنید.
#هوش_مصنوعی #Grok #xAI #ویدیو
@rss_ai_ir
@rss_ai_ir
شرکت xAI قابلیت جدید Grok Imagine را معرفی کرده که امکان ساخت ویدیوهای ۵ ثانیهای را فراهم میکند.
🔹 سرعت بالا — گرچه کیفیت آن به پای Veo 3 نمیرسد، اما در ساخت ویدیو بسیار سریع است.
🔹 سانسور کمتر — یکی از مزیتهای بزرگ آن، محدودیت کمتر در تولید محتواست؛ .
🔹 افزودن صدا — قابلیت اضافه کردن صدا دارد، اما در حد صداهای پسزمینه و نه در سطح Veo 3.
🔹 فرآیند کار — ابتدا تصویر را بر اساس پرامپت تولید میکند، سپس با یک دکمه امکان متحرکسازی آن را میدهد؛ این روش کنترل جزئیات حرکتی را محدود میکند.
📱 این قابلیت تا چند روز بهصورت رایگان برای کاربران اندروید و iOS فعال است (تب Imagine). در صورت نیاز به اشتراک، با IP آمریکا اپ را باز کنید.
#هوش_مصنوعی #Grok #xAI #ویدیو
@rss_ai_ir
🔥9👍7😁5🎉5❤4👏4🥰3
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 شرکت OpenAI قابلیت جدیدی اضافه کرده که نشان میدهد پاسخ هر پیام توسط کدام مدل تولید شده است.
📌 مشکل اصلی این بود که برای هر درخواست، یک «روتر» تصمیم میگیرد کدام مدل پاسخ دهد. حتی در یک گفتوگو، ممکن است برخی پیامها (بهخصوص برای کاربران رایگان یا کاربران پولی بعد از رسیدن به سقف محدودیت) توسط gpt-5-mini یا حتی gpt-4o-mini پاسخ داده شوند.
✅ این قابلیت شفافیت بیشتری ایجاد میکند و میتوان بهتر فهمید که سیستم چه زمانی از کدام مدل استفاده میکند.
📱 روی نسخه موبایل هم فعال است؛ کافی است روی پاسخ مدل کمی نگه دارید تا نام مدل نمایش داده شود.
#هوش_مصنوعی #GPT5 #OpenAI
@rss_ai_ir
📌 مشکل اصلی این بود که برای هر درخواست، یک «روتر» تصمیم میگیرد کدام مدل پاسخ دهد. حتی در یک گفتوگو، ممکن است برخی پیامها (بهخصوص برای کاربران رایگان یا کاربران پولی بعد از رسیدن به سقف محدودیت) توسط gpt-5-mini یا حتی gpt-4o-mini پاسخ داده شوند.
✅ این قابلیت شفافیت بیشتری ایجاد میکند و میتوان بهتر فهمید که سیستم چه زمانی از کدام مدل استفاده میکند.
📱 روی نسخه موبایل هم فعال است؛ کافی است روی پاسخ مدل کمی نگه دارید تا نام مدل نمایش داده شود.
#هوش_مصنوعی #GPT5 #OpenAI
@rss_ai_ir
🎉8❤7🔥6👍4🥰4😁4👏1
🚗 مدل PRIX و تحول رانندگی خودران با ورودی صرفاً دوربین
در این رویکرد نوآورانه، سیستم PRIX بدون استفاده از LiDAR یا نمایشهای سنگین BEV، مسیر رانندگی را مستقیماً از پیکسلهای خام برنامهریزی میکند و حتی از مدلهای چندحسگری بزرگتر نیز عملکرد بهتری دارد.
📌 ویژگیها و نوآوریها:
♻️حذف کامل نیاز به LiDAR و پردازشهای پرهزینه BEV.
♻️بهرهگیری از بکبون ResNet همراه با ماژول CaRT (Context-aware Recalibration Transformer) برای غنیسازی ویژگیهای چندمقیاسی.
♻️استفاده از برنامهریز انتشار شرطی همراه با وظایف کمکی شامل تشخیص اشیا و سگمنتیشن معنایی در چارچوب یادگیری چندوظیفهای.
📊 نتایج در NavSim-v1:
✳️امتیاز PDMS = 87.8 ➕ بهترین نتیجه بین مدلهای صرفاً دوربین و حتی بالاتر از مدلهای چندحسگری.
✳️برتری نسبت به Hydra-MDP++ (امتیاز 86.6) و GoalFlow+ (امتیاز 85.7).
✳️سرعت 57 FPS با تنها 37 میلیون پارامتر.
💡 جمعبندی:
قدرت یک استخراجکننده ویژگی تصویری قوی، آموزشدیده با وظایف کمکی مناسب، میتواند مهمتر از پیچیدگی برنامهریز یا ادغام چند حسگر باشد و مسیر را برای ساخت سیستمهای رانندگی خودران مقیاسپذیر و کمهزینه هموار کند.
📄 مطالعه کامل:
🔗 arXiv
💻 HuggingFace
#هوش_مصنوعی #رانندگی_خودران #یادگیری_عمیق
@rss_ai_ir
در این رویکرد نوآورانه، سیستم PRIX بدون استفاده از LiDAR یا نمایشهای سنگین BEV، مسیر رانندگی را مستقیماً از پیکسلهای خام برنامهریزی میکند و حتی از مدلهای چندحسگری بزرگتر نیز عملکرد بهتری دارد.
📌 ویژگیها و نوآوریها:
♻️حذف کامل نیاز به LiDAR و پردازشهای پرهزینه BEV.
♻️بهرهگیری از بکبون ResNet همراه با ماژول CaRT (Context-aware Recalibration Transformer) برای غنیسازی ویژگیهای چندمقیاسی.
♻️استفاده از برنامهریز انتشار شرطی همراه با وظایف کمکی شامل تشخیص اشیا و سگمنتیشن معنایی در چارچوب یادگیری چندوظیفهای.
📊 نتایج در NavSim-v1:
✳️امتیاز PDMS = 87.8 ➕ بهترین نتیجه بین مدلهای صرفاً دوربین و حتی بالاتر از مدلهای چندحسگری.
✳️برتری نسبت به Hydra-MDP++ (امتیاز 86.6) و GoalFlow+ (امتیاز 85.7).
✳️سرعت 57 FPS با تنها 37 میلیون پارامتر.
💡 جمعبندی:
قدرت یک استخراجکننده ویژگی تصویری قوی، آموزشدیده با وظایف کمکی مناسب، میتواند مهمتر از پیچیدگی برنامهریز یا ادغام چند حسگر باشد و مسیر را برای ساخت سیستمهای رانندگی خودران مقیاسپذیر و کمهزینه هموار کند.
📄 مطالعه کامل:
🔗 arXiv
💻 HuggingFace
#هوش_مصنوعی #رانندگی_خودران #یادگیری_عمیق
@rss_ai_ir
🥰6👏6🎉6❤4🔥4😁4👍3
🆓 گراک ۴ رایگان شد!
در حالت Expert (همان Grok 4) میتوانید هر ۱۲ ساعت، ۴ سؤال از آن بپرسید و سپس به Grok 3 سوییچ میشود.
🖼 علاوه بر این، قابلیت Grok Imagine (تجربه جدید ساخت عکس و ویدئو که هنگام اسکرول بهصورت لحظهای تصاویر مختلف تولید میکند) نیز در اپ گراک با VPN آمریکا رایگان فعال است.
📲 برای دسترسی میتوانید از داخل X (توییتر) یا سایت گراک اقدام کنید:
🌐 grok.com
#هوش_مصنوعی #Grok
@rss_ai_ir
در حالت Expert (همان Grok 4) میتوانید هر ۱۲ ساعت، ۴ سؤال از آن بپرسید و سپس به Grok 3 سوییچ میشود.
🖼 علاوه بر این، قابلیت Grok Imagine (تجربه جدید ساخت عکس و ویدئو که هنگام اسکرول بهصورت لحظهای تصاویر مختلف تولید میکند) نیز در اپ گراک با VPN آمریکا رایگان فعال است.
📲 برای دسترسی میتوانید از داخل X (توییتر) یا سایت گراک اقدام کنید:
🌐 grok.com
#هوش_مصنوعی #Grok
@rss_ai_ir
👍13😁12🔥10🥰9🎉9👏7❤6
🐺 چین نسل جدید «گرگهای رباتیک» میدان نبرد را رونمایی کرد
دیگر خبری از سگهای رباتیک بامزه نیست؛ این بار صحبت از گرگهای رباتیک ۷۰ کیلوگرمی است که به تفنگ و نارنجکانداز مجهز شدهاند.
🔸 در رزمایشهای اخیر ارتش چین، این رباتها در کنار نیروهای انسانی در خط مقدم جنگیدند.
🔸 کنترل آنها از طریق دادههای پهپادهای FPV انجام میشود؛ برخی برای شناسایی و برخی برای نبرد مستقیم تجهیز شدهاند.
🔸 فرماندهان میگویند این «گلههای رباتیک» مأموریتها را سریع انجام میدهند و با ایجاد رعب، اثر روانی زیادی بر دشمن دارند.
⚔️ بهنظر میرسد نبردهای آینده، به اندازه قدرت آتش، برتری روانی را هم تعیینکننده میدانند.
#رباتیک #جنگ_هوشمند #چین
@rss_ai_ir
دیگر خبری از سگهای رباتیک بامزه نیست؛ این بار صحبت از گرگهای رباتیک ۷۰ کیلوگرمی است که به تفنگ و نارنجکانداز مجهز شدهاند.
🔸 در رزمایشهای اخیر ارتش چین، این رباتها در کنار نیروهای انسانی در خط مقدم جنگیدند.
🔸 کنترل آنها از طریق دادههای پهپادهای FPV انجام میشود؛ برخی برای شناسایی و برخی برای نبرد مستقیم تجهیز شدهاند.
🔸 فرماندهان میگویند این «گلههای رباتیک» مأموریتها را سریع انجام میدهند و با ایجاد رعب، اثر روانی زیادی بر دشمن دارند.
⚔️ بهنظر میرسد نبردهای آینده، به اندازه قدرت آتش، برتری روانی را هم تعیینکننده میدانند.
#رباتیک #جنگ_هوشمند #چین
@rss_ai_ir
👍14🥰14🔥11🎉10😁8❤6👏4
🧩 مدل OmniPart: نسل جدید تولید سهبعدی با آگاهی از اجزای شیء
پژوهشگران در مدل OmniPart روشی دومرحلهای برای ساخت اشیاء سهبعدی قابلویرایش از روی تصاویر و ماسکهای دوبعدی ارائه کردهاند.
🔹 ویژگیهای کلیدی:
1. جداسازی معنایی قوی بین اجزاء (Semantic Decoupling)
2. انسجام ساختاری بالا بین کل مدل (Structural Cohesion)
3. امکان کنترل و ویرایش بخشهای جداگانه مدل پس از تولید
🔹 روش کار:
مرحله اول: یک ترنسفورمر خودبازگشتی (Autoregressive Transformer) چیدمان سهبعدی اجزاء را به صورت توالی باکسها، بر اساس ماسکهای ۲بعدی، طراحی میکند.
مرحله دوم: یک ماژول سنتز مکانی (Spatially-Conditioned Synthesis) — آموزشدیده از یک مدل تولیدی پیشفرض — همه اجزاء را به طور همزمان در این چیدمان میسازد.
🔹 نتایج:
دقت F1 Score = 0.74 در سطح جزء (با آستانه Chamfer Distance < 0.1)
عملکرد بهتر نسبت به تمام مدلهای موجود در تولید سهبعدی مبتنی بر اجزاء
🔹 کاربردها:
♻️ویرایش جزئی مدلهای سهبعدی
♻️انیمیشنسازی بخشی
♻️اختصاص متریال به قسمتهای خاص در سیستمهای تعاملی
📄 مطالعه کامل: arXiv
💻 کد و مدل: HuggingFace
#3D #ComputerVision #GenerativeAI
@rss_ai_ir
پژوهشگران در مدل OmniPart روشی دومرحلهای برای ساخت اشیاء سهبعدی قابلویرایش از روی تصاویر و ماسکهای دوبعدی ارائه کردهاند.
🔹 ویژگیهای کلیدی:
1. جداسازی معنایی قوی بین اجزاء (Semantic Decoupling)
2. انسجام ساختاری بالا بین کل مدل (Structural Cohesion)
3. امکان کنترل و ویرایش بخشهای جداگانه مدل پس از تولید
🔹 روش کار:
مرحله اول: یک ترنسفورمر خودبازگشتی (Autoregressive Transformer) چیدمان سهبعدی اجزاء را به صورت توالی باکسها، بر اساس ماسکهای ۲بعدی، طراحی میکند.
مرحله دوم: یک ماژول سنتز مکانی (Spatially-Conditioned Synthesis) — آموزشدیده از یک مدل تولیدی پیشفرض — همه اجزاء را به طور همزمان در این چیدمان میسازد.
🔹 نتایج:
دقت F1 Score = 0.74 در سطح جزء (با آستانه Chamfer Distance < 0.1)
عملکرد بهتر نسبت به تمام مدلهای موجود در تولید سهبعدی مبتنی بر اجزاء
🔹 کاربردها:
♻️ویرایش جزئی مدلهای سهبعدی
♻️انیمیشنسازی بخشی
♻️اختصاص متریال به قسمتهای خاص در سیستمهای تعاملی
📄 مطالعه کامل: arXiv
💻 کد و مدل: HuggingFace
#3D #ComputerVision #GenerativeAI
@rss_ai_ir
👍14😁13🥰10👏10🎉9🔥8❤3
🚀 تراشههای نوری؛ شرطبندی بزرگ Q.ANT برای عصر هوش مصنوعی
شرکت آلمانی Q.ANT با جذب سرمایه ۶۲ میلیون یورویی — بزرگترین دور سرمایهگذاری فوتونیک در اروپا — قصد دارد جایگزینی برای تراشههای سیلیکونی سنتی ارائه دهد: پردازندههایی که با نور کار میکنند.
🔹 انجام عملیاتهایی مثل ضرب تنها با یک المان نوری
🔹 ساخت بر پایه لیتیوم نیوبات لایهنازک با راندمان انرژی تا ۳۰ برابر بالاتر
🔹 سرورهای آمادهبهکار، بدون نیاز به خنکسازی آبی یا نصب پیچیده
🔹 پشتیبانی از Python، C++ و استکهای استاندارد
🔹 منشعبشده از TRUMPF و به رهبری فیزیکدان مؤسسه ماکس پلانک Michael Förtsch
📌 نکته مهم اینجاست که برخلاف بسیاری از رقبا که هنوز در مرحله تحقیق و توسعه هستند، Q.ANT همین حالا در حال عرضه محصول است و قصد دارد تا سال ۲۰۳۰، همراهپردازندههای فوتونیک را کنار GPUها در تمام مراکز داده بزرگ قرار دهد.
@rss_ai_ir 💡
شرکت آلمانی Q.ANT با جذب سرمایه ۶۲ میلیون یورویی — بزرگترین دور سرمایهگذاری فوتونیک در اروپا — قصد دارد جایگزینی برای تراشههای سیلیکونی سنتی ارائه دهد: پردازندههایی که با نور کار میکنند.
🔹 انجام عملیاتهایی مثل ضرب تنها با یک المان نوری
🔹 ساخت بر پایه لیتیوم نیوبات لایهنازک با راندمان انرژی تا ۳۰ برابر بالاتر
🔹 سرورهای آمادهبهکار، بدون نیاز به خنکسازی آبی یا نصب پیچیده
🔹 پشتیبانی از Python، C++ و استکهای استاندارد
🔹 منشعبشده از TRUMPF و به رهبری فیزیکدان مؤسسه ماکس پلانک Michael Förtsch
📌 نکته مهم اینجاست که برخلاف بسیاری از رقبا که هنوز در مرحله تحقیق و توسعه هستند، Q.ANT همین حالا در حال عرضه محصول است و قصد دارد تا سال ۲۰۳۰، همراهپردازندههای فوتونیک را کنار GPUها در تمام مراکز داده بزرگ قرار دهد.
@rss_ai_ir 💡
❤7👍7👏7🔥6🥰3🎉3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 تکنیک بوستینگ (Boosting) در یادگیری ماشین
بوستینگ یکی از قدرتمندترین تکنیکها در یادگیری تجمعی (Ensemble Learning) است که هدف آن ترکیب چندین مدل ضعیف (Weak Learners) برای ساخت یک مدل قوی با خطای کم است.
🔹 ایده اصلی
در بوستینگ، مدلها بهصورت پیاپی (Sequential) آموزش داده میشوند. هر مدل جدید تلاش میکند خطاهای مدلهای قبلی را اصلاح کند. به این ترتیب، وزن بیشتری به نمونههایی داده میشود که در مراحل قبلی بهدرستی پیشبینی نشدهاند.
🔹 مراحل کلی
1. شروع با یک مدل ضعیف (مثلاً درخت تصمیم کوچک)
2. محاسبه خطاها و افزایش وزن دادههای سخت
3. آموزش مدل بعدی با تمرکز بر دادههای دارای خطای بالا
4. ترکیب خروجی مدلها (مثلاً با میانگین وزنی یا جمعبندی)
🔹 انواع معروف بوستینگ
AdaBoost → اولین نسخه مشهور بوستینگ، تغییر وزن نمونهها پس از هر مرحله
Gradient Boosting → استفاده از گرادیان برای کاهش خطا بهصورت مرحلهای
XGBoost → نسخه بهینهسازیشده با سرعت و دقت بالا
LightGBM → سریع و مناسب دادههای حجیم
CatBoost → بهینه برای دادههای دستهای (Categorical)
🔹 مزایا
♻️دقت بالا در مسائل طبقهبندی و رگرسیون
♻️توانایی مدیریت دادههای پیچیده
♻️کاهش Bias و بهبود Generalization
🔹 معایب
♻️حساس به نویز و دادههای پرت
♻️هزینه محاسباتی بالا در مجموعه دادههای بزرگ
📌 بوستینگ در بسیاری از مسابقات دادهکاوی (Kaggle) و پروژههای صنعتی، انتخاب اول برای رسیدن به بالاترین دقت است.
#هوش_مصنوعی #یادگیری_ماشین #Boosting #DataScience #MachineLearning #EnsembleLearning #AI #XGBoost #LightGBM #CatBoost #GradientBoosting
@rss_ai_ir 🤖
بوستینگ یکی از قدرتمندترین تکنیکها در یادگیری تجمعی (Ensemble Learning) است که هدف آن ترکیب چندین مدل ضعیف (Weak Learners) برای ساخت یک مدل قوی با خطای کم است.
🔹 ایده اصلی
در بوستینگ، مدلها بهصورت پیاپی (Sequential) آموزش داده میشوند. هر مدل جدید تلاش میکند خطاهای مدلهای قبلی را اصلاح کند. به این ترتیب، وزن بیشتری به نمونههایی داده میشود که در مراحل قبلی بهدرستی پیشبینی نشدهاند.
🔹 مراحل کلی
1. شروع با یک مدل ضعیف (مثلاً درخت تصمیم کوچک)
2. محاسبه خطاها و افزایش وزن دادههای سخت
3. آموزش مدل بعدی با تمرکز بر دادههای دارای خطای بالا
4. ترکیب خروجی مدلها (مثلاً با میانگین وزنی یا جمعبندی)
🔹 انواع معروف بوستینگ
AdaBoost → اولین نسخه مشهور بوستینگ، تغییر وزن نمونهها پس از هر مرحله
Gradient Boosting → استفاده از گرادیان برای کاهش خطا بهصورت مرحلهای
XGBoost → نسخه بهینهسازیشده با سرعت و دقت بالا
LightGBM → سریع و مناسب دادههای حجیم
CatBoost → بهینه برای دادههای دستهای (Categorical)
🔹 مزایا
♻️دقت بالا در مسائل طبقهبندی و رگرسیون
♻️توانایی مدیریت دادههای پیچیده
♻️کاهش Bias و بهبود Generalization
🔹 معایب
♻️حساس به نویز و دادههای پرت
♻️هزینه محاسباتی بالا در مجموعه دادههای بزرگ
📌 بوستینگ در بسیاری از مسابقات دادهکاوی (Kaggle) و پروژههای صنعتی، انتخاب اول برای رسیدن به بالاترین دقت است.
#هوش_مصنوعی #یادگیری_ماشین #Boosting #DataScience #MachineLearning #EnsembleLearning #AI #XGBoost #LightGBM #CatBoost #GradientBoosting
@rss_ai_ir 🤖
🎉8👍6👏6❤5😁5🔥4🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 شرکت Runway از مدل قدرتمند Aleph رونمایی کرده که ویرایش ویدیو را تنها با دستورات متنی ممکن میکند.
با Aleph میتوانید:
🌄 تغییر محیط و زمان ویدیو
⏩ گسترش بازه زمانی و پیشبینی ادامه ویدیو
🗑 حذف اشیای ناخواسته یا بازتاب آنها در آینه
🎯 جداسازی سوژه متحرک و قراردادن آن روی پرده سبز
🎥 دریافت نماهای مختلف از یک سوژه
🎨 انتقال استایل یک ویدیو به ویدیوی دیگر
👵 تغییر سن افراد در تصویر
✨ و سایر ویرایشهای پیشرفته تنها با متن
این قابلیت از هماکنون برای تمام کاربران اشتراک Runway فعال است.
#هوش_مصنوعی #Runway #AI #Aleph #ویدیو #ویرایش_ویدیو #AIEditing
@rss_ai_ir
با Aleph میتوانید:
🌄 تغییر محیط و زمان ویدیو
⏩ گسترش بازه زمانی و پیشبینی ادامه ویدیو
🗑 حذف اشیای ناخواسته یا بازتاب آنها در آینه
🎯 جداسازی سوژه متحرک و قراردادن آن روی پرده سبز
🎥 دریافت نماهای مختلف از یک سوژه
🎨 انتقال استایل یک ویدیو به ویدیوی دیگر
👵 تغییر سن افراد در تصویر
✨ و سایر ویرایشهای پیشرفته تنها با متن
این قابلیت از هماکنون برای تمام کاربران اشتراک Runway فعال است.
#هوش_مصنوعی #Runway #AI #Aleph #ویدیو #ویرایش_ویدیو #AIEditing
@rss_ai_ir
👏11😁8👍7🔥6🎉5🥰4❤1
📊🤖 بهبود دقت GPT-5 با پرامپت کاستوم جدید
تستها روی مدل gpt-5-nano با تلاش medium و بنچمارک MMLU-PRO نشان دادند که استفاده از نسخه سوم پرامپت کاستوم باعث افزایش دقت از 68.73٪ به 70.20٪ شده است (+1.47٪).
📌 ویژگیهای نسخه جدید
♻️استفاده از تکنیک «ساخت روبریک» در حین فکر کردن مدل
♻️ارزیابی داخلی پاسخها (۰ تا ۱۰۰) و بازنویسی در صورت کیفیت پایین
♻️حذف ترفندهای قدیمی بیاثر و بهبود فرمت خروجی
♻️بدون تحمیل جدول یا پیشنهاد اضافی مگر درخواستی باشد
📈 در نمودار دوم میبینید که تقریباً در تمام حوزهها (مهندسی، علوم کامپیوتر، شیمی، بیزینس، زیست، فیزیک و …) عملکرد کمی بهتر بوده است.
📥 پرامپت و توضیحات کامل:
github.com/DenisSergeevitch/chatgpt-custom-instructions
@rss_ai_ir 🚀 | #هوش_مصنوعی #پرامپت #GPT5 #LLM #پردازش_زبان
تستها روی مدل gpt-5-nano با تلاش medium و بنچمارک MMLU-PRO نشان دادند که استفاده از نسخه سوم پرامپت کاستوم باعث افزایش دقت از 68.73٪ به 70.20٪ شده است (+1.47٪).
📌 ویژگیهای نسخه جدید
♻️استفاده از تکنیک «ساخت روبریک» در حین فکر کردن مدل
♻️ارزیابی داخلی پاسخها (۰ تا ۱۰۰) و بازنویسی در صورت کیفیت پایین
♻️حذف ترفندهای قدیمی بیاثر و بهبود فرمت خروجی
♻️بدون تحمیل جدول یا پیشنهاد اضافی مگر درخواستی باشد
📈 در نمودار دوم میبینید که تقریباً در تمام حوزهها (مهندسی، علوم کامپیوتر، شیمی، بیزینس، زیست، فیزیک و …) عملکرد کمی بهتر بوده است.
📥 پرامپت و توضیحات کامل:
github.com/DenisSergeevitch/chatgpt-custom-instructions
@rss_ai_ir 🚀 | #هوش_مصنوعی #پرامپت #GPT5 #LLM #پردازش_زبان
🔥18❤12😁11👍9🥰7🎉6👏5
🚀 افزایش چشمگیر سقف استفاده از GPT-5 Thinking برای کاربران Plus
سام آلتمن اعلام کرد که سهمیه هفتگی کاربران Plus برای مدل GPT-5-Thinking به ۳۰۰۰ درخواست رسیده است؛ رقمی که چندین برابر مجموع سقف مدلهای استدلالی قبلی مثل o3 و o4-mini است.
📊 آمار جالب از استفاده مدلهای استدلالی
کاربران رایگان: سهم پاسخهای مدلهای استدلالی از کمتر از ۱٪ به ۷٪ افزایش یافته است.
کاربران Plus: این سهم از ۷٪ به ۲۴٪ رسیده است.
نتیجه: تقاضا برای GPT-5-Thinking حدود ۳.۵ برابر رشد کرده و کیفیت تجربه کاربران تازهکار بهطور محسوسی بهتر شده است.
⚙️ روش فعالسازی Thinking بهصورت خودکار
در پایان پرسش بنویسید: «Think better»، «think for long» یا «لطفاً عمیق فکر کن».
یا از تنظیمات بالای چت، حالت Thinking را بهصورت پیشفرض فعال کنید.
💡 جمعبندی: با سقف جدید ۳۰۰۰ درخواست هفتگی، مدل GPT-5 در حالت Thinking میتواند به شکل روزمره در طیف وسیعی از سناریوها، پاسخهایی عمیقتر و دقیقتر ارائه دهد.
#هوش_مصنوعی #GPT5 #Thinking #ChatGPT
@rss_ai_ir
سام آلتمن اعلام کرد که سهمیه هفتگی کاربران Plus برای مدل GPT-5-Thinking به ۳۰۰۰ درخواست رسیده است؛ رقمی که چندین برابر مجموع سقف مدلهای استدلالی قبلی مثل o3 و o4-mini است.
📊 آمار جالب از استفاده مدلهای استدلالی
کاربران رایگان: سهم پاسخهای مدلهای استدلالی از کمتر از ۱٪ به ۷٪ افزایش یافته است.
کاربران Plus: این سهم از ۷٪ به ۲۴٪ رسیده است.
نتیجه: تقاضا برای GPT-5-Thinking حدود ۳.۵ برابر رشد کرده و کیفیت تجربه کاربران تازهکار بهطور محسوسی بهتر شده است.
⚙️ روش فعالسازی Thinking بهصورت خودکار
در پایان پرسش بنویسید: «Think better»، «think for long» یا «لطفاً عمیق فکر کن».
یا از تنظیمات بالای چت، حالت Thinking را بهصورت پیشفرض فعال کنید.
💡 جمعبندی: با سقف جدید ۳۰۰۰ درخواست هفتگی، مدل GPT-5 در حالت Thinking میتواند به شکل روزمره در طیف وسیعی از سناریوها، پاسخهایی عمیقتر و دقیقتر ارائه دهد.
#هوش_مصنوعی #GPT5 #Thinking #ChatGPT
@rss_ai_ir
👏16👍11🔥11🥰10😁10🎉9❤7🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🟦 بررسی مفهوم وکسل (Voxel) در پردازش تصویر سهبعدی
در پردازش تصویر سهبعدی، همانطور که یک پیکسل کوچکترین واحد تصویری دوبعدی است، وکسل (Voxel – Volumetric Pixel) کوچکترین واحد حجم در دادههای سهبعدی محسوب میشود. هر وکسل در واقع یک مکعب یا حجم کوچک است که ویژگیهایی مانند مکان (X,Y,Z)، شدت روشنایی یا حتی رنگ را ذخیره میکند.
📍 کاربردهای وکسل در پردازش تصویر
🩻 تصویربرداری پزشکی: در CT و MRI، وکسلها دادههای حجمی بدن را بازنمایی میکنند.
🛰 مدلسازی سهبعدی و GIS: برای نمایش حجم سازهها، زمین و اجسام.
🤖 بینایی ماشین و رباتیک: در نقشهبرداری سهبعدی با LiDAR یا ساخت مدل محیط.
🎮 گرافیک و بازیسازی: ایجاد جهانهای سهبعدی با دقت و جزئیات بالا.
⚙️ مزیت وکسل نسبت به مشها
♻️نمایش دقیقتر ساختارهای داخلی اجسام (نه فقط سطح آنها).
♻️امکان پردازش دادههای حجمی برای شبیهسازی فیزیکی یا تحلیلی.
📊 چالشها
♻️حجم داده بالا به دلیل ذخیرهسازی سهبعدی.
♻️نیاز به الگوریتمهای فشردهسازی و پردازش سریع.
💡 جمعبندی: وکسلها ستون فقرات پردازش تصویر سهبعدی هستند و نقش کلیدی در پزشکی، مهندسی و شبیهسازی دارند، اما مدیریت حجم بالای داده یکی از چالشهای اصلی آنها است.
#پردازش_تصویر #Voxel #بینایی_ماشین #مدلسازی_سهبعدی
@rss_ai_ir
در پردازش تصویر سهبعدی، همانطور که یک پیکسل کوچکترین واحد تصویری دوبعدی است، وکسل (Voxel – Volumetric Pixel) کوچکترین واحد حجم در دادههای سهبعدی محسوب میشود. هر وکسل در واقع یک مکعب یا حجم کوچک است که ویژگیهایی مانند مکان (X,Y,Z)، شدت روشنایی یا حتی رنگ را ذخیره میکند.
📍 کاربردهای وکسل در پردازش تصویر
🩻 تصویربرداری پزشکی: در CT و MRI، وکسلها دادههای حجمی بدن را بازنمایی میکنند.
🛰 مدلسازی سهبعدی و GIS: برای نمایش حجم سازهها، زمین و اجسام.
🤖 بینایی ماشین و رباتیک: در نقشهبرداری سهبعدی با LiDAR یا ساخت مدل محیط.
🎮 گرافیک و بازیسازی: ایجاد جهانهای سهبعدی با دقت و جزئیات بالا.
⚙️ مزیت وکسل نسبت به مشها
♻️نمایش دقیقتر ساختارهای داخلی اجسام (نه فقط سطح آنها).
♻️امکان پردازش دادههای حجمی برای شبیهسازی فیزیکی یا تحلیلی.
📊 چالشها
♻️حجم داده بالا به دلیل ذخیرهسازی سهبعدی.
♻️نیاز به الگوریتمهای فشردهسازی و پردازش سریع.
💡 جمعبندی: وکسلها ستون فقرات پردازش تصویر سهبعدی هستند و نقش کلیدی در پزشکی، مهندسی و شبیهسازی دارند، اما مدیریت حجم بالای داده یکی از چالشهای اصلی آنها است.
#پردازش_تصویر #Voxel #بینایی_ماشین #مدلسازی_سهبعدی
@rss_ai_ir
👍13❤10🔥10😁10👏9🎉6🥰5
📉🧠 در یک تست آفلاین مقایسهای، میزان IQ مدلهای مختلف هوش مصنوعی اندازهگیری شد.
🔹 مدل Claude-4 Opus با امتیاز 118 بالاترین رتبه را به دست آورد.
🔹 مدلهای o3 Pro و Gemini 2.5 Pro نیز با اختلاف اندک در جایگاههای بعدی قرار گرفتند.
🔹 نکته جالب این است که GPT-5 Thinking با امتیاز 57 پایینترین رکورد را ثبت کرده و حتی در تست آفلاین هم فقط به 70 رسیده است.
📊 این نتایج نشان میدهد که عملکرد مدلهای هوش مصنوعی میتواند بسته به نوع و بهینهسازی آنها بسیار متفاوت باشد، حتی اگر از یک شرکت باشند.
#هوش_مصنوعی #تست_IQ #GPT5 #Claude4
@rss_ai_ir
🔹 مدل Claude-4 Opus با امتیاز 118 بالاترین رتبه را به دست آورد.
🔹 مدلهای o3 Pro و Gemini 2.5 Pro نیز با اختلاف اندک در جایگاههای بعدی قرار گرفتند.
🔹 نکته جالب این است که GPT-5 Thinking با امتیاز 57 پایینترین رکورد را ثبت کرده و حتی در تست آفلاین هم فقط به 70 رسیده است.
📊 این نتایج نشان میدهد که عملکرد مدلهای هوش مصنوعی میتواند بسته به نوع و بهینهسازی آنها بسیار متفاوت باشد، حتی اگر از یک شرکت باشند.
#هوش_مصنوعی #تست_IQ #GPT5 #Claude4
@rss_ai_ir
👏9😁6🔥5🥰4❤3👍3🎉3🤯1
animation.gif
19.5 MB
🌀 چه زمانی باید سراغ پردازش سهبعدی برویم؟
پردازش سهبعدی (3D Processing) همیشه لازم نیست، اما در برخی پروژهها تغییر بازی ایجاد میکند. انتخاب آن باید بر اساس ماهیت دادهها و نیاز پروژه باشد.
🔍 مواردی که پردازش سهبعدی توجیه دارد:
1. دادههای حجمی یا وکسل (Voxel) → مثل تصاویر MRI، CT یا اسکنهای صنعتی که اطلاعات عمق در کل حجم مهم است.
2. تحلیل هندسه و ساختار واقعی اشیا → در رباتیک، مهندسی معکوس یا کنترل کیفیت قطعات پیچیده.
3. بینایی ماشین پیشرفته → تشخیص و ردیابی اجسام در محیطهای سهبعدی (خودروهای خودران، پهپادها).
4. شبیهسازیهای علمی و مهندسی → جریان سیالات، تحلیل سازه، یا شبیهسازیهای پزشکی.
5. مدلسازی و واقعیت مجازی/افزوده (VR/AR) → ایجاد محیطهای تعاملی و دقیق.
⚠️ چه زمانی نرویم سمت 3D؟
وقتی داده دوبعدی جوابگو است و هزینه پردازش پایینتر اهمیت دارد.
وقتی ابعاد اضافه، ارزش افزوده واقعی در دقت یا کاربرد ایجاد نمیکند.
📌 نکته: پردازش سهبعدی نیازمند منابع سختافزاری بیشتر (GPU، حافظه) و الگوریتمهای بهینهسازی خاص است، پس انتخاب آن باید آگاهانه باشد.
@rss_ai_ir 🤖
پردازش سهبعدی (3D Processing) همیشه لازم نیست، اما در برخی پروژهها تغییر بازی ایجاد میکند. انتخاب آن باید بر اساس ماهیت دادهها و نیاز پروژه باشد.
🔍 مواردی که پردازش سهبعدی توجیه دارد:
1. دادههای حجمی یا وکسل (Voxel) → مثل تصاویر MRI، CT یا اسکنهای صنعتی که اطلاعات عمق در کل حجم مهم است.
2. تحلیل هندسه و ساختار واقعی اشیا → در رباتیک، مهندسی معکوس یا کنترل کیفیت قطعات پیچیده.
3. بینایی ماشین پیشرفته → تشخیص و ردیابی اجسام در محیطهای سهبعدی (خودروهای خودران، پهپادها).
4. شبیهسازیهای علمی و مهندسی → جریان سیالات، تحلیل سازه، یا شبیهسازیهای پزشکی.
5. مدلسازی و واقعیت مجازی/افزوده (VR/AR) → ایجاد محیطهای تعاملی و دقیق.
⚠️ چه زمانی نرویم سمت 3D؟
وقتی داده دوبعدی جوابگو است و هزینه پردازش پایینتر اهمیت دارد.
وقتی ابعاد اضافه، ارزش افزوده واقعی در دقت یا کاربرد ایجاد نمیکند.
📌 نکته: پردازش سهبعدی نیازمند منابع سختافزاری بیشتر (GPU، حافظه) و الگوریتمهای بهینهسازی خاص است، پس انتخاب آن باید آگاهانه باشد.
@rss_ai_ir 🤖
🥰8🔥6🎉5❤4👍4👏4😁4
📊 روشهای تخصصی تشخیص ناهنجاری (Anomaly Detection)
تشخیص ناهنجاری یا Anomaly Detection یکی از بخشهای کلیدی در هوش مصنوعی، یادگیری ماشین و تحلیل داده است که هدف آن شناسایی الگوهای غیرعادی در دادههاست. این روشها در حوزههایی مانند تشخیص خرابی تجهیزات، امنیت سایبری، تشخیص تقلب مالی و مانیتورینگ سلامت کاربرد دارند.
---
🔍 دستهبندی اصلی روشها
1️⃣ روشهای آماری (Statistical Methods)
ایده: فرض بر این است که دادههای نرمال از یک توزیع مشخص (مثلاً Gaussian) پیروی میکنند و نقاطی که احتمال وقوعشان کم است، ناهنجار هستند.
مثالها:
Z-Score
Grubbs’ Test
Generalized ESD Test
✅ مزیت: ساده و سریع
❌ ضعف: کارایی پایین در دادههای پیچیده یا توزیع غیرخطی
---
2️⃣ روشهای مبتنی بر فاصله و چگالی (Distance & Density Based)
ایده: نقاط ناهنجار فاصله زیادی از خوشهها دارند یا در مناطق با چگالی کم قرار گرفتهاند.
مثالها:
K-Nearest Neighbors (KNN) for Outlier Detection
Local Outlier Factor (LOF)
DBSCAN برای شناسایی نقاط کمچگالی
✅ مزیت: عدم نیاز به فرض توزیع
❌ ضعف: مقیاسپذیری ضعیف در دیتاستهای خیلی بزرگ
---
3️⃣ روشهای مبتنی بر یادگیری نظارتشده (Supervised Learning)
ایده: برچسبگذاری دادههای نرمال و غیرنرمال، سپس آموزش یک مدل طبقهبندی.
مثالها:
Random Forest
SVM (با کلاسبندی دوتایی)
XGBoost
✅ مزیت: دقت بالا در دادههای برچسبخورده
❌ ضعف: نیاز به دادههای برچسبخورده (که معمولاً نایاب هستند)
---
4️⃣ روشهای بدوننظارت (Unsupervised Learning)
ایده: الگوریتم دادهها را بدون برچسب خوشهبندی کرده و نقاط دورافتاده را ناهنجار تشخیص میدهد.
مثالها:
Isolation Forest
One-Class SVM
PCA for Anomaly Detection
✅ مزیت: بدون نیاز به برچسب
❌ ضعف: حساسیت به نویز
---
5️⃣ روشهای مبتنی بر یادگیری عمیق (Deep Learning)
ایده: استفاده از شبکههای عصبی برای مدلسازی دادههای نرمال و شناسایی نمونههای غیرعادی بر اساس خطای بازسازی یا احتمال تولید.
مثالها:
Autoencoders (و Variational Autoencoders)
LSTM Autoencoders برای دادههای زمانی
GAN-based Anomaly Detection (مثل AnoGAN)
✅ مزیت: قدرت مدلسازی بالا در دادههای پیچیده
❌ ضعف: نیاز به منابع محاسباتی زیاد و داده کافی
---
6️⃣ روشهای ترکیبی (Hybrid Approaches)
ایده: ترکیب چند الگوریتم برای بهبود دقت و کاهش نرخ خطا.
مثال: استفاده از Isolation Forest بهعنوان پیشپردازش و سپس Autoencoder برای تحلیل عمیق.
---
💡 نکته صنعتی:
در مانیتورینگ صنعتی (مثل تشخیص خرابی موتور یا توربین)، ترکیب مدلهای پیشبینی سری زمانی (مثل Prophet یا LSTM) با روشهای anomaly detection بسیار مؤثر است.
---
📍 @rss_ai_ir | #هوش_مصنوعی #AnomalyDetection #یادگیری_ماشین #DeepLearning #داده_کاوی
تشخیص ناهنجاری یا Anomaly Detection یکی از بخشهای کلیدی در هوش مصنوعی، یادگیری ماشین و تحلیل داده است که هدف آن شناسایی الگوهای غیرعادی در دادههاست. این روشها در حوزههایی مانند تشخیص خرابی تجهیزات، امنیت سایبری، تشخیص تقلب مالی و مانیتورینگ سلامت کاربرد دارند.
---
🔍 دستهبندی اصلی روشها
1️⃣ روشهای آماری (Statistical Methods)
ایده: فرض بر این است که دادههای نرمال از یک توزیع مشخص (مثلاً Gaussian) پیروی میکنند و نقاطی که احتمال وقوعشان کم است، ناهنجار هستند.
مثالها:
Z-Score
Grubbs’ Test
Generalized ESD Test
✅ مزیت: ساده و سریع
❌ ضعف: کارایی پایین در دادههای پیچیده یا توزیع غیرخطی
---
2️⃣ روشهای مبتنی بر فاصله و چگالی (Distance & Density Based)
ایده: نقاط ناهنجار فاصله زیادی از خوشهها دارند یا در مناطق با چگالی کم قرار گرفتهاند.
مثالها:
K-Nearest Neighbors (KNN) for Outlier Detection
Local Outlier Factor (LOF)
DBSCAN برای شناسایی نقاط کمچگالی
✅ مزیت: عدم نیاز به فرض توزیع
❌ ضعف: مقیاسپذیری ضعیف در دیتاستهای خیلی بزرگ
---
3️⃣ روشهای مبتنی بر یادگیری نظارتشده (Supervised Learning)
ایده: برچسبگذاری دادههای نرمال و غیرنرمال، سپس آموزش یک مدل طبقهبندی.
مثالها:
Random Forest
SVM (با کلاسبندی دوتایی)
XGBoost
✅ مزیت: دقت بالا در دادههای برچسبخورده
❌ ضعف: نیاز به دادههای برچسبخورده (که معمولاً نایاب هستند)
---
4️⃣ روشهای بدوننظارت (Unsupervised Learning)
ایده: الگوریتم دادهها را بدون برچسب خوشهبندی کرده و نقاط دورافتاده را ناهنجار تشخیص میدهد.
مثالها:
Isolation Forest
One-Class SVM
PCA for Anomaly Detection
✅ مزیت: بدون نیاز به برچسب
❌ ضعف: حساسیت به نویز
---
5️⃣ روشهای مبتنی بر یادگیری عمیق (Deep Learning)
ایده: استفاده از شبکههای عصبی برای مدلسازی دادههای نرمال و شناسایی نمونههای غیرعادی بر اساس خطای بازسازی یا احتمال تولید.
مثالها:
Autoencoders (و Variational Autoencoders)
LSTM Autoencoders برای دادههای زمانی
GAN-based Anomaly Detection (مثل AnoGAN)
✅ مزیت: قدرت مدلسازی بالا در دادههای پیچیده
❌ ضعف: نیاز به منابع محاسباتی زیاد و داده کافی
---
6️⃣ روشهای ترکیبی (Hybrid Approaches)
ایده: ترکیب چند الگوریتم برای بهبود دقت و کاهش نرخ خطا.
مثال: استفاده از Isolation Forest بهعنوان پیشپردازش و سپس Autoencoder برای تحلیل عمیق.
---
💡 نکته صنعتی:
در مانیتورینگ صنعتی (مثل تشخیص خرابی موتور یا توربین)، ترکیب مدلهای پیشبینی سری زمانی (مثل Prophet یا LSTM) با روشهای anomaly detection بسیار مؤثر است.
---
📍 @rss_ai_ir | #هوش_مصنوعی #AnomalyDetection #یادگیری_ماشین #DeepLearning #داده_کاوی
🥰7🎉7🔥6👏6❤5👍4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 فاینتیونینگ کارآمد مدلهای زبانی با PEFT
✳️در پروژههای هوش مصنوعی، مخصوصاً مدلهای زبانی بزرگ (LLM)، فاینتیونینگ کامل تمام وزنها (Full Fine-Tuning) بسیار پرهزینه و نیازمند GPUهای قدرتمند است. تکنیک PEFT (Parameter-Efficient Fine-Tuning) با هدف کاهش این هزینهها معرفی شده و امروز یکی از رایجترین رویکردها برای سفارشیسازی مدلها در حوزه تخصصی است.
🔍 ایده اصلی PEFT
بهجای تغییر دادن همه پارامترهای مدل (که ممکن است میلیاردها وزن باشد)، فقط یک زیرمجموعه کوچک از پارامترها یا لایههای اضافه شده (مثل LoRA – Low-Rank Adaptation) آموزش داده میشود. وزنهای اصلی مدل پیشآموزشدیده (Pretrained Weights) ثابت میمانند و تنها ماتریسهای کمرتبهی افزوده شده بهروزرسانی میشوند.
⚙️ مهمترین روشهای PEFT
LoRA (Low-Rank Adaptation) 🟦
تزریق دو ماتریس کمرتبه (A و B) به وزنهای مدل
بهروزرسانی فقط این ماتریسها
کاهش چشمگیر تعداد پارامترهای قابلآموزش (تا 1000 برابر کمتر از Full Fine-Tuning)
Prefix-Tuning 🟧
اضافه کردن یک توالی از "توکنهای پیشوند" قابلآموزش به ورودی هر لایه ترنسفورمر
مناسب برای وظایف تولید متن (NLG) و دیالوگ
Prompt-Tuning 🟨
آموزش چند embedding بهعنوان پرامپت ثابت برای هدایت مدل مناسب برای سناریوهایی که ورودی همیشه ساختار مشخصی دارد
Adapters 🟩
اضافه کردن ماژولهای کوچک بین لایههای ترنسفورمر مدل اصلی ثابت میماند و فقط آداپترها آموزش میبینند
📊 مزایا برای پروژههای صنعتی
💾 نیاز کمتر به حافظه GPU (مثلاً 8GB هم کافی است)
⏱️ سرعت بالاتر آموزش و استقرار
🔄 قابلیت اشتراک و ترکیب ماژولهای فاینتیون (Adapter Fusion)
📦 امکان استفاده روی مدلهای خیلی بزرگ بدون منابع ابری گران
💡 کاربردهای تخصصی
♻️سفارشیسازی GPT یا LLaMA برای تحلیل متون حقوقی، پزشکی یا فنی
♻️آموزش مدلهای چندزبانه روی دادههای سازمانی محدود
♻️ایجاد نسخههای سبکتر و بهینه برای اجرا روی لبه (Edge AI)
📌 جمعبندی
روشPEFT با تمرکز روی تغییرات کمهزینه و ماژولار، فاینتیونینگ را برای همه قابلدسترس کرده است. بهجای روزها آموزش روی چندین GPU، میتوان با منابع محدود، مدلهای قدرتمند را دقیقاً مطابق نیاز حوزه تخصصی خود تنظیم کرد.
@rss_ai_ir 🤖
| #هوش_مصنوعی #LLM #PEFT #LoRA #پردازش_زبان_طبیعی
✳️در پروژههای هوش مصنوعی، مخصوصاً مدلهای زبانی بزرگ (LLM)، فاینتیونینگ کامل تمام وزنها (Full Fine-Tuning) بسیار پرهزینه و نیازمند GPUهای قدرتمند است. تکنیک PEFT (Parameter-Efficient Fine-Tuning) با هدف کاهش این هزینهها معرفی شده و امروز یکی از رایجترین رویکردها برای سفارشیسازی مدلها در حوزه تخصصی است.
🔍 ایده اصلی PEFT
بهجای تغییر دادن همه پارامترهای مدل (که ممکن است میلیاردها وزن باشد)، فقط یک زیرمجموعه کوچک از پارامترها یا لایههای اضافه شده (مثل LoRA – Low-Rank Adaptation) آموزش داده میشود. وزنهای اصلی مدل پیشآموزشدیده (Pretrained Weights) ثابت میمانند و تنها ماتریسهای کمرتبهی افزوده شده بهروزرسانی میشوند.
⚙️ مهمترین روشهای PEFT
LoRA (Low-Rank Adaptation) 🟦
تزریق دو ماتریس کمرتبه (A و B) به وزنهای مدل
بهروزرسانی فقط این ماتریسها
کاهش چشمگیر تعداد پارامترهای قابلآموزش (تا 1000 برابر کمتر از Full Fine-Tuning)
Prefix-Tuning 🟧
اضافه کردن یک توالی از "توکنهای پیشوند" قابلآموزش به ورودی هر لایه ترنسفورمر
مناسب برای وظایف تولید متن (NLG) و دیالوگ
Prompt-Tuning 🟨
آموزش چند embedding بهعنوان پرامپت ثابت برای هدایت مدل مناسب برای سناریوهایی که ورودی همیشه ساختار مشخصی دارد
Adapters 🟩
اضافه کردن ماژولهای کوچک بین لایههای ترنسفورمر مدل اصلی ثابت میماند و فقط آداپترها آموزش میبینند
📊 مزایا برای پروژههای صنعتی
💾 نیاز کمتر به حافظه GPU (مثلاً 8GB هم کافی است)
⏱️ سرعت بالاتر آموزش و استقرار
🔄 قابلیت اشتراک و ترکیب ماژولهای فاینتیون (Adapter Fusion)
📦 امکان استفاده روی مدلهای خیلی بزرگ بدون منابع ابری گران
💡 کاربردهای تخصصی
♻️سفارشیسازی GPT یا LLaMA برای تحلیل متون حقوقی، پزشکی یا فنی
♻️آموزش مدلهای چندزبانه روی دادههای سازمانی محدود
♻️ایجاد نسخههای سبکتر و بهینه برای اجرا روی لبه (Edge AI)
📌 جمعبندی
روشPEFT با تمرکز روی تغییرات کمهزینه و ماژولار، فاینتیونینگ را برای همه قابلدسترس کرده است. بهجای روزها آموزش روی چندین GPU، میتوان با منابع محدود، مدلهای قدرتمند را دقیقاً مطابق نیاز حوزه تخصصی خود تنظیم کرد.
@rss_ai_ir 🤖
| #هوش_مصنوعی #LLM #PEFT #LoRA #پردازش_زبان_طبیعی
😁9🎉8🔥7👏6❤3🥰3👍1