کارگروه علم داده
430 subscribers
458 photos
14 videos
119 files
431 links
ارتباط با ادمین:
@Smn_statistics
Download Telegram
⭕️ دوره رایگان یادگیری ماشین به فارسی

👨🏻‍💻 دکتر رضا منصفی استادیار گروه مهندسی کامپیوتر دانشگاه فردوسی مشهد، دوره آموزشی جامع "یادگیری ماشین" رو به زبان فارسی و کاملاً رایگان منتشر کردن.

📑 این دوره‌ شامل 18 ویدیوی آموزشی و بیش از 26 ساعت آموزش جامع و کاربردی مباحث ماشین لرنینگ میشه.

برای دسترسی به منابع این دوره فوق العاده، می‌تونین از لینک زیر استفاده کنین.👇🏼

🏷 لینک دوره
◼️
دوره Machine Learning


#️⃣ #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
📎
@MachineLearning_ir
👍2
📂 تمامی دوره‌های رایگان یادگیری ماشین
💻 دانشگاه استنفورد

👨🏻‍💻 من امسال این دوره‌ها رو گذروندم و واقعا بهم کمک کرد دید عمیق‌تری نسبت به پردازش زبان طبیعی (NLP)، ترنسفورمرها، یادگیری تقویتی و حتی ساخت مدل‌های زبانی بزرگ (LLMs) پیدا کنم.

✏️ یکی از نکات مثبت این دوره‌ها اینه که، اساتید این دوره‌ها از بهترین‌ها هستن (مثل اندرو ان جی که نیازی به معرفی نداره!) و همه چیز به زبون ساده و کاربردی توضیح داده. از احتمال و توضیح‌پذیری مدل‌ها گرفته تا یادگیری ماشین با گراف‌ها.


1️⃣ تئوری احتمالات برای دانشمندان کامپیوتر

2️⃣ یادگیری ماشین با تدریس Andrew Ng

3️⃣ پردازش زبان طبیعی با یادگیری عمیق

4️⃣ توضیح‌پذیری در یادگیری ماشین

5️⃣ یادگیری تقویتی

6️⃣ مدل‌های مولد یادگیری عمیق

7️⃣ ساخت مدل‌های زبان بزرگ (LLMs)

8️⃣ یادگیری ماشین با گراف‌ها

9️⃣ همه چیز درباره ترنسفورمرها



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
🔹 دوره‌های رایگان «یادگیری ماشین» به فارسی


👨🏻‍💻
دکتر صادق رئیسی استادیار دانشکده فیزیک دانشگاه صنعتی شریف، ۲ دوره "یادگیری ماشین" که بیش از 60 ساعت محتوای ویدیویی به زبان فارسی داره رو به رایگان در کانال آپاراتشون منتشر کردن.👌🏼


✔️ می‌تونین از طریق لینک زیر، به صورت کاملا رایگان به محتوای این دوره‌ها دسترسی داشته باشین:👇


✍️ لیست دوره‌ها
◾️
یادگیری ماشین Pt.1
◽️یادگیری ماشین Pt.2



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
2
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 با این روش مشکل داده‌های نامتوازن رو به سادگی حل کن!


👨🏻‍💻 یه مشکل مهم تو یادگیری ماشین، داده‌های نامتوازن هستن؛ یعنی یکی از کلاس‌ها (مثلاً موارد نادر) تعدادشون خیلی کمتر از بقیه‌ست. اگه بخوای این موارد کم‌یاب رو هم درست‌تر پیش‌بینی کنی، باید یه فکری براشون بکنی. یکی از روش‌های معروف، SMOTE هست.


حالا SMOTE دقیقاً چی کار می‌کنه؟ ایده‌ش خیلی ساده و در عین حال تاثیرگذاره:

1️⃣ اول SMOTE میاد سراغ هر نقطه قرمز (یعنی کلاس اقلیت) و نزدیک‌ترین همسایه‌های قرمز اون رو پیدا می‌کنه.

2️⃣ یه همسایه رو به صورت تصادفی انتخاب می‌کنه و بین اون دو تا نقطه یه خط مستقیم فرض می‌کشه.

3️⃣ یه نقطه جدید، جایی روی همین خط (هر جایی که شد، کاملاً تصادفی) ایجاد می‌کنه.

4️⃣در آخر این کار رو برای همه نمونه‌های اقلیت تکرار می‌کنه (یا تا زمانی که تعداد کافی داده مصنوعی ساختیم).


به این ترتیب، با تولید داده مصنوعی بین نقاط واقعی اقلیت، داده‌ها متعادل‌تر می‌شن و مدل (مثلاً رگرسیون لجستیک) می‌تونه مرز تصمیم‌گیری بهتری بذاره و نقاط نادر رو هم بهتر یاد بگیره.


🧬 SMOTE
📖 Documentation



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
🕰 ۱۰ مدل برتر پیش‌بینی سری‌های زمانی


1️⃣ مدل TCN

✏️ مدل کانولوشنی برای درک الگوهای بلندمدت در سری‌های زمانی.

✔️ خوبیش اینه که: سریع، موازی و پایدار آموزش می‌بینه.

بدیش اینه که: ساختارش برای بعضیا که با RNN کار کردن، ممکنه گیج‌کننده باشه.

💡 کاربرد: سیگنال‌های پرنوسان، سری‌های با حافظه طولانی، داده‌های حسگر یا بازار مالی.



2️⃣ مدل TS-Mixer

✏️ مدل سبک و سریع مبتنی بر شبکه عصبی MLP برای سری‌های پیچیده.

✔️ خوبیش اینه که: سریع، قابل توسعه و مناسب داده‌های سنگین و پرتراکم.

بدیش اینه که: هنوز بیشتر در فاز تحقیقاتی استفاده می‌شه.

💡 کاربرد: داده‌های چندمتغیره و پرتکرار مثل قیمت رمزارز، ترافیک شبکه یا داده‌های صنعتی.



3️⃣ مدل TimesNet

✏️ مدل عمیق برای یادگیری الگوهای چندلایه و بلندمدت زمانی.

✔️ خوبیش اینه که: برای پیش‌بینی‌های بلندمدت با چند فصل‌پذیری عملکرد عالی داره.

بدیش اینه که: هنوز کاربردهای تجاری زیادی براش منتشر نشده.

🔧 کاربرد: سری‌های پیچیده مثل آب‌وهوا، مصرف انرژی یا تحلیل روند بلندمدت بازار.



4️⃣ مدل N-BEATS

✏️ مدل یادگیری عمیق بدون فرض خاص روی ساختار سری زمانی.

✔️ خوبیش اینه که: انعطاف‌پذیر و مستقل از ساختار خاصیه.

بدیش اینه که: نیاز به داده زیاد داره و تفسیر نتایجش ساده نیست.

🔧 کاربرد: پیش‌بینی روند و فصل‌پذیری در سری‌های بدون الگوی مشخص.



5️⃣ مدل DeepAR / DeepVAR

✏️ مدل دنباله‌ای مبتنی بر RNN برای پیش‌بینی توزیعی

✔️ خوبیش اینه که: با تعداد زیادی سری مشابه خیلی خوب مقیاس‌پذیره.

بدیش اینه که: تو درک وابستگی‌های خیلی طولانی ممکنه ضعف داشته باشه.

💡 کاربرد: پیش‌بینی فروش در فروشگاه‌های مختلف یا عملکرد شعب مختلف یک سیستم.



6️⃣ مدل Temporal Fusion Transformer

✏️ مدل attentionمحور برای تحلیل سری‌های چندمتغیره پیچیده.

✔️ خوبیش اینه که: هم اطلاعات گذشته رو خوب می‌فهمه، هم وضعیت فعلی رو.

بدیش اینه که: تنظیماتش پیچیده‌ست و دیتای زیاد می‌خواد.

💡 کاربرد: پیش‌بینی‌های بلندمدت با ورودی‌های متنوع مثل قیمت، دما، تقویم و رویداد.



7️⃣ مدل Prophet

✏️ مدل جمع‌پذیر با توانایی تشخیص روند، فصل‌پذیری و مناسبت‌ها.

✔️ خوبیش اینه که: استفاده‌ش راحته و خودش فصل‌ها و تعطیلات رو تشخیص می‌ده.

بدیش اینه که: تو نوسانات سریع یا جهش‌های ناگهانی دقیق نیست.

💡 کاربرد: داده‌های کسب‌وکار، تحلیل فروش، کمپین‌های بازاریابی و گزارش‌های فصلی.



8️⃣ مدل Gradient Boosting با ویژگی‌های lag

✏️ مدل درخت تصمیم با ویژگی‌های مهندسی‌شده زمانی (مثل lag و rolling mean).

✔️ خوبیش اینه که: با الگوهای پیچیده و داده‌های غیرخطی خوب کنار میاد.

بدیش اینه که: باید خودت دستی ویژگی‌های زمانی بسازی.

💡 کاربرد: سری‌های چندمتغیره با متغیرهای خارجی مثل تبلیغات، قیمت یا شرایط آب‌وهوا.



9️⃣ مدل Exponential Smoothing

✏️ مدل آماری برای سری‌هایی با روند یا فصل‌پذیری نرم.

✔️ خوبیش اینه که: سریع، ساده و قابل تفسیر توسط افراد غیرمتخصص هم هست.

بدیش اینه که: توی داده‌های پرنوسان یا با تغییرات شدید عملکرد ضعیفی داره.

💡 کاربرد: داده‌های آرام و فصلی مثل مصرف انرژی یا تولید ماهانه کارخانه‌ها.



1️⃣ مدل ARIMA / SARIMA

✏️ مدل کلاسیک آماری برای سری‌های خطی و فصلی.

✔️ خوبیش اینه که: توی داده‌های پایدار و فصلی عالی کار می‌کنه.

بدیش اینه که: برای داده‌های غیرخطی یا وقتی متغیر بیرونی داریم، ضعف داره.

💡 کاربرد: پیش‌بینی فروش، دما، یا روندهای کوتاه‌مدت تک‌متغیره.



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
👍1
🔥 5 کتابخونه خفن برای توضیح مدل‌های ML !


👨🏻‍💻 یادگیری ماشین فقط ساختن مدل نیست، باید بدونی مدلت چطوری فکر می‌کنه و خروجی می‌ده!

هرچی شفافیت مدل‌ها بیش‌تر = اعتماد بیش‌تر

من اینجا ۵ تا کتابخونه‌ی فوق‌العاده برای توضیح و تفسیر مدل‌های ML آوردم که واقعاً به دردتون می‌خورن!👇


🔢 کتابخونه SHAP

✏️ مشهورترین روش برای توضیح مدل‌ها: الگوریتم SHAP از مفهوم اهمیت ویژگی‌ها به صورت افزایشی استفاده می‌کنه تا تأثیر هر ویژگی روی خروجی مدل رو نشون بده.

در واقع یه دید کلی بهت می‌ده که مدل چطوری تصمیم می‌گیره!

▶️ بهترین برای؛ فهمیدن تأثیر هر ویژگی در مدل‌های پیچیده.



🔢 کتابخونه LIME

✏️ یه روش مدل-آگنوستیک (یعنی به نوع مدل وابسته نیست) که خیلی شبیه SHAP عمل می‌کنه.

تفاوتش اینه که مدل رو در سطح محلی بررسی می‌کنه، یعنی به جای نگاه کردن به کل مدل، روی پیش‌بینی‌های خاصی تمرکز داره.

▶️ بهترین برای؛ توضیح پیش‌بینی‌های خاص، مخصوصاً تو مدل‌های پیچیده مثل شبکه‌های عصبی.



🔢 کتابخونه Eli5

✏️ وقتی مدل مثل جعبه سیاهه، Eli5 میاد به زبون ساده توضیح میده! این کتابخونه کدهای ML رو دیباگ می‌کنه، مدل‌ها رو بررسی می‌کنه و خروجی‌ها رو شفاف نشون میده.

از Scikit-Learn و Keras پشتیبانی می‌کنه و خیلی سریع و آسونه!

▶️ بهترین برای؛ دیباگ کردن و بررسی مدل‌های کلاسیک و بیشتر مبتنی بر طبقه‌بندی.



🔢 کتابخونه AIX360

✏️ این یکی از محصولات IBM برای توضیح مدل‌های هوش مصنوعی توی داده‌های مختلف (جدولی، متنی، تصویری و سری‌های زمانی) هست.

از الگوریتم‌های مختلف برای تحلیل شفافیت مدل استفاده می‌کنه و کمک می‌کنه که مدل‌های پیچیده رو بهتر درک کنی!

▶️ بهترین برای؛ تحلیل مدل‌هایی که با داده‌های غیرجدولی مثل متن و تصویر کار می‌کنن.



🔢 کتابخونه InterpretML

✏️ یه پکیج خفن از مایکروسافت که هم مدل‌های قابل تفسیر (glassbox) ارائه میده، هم می‌تونه مدل‌های جعبه‌سیاه رو توضیح بده.

این کتابخونه از روش‌های جدید و پیشرفته‌ی تفسیر مدل‌ها استفاده می‌کنه و یکی از ابزارهای مهم برای هوش مصنوعی مسئولانه محسوب میشه.

▶️ بهترین برای؛ ترکیب مدل‌های قابل‌توضیح و جعبه‌سیاه برای بررسی رفتار مدل‌ها.



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
1
🔴 10 تا از پرکاربردترین‌ها توابع زیان در ML


👨🏻‍💻 وقتی می‌خوای مدلت رو آموزش بدی، انتخاب درست تابع زیان از نون شب هم واجب‌تره!

بسته به اینکه مدل رگرسیون باشه یا طبقه‌بندی، باید بدونی کدوم تابع برات بهتر جواب می‌ده.


📂 مدل رگرسیون


🔢 خطای بایاس میانگین

⬅️ میانگین خطای مدل رو نشون می‌ده اما خیلی استفاده نمی‌شه چون خطای مثبت و منفی همدیگه رو خنثی می‌کنن.


🔢 میانگین قدرمطلق خطا

⬅️ میانگین اختلاف مطلق بین پیش‌بینی و مقدار واقعی. برای مدل‌هایی خوبه که می‌خوای همه خطاها رو یکسان ببینی.


🔢 میانگین مربعات خطا

⬅️ خطاهای بزرگ‌تر رو شدیدتر جریمه می‌کنه؛ واسه مدل‌هایی که Outlier داری یکم حساسه.


🔢 ریشه میانگین مربعات خطا

⬅️ مثل MSEئه، ولی تهش رادیکال می‌گیری، واحدش می‌شه مثل مقدار واقعی y.


🔢 تابع هابر

⬅️ ترکیبی از MAE و MSEئه. برای خطاهای کوچیک MSE، برای خطاهای بزرگ MAE. ولی یه پارامتر اضافه داره (دلتا).


🔢 تابع زیان لاگ-کاش

⬅️ جایگزین بدون پارامتر برای هابر. گرچه یه کم سنگین‌تره محاسباتش.



📂 مدل طبقه‌بندی


1⃣ زیان متقاطع دودویی

⬅️ برای مدل‌های دوتایی. تفاوت بین برچسب واقعی و احتمال پیش‌بینی‌شده رو با لگاریتم حساب می‌کنه.


🔢 تابع زیان هینج

⬅️ مخصوص SVMهاست. حتی اگه پیش‌بینی درست باشه ولی با اطمینان پایین، باز هم جریمه می‌شه.


🔢 زیان متقاطع چندکلاسه

⬅️ نسخه‌ی چندکلاسه‌ی BCE. مرسوم‌ترین تابع برای طبقه‌بندی.


🔢 واگرایی کولبک-لایبلر

⬅️ وقتی می‌خوای یه توزیع رو با یه توزیع دیگه تقریب بزنی. تو کلاسه‌بندی معمولی، همون کراس‌انتروپیه، ولی تو مدل‌های فشرده‌سازی یا t-SNE کاربرد داره.



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
1
📖 کتاب رایگان و بی‌نظیر «مقدمه‌ای بر آمار»


👨🏻‍💻 بدون یه پایه محکم تو آمار، کار تو حوزه‌هایی مثل یادگیری ماشین و تحلیل داده واقعا سخته. من خودم با خوندن کتاب Introduction to Modern Statistics کلی جلو افتادم. هم محتواش روان و ساده‌ست، هم رایگانه!

📘 این کتاب به مفاهیمی مثل تحلیل اکتشافی داده، رگرسیون، آزمون فرضیه و کلی موضوع دیگه می‌پردازه.

جدیدا هم نسخه دومش منتشر شده، هم محتواش به‌روزتر شده، هم تمرین‌های بیشتری داره.


🔖 Intro to Modern Statistics
📖 Book (Web)



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
👨🏻‍💻 دانشگاه صنعتی دانمارک دوره تخصصی MLOps رو به رایگان منتشر کرد. تو این دوره مفاهیم و ابزارهای مورد نیاز برای مدیریت و اجرای مدل‌های یادگیری ماشین رو در محیط‌های تحقیقی و تولیدی یاد می‌گیرین.

📂 برخی از ویژگی‌های این دوره:

۱) درسنامه ها + تمرین‌های عملی + پروژه‌های کاربردی
۲) تاکید روی ابزارهای عملی و کدنویسی برای اجرای مدل‌های ML در محیط‌های تولیدی
۳) انجام پروژه‌های کاربردی روی یک طرح واقعی
۴) استفاده از ابزارها و چارچوب‌های مختلف طی دوره.


🏷 Machine Learning Operations Course
🚀
DTU-MLOps


#️⃣ #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
📎
@MachineLearning_ir
📺 دوره جامع یادگیری ماشین Hugging Face


👨🏻‍💻 چالش واقعی تو یادگیری ماشین، فقط فهمیدن الگوریتم‌ها و ریاضیاتش نیست، اینه که بدونی کِی و کجا باید از چه مدلی استفاده کنی!

✏️ پلتفرم Hugging Face اومده یه دوره‌ی جامع رایگان منتشر کرده که تو ۸۰ تا ویدیو و بیش از ۱۳ ساعت محتوا، یادگیری ماشین رو نه فقط روی کاغذ، بلکه با تمرین واقعی و ابزارهای به‌روز یادت می‌ده!


💸 این دوره شامل:

مبانی یادگیری ماشین به زبان ساده ولی کاربردی.

آموزش و فاین‌تیون مدل‌های NLP مثل BERT و DistilBERT.

طراحی و پیاده‌سازی پایپ‌لاین‌های ML

و...


🤗 Hugging Face Course
🖥 Course Homepage
😉 Youtube Playlist



🌐 #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
💡 @MachineLearning_ir
📱 پیج اینستاگرام:
💡 @MachineLearning_fa
Please open Telegram to view this post
VIEW IN TELEGRAM
👨🏻‍💻 جاناتان شوچک استاد علوم کامپیوتر دانشگاه کالیفرنیا دوره مقدماتی یادگیری ماشین رو به همراه تمامی منابع طی دوره، به رایگان منتشر کرده. اگه دنبال یادگیری مبانی نظری، الگوریتم‌ها، روش‌ها و کاربردهای یادگیری ماشین در پروژه‌های واقعی هستین، این دوره رو از دست ندین.💯

🔷 از جمله مباحثی که در این دوره پوشش داده میشه، مدل‌های یادگیری عمیق از جمله CNNs و ترنسفورمرها، شبکه‌های عصبی گرافی برای تسک‌های بینایی و زبانی و مدل‌های مارکوفی برای یادگیری تقویتی و رباتیکه.

اینم لینک‌ تمام منابع دوره:👇🏼

🏷 Introduction to ML CS 189/289A
🌐
Course Homepage
🎬 Lecture Videos


#️⃣ #یادگیری_ماشین #MachineLearning

💡 مهندس ML شوید :
📎
@MachineLearning_ir
🆒1