آموزش دیتاساینس و ماشین‌لرنینگ

💡

در K-NN چطور مقدار بهینه انتخاب میشه؟

هیچ قانون مشخصی برای انتخاب یک k استاندارد وجود نداره. این مقدار بسته به دیتاست متفاوته اما به طور کلی، هدف اصلی حفظ k در حدیه که:

- کوچک باشه تا نمونه‌های سایر کلاس‌ها رو حذف کنه اما
- به اندازه کافی بزرگ باشه تا هرگونه نویز توی داده‌ها رو به حداقل برسونه.

یک راه برای جستجوی مقدار بهینه این پارامتر، Elbow method هست که شامل ایجاد یک حلقه for هست که مدل‌های مختلف KNN رو با مقادیر k مختلف آموزش می‌ده، و بعد از مدلی که بالاترین دقت رو داره، استفاده می‌کنه.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9❤3👨‍💻1

570 views17:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

پیچیدگی محاسباتی KNN

توی K نزدیک‌ترین همسایه، بیشترین هزینه محاسباتی برای فاز پیش‌بینی هست، جایی که الگوریتم باید K نزدیک‌ترین همسایه‌ به یک نقطه داده جدید رو شناسایی کنه.

الگوریتم K-NN باید برای هر نقطه‌ای که مورد بررسی قرار می‌گیره، فاصله‌اش رو با تمام n نقطه دیگه داده‌ها حساب کنه و برای این محاسبه، باید از تمام d ویژگی‌های هر نقطه عبور کنه (O(n * d))، در نتیجه پیچیدگی محاسباتی زیادی داره.

🔵 عوامل پیچیدگی محاسباتی KNN

🔵تعداد نمونه‌ها (N): با افزایش تعداد داده‌ها، زمان لازم برای پیدا کردن K همسایه نزدیک بیشتر میشه.

🔵تعداد ویژگی‌ها (D): با افزایش تعداد ویژگی‌ها، محاسبه فاصله بین نمونه‌ها پیچیده‌تر و زمان‌برتر میشه.

🔵مقدار K: انتخاب K تاثیر زیادی روی دقت و پیچیدگی محاسباتی داره. مقدار بزرگ‌تر K می‌تونه به کاهش نویز کمک کنه اما ممکنه منجر به ایجاد مدل‌های کم دقت‌تر میشه.

🔵

بهینه‌سازی پیچیدگی محاسباتی

🔵استفاده از الگوریتم‌های KD-Tree یا Ball Tree: این روش‌ها به کاهش تعداد محاسبات لازم برای پیدا کردن K همسایه نزدیک کمک می‌کنن.

🔵کاهش ابعاد: استفاده از تکنیک‌های کاهش ابعاد مثل PCA (تحلیل مؤلفه‌های اصلی) می‌تونه تعداد ویژگی‌های داده‌ها رو کاهش بده و در نتیجه زمان محاسباتی رو کم کنه.

🔵انتخاب هوشمندانه‌ی K: استفاده از روش‌های مختلف برای تعیین بهترین مقدار K می‌تونه به بهبود دقت و کاهش پیچیدگی محاسباتی کمک کنه.

🔵توی داده‌های بزرگ و پیچیده، K نزدیک‌ترین همسایه می‌تونه به شدت کند عمل کنه. توی این موارد، استفاده از تکنیک‌های پردازش موازی و توزیع‌شده، مانند Apache Spark یا Hadoop، به افزایش کارایی کمک می‌کنه.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7👌2👏1

622 views08:01

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۴۵: کدوم یک از الگوریتم‌های یادگیری ماشین زیر می‌تونه برای جایگزین کردن مقادیر گمشده هم توی متغیرهای Categorical و هم توی متغیرهای پیوسته استفاده شه؟

Anonymous Quiz

👍6😎4🔥1

73 voters559 views13:47

آموزش دیتاساینس و ماشین‌لرنینگ

💡

تفاوت بین k-Means و KNN

الگوریتم k-Means یه الگوریتم خوشه‌بندیه که سعی می‌کنه مجموعه‌ای از نقاط رو به k مجموعه تقسیم کنه؛ به طوری که نقاط هر خوشه نزدیک به هم باشن و بدون نظارته.

الگوریتم KNN یه الگوریتم طبقه‌بندی (یا رگرسیون) هست که برای تعیین طبقه‌بندی یه نقطه، طبقه‌بندی k نزدیک‌ترین نقطه رو ترکیب می‌کنه. باناظره چون سعی می‌کنه یه نقطه رو بر اساس طبقه‌بندی شناخته شده سایر نقاط طبقه‌بندی کنه.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👌9❤1👏1

568 views17:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

بررسی ساختار K-Dimensional Trees در KNN

درخت KD (درخت K-بعدی) ساختارهای داده پیچیده‌ای هست که برای سازماندهی و جستجوی کارآمد داده‌های چند بعدی به کار می‌ره.

الگوریتم درخت KD فضای داده رو با استفاده از صفحات hyperplanes که عمود بر محورهای مختصات هستن، تقسیم می‌کنه و یک ساختار درختی دودویی ایجاد می‌کنه. ساختار درخت‌های KD بسیار مناسب و مؤثر برای مرتب‌سازی و دسته‌بندی اطلاعات در فضاهای گسترده و چندبعدیه.

الگوریتم درخت KD توی کتابخانه‌های پایتونی مثل Scikit-learn پیاده‌سازی شده، که به کاربران ابزارهای قدرتمندی رو برای بهینه‌سازی عملیات جستجوی نزدیک‌ترین همسایه در ابعاد و ویژگی‌های مختلف دیتاست می‌ده.

کاربرد در KNN

توی KNN، درخت‌های K-بعدی برای کاهش زمان جستجو توی فضای چندبعدی استفاده میشن. به جای بررسی تک تک نقاط، این الگوریتم می‌تونه با پیمایش درخت، سریع‌تر نقاط نزدیک رو پیدا کنه.

پیچیدگی‌ها و بهینه‌سازی‌ها

درخت‌های K-بعدی می‌تونن نامتعادل بشن. استفاده از الگوریتم‌های متعادل کننده مثل درخت‌های AVL یا Red-Black می‌تونن مفید باشن. همچنین انتخاب تعداد همسایه‌ها (K) تأثیر زیادی روی دقت پیش‌بینی داره.

from sklearn.neighbors import KDTree, KNeighborsClassifier
import numpy as np

X = np.array([[1, 2], [3, 4], [5, 6], [7, 8], [9, 10]])
y = np.array([0, 1, 0, 1, 0])

knn = KNeighborsClassifier(n_neighbors=3, algorithm='kd_tree')
knn.fit(X, y)

# Predicting the label for a new point using KNN
query_point = np.array([[2, 3]])
prediction = knn.predict(query_point)
print("KNN prediction for the new point: ", prediction)

# Creating an independent KD Tree using the data
kdtree = KDTree(X, leaf_size=30, metric='euclidean')

# Searching for the 3 nearest neighbors using the KD Tree
dist, ind = kdtree.query(query_point, k=3)
print("Nearest neighbors using KD Tree:")
print("Distances: ", dist)
print("Indices: ", ind)

🔜KNN prediction for the new point: [0]
Nearest neighbors using KD Tree:
Distances: [[1.41421356 1.41421356 4.24264069]]
Indices: [[0 1 2]]

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👌7👨‍💻2❤1👍1

589 views08:01

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۴۶: توی جستجوی نزدیک‌ترین همسایه با استفاده از درخت K-بعدی، در چه شرایطی به شاخه متفاوتی از درخت برمی‌گردیم؟

Anonymous Quiz

61%

زمانیکه فاصله نقطه جستجو از مرز تقسیم کمتر از فاصله فعلی باشه

14%

فقط زمانی که در نقطه میانی درخت هستیم

14%

فقط اگه نقطه جستجو توی یک بعد خاص باشه

11%

همیشه به هر دو شاخه سرکشی می‌کنیم

👏5❤2😎2

28 voters557 views13:47

آموزش دیتاساینس و ماشین‌لرنینگ

💡

نرمال‌سازی داده‌ها در استفاده از الگوریتم KNN

زمان استفاده از الگوریتم KNN، ضروریه داده‌ها نرمال‌سازی شن تا مطمئن شیم هیچ کدوم از ویژگی‌ها به دلیل تفاوت‌های مقیاس از اهمیت بیشتر یا کمتری برخوردار نشدن. برای نرمال‌سازی میشه از دو روش رایج Min-Max Normalization و Z-score normalization استفاده کرد.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍9👏3👌1

530 views17:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

چالش‌ها و معایب KNN

🔵حساسیت به مقیاس داده‌ها: الگوریتم KNN به شدت به مقیاس داده‌ها حساسه. داده‌هایی که در یک مقیاس نباشن می‌تونن باعث تحریف نتایج شن. بنابراین، نرمال‌سازی داده‌ها (مثل استانداردسازی یا نرمال‌سازی) قبل از استفاده از KNN ضروریه.

🔵نیاز به انتخاب K: انتخاب تعداد مناسب همسایه‌ها (K) یک چالشه. K بسیار کوچک می‌تونه به نویز حساس باشه و K بسیار بزرگ ممکنه مرزهای تصمیم‌گیری رو مبهم کنه. انتخاب K مناسب نیازمند آزمون و خطاست.

🔵محاسبات سنگین: KNN برای هر نمونه تست نیاز به محاسبه فاصله با تمام نمونه‌های آموزش داره. در نتیجه توی مجموعه‌های داده بزرگ بسیار کند عمل می‌کنه.

🔵تاثیرپذیری از نویز و داده‌های پرت: KNN به نویز و داده‌های پرت حساسه. حضور داده‌های نامرتبط یا پرت روی دقت مدل تاثیر منفی می‌ذاره.

🔵نیاز به انتخاب فاصله مناسب: انتخاب نوع فاصله (مثل فاصله اقلیدسی، منهتن، یا مینکوفسکی) تاثیر زیادی روی عملکرد مدل داره. انتخاب نادرست باعث کاهش دقت مدل میشه.

🔵

عدم مقیاس‌پذیری: الگوریتم KNN به عنوان یک الگوریتم تنبل در نظر گرفته می‌شه. این الگوریتم نیاز به قدرت محاسباتی زیاد و ذخیره‌سازی داده‌ها داره و زمان‌بر هست.

🔵

مستعد برازش بیش از حد: این الگوریتم تحت تاثیر ابعاد بالا قرار می‌گیره یعنی زمانی که ویژگی‌ها زیاد هستن، با مشکل طبقه‌بندی صحیح نقاط داده روبرو میشه و همچنین مستعد بیش‌برازشه. معمولاً تکنیک‌های انتخاب ویژگی و کاهش ابعاد توی این الگوریتم به کار گرفته می‌شن.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤1👨‍💻1

551 views08:00

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۴۷: معایب استفاده از الگوریتم K نزدیک‌ترین همسایه (KNN) کدوم گزینه میشه؟

Anonymous Quiz

با افزایش تعداد ابعاد، پیدا کردن نزدیک‌ترین همسایه‌های معنادار سخت میشه.

13%

مصرف زیاد منابع محاسباتی، به ویژه برای دیتاست‌های بزرگ، و نیاز به حافظه زیاد برای ذخیره کل دیتاست.

13%

حساسیت به انتخاب K و معیار فاصله.

72%

تمام موارد بالا

😎7👍3👏1

53 voters486 views13:47

آموزش دیتاساینس و ماشین‌لرنینگ

💡

آیا میشه الگوریتم KNN رو به مفهوم Bias-Variance tradeoff مرتبط دونست؟

الگوریتم KNN رو میشه مستقیماً با مفهوم Bias-Variance tradeoff مرتبط دونست. Bias به میزان خطایی اشاره داره که توی مدل رخ می‌ده، و پراکندگی (Variance) به میزان حساسیت مدل نسبت به تغییرات توی دیتاست آموزشی اشاره داره.

توی KNN، مقدار K نقش مهمی برای تعادل Bias-Variance tradeoff داره. اگه K خیلی کوچک باشه (مثلاً 1 یا 2)، مدل ممکنه به شدت نسبت به داده‌های آموزشی حساس شه و پراکندگی بالایی داشته باشه؛ در نتیجه overfitting رخ بده.

از طرف دیگه مقدار بزرگ K، باعث میشه مدل نمی‌تونه الگوهای پیچیده‌ دیتاست رو یاد بگیره، عملکرد ضعیفی داشته باشه و underfitting رخ بده. بنابراین، انتخاب K متعادل می‌تونه به تعادل Bias-Variance tradeoff کمک کنه.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👌9❤3👨‍💻1

511 views17:30

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

کاربردها و مزایا KNN

🔵

کاربردها

🔵تشخیص ناهنجاری: K نزدیک‌ترین همسایه در تشخیص داده‌های ناهنجار یا خارج از الگو کاربرد داره. این روش می‌تونه توی سیستم‌های امنیتی برای تشخیص فعالیت‌های مشکوک یا توی حوزه پزشکی برای شناسایی نمونه‌های غیرعادی استفاده شه.

🔵طبقه‌بندی و پیش‌بینی: توی زمینه‌هایی مثل تشخیص بیماری‌ها، تحلیل مشتریان در بازاریابی، یا پیش‌بینی روندهای مالی، K نزدیک‌ترین همسایه می‌تونه برای طبقه‌بندی و پیش‌بینی موثر باشه.

🔵توصیه‌گر سیستم‌ها: این الگوریتم توی سیستم‌های توصیه‌گر، مثل توصیه فیلم یا محصول، به کار گرفته می‌شه تا تجربه کاربری شخصی‌سازی شده‌ای ارائه بده.

🔵پردازش تصویر و بینایی کامپیوتری: توی تشخیص چهره، تشخیص حروف دست‌نویس و سایر کاربردهای بینایی ماشین، K نزدیک‌ترین همسایه به دلیل توانایی‌ کار با داده‌های چندبعدی بسیار مفیده.

🔵

مزایا

🔵سادگی پیاده‌سازی: یکی از بزرگترین مزایای K نزدیک‌ترین همسایه، سادگیش توی پیاده‌سازیه. این الگوریتم نیازی به مراحل پیچیده یادگیری نداره.

🔵انعطاف‌پذیری: K نزدیک‌ترین همسایه قابلیت کار توی شرایط و داده‌های مختلف رو داره و می‌تونه برای انواع مختلف داده‌ها و مسائل استفاده شه.

🔵نیاز کم به پیش‌پردازش: این الگوریتم نسبت به سایر روش‌های یادگیری ماشین، نیاز کمتری به پیش‌پردازش داده‌ها داره.

🔵موثر در مجموعه‌های داده کوچک: K نزدیک‌ترین همسایه می‌تواند در مجموعه‌های داده کوچکتر نیز موثر عمل کنه.

🔵

تطابق‌پذیری آسان: با توجه به نحوه کار الگوریتم K نزدیک‌ترین همسایه که تمام داده‌ها رو توی حافظه ذخیره می‌کنه، زمانیکه نمونه یا نقطه داده جدیدی اضافه شه، الگوریتم خودش رو با اون نمونه جدید تطابق میده و توی پیش‌بینی‌های آینده هم تأثیر می‌گذاره.

🔵

تعداد کمی هایپرپارامترها: تنها پارامترهایی که برای آموزش الگوریتم K نزدیک‌ترین همسایه لازمه، مقدار k و انتخاب متریک فاصله‌ای هست که می‌خوایم از بین معیارهای ارزیابی انتخاب کنیم.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👨‍💻1

563 views08:01

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۴۸: کدوم گزینه‌در مورد انتخاب مقدار K توی الگوریتم KNN صحیحه؟

Anonymous Quiz

باید برابر با تعداد ویژگی‌های مجموعه داده باشه.

26%

باید به صورت جذر تعداد نمونه‌ها در مجموعه داده‌های آموزش انتخاب شه.

10%

باید برابر با تعداد نمونه‌های آموزشی مجموعه داده باشه.

59%

باید به صورت تصادفی انتخاب شه.

👏5👌3😎2❤1

39 voters472 views13:31

آموزش دیتاساینس و ماشین‌لرنینگ

💡

آیا ابعاد بالا می‌تونه برای KNN مشکل ساز بشه؟

بله، این الگوریتم ممکنه تحت تأثیر مشکل ابعاد بالا قرار بگیره. این مشکل به چالش‌هایی اشاره داره که زمان افزایش تعداد ویژگی‌ها یا ابعاد فضای ویژگی‌ها رخ می‌ده.

با افزایش ابعاد، داده‌ها توی فضای بزرگ‌تری پراکنده میشن و فاصله معنادار بین نقاط کمتر می‌شه، که در نتیجه منجر به کاهش کارایی KNN میشه چون این الگوریتم بر مبنای محاسبه فاصله بین نقاط عمل می‌کنه.

همچنین، محاسبه فاصله توی ابعاد بالا می‌تونه بسیار وقت‌گیر و پرهزینه باشه. به همین دلیل، گاهی اوقات نیازه تا از روش‌های کاهش بُعد مثل PCA یا انتخاب ویژگی استفاده شه تا فقط ابعاد مرتبط و مؤثر داده‌ها حفظ شه.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👨‍💻1

502 views17:31

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🏫

الگوریتم KNN در Scikit-learn

برای پیاده‌سازی KNN در Scikit-learn، اول باید کلاس KNeighborsClassifier رو از ماژول sklearn.neighbors وارد کنیم. این کلاس امکان استفاده از الگوریتم KNN رو فراهم می‌کنه.

🔵وارد کردن کلاس KNeighborsClassifier: اول باید کلاس KNeighborsClassifier رو وارد کنیم.

🔵ایجاد یک نمونه از KNeighborsClassifier: بعد یک نمونه از این کلاس ایجاد و تعداد همسایه‌ها (n_neighbors) و سایر پارامترها رو تنظیم کنیم.

🔵آموزش دادن به مدل: با استفاده از داده‌های آموزشی، مدل رو آموزش می‌دیم. این شامل تنظیم مدل با داده‌های feature و labels هست.

🔵استفاده از مدل برای پیش‌بینی: بعد از آموزش، از مدل برای پیش‌بینی برچسب‌های داده‌های جدید استفاده میشه.

🔵ارزیابی عملکرد مدل: از معیارهای مختلف مثل accuracy برای ارزیابی عملکرد مدل استفاده می‌شه.

🔵

پارامترهای مهم

- n_neighbors: تعیین تعداد همسایه‌های در نظر گرفته شده.
- weights: تعیین نحوه وزن‌دهی به همسایه‌ها ('uniform' یا 'distance').
- metric: انتخاب معیار فاصله برای محاسبه همسایگی.

from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score

iris = load_iris()
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

knn = KNeighborsClassifier(n_neighbors=3)

knn.fit(X_train, y_train)
predictions = knn.predict(X_test)
accuracy = accuracy_score(y_test, predictions)
print(f'دقت مدل: {accuracy}')

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤1👌1👨‍💻1

529 views15:01

آموزش دیتاساینس و ماشین‌لرنینگ

❓کوئیز شماره ۴۹: توی استفاده از KNeighborsClassifier, در چه شرایطی باید مقدار پارامتر algorithm رو از auto (که حالت پیش فرضه) به kd_tree یا ball_tree تغییر داد؟

Anonymous Quiz

50%

زمان کار با داده‌های بسیار بزرگ

19%

زمانی که تعداد ویژگی‌ها (features) کمه

19%

فقط در مواردی که سرعت محاسبات اهمیت داره

13%

زمانی که داده‌ها غیر عددی هستن

❤6👌2😎2

32 voters475 views17:01

آموزش دیتاساینس و ماشین‌لرنینگ

💡

تأثیر داده‌های Sparse روی الگوریتم KNN

یه نکته مهم برای استفاده از KNeighborsClassifier توی Scikit-learn اینکه اگه داده‌های ورودی به صورت sparse (پراکنده) باشن، به طور خودکار الگوریتم برای محاسبه همسایه‌های نزدیک از روش brute force استفاده می‌کنه.

یعنی تنظیمات پیش‌فرض الگوریتم برای انتخاب بهترین روش محاسبه همسایه‌های نزدیک، مثل auto, ball_tree, kd_tree در صورتی که داده‌ها sparse باشن، نادیده گرفته می‌شن و به جاش از روش brute force استفاده می‌شه. این موضوع می‌تونه روی عملکرد و سرعت مدل تأثیر بگذاره.

#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍7❤2👏1

489 views19:01

آموزش دیتاساینس و ماشین‌لرنینگ

⏰

پست‌های هفته‌ای که گذشت رو این‌جا پیدا کنین!

🔺

آموزشی

🔵تعریف KNN و بررسی نقش K

👉

🔗 https://t.iss.one/data_ml/156

🔵پیچیدگی محاسباتی KNN

👉

🔗 https://t.iss.one/data_ml/159

🔵بررسی ساختار K-Dimensional Trees در KNN

👉

🔗 https://t.iss.one/data_ml/162

🔵چالش‌ها و معایب KNN

👉

🔗 https://t.iss.one/data_ml/165

🔵کاربردها و مزایا KNN

👉

🔗 https://t.iss.one/data_ml/168

🔵الگوریتم KNN در Scikit-learn

👉

🔗 https://t.iss.one/data_ml/171

🔺

کوئیز

🔵کوئیز شماره ۴۴: الگوریتم KNN یادگیری تنبل

👉

🔗 https://t.iss.one/data_ml/157

🔵کوئیز شماره ۴۵: KNN Imputer

👉

🔗 https://t.iss.one/data_ml/160

🔵کوئیز شماره ۴۶: K-D Tree در KNN

👉

🔗 https://t.iss.one/data_ml/163

🔵کوئیز شماره ۴۷: معایب KNN

👉

🔗 https://t.iss.one/data_ml/166

🔵کوئیز شماره ۴۸: روش انتخاب مقدار K

👉

🔗 https://t.iss.one/data_ml/169

🔵کوئیز شماره ۴۹: مقدار algorithm در KNeighborsClassifier

👉

🔗 https://t.iss.one/data_ml/172

🔺

نکته

🔵انتخاب مقدار k بهینه در KNN

👉

🔗 https://t.iss.one/data_ml/158

🔵تفاوت بین k-Means و KNN

👉

🔗 https://t.iss.one/data_ml/161

🔵نرمال‌سازی داده‌ها در KNN

👉

🔗 https://t.iss.one/data_ml/164

🔵الگوریتم KNN و Bias-Variance tradeoff

👉

🔗 https://t.iss.one/data_ml/167

🔵ابعاد بالا و KNN

👉

🔗 https://t.iss.one/data_ml/170

🔵تأثیر داده‌های Sparse روی الگوریتم KNN

👉

🔗 https://t.iss.one/data_ml/173

#Weekend
#Machine_Learning
#KNN

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

👍6❤2👏2

501 views08:31

آموزش دیتاساینس و ماشین‌لرنینگ

🟡 دوره‌های مقدماتی و پیشرفته علم داده

دنیای داده‌ها جذابه و دونستن علم داده، توانایی تحلیل داده‌، یا بازاریابی مبتنی بر داده، می‌تونه شما رو برای فرصت‌های شغلی زیادی مناسب کنه.

فارغ از رشته‌ و پیش زمینه‌تون، می‌تونین با استفاده از دوره‌های رضا شکرزاد این مسیر رو شروع کنین و از سطح مقدماتی تا پیشرفته پیش برین.

🟢 دوره جامع دیتاساینس و ماشین لرنینگ:

👉

📎

https://ctdrs.ir/cr14924

❗️دانشجویان دوره علم داده ۱ می‌تونن با پرداخت اختلاف هزینه، دوره جامع رو تهیه کنن.

🔵 هوش تجاری و تحلیل داده با Tableau و Power BI:

👉

📎

https://ctdrs.ir/cr14230

🟠مارکتینگ داده‌محور:

👉

📎

https://ctdrs.ir/cr13581

#Courses

@DSLanders | دی‌اس‌لندرز

Please open Telegram to view this post

VIEW IN TELEGRAM

👏7❤2👍1🔥1

539 views12:30

آموزش دیتاساینس و ماشین‌لرنینگ

👩‍🎓

برنامه آموزشی هفته: الگوریتم ماشین بردار پشتیبان یا SVM

🟠شنبه: تعریف SVM و مرز تصمیم گیری

🔵یک‌شنبه: بررسی حاشیه در SVM با جزئیات

🟢دوشنبه: کرنل در SVM

🔴سه‌شنبه: انواع کرنل

🟠چهارشنبه: حاشیه در Sklearn

🔵پنج‌شنبه: کرنل در Sklearn

🟢جمعه: جمع بندی

#Machine_Learning
#SVM

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

❤8👍5👏2

2.2K views16:30

آموزش دیتاساینس و ماشین‌لرنینگ

👨‍🎓

تعریف SVM و مرز تصمیم گیری

🔵 الگوریتم ماشین بردار پشتیبان (Support Vector Machine)

🔵ماشین بردار پشتیبان، یک مدل یادگیری نظارت شده است که برای طبقه‌بندی و رگرسیون استفاده می‌شه. این مدل با پیدا کردن یه مرز تصمیم (hyperplane) در فضای ویژگی‌ها، داده‌ها رو به دسته‌های مختلف تقسیم می‌کنه.

🔵توی مواردی که داده‌ها به صورت خطی قابل جداسازی نیستن، SVM از توابع هسته (kernel functions) برای افزایش بعد داده‌ها و پیدا کردن یه مرز تصمیم مناسب در فضای بالاتر استفاده می‌کنه.

🔵یکی از ویژگی‌های مهم SVM، بهینه‌سازی مارجینه. Margin فاصله بین مرز تصمیم و نزدیک‌ترین نمونه‌های داده به این مرزه. SVM تلاش می‌کنه تا این فاصله رو بیشینه کنه.

🔵 مرز تصمیم (Decision Boundary)

مرز تصمیم، سطحیه که داده‌ها رو در فضای ویژگی به دو یا چند کلاس تقسیم می‌کنه. این مرز می‌تونه خطی یا غیرخطی باشه. تعیین مرز تصمیم صحیح برای دقت بالای مدل حیاتیه. مرزهای تصمیم نادرست می‌تونن منجر به بیش‌برازش یا کم‌برازش شن.

🔵در سطح پیشرفته، تکنیک‌هایی مثل روش‌های انتخاب ویژگی، بهینه‌سازی پارامترهای مدل و استفاده از روش‌های ترکیبی برای بهبود تعریف مرز تصمیم مورد استفاده قرار می‌گیرن.

#Machine_Learning
#SVM

@Data_ML | دیتاساینس و ماشین‌ لرنینگ

Please open Telegram to view this post

VIEW IN TELEGRAM

❤7👍4👨‍💻1

593 views08:00

About

Blog

Apps

Platform