چالش پایتون
5.04K subscribers
322 photos
38 videos
26 files
253 links
Download Telegram
فاز ۱ رو کامل کردیم حالا میریم سراغ فاز ۲: پردازش داده‌ها.
🔹 فاز ۲: پردازش داده‌ها

آشنایی با NumPy

آشنایی با Pandas 🗂

کار با داده‌های جدولی 📊

پاک‌سازی و آماده‌سازی داده‌ها 🧹

تجسم داده‌ها با Matplotlib 🎨

پروژه عملی پردازش داده 📑

🗂 مرکز آموزش پایتون

@pythonchallenge
2
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۷: آشنایی با NumPy

سلام دوستان! 👋
امروز می‌خوایم وارد دنیای NumPy بشیم. این کتابخونه یکی از مهم‌ترین ابزارها برای کار با اعداد، آرایه‌ها و محاسبات ریاضی در پایتونه. 🚀

---
۱. نصب NumPy

اگر نصب نکردی، با این دستور می‌تونی نصبش کنی:

pip install numpy


---
۲. وارد کردن NumPy

import numpy as np


معمولاً با اسم کوتاه np صداش می‌کنیم.

---
۳. ساخت آرایه (Array)

* آرایه‌ها تو NumPy مثل لیست‌های پایتون هستن ولی خیلی سریع‌تر و حرفه‌ای‌تر!

import numpy as np

arr = np.array([1, 2, 3, 4, 5])
print(arr)


---
۴. عملیات ریاضی روی آرایه‌ها

می‌تونیم مستقیم روی همه عناصر محاسبات انجام بدیم:

arr = np.array([10, 20, 30])
print(arr + 5) # جمع با همه عناصر
print(arr * 2) # ضرب در همه عناصر
print(arr / 10) # تقسیم همه عناصر


---
۵. آرایه‌های چندبعدی (Matrix)

matrix = np.array([[1, 2], [3, 4]])
print("ماتریس:\n", matrix)
print("شکل:", matrix.shape)
print("جمع همه عناصر:", matrix.sum())


---

۶. توابع آماده NumPy

arr = np.array([1, 2, 3, 4, 5])
print("میانگین:", np.mean(arr))
print("بیشترین مقدار:", np.max(arr))
print("کمترین مقدار:", np.min(arr))


---

۷. پروژه کوچک

محاسبه معدل نمرات با NumPy:

grades = np.array([18, 15, 20, 12, 19])
average = np.mean(grades)
print("معدل دانش‌آموز =", average)


---

👀 قسمت بعدی: آشنایی با Pandas 🗂

🗂 مرکز آموزش پایتون

@pythonchallenge
👍5
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۸: آشنایی با Pandas 🗂

سلام دوستان! 👋
امروز می‌خوایم با Pandas آشنا بشیم. این کتابخونه فوق‌العاده برای کار با داده‌های جدولی مثل فایل‌های Excel یا CSV استفاده می‌شه. 📊

---
۱. نصب Pandas

pip install pandas


---
۲. وارد کردن Pandas

import pandas as pd


معمولاً با اسم کوتاه pd استفاده می‌شه.

---
۳. ساخت جدول (DataFrame)

import pandas as pd

data = {"نام": ["علی", "سارا", "نیما"], "سن": [18, 20, 19]}
df = pd.DataFrame(data)
print(df)


📌 خروجی:

     نام   سن
0 علی 18
1 سارا 20
2 نیما 19


---
۴. دسترسی به ستون‌ها و سطرها

print(df["نام"])      # دسترسی به یک ستون
print(df.iloc[1]) # دسترسی به یک سطر بر اساس اندیس


---
۵. خواندن فایل‌های داده

* خواندن فایل CSV:

df = pd.read_csv("data.csv")


* ذخیره جدول به CSV:

df.to_csv("output.csv", index=False)


---
۶. عملیات روی داده‌ها

print(df.describe())   # آمار خلاصه
print(df["سن"].mean()) # میانگین سن‌ها


---
۷. پروژه کوچک

ساخت جدول نمرات و محاسبه معدل هر دانش‌آموز:

import pandas as pd

data = {
"نام": ["علی", "سارا", "نیما"],
"ریاضی": [18, 19, 15],
"فیزیک": [17, 20, 14],
"شیمی": [16, 18, 13]
}

df = pd.DataFrame(data)
df["معدل"] = df[["ریاضی", "فیزیک", "شیمی"]].mean(axis=1)
print(df)


📌 خروجی نمونه:

     نام  ریاضی  فیزیک  شیمی   معدل
0 علی 18 17 16 17.0
1 سارا 19 20 18 19.0
2 نیما 15 14 13 14.0


---

👀 قسمت بعدی: کار با داده‌های جدولی 📊

🗂 مرکز آموزش پایتون

@pythonchallenge
4
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۹: کار با داده‌های جدولی 📊

سلام دوستان! 👋
حالا که با Pandas آشنا شدیم، بیایید یاد بگیریم چطوری روی داده‌های جدولی عملیات مختلف انجام بدیم. این بخش خیلی مهمه چون بیشتر داده‌های دنیای واقعی به شکل جدول هستن. 🗂

---
۱. فیلتر کردن داده‌ها

import pandas as pd

data = {
"نام": ["علی", "سارا", "نیما", "رضا"],
"سن": [18, 20, 19, 21],
"نمره": [15, 19, 17, 20]
}

df = pd.DataFrame(data)

# فیلتر: نمایش فقط کسانی که نمره بالای 17 دارن
print(df[df["نمره"] > 17])


---
۲. مرتب‌سازی داده‌ها

# مرتب‌سازی بر اساس نمره
print(df.sort_values("نمره", ascending=False))


---
۳. انتخاب چند ستون

print(df[["نام", "نمره"]])


---
۴. اضافه کردن ستون جدید

df["وضعیت"] = df["نمره"].apply(lambda x: "قبول " if x >= 18 else "مردود ")
print(df)


---

۵. محاسبات گروهی (GroupBy)

مثال: محاسبه میانگین نمره‌ها بر اساس سن 👇

print(df.groupby("سن")["نمره"].mean())


---

۶. پروژه کوچک

جدول نمرات دانش‌آموزان رو مرتب کنیم و وضعیت هر کس رو نشون بدیم:

students = {
"نام": ["علی", "سارا", "نیما", "رضا"],
"نمره": [15, 19, 17, 20]
}

df = pd.DataFrame(students)
df["وضعیت"] = df["نمره"].apply(lambda x: "قبول " if x >= 18 else "مردود ")
print(df.sort_values("نمره", ascending=False))


📌 خروجی نمونه:

     نام  نمره     وضعیت
3 رضا 20 قبول
1 سارا 19 قبول
2 نیما 17 مردود
0 علی 15 مردود


---

👀 قسمت بعدی: پاک‌سازی و آماده‌سازی داده‌ها 🧹

🗂 مرکز آموزش پایتون

@pythonchallenge
4
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۱۰: پاک‌سازی و آماده‌سازی داده‌ها 🧹

سلام دوستان! 👋
داده‌های دنیای واقعی همیشه مرتب نیستن! 😅
گاهی داده‌ها ناقص، تکراری یا اشتباه هستن. برای همین قبل از تحلیل یا یادگیری ماشین، باید داده‌ها رو پاک‌سازی و آماده‌سازی کنیم.

---
۱. شناسایی داده‌های گمشده (NaN)

import pandas as pd
import numpy as np

data = {
"نام": ["علی", "سارا", "نیما", "رضا"],
"نمره": [18, np.nan, 15, 20]
}

df = pd.DataFrame(data)
print(df)
print(df.isnull()) # نمایش مقادیر گمشده


---
۲. حذف داده‌های ناقص

df_clean = df.dropna()   # حذف سطرهایی که مقدار گمشده دارن
print(df_clean)


---
۳. جایگزین کردن داده‌های گمشده

df["نمره"].fillna(df["نمره"].mean(), inplace=True)  # جایگزینی با میانگین
print(df)


---
۴. حذف داده‌های تکراری

df = pd.DataFrame({
"نام": ["علی", "سارا", "علی"],
"نمره": [18, 19, 18]
})

print("قبل از حذف:\n", df)
df = df.drop_duplicates()
print("بعد از حذف:\n", df)


---
۵. تغییر نام ستون‌ها

df.rename(columns={"نام": "Name", "نمره": "Score"}, inplace=True)
print(df)


---
۶. پروژه کوچک

پاک‌سازی داده‌های ناقص و محاسبه معدل:

data = {
"نام": ["علی", "سارا", "نیما", "رضا"],
"ریاضی": [18, np.nan, 15, 20],
"فیزیک": [17, 19, np.nan, 18]
}

df = pd.DataFrame(data)

# پر کردن مقادیر گمشده با میانگین هر ستون
df = df.fillna(df.mean(numeric_only=True))

# محاسبه معدل
df["معدل"] = df[["ریاضی", "فیزیک"]].mean(axis=1)
print(df)


📌 خروجی نمونه:

     نام   ریاضی  فیزیک   معدل
0 علی 18.0 17.0 17.5
1 سارا 17.7 19.0 18.3
2 نیما 15.0 18.0 16.5
3 رضا 20.0 18.0 19.0


---

👀 قسمت بعدی: تجسم داده‌ها با Matplotlib 🎨

🗂 مرکز آموزش پایتون

@pythonchallenge
👍3
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۱۱: تجسم داده‌ها با Matplotlib 🎨

سلام دوستان! 👋
یکی از بهترین روش‌ها برای درک بهتر داده‌ها، نقاشی کردنشونه! 🎨
کتابخونه‌ی Matplotlib به ما کمک می‌کنه داده‌ها رو به شکل نمودار نشون بدیم.

---
۱. نصب و import

pip install matplotlib


import matplotlib.pyplot as plt


---
۲. رسم نمودار خطی (Line Plot)

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]

plt.plot(x, y)
plt.title("نمودار خطی 📈")
plt.xlabel("X")
plt.ylabel("Y")
plt.show()


---
۳. رسم نمودار ستونی (Bar Chart)

names = ["علی", "سارا", "نیما", "رضا"]
scores = [18, 20, 15, 19]

plt.bar(names, scores, color="skyblue")
plt.title("نمرات دانش‌آموزان 📊")
plt.show()


---
۴. رسم نمودار دایره‌ای (Pie Chart)

labels = ["ریاضی", "فیزیک", "شیمی"]
values = [30, 45, 25]

plt.pie(values, labels=labels, autopct="%1.1f%%")
plt.title("درصد نمرات 🥧")
plt.show()


---
۵. چند نمودار در یک شکل

import numpy as np

x = np.linspace(0, 10, 100)
y1 = np.sin(x)
y2 = np.cos(x)

plt.plot(x, y1, label="sin(x)")
plt.plot(x, y2, label="cos(x)")
plt.legend()
plt.title("مقایسه سینوس و کسینوس 🔄")
plt.show()


---
۶. پروژه کوچک

نمودار معدل دانش‌آموزان:

import pandas as pd
import matplotlib.pyplot as plt

data = {"نام": ["علی", "سارا", "نیما"], "معدل": [17.5, 19, 16]}
df = pd.DataFrame(data)

plt.bar(df["نام"], df["معدل"], color="green")
plt.title("معدل دانش‌آموزان 📚")
plt.ylabel("معدل")
plt.show()


---

👀 قسمت بعدی: پروژه عملی پردازش داده 📑 (جمع‌بندی فاز ۲)

🗂 مرکز آموزش پایتون

@pythonchallenge
🙏3
#چالش_پایتون_در_هوش_مصنوعی

🧠 قسمت ۱۲: پروژه عملی پردازش داده 📑

سلام دوستان! 👋
تو این قسمت می‌خوایم همه چیزهایی که تو فاز ۲ یاد گرفتیم (NumPy، Pandas، Matplotlib) رو ترکیب کنیم و یک پروژه کامل انجام بدیم. 🎯

---

🎓 پروژه: تحلیل نمرات یک کلاس

۱. آماده‌سازی داده‌ها

فرض کنید یک فایل CSV به اسم grades.csv داریم:

نام,ریاضی,فیزیک,شیمی
علی,18,17,16
سارا,20,19,18
نیما,15,14,13
رضا,19,20,18


---
۲. خواندن داده‌ها با Pandas

import pandas as pd

df = pd.read_csv("grades.csv")
print(df)


---
۳. پاک‌سازی داده‌ها

مثلاً اگر مقادیر گمشده باشه، پرشون می‌کنیم:

df = df.fillna(df.mean(numeric_only=True))


---
۴. محاسبه معدل هر دانش‌آموز

df["معدل"] = df[["ریاضی", "فیزیک", "شیمی"]].mean(axis=1)
print(df)


---
۵. تحلیل داده‌ها

* پیدا کردن بالاترین و پایین‌ترین معدل:

print("بیشترین معدل:", df["معدل"].max())
print("کمترین معدل:", df["معدل"].min())


* میانگین کل کلاس:

print("میانگین کلاس:", df["معدل"].mean())


---
۶. تجسم داده‌ها با Matplotlib

import matplotlib.pyplot as plt

plt.bar(df["نام"], df["معدل"], color="orange")
plt.title("معدل دانش‌آموزان کلاس 📊")
plt.ylabel("معدل")
plt.show()


📌 خروجی: نمودار ستونی معدل هر دانش‌آموز

---

۷. نتیجه‌گیری

* یاد گرفتیم داده‌ها رو بخونیم، پاک‌سازی کنیم، تحلیل کنیم و تجسم کنیم
* این‌ها پایه‌ی اصلی کارهای هوش مصنوعی و یادگیری ماشین هستن. 🤖
* در فاز بعدی می‌ریم سراغ مبانی یادگیری ماشین (Machine Learning)

---

👀 قسمت بعدی (شروع فاز ۳): مقدمه‌ای بر یادگیری ماشین 🤖

🗂 مرکز آموزش پایتون

@pythonchallenge
👏4