Python3
200 subscribers
100 photos
6 videos
26 files
518 links
🎓 آموزش و پروژه‌های Python
آموزش‌های کاربردی و پروژه‌های عملی Python برای همه سطوح. 🚀
Download Telegram
📚 دوره آموزش پایتون از 0 تا 100

پارت ۲۱: معرفی Pandas برای تحلیل داده‌ها 📊

در این پارت با کتابخانه قدرتمند Pandas آشنا می‌شویم و یاد می‌گیریم چگونه از این ابزار برای تحلیل و پردازش داده‌ها استفاده کنیم.

۱. Pandas چیست؟ 🤔
Pandas یک کتابخانه متن‌باز برای زبان برنامه‌نویسی پایتون است که برای کار با داده‌های ساختاریافته و جدول‌بندی‌شده به کار می‌رود. این کتابخانه ابزارهای متنوعی برای خواندن، نوشتن، پردازش و تحلیل داده‌ها فراهم می‌کند.

۲. نصب Pandas 🛠️

برای نصب Pandas از pip استفاده می‌کنیم:

pip install pandas

۳. ایجاد و کار با سری‌ها (Series) 📝

سری‌ها، ساختارهای داده‌ای یک‌بعدی در Pandas هستند. یک سری را می‌توان به صورت یک ستون از یک جدول در نظر گرفت.

import pandas as pd

data = [1, 2, 3, 4, 5]
series = pd.Series(data)

print(series)

این کد:
- Pandas را ایمپورت می‌کند.
- یک لیست از داده‌ها ایجاد می‌کند.
- یک سری از داده‌ها ایجاد می‌کند و آن را چاپ می‌کند.

۴. ایجاد و کار با دیتا‌فریم‌ها (DataFrame) 📋

دیتافریم‌ها، ساختارهای داده‌ای دوبعدی در Pandas هستند که می‌توانند به صورت جداولی با ردیف‌ها و ستون‌ها در نظر گرفته شوند.

data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
}

df = pd.DataFrame(data)

print(df)

این کد:
- یک دیکشنری از داده‌ها ایجاد می‌کند.
- یک دیتافریم از داده‌ها ایجاد می‌کند و آن را چاپ می‌کند.

۵. خواندن و نوشتن فایل‌های CSV 📄

Pandas ابزارهایی برای خواندن و نوشتن فایل‌های CSV فراهم می‌کند.

برای خواندن یک فایل CSV:

df = pd.read_csv('data.csv')

print(df.head())

برای نوشتن یک دیتافریم به فایل CSV:

df.to_csv('output.csv', index=False)

۶. فیلتر و مرتب‌سازی داده‌ها 🔍

Pandas ابزارهایی برای فیلتر و مرتب‌سازی داده‌ها فراهم می‌کند.

برای فیلتر کردن داده‌ها:

filtered_df = df[df['Age'] > 30]

print(filtered_df)

برای مرتب‌سازی داده‌ها:

sorted_df = df.sort_values(by='Age')

print(sorted_df)

۷. عملیات بر روی دیتافریم‌ها

Pandas امکان انجام عملیات‌های مختلف بر روی دیتافریم‌ها را فراهم می‌کند.

برای اضافه کردن یک ستون جدید:

df['Salary'] = [50000, 60000, 70000]

print(df)

برای حذف یک ستون:

df = df.drop(columns=['Salary'])

print(df)

۸. گروه‌بندی و تجمع داده‌ها 📊

Pandas ابزارهایی برای گروه‌بندی و تجمع داده‌ها فراهم می‌کند.

برای گروه‌بندی داده‌ها:

grouped_df = df.groupby('City').mean()

print(grouped_df)


نکات مهم
- Pandas: یک کتابخانه قدرتمند برای تحلیل داده‌ها در پایتون است.
- سری‌ها و دیتافریم‌ها: ساختارهای داده‌ای پایه‌ای برای کار با داده‌ها.
- خواندن و نوشتن فایل‌های CSV: ابزارهای Pandas برای کار با فایل‌های داده‌ای.
- فیلتر و مرتب‌سازی داده‌ها: امکانات Pandas برای جستجو و سازمان‌دهی داده‌ها.
- عملیات بر روی دیتافریم‌ها: افزودن، حذف و تغییر داده‌ها در دیتافریم‌ها.
- گروه‌بندی و تجمع داده‌ها: ابزارهای Pandas برای تحلیل‌های پیچیده‌تر داده‌ها.

با این آموزش، شما می‌توانید به راحتی داده‌ها را با استفاده از Pandas تحلیل و پردازش کنید. موفق باشید! 🌟

🔻برای بیشتر یاد گرفتن بیا اینجا

#پایتون #آموزش_پایتون #Pandas #تحلیل_داده #PythonDataAnalysis #PythonProgramming
📚 دوره آموزش پایتون از 0 تا 100

پارت ۲۳: پروژه نهایی - تحلیل داده‌ها 📊

در این پارت، از تمامی مفاهیمی که تا به حال آموخته‌ایم، برای انجام یک پروژه نهایی تحلیل داده‌ها استفاده می‌کنیم. هدف این پروژه، تحلیل یک مجموعه داده و استخراج اطلاعات مفید از آن است.

۱. انتخاب مجموعه داده 📂

ابتدا باید یک مجموعه داده مناسب انتخاب کنیم. برای این پروژه، از مجموعه داده معروف "Titanic" استفاده خواهیم کرد. این مجموعه داده شامل اطلاعاتی درباره مسافران کشتی تایتانیک است و می‌توانیم تحلیل‌های جالبی بر روی آن انجام دهیم.

۲. نصب کتابخانه‌های مورد نیاز 🛠️

برای انجام تحلیل داده‌ها، نیاز به نصب کتابخانه‌های Pandas و NumPy داریم. اگر قبلاً این کتابخانه‌ها را نصب نکرده‌اید، می‌توانید از طریق pip آن‌ها را نصب کنید:

pip install pandas numpy

۳. خواندن داده‌ها 📥

ابتدا مجموعه داده را با استفاده از Pandas وارد می‌کنیم:

import pandas as pd

# خواندن داده‌ها از فایل CSV
df = pd.read_csv('titanic.csv')

# نمایش چند ردیف اول از داده‌ها
print(df.head())

۴. بررسی اولیه داده‌ها 🔍

برای آشنایی بیشتر با داده‌ها، یک بررسی اولیه انجام می‌دهیم:

# نمایش اطلاعات کلی درباره داده‌ها
print(df.info())

# نمایش آمار توصیفی از داده‌ها
print(df.describe())

۵. تمیز کردن داده‌ها 🧹

برای انجام تحلیل‌های دقیق‌تر، نیاز به تمیز کردن داده‌ها داریم. این شامل پر کردن مقادیر گمشده و حذف داده‌های نامعتبر است.

# پر کردن مقادیر گمشده با میانگین ستون
df['Age'].fillna(df['Age'].mean(), inplace=True)

# حذف ردیف‌های با مقادیر گمشده در ستون Embarked
df.dropna(subset=['Embarked'], inplace=True)

۶. تحلیل داده‌ها 📊

حال که داده‌ها تمیز شده‌اند، می‌توانیم تحلیل‌های مختلفی بر روی آن‌ها انجام دهیم. به عنوان مثال، بررسی می‌کنیم چند درصد از مسافران زنده مانده‌اند.

# محاسبه درصد زنده‌مانده‌ها
survival_rate = df['Survived'].mean() * 100

print(f"درصد زنده‌مانده‌ها: {survival_rate:.2f}%")

۷. تحلیل گروهی داده‌ها 📋

یکی از ویژگی‌های مفید Pandas، امکان گروه‌بندی داده‌ها و انجام تحلیل‌های گروهی است. به عنوان مثال، بررسی می‌کنیم نرخ زنده‌ماندن برای گروه‌های سنی مختلف چگونه است.

# تعریف دسته‌های سنی
bins = [0, 12, 20, 40, 60, 80]
labels = ['کودک', 'نوجوان', 'جوان', 'میانسال', 'سالمند']
df['AgeGroup'] = pd.cut(df['Age'], bins=bins, labels=labels)

# محاسبه نرخ زنده‌ماندن برای هر گروه سنی
age_group_survival = df.groupby('AgeGroup')['Survived'].mean() * 100

print(age_group_survival)

۸. رسم نمودارها 📈

برای نمایش نتایج تحلیل‌ها، می‌توانیم از کتابخانه Matplotlib استفاده کنیم. اگر این کتابخانه را نصب ندارید، با استفاده از pip آن را نصب کنید:

pip install matplotlib

سپس می‌توانیم یک نمودار میله‌ای از نرخ زنده‌ماندن برای گروه‌های سنی مختلف رسم کنیم:

import matplotlib.pyplot as plt

# رسم نمودار میله‌ای
age_group_survival.plot(kind='bar')
plt.title('نرخ زنده‌ماندن برای گروه‌های سنی مختلف')
plt.xlabel('گروه سنی')
plt.ylabel('نرخ زنده‌ماندن (%)')
plt.show()



نکات مهم
- انتخاب مجموعه داده: استفاده از مجموعه داده Titanic.
- خواندن و بررسی داده‌ها: استفاده از Pandas برای خواندن و بررسی اولیه داده‌ها.
- تمیز کردن داده‌ها: پر کردن مقادیر گمشده و حذف داده‌های نامعتبر.
- تحلیل داده‌ها: انجام تحلیل‌های مختلف برای استخراج اطلاعات مفید.
- تحلیل گروهی داده‌ها: استفاده از گروه‌بندی برای تحلیل دقیق‌تر داده‌ها.
- رسم نمودارها: استفاده از Matplotlib برای نمایش بصری نتایج.

با این پروژه نهایی، شما قادر خواهید بود تحلیل داده‌ها را به طور کامل انجام دهید و نتایج خود را به صورت بصری نمایش دهید. موفق باشید! 🌟

🔻برای بیشتر یاد گرفتن بیا اینجا

#پایتون #آموزش_پایتون #تحلیل_داده #پروژه_نهایی #PythonDataAnalysis #PythonProgramming