Python3

📚 آموزش مدیریت داده‌ها با Pandas در پایتون 📊

سلام دوستان! امروز قصد داریم با کتابخانه Pandas در پایتون، داده‌ها را مدیریت و تحلیل کنیم. Pandas یکی از قدرتمندترین ابزارهای تحلیل داده در پایتون است. 🎓📈

مراحل مدیریت داده‌ها:

1. Pandas چیست؟
Pandas یک کتابخانه قدرتمند برای تحلیل و مدیریت داده‌ها در پایتون است که قابلیت‌هایی مانند خواندن و نوشتن داده‌ها از فرمت‌های مختلف، پاکسازی و آماده‌سازی داده‌ها، و انجام محاسبات آماری و تحلیل داده‌ها را فراهم می‌کند.

2. نصب Pandas:

    pip install pandas

3. نوشتن کد:

    import pandas as pd

    # خواندن داده‌ها از فایل CSV
    df = pd.read_csv('data.csv')

    # نمایش اطلاعات اولیه داده‌ها
    print(df.head())
    print(df.info())

    # پاکسازی داده‌ها
    df.dropna(inplace=True)

    # تحلیل داده‌ها
    mean_price = df['price'].mean()
    print(f"Mean Price: {mean_price}")

    # ذخیره داده‌ها به فایل جدید
    df.to_csv('cleaned_data.csv', index=False)

توضیحات:

- خواندن داده‌ها: با استفاده از pd.read_csv می‌توانیم داده‌ها را از یک فایل CSV بخوانیم و آن را به یک DataFrame تبدیل کنیم.

    df = pd.read_csv('data.csv')

- نمایش اطلاعات اولیه داده‌ها: با استفاده از head می‌توانیم چند سطر اول داده‌ها را ببینیم و با info اطلاعاتی مانند تعداد سطرها و ستون‌ها و نوع داده‌ها را بررسی کنیم.

    print(df.head())
    print(df.info())

- پاکسازی داده‌ها: با استفاده از dropna می‌توانیم سطرهایی که دارای مقادیر گمشده (NaN) هستند را حذف کنیم.

    df.dropna(inplace=True)

- تحلیل داده‌ها: با استفاده از توابع آماری مانند mean می‌توانیم محاسبات آماری روی داده‌ها انجام دهیم. در اینجا میانگین قیمت‌ها محاسبه شده است.

    mean_price = df['price'].mean()
    print(f"Mean Price: {mean_price}")

- ذخیره داده‌ها: با استفاده از to_csv می‌توانیم داده‌ها را در یک فایل CSV جدید ذخیره کنیم.

    df.to_csv('cleaned_data.csv', index=False)

نکات:

- پاکسازی داده‌ها: استفاده از توابعی مانند dropna و fillna برای پاکسازی داده‌ها و مدیریت مقادیر گمشده.
- تحلیل داده‌ها: استفاده از توابع آماری مانند mean، median، std و توابع دیگر برای تحلیل داده‌ها.
- مدیریت داده‌ها: استفاده از توابعی مانند groupby، merge و pivot_table برای مدیریت و ترکیب داده‌ها.
- ذخیره و بارگذاری داده‌ها: استفاده از to_csv، to_excel و توابع مشابه برای ذخیره و بارگذاری داده‌ها در فرمت‌های مختلف.

(اموزش های بیشتر داخل کانال ما)

#پایتون #آموزش_پایتون #تحلیل_داده #Pandas #داده_کاوی #توسعه_نرم_افزار