📚 دوره آموزش پایتون از 0 تا 100
پارت ۲۱: معرفی Pandas برای تحلیل دادهها 📊
در این پارت با کتابخانه قدرتمند Pandas آشنا میشویم و یاد میگیریم چگونه از این ابزار برای تحلیل و پردازش دادهها استفاده کنیم.
۱. Pandas چیست؟ 🤔
Pandas یک کتابخانه متنباز برای زبان برنامهنویسی پایتون است که برای کار با دادههای ساختاریافته و جدولبندیشده به کار میرود. این کتابخانه ابزارهای متنوعی برای خواندن، نوشتن، پردازش و تحلیل دادهها فراهم میکند.
۲. نصب Pandas 🛠️
برای نصب Pandas از pip استفاده میکنیم:
۳. ایجاد و کار با سریها (Series) 📝
سریها، ساختارهای دادهای یکبعدی در Pandas هستند. یک سری را میتوان به صورت یک ستون از یک جدول در نظر گرفت.
این کد:
- Pandas را ایمپورت میکند.
- یک لیست از دادهها ایجاد میکند.
- یک سری از دادهها ایجاد میکند و آن را چاپ میکند.
۴. ایجاد و کار با دیتافریمها (DataFrame) 📋
دیتافریمها، ساختارهای دادهای دوبعدی در Pandas هستند که میتوانند به صورت جداولی با ردیفها و ستونها در نظر گرفته شوند.
این کد:
- یک دیکشنری از دادهها ایجاد میکند.
- یک دیتافریم از دادهها ایجاد میکند و آن را چاپ میکند.
۵. خواندن و نوشتن فایلهای CSV 📄
Pandas ابزارهایی برای خواندن و نوشتن فایلهای CSV فراهم میکند.
برای خواندن یک فایل CSV:
برای نوشتن یک دیتافریم به فایل CSV:
۶. فیلتر و مرتبسازی دادهها 🔍
Pandas ابزارهایی برای فیلتر و مرتبسازی دادهها فراهم میکند.
برای فیلتر کردن دادهها:
برای مرتبسازی دادهها:
۷. عملیات بر روی دیتافریمها ➕➖
Pandas امکان انجام عملیاتهای مختلف بر روی دیتافریمها را فراهم میکند.
برای اضافه کردن یک ستون جدید:
برای حذف یک ستون:
۸. گروهبندی و تجمع دادهها 📊
Pandas ابزارهایی برای گروهبندی و تجمع دادهها فراهم میکند.
برای گروهبندی دادهها:
نکات مهم
- Pandas: یک کتابخانه قدرتمند برای تحلیل دادهها در پایتون است.
- سریها و دیتافریمها: ساختارهای دادهای پایهای برای کار با دادهها.
- خواندن و نوشتن فایلهای CSV: ابزارهای Pandas برای کار با فایلهای دادهای.
- فیلتر و مرتبسازی دادهها: امکانات Pandas برای جستجو و سازماندهی دادهها.
- عملیات بر روی دیتافریمها: افزودن، حذف و تغییر دادهها در دیتافریمها.
- گروهبندی و تجمع دادهها: ابزارهای Pandas برای تحلیلهای پیچیدهتر دادهها.
با این آموزش، شما میتوانید به راحتی دادهها را با استفاده از Pandas تحلیل و پردازش کنید. موفق باشید! 🌟
🔻برای بیشتر یاد گرفتن بیا اینجا
#پایتون #آموزش_پایتون #Pandas #تحلیل_داده #PythonDataAnalysis #PythonProgramming
پارت ۲۱: معرفی Pandas برای تحلیل دادهها 📊
در این پارت با کتابخانه قدرتمند Pandas آشنا میشویم و یاد میگیریم چگونه از این ابزار برای تحلیل و پردازش دادهها استفاده کنیم.
۱. Pandas چیست؟ 🤔
Pandas یک کتابخانه متنباز برای زبان برنامهنویسی پایتون است که برای کار با دادههای ساختاریافته و جدولبندیشده به کار میرود. این کتابخانه ابزارهای متنوعی برای خواندن، نوشتن، پردازش و تحلیل دادهها فراهم میکند.
۲. نصب Pandas 🛠️
برای نصب Pandas از pip استفاده میکنیم:
pip install pandas
۳. ایجاد و کار با سریها (Series) 📝
سریها، ساختارهای دادهای یکبعدی در Pandas هستند. یک سری را میتوان به صورت یک ستون از یک جدول در نظر گرفت.
import pandas as pd
data = [1, 2, 3, 4, 5]
series = pd.Series(data)
print(series)
این کد:
- Pandas را ایمپورت میکند.
- یک لیست از دادهها ایجاد میکند.
- یک سری از دادهها ایجاد میکند و آن را چاپ میکند.
۴. ایجاد و کار با دیتافریمها (DataFrame) 📋
دیتافریمها، ساختارهای دادهای دوبعدی در Pandas هستند که میتوانند به صورت جداولی با ردیفها و ستونها در نظر گرفته شوند.
data = {
'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35],
'City': ['New York', 'San Francisco', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
این کد:
- یک دیکشنری از دادهها ایجاد میکند.
- یک دیتافریم از دادهها ایجاد میکند و آن را چاپ میکند.
۵. خواندن و نوشتن فایلهای CSV 📄
Pandas ابزارهایی برای خواندن و نوشتن فایلهای CSV فراهم میکند.
برای خواندن یک فایل CSV:
df = pd.read_csv('data.csv')
print(df.head())
برای نوشتن یک دیتافریم به فایل CSV:
df.to_csv('output.csv', index=False)
۶. فیلتر و مرتبسازی دادهها 🔍
Pandas ابزارهایی برای فیلتر و مرتبسازی دادهها فراهم میکند.
برای فیلتر کردن دادهها:
filtered_df = df[df['Age'] > 30]
print(filtered_df)
برای مرتبسازی دادهها:
sorted_df = df.sort_values(by='Age')
print(sorted_df)
۷. عملیات بر روی دیتافریمها ➕➖
Pandas امکان انجام عملیاتهای مختلف بر روی دیتافریمها را فراهم میکند.
برای اضافه کردن یک ستون جدید:
df['Salary'] = [50000, 60000, 70000]
print(df)
برای حذف یک ستون:
df = df.drop(columns=['Salary'])
print(df)
۸. گروهبندی و تجمع دادهها 📊
Pandas ابزارهایی برای گروهبندی و تجمع دادهها فراهم میکند.
برای گروهبندی دادهها:
grouped_df = df.groupby('City').mean()
print(grouped_df)
نکات مهم
- Pandas: یک کتابخانه قدرتمند برای تحلیل دادهها در پایتون است.
- سریها و دیتافریمها: ساختارهای دادهای پایهای برای کار با دادهها.
- خواندن و نوشتن فایلهای CSV: ابزارهای Pandas برای کار با فایلهای دادهای.
- فیلتر و مرتبسازی دادهها: امکانات Pandas برای جستجو و سازماندهی دادهها.
- عملیات بر روی دیتافریمها: افزودن، حذف و تغییر دادهها در دیتافریمها.
- گروهبندی و تجمع دادهها: ابزارهای Pandas برای تحلیلهای پیچیدهتر دادهها.
با این آموزش، شما میتوانید به راحتی دادهها را با استفاده از Pandas تحلیل و پردازش کنید. موفق باشید! 🌟
🔻برای بیشتر یاد گرفتن بیا اینجا
#پایتون #آموزش_پایتون #Pandas #تحلیل_داده #PythonDataAnalysis #PythonProgramming
📚 دوره آموزش پایتون از 0 تا 100
پارت ۲۳: پروژه نهایی - تحلیل دادهها 📊
در این پارت، از تمامی مفاهیمی که تا به حال آموختهایم، برای انجام یک پروژه نهایی تحلیل دادهها استفاده میکنیم. هدف این پروژه، تحلیل یک مجموعه داده و استخراج اطلاعات مفید از آن است.
۱. انتخاب مجموعه داده 📂
ابتدا باید یک مجموعه داده مناسب انتخاب کنیم. برای این پروژه، از مجموعه داده معروف "Titanic" استفاده خواهیم کرد. این مجموعه داده شامل اطلاعاتی درباره مسافران کشتی تایتانیک است و میتوانیم تحلیلهای جالبی بر روی آن انجام دهیم.
۲. نصب کتابخانههای مورد نیاز 🛠️
برای انجام تحلیل دادهها، نیاز به نصب کتابخانههای Pandas و NumPy داریم. اگر قبلاً این کتابخانهها را نصب نکردهاید، میتوانید از طریق pip آنها را نصب کنید:
۳. خواندن دادهها 📥
ابتدا مجموعه داده را با استفاده از Pandas وارد میکنیم:
۴. بررسی اولیه دادهها 🔍
برای آشنایی بیشتر با دادهها، یک بررسی اولیه انجام میدهیم:
۵. تمیز کردن دادهها 🧹
برای انجام تحلیلهای دقیقتر، نیاز به تمیز کردن دادهها داریم. این شامل پر کردن مقادیر گمشده و حذف دادههای نامعتبر است.
۶. تحلیل دادهها 📊
حال که دادهها تمیز شدهاند، میتوانیم تحلیلهای مختلفی بر روی آنها انجام دهیم. به عنوان مثال، بررسی میکنیم چند درصد از مسافران زنده ماندهاند.
۷. تحلیل گروهی دادهها 📋
یکی از ویژگیهای مفید Pandas، امکان گروهبندی دادهها و انجام تحلیلهای گروهی است. به عنوان مثال، بررسی میکنیم نرخ زندهماندن برای گروههای سنی مختلف چگونه است.
۸. رسم نمودارها 📈
برای نمایش نتایج تحلیلها، میتوانیم از کتابخانه Matplotlib استفاده کنیم. اگر این کتابخانه را نصب ندارید، با استفاده از pip آن را نصب کنید:
سپس میتوانیم یک نمودار میلهای از نرخ زندهماندن برای گروههای سنی مختلف رسم کنیم:
نکات مهم
- انتخاب مجموعه داده: استفاده از مجموعه داده Titanic.
- خواندن و بررسی دادهها: استفاده از Pandas برای خواندن و بررسی اولیه دادهها.
- تمیز کردن دادهها: پر کردن مقادیر گمشده و حذف دادههای نامعتبر.
- تحلیل دادهها: انجام تحلیلهای مختلف برای استخراج اطلاعات مفید.
- تحلیل گروهی دادهها: استفاده از گروهبندی برای تحلیل دقیقتر دادهها.
- رسم نمودارها: استفاده از Matplotlib برای نمایش بصری نتایج.
با این پروژه نهایی، شما قادر خواهید بود تحلیل دادهها را به طور کامل انجام دهید و نتایج خود را به صورت بصری نمایش دهید. موفق باشید! 🌟
🔻برای بیشتر یاد گرفتن بیا اینجا
#پایتون #آموزش_پایتون #تحلیل_داده #پروژه_نهایی #PythonDataAnalysis #PythonProgramming
پارت ۲۳: پروژه نهایی - تحلیل دادهها 📊
در این پارت، از تمامی مفاهیمی که تا به حال آموختهایم، برای انجام یک پروژه نهایی تحلیل دادهها استفاده میکنیم. هدف این پروژه، تحلیل یک مجموعه داده و استخراج اطلاعات مفید از آن است.
۱. انتخاب مجموعه داده 📂
ابتدا باید یک مجموعه داده مناسب انتخاب کنیم. برای این پروژه، از مجموعه داده معروف "Titanic" استفاده خواهیم کرد. این مجموعه داده شامل اطلاعاتی درباره مسافران کشتی تایتانیک است و میتوانیم تحلیلهای جالبی بر روی آن انجام دهیم.
۲. نصب کتابخانههای مورد نیاز 🛠️
برای انجام تحلیل دادهها، نیاز به نصب کتابخانههای Pandas و NumPy داریم. اگر قبلاً این کتابخانهها را نصب نکردهاید، میتوانید از طریق pip آنها را نصب کنید:
pip install pandas numpy
۳. خواندن دادهها 📥
ابتدا مجموعه داده را با استفاده از Pandas وارد میکنیم:
import pandas as pd
# خواندن دادهها از فایل CSV
df = pd.read_csv('titanic.csv')
# نمایش چند ردیف اول از دادهها
print(df.head())
۴. بررسی اولیه دادهها 🔍
برای آشنایی بیشتر با دادهها، یک بررسی اولیه انجام میدهیم:
# نمایش اطلاعات کلی درباره دادهها
print(df.info())
# نمایش آمار توصیفی از دادهها
print(df.describe())
۵. تمیز کردن دادهها 🧹
برای انجام تحلیلهای دقیقتر، نیاز به تمیز کردن دادهها داریم. این شامل پر کردن مقادیر گمشده و حذف دادههای نامعتبر است.
# پر کردن مقادیر گمشده با میانگین ستون
df['Age'].fillna(df['Age'].mean(), inplace=True)
# حذف ردیفهای با مقادیر گمشده در ستون Embarked
df.dropna(subset=['Embarked'], inplace=True)
۶. تحلیل دادهها 📊
حال که دادهها تمیز شدهاند، میتوانیم تحلیلهای مختلفی بر روی آنها انجام دهیم. به عنوان مثال، بررسی میکنیم چند درصد از مسافران زنده ماندهاند.
# محاسبه درصد زندهماندهها
survival_rate = df['Survived'].mean() * 100
print(f"درصد زندهماندهها: {survival_rate:.2f}%")
۷. تحلیل گروهی دادهها 📋
یکی از ویژگیهای مفید Pandas، امکان گروهبندی دادهها و انجام تحلیلهای گروهی است. به عنوان مثال، بررسی میکنیم نرخ زندهماندن برای گروههای سنی مختلف چگونه است.
# تعریف دستههای سنی
bins = [0, 12, 20, 40, 60, 80]
labels = ['کودک', 'نوجوان', 'جوان', 'میانسال', 'سالمند']
df['AgeGroup'] = pd.cut(df['Age'], bins=bins, labels=labels)
# محاسبه نرخ زندهماندن برای هر گروه سنی
age_group_survival = df.groupby('AgeGroup')['Survived'].mean() * 100
print(age_group_survival)
۸. رسم نمودارها 📈
برای نمایش نتایج تحلیلها، میتوانیم از کتابخانه Matplotlib استفاده کنیم. اگر این کتابخانه را نصب ندارید، با استفاده از pip آن را نصب کنید:
pip install matplotlib
سپس میتوانیم یک نمودار میلهای از نرخ زندهماندن برای گروههای سنی مختلف رسم کنیم:
import matplotlib.pyplot as plt
# رسم نمودار میلهای
age_group_survival.plot(kind='bar')
plt.title('نرخ زندهماندن برای گروههای سنی مختلف')
plt.xlabel('گروه سنی')
plt.ylabel('نرخ زندهماندن (%)')
plt.show()
نکات مهم
- انتخاب مجموعه داده: استفاده از مجموعه داده Titanic.
- خواندن و بررسی دادهها: استفاده از Pandas برای خواندن و بررسی اولیه دادهها.
- تمیز کردن دادهها: پر کردن مقادیر گمشده و حذف دادههای نامعتبر.
- تحلیل دادهها: انجام تحلیلهای مختلف برای استخراج اطلاعات مفید.
- تحلیل گروهی دادهها: استفاده از گروهبندی برای تحلیل دقیقتر دادهها.
- رسم نمودارها: استفاده از Matplotlib برای نمایش بصری نتایج.
با این پروژه نهایی، شما قادر خواهید بود تحلیل دادهها را به طور کامل انجام دهید و نتایج خود را به صورت بصری نمایش دهید. موفق باشید! 🌟
🔻برای بیشتر یاد گرفتن بیا اینجا
#پایتون #آموزش_پایتون #تحلیل_داده #پروژه_نهایی #PythonDataAnalysis #PythonProgramming