ایجاد نقشه حرارتی در دیتافریم
بسیاری از اوقات می خواهیم با یک نگاه رابطه بین متغیرها رو بررسی کنیم. یکی از بهترین نماگرها برای این موضوع، نقشه حرارتی است. به کمک پانداس به راحتی می توان نقشه حرارتی را تشکیل داد.
در مثال این پست، رابطه همبستگی بین بازدهی سهام چند شرکت از ابتدای 2024 بررسی و نقشه حرارتی آنها نیز مشخص می شود.
#پانداس
#همبستگی
#نقشه حرارتی
#pandas
#heatmaps
🆔 t.iss.one/python4finance
بسیاری از اوقات می خواهیم با یک نگاه رابطه بین متغیرها رو بررسی کنیم. یکی از بهترین نماگرها برای این موضوع، نقشه حرارتی است. به کمک پانداس به راحتی می توان نقشه حرارتی را تشکیل داد.
در مثال این پست، رابطه همبستگی بین بازدهی سهام چند شرکت از ابتدای 2024 بررسی و نقشه حرارتی آنها نیز مشخص می شود.
import pandas as pd
import yfinance as yf
df=yf.download(["GOOG","META","MSFT","AMZN","AAPL"],start="2024-01-01")["Adj Close"].pct_change().corr()
df.sort_values("AAPL",axis=0).style.format().background_gradient()
#پانداس
#همبستگی
#نقشه حرارتی
#pandas
#heatmaps
🆔 t.iss.one/python4finance
❤33
کار با مقادیر از دست رفته در پایتون، ماژول Pandas - بخش ششم (توابع جدید)
قبلا در این پست در خصوص تمیز کردن داده ها و کار با مقادیر از دست رفته (None و NAN) صحبت کرده بودیم. در به روزرسانی های اخیر پانداس، توابع ffill و bfill جایگزین fillna(method='ffill') و fillna(method='bfill') شده اند و از نسخه 2.1.0 این تغییر اتفاق افتاده است. در صورتی که در کدهای خود از این توابع استفاده کرده اید، هر چه سریعتر نسبت به بروزرسانی اقدام نمایید.
#pandas
#fillna
#bfill
#ffill
پایتون برای مالی
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
قبلا در این پست در خصوص تمیز کردن داده ها و کار با مقادیر از دست رفته (None و NAN) صحبت کرده بودیم. در به روزرسانی های اخیر پانداس، توابع ffill و bfill جایگزین fillna(method='ffill') و fillna(method='bfill') شده اند و از نسخه 2.1.0 این تغییر اتفاق افتاده است. در صورتی که در کدهای خود از این توابع استفاده کرده اید، هر چه سریعتر نسبت به بروزرسانی اقدام نمایید.
#pandas
#fillna
#bfill
#ffill
پایتون برای مالی
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
❤22
اختصاصی سازی مقادیر نمایش داده شده در pandas
یکی از ویژگی های جالب پانداس، امکانات بسیار خوبی است که برای اختصاصی سازی داده ها به کاربر می دهد. برای مثال فرض کنید می خواهیم به جای داده های Nan عبارت خالی را نمایش دهیم. یا می خواهیم داده ها را به صورت سه رقم سه رقم نمایش دهیم. برای این کار به آسانی می توانیم از style.format استفاده کنیم.
در مثال این پست، اختصاصی سازی داده ها برای مقادیر مختلف نمایش داده می شود.
#پایتون_مالی
#پانداس
#pandas
عضویت در کانال پایتون برای مالی👇👇👇
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
یکی از ویژگی های جالب پانداس، امکانات بسیار خوبی است که برای اختصاصی سازی داده ها به کاربر می دهد. برای مثال فرض کنید می خواهیم به جای داده های Nan عبارت خالی را نمایش دهیم. یا می خواهیم داده ها را به صورت سه رقم سه رقم نمایش دهیم. برای این کار به آسانی می توانیم از style.format استفاده کنیم.
در مثال این پست، اختصاصی سازی داده ها برای مقادیر مختلف نمایش داده می شود.
import pandas as pd
df = pd.DataFrame([[np.nan, 1234567, np.nan], [2.0, 'A' , 3.0]])
df.style.format(thousands=",", precision=2 , decimal="/", na_rep='خالی')
#پایتون_مالی
#پانداس
#pandas
عضویت در کانال پایتون برای مالی👇👇👇
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
❤30
خلاصه بندی OHLC داده ها با resample
یکی از توابع بسیار کاربردی pandas تابع resample است. به کمک این تابع می توانیم تناوب داده ها را تغییر دهیم. مثلا داده های ساعتی را به داده های روزانه تبدیل کنیم یا داده های روزانه را به هفتگی، ماهانه و سالانه.
یکی از بخش های قشنگ این ماژل تبدیل داده ها به فرمت OHLC است. یعنی داده های مربوط به بازشدن، بالاترین داده، کمترین داده و داده بسته شده. (البته برای بچه های بازار سرمایه این فرمت آشناست، اما برای سایر رشته ها شاید کمی عجیب به نظر برسد)
فرض کنید داده های ساعتی هواشناسی را داریم. می خواهیم دمای هوا در ابتدا و انتهای روز و نیز بالاترین دما و پایین ترین دما را مشخص و رسم کنیم.
با استفاده از resample به راحتی قابل انجام است.
#پانداس
#pandas
#resample
پایتون برای مالی
🆔 @python4finance
یکی از توابع بسیار کاربردی pandas تابع resample است. به کمک این تابع می توانیم تناوب داده ها را تغییر دهیم. مثلا داده های ساعتی را به داده های روزانه تبدیل کنیم یا داده های روزانه را به هفتگی، ماهانه و سالانه.
یکی از بخش های قشنگ این ماژل تبدیل داده ها به فرمت OHLC است. یعنی داده های مربوط به بازشدن، بالاترین داده، کمترین داده و داده بسته شده. (البته برای بچه های بازار سرمایه این فرمت آشناست، اما برای سایر رشته ها شاید کمی عجیب به نظر برسد)
فرض کنید داده های ساعتی هواشناسی را داریم. می خواهیم دمای هوا در ابتدا و انتهای روز و نیز بالاترین دما و پایین ترین دما را مشخص و رسم کنیم.
با استفاده از resample به راحتی قابل انجام است.
import pandas as pd
import mplfinance as mpf
url="https://python4finance.ir/datafolder/WeatherData.csv"
df=pd.read_csv(url,index_col="Date/Time" , parse_dates=True)
mpf.plot(df.loc["01/01/2012 00:00":"05/01/2012 00:00"]["Temp_C"].resample("D").ohlc(),type="candle",figsize=(16,6),mav=(10))
#پانداس
#pandas
#resample
پایتون برای مالی
🆔 @python4finance
❤35
یک کتابخانه بسیار سریع برای کار با داده ها-Polars
در پایتون برای مشاهده و دستکاری داده ها عموما از Pandas استفاده می کنیم. پانداس کتابخانه بسیار خوب و جامعی است اما وقتی تعداد داده ها بزرگ می شود کارایی پانداس رفته رفته کم می شود و سرعت پردازش هم پایین می آید. البته دلیل آن مشخص است. پانداس برای کار با Multithreading ساخته نشده است و در هر لحظه یک thread را پردازش می کند.
برای حل این موضوع از Polars استفاده می کنیم. Polars بر سرعت و کارایی تمرکز دارد. هنگام کار با میلیونها ردیف، پانداس دچار مشکل می شود اما با Polars به راحتی اجرا میشوند.
یک ویژگی جالب دیگر Polars توانایی پردازش داده های با حجم بالاتر از RAM سیستم است.
کار با polars بسیار ساده است و توابع آن شبیه پانداس نوشته است.
اگر به این ماژول علاقه مند شدید سری به این آدرس بزنید.
در تصویر این پست، مقایسه چند ماژول متداول کار با داده ها برای کار با یک دیتافریم بزرگ نشان داده شده است.
#polars
#pandas
#dataframe
پایتون برای مالی
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
در پایتون برای مشاهده و دستکاری داده ها عموما از Pandas استفاده می کنیم. پانداس کتابخانه بسیار خوب و جامعی است اما وقتی تعداد داده ها بزرگ می شود کارایی پانداس رفته رفته کم می شود و سرعت پردازش هم پایین می آید. البته دلیل آن مشخص است. پانداس برای کار با Multithreading ساخته نشده است و در هر لحظه یک thread را پردازش می کند.
برای حل این موضوع از Polars استفاده می کنیم. Polars بر سرعت و کارایی تمرکز دارد. هنگام کار با میلیونها ردیف، پانداس دچار مشکل می شود اما با Polars به راحتی اجرا میشوند.
یک ویژگی جالب دیگر Polars توانایی پردازش داده های با حجم بالاتر از RAM سیستم است.
کار با polars بسیار ساده است و توابع آن شبیه پانداس نوشته است.
اگر به این ماژول علاقه مند شدید سری به این آدرس بزنید.
در تصویر این پست، مقایسه چند ماژول متداول کار با داده ها برای کار با یک دیتافریم بزرگ نشان داده شده است.
#polars
#pandas
#dataframe
پایتون برای مالی
🆔 t.iss.one/python4finance
🆔 ble.ir/python4finance
❤19