مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
3.2K subscribers
354 photos
39 videos
10 files
312 links
🔹یادگیری گام‌به‌گام مهارت کار با داده‌ها

وبسایت: d-learn.ir

▫️شناسه تلگرام پشتیبانی مدرسه
@dlearnsup

▫️اینستاگرام
instagram.com/dlearn.ir
▫️توییتر
twitter.com/dlearn_ir
▫️لینکدین
linkedin.com/company/dlearn
Download Telegram
سال نو مبارک 🌾

خوشنویسی: مریم رمضانخانی
تذهیب: حمیده زارع‌دار

نوروز ۱۴۰۴

@dmag_ir
@dlearn_ir
✍️ به نظر شما کدام گزینه معادل بهتری برای data science است؟

علم داده
علم داده‌ها
علوم داده
علوم داده‌ها

سه دلیل می‌توان ذکر کرد که✔️ «علوم داده» در مقایسه با سایر گزینه‌ها در مجموع معادل بهتری برای ترجمه data science در زبان فارسی است:

📍 تفاوت علم و science در زبان فارسی و انگلیسی
📍 سابقه استفاده از «علوم» برای معادل‌سازی science
📍 شباهت به computer science از نظر ماهیت کاربردی و بین رشته‌ای


بررسی معادل‌های فارسی data science در گوگل ترند نشان می‌دهد همه ترکیب‌های ممکن در جستجوهای کاربران در گوگل آمده اما سهم «علم داده» و «علوم داده» از سایر گزینه‌ها بیشتر است.

اگر آنچه در دهه‌های گذشته در زبان فارسی متعارف بوده و به نوعی عرف زبانی تبدیل شده را معیار قرار دهیم، می‌توان به اختصار گفت علوم داده ترجمه بهتری از علم داده است همچنان که علوم کامپیوتر ترجمه بهتری از علم کامپیوتر بوده است.

متن کامل پاسخ علیرضا کدیور به این پرسش را در مجله پرانتز در وبسایت مدرسه دقیقه مطالعه کنید:

d-learn.ir/p/data-science-fa

#واژگان_علم_و_فناوری_در_زبان_فارسی

@dlearn_ir
مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
🔵 استخراج داده از وب محیط وب یکی از بزرگترین منابع برای داده‌ در موضوعات گوناگون است. اگر می‌خواهید قیمت‌های یک فروشگاه اینترنتی را یکجا استخراج کنید، داده‌های بورس یا قیمت ارز را از وبسایت‌های مربوطه بدست آورید، یا آمار اقتصادی و محیط زیستی وبگاه یک سازمان…
This media is not supported in your browser
VIEW IN TELEGRAM
📽️ استخراج داده از وب

#ویدئوی_معرفی_دوره

🎓 مجید پورکاشانی | هم‌بنیان‌گذار، توسعه‌دهنده نرم‌افزار و مهندس داده در شرکت پردازش و تحلیل داده دقیقه، کارشناسی مهندس برق از دانشگاه شریف و کارشناسی ارشد هوش مصنوعی از دانشگاه علم‌و‌صنعت

Web Scraping with Python and Other Tools

📆 چهارشنبه‌ها ۱۸:۳۰ تا ۲۱:۳۰
🗓 از ۱۷ اردیبهشت ۱۴۰۴
⏺️ ۱۵ ساعت (۵ هفته)
🎞 با دسترسی به ویدئوی جلسات
🏅 گواهی پایان دوره (قابل استعلام)

برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: SpfR30
🙂 کد تخفیف 20% برای پرداخت قسطی: SpFr20

🔴 اعتبار کدهای تخفیف تا ۲۲ فروردین ۱۴۰۴

🔗 لینک ثبت نام:

d-learn.ir/wbsp

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
🖼 تصویرگری با قلموی الگوریتم
💡 با توماس لین پدرسن و هنر زایشگر آشنا شوید

🔴 توماس لین پِدِرسن متخصص بیوانفورماتیک و زیست‌شناسی محاسباتی که به علوم داده روی آورده و علاوه بر زندگی حرفه‌ای، تخصص و علمش را در خدمت هنر در آورده و به خلق چنین آثار زیبایی می‌پردازد.

🟠 در این تصاویر معمولا جزئیات زیادی وجود دارد. اشکال و رنگ‌ها با ظرافت و هارمونی خیره‌کننده‌ای در کنار یکدیگر قرار می‌گیرند و توجه بیننده را به خود جلب می‌کنند.
این گونه آثار با تصمیمات نقاش و حرکت قلموی او روی بوم نقاشی تولید نمی‌شود، بلکه با استفاده از مجموعه‌ای محدود و مشخص از قواعد و مقدارهای اولیه اولیه که معمولا تحت عنوان سامانه‌های مولد یا زایشگر از آن یاد می‌شود.

🔵 توماس در حقیقت خود را هنرمندی می‌داند که تمرکز اصلی‌اش کشف زیبای سیستم‌های دینامیکی است. به گفته خودش هر چه بیشتر با سیستم‌های دینامیکی آشنا شوی قلموی نقاشی بیشتر در دستت آرام و قرار می‌گیرد اما همیشه قدری از پیش‌بینی‌ناپذیری و شگفت‌زدگی وجود دارد.

🔴 او آثار هنری خود را از به وجود آوردن سامانۀ مولد تا بصری‌سازی داده‌ها در محیط #R انجام می‌دهد و علاوه بر کتابخانه #ggplot2، از کتابخانه‌های ggforce, ambient, particles, tidygraph, و ggraph که بیشتر آن‌ها را نیز خودش توسعه داده‌ استفاده می‌کند.

🟢 یادداشت کامل «تصویرگری با قلموی الگوریتم» و دیگر آثار توماس لین پدرسن را می‌توانید در مجله پرانتز بخوانید:
🔗 d-learn.ir/p/generative-art-thomas-lin-pedersen

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
📽️ استخراج داده از وب #ویدئوی_معرفی_دوره 🎓 مجید پورکاشانی | هم‌بنیان‌گذار، توسعه‌دهنده نرم‌افزار و مهندس داده در شرکت پردازش و تحلیل داده دقیقه، کارشناسی مهندس برق از دانشگاه شریف و کارشناسی ارشد هوش مصنوعی از دانشگاه علم‌و‌صنعت Web Scraping with Python…
🖥 وب‌اسکرپینگ چیست و چرا اهمیت دارد؟

وب‌اسکرپینگ به فرایند استخراج خودکار داده‌ها از وب‌سایت‌ها گفته می‌شود. این روش به کاربران امکان می‌دهد تا بدون نیاز به ورود دستی اطلاعات، داده‌های مورد نیاز را از صفحات وب جمع‌آوری کرده و برای تحلیل‌های بعدی ذخیره‌سازی کنند.

این فرآیند را می‌توان به مثابه بهره‌گیری از یک مکانیزم خودکار با سرعت و دقت بالا برای پیمایش و استخراج داده از صدها یا هزاران صفحه وب در کوتاه‌ترین زمان ممکن، تصور نمود.

چرا وب‌اسکرپینگ؟

کسب مهارت در وب اسکرپینگ، مجموعه‌ای از مزایای فنی و استراتژیک قابل توجه را ارائه می‌دهد:

۱- جمع‌آوری کارآمد داده‌ها
۲- تحقیقات مقرون به صرفه
۳- دقت بالا
۴- دسترسی به داده‌های با سرعت بالا
۵-- تحلیل رقابتی
۶-- جمع‌آوری داده‌های قابل سفارشی‌سازی

💡 کاربردهای واقعی در کسب‌و کارها

۱- اتوماسیون فرآیندهای جمع‌آوری داده‌ها
۲- پایش و بهینه‌سازی پویای قیمت‌ها
۳- تولید لیدهای هوشمند
۴- تحلیل احساسات
۵- تحقیقات بازار و هوش تجاری
۶- پژوهش‌های علمی و مطالعات اجتماعی
۷- بازارهای مالی و سرمایه‌گذاری؟
۸- روزنامه‌نگاری و رسانه‌ها

توضیحات در مورد نمونه‌های کاربردی برای هر یک از کاربردها، آینده شغلی و مطالعه کامل متن در لینک زیر در دسترس است:
🔗 d-learn.ir/p/what-is-web-scraping


🔥همچنین اگر علاقه‌مند به یادگیری این مهارت هستید، دوره آموزشی استخراج #داده از وب برای شما طراحی شده است. جزییات دوره و سرفصل‌ها در صفحه‌ی دوره در دسترس است:
👆 d-learn.ir/wbsp

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
🔵 مدیریت محصول موفقیت یک محصول تنها به ایده‌های خلاقانه بستگی ندارد. مدیریت درست محصول از مرحله ایده‌پردازی تا عرضه و توسعه، نقش حیاتی در موفقیت آن دارد. دوره آموزشی «مدیریت محصول» طراحی شده است تا شما را با اصول، ابزارها و تکنیک‌های کلیدی این حوزه آشنا کند…
📈 شاخص‌های کلیدی عملکرد در مدیریت محصول

شاخص‌های محصول به شما کمک می‌کنند موفقیت و شکست را بسنجید و محصولاتی سریع‌تر، هوشمندانه‌تر و بهتر تولید کنید.
در ادامه برخی از این شاخص‌ها آمده‌اند:

💸 شاخص‌های درآمدی

🟢درآمد مکرر ماهیانه
Monthly Recurring Revenue (MRR)
درآمد کل ماهانه‌ای که انتظار می‌رود در یک ماه ایجاد شود.

🔴میانگین درآمد به ازای هر مشتری
Average Revenue Per User (ARPU)
چه میزان درآمد به ازای هر کاربر به صورت ماهانه یا سالانه ایجاد خواهد شد.

🔵ارزش طول عمر مشتری
Customer Lifetime Value (CLTV)
محاسبه درآمد قابل پیش‌بینی که می‌توانید در طول دوره عمر یک مشتری به عنوان کاربر پرداخت‌کننده کسب کنید.

🔴هزینه جذب مشتری
Customer Acquisition Cost (CAC)
هزینه جذب یک مشتری برای پرداخت هزینه محصول، شامل بازاریابی، فروش و تبلیغات.

👥 شاخص‌های کاربران

🔴 کاربران فعال روزانه/ماهانه
Daily/Monthly Active Users (DAU/MAU)
آیا کاربران در حال کاهش یا افزایش هستند و به پیش‌بینی، بودجه‌بندی و برنامه‌ریزی کمک می‌کند.

🔴بازدید از سایت
Website Traffic (Traffic)
چه تعداد کاربر وب‌سایت شما را پیدا کرده‌اند و به شما کمک می‌کنند تبلیغات، سئو و هزینه‌ها را سازماندهی کنید.

🟣نرخ پرش
Bounce rate (BR)
درصد کاربرانی که بعد از دیدن یک صفحه خارج شده‌اند. هر چه درصد پایین‌تر باشد، بهتر است.

🟠میانگین زمان سپری شده
Average Session Duration(A.SD)
پیگیری می‌کند کاربران به طور متوسط چه مدت زمانی را در وب‌سایت شما می‌گذرانند.

☺️ شاخص‌های رضایت

🔵نرخ ریزش
Churn Rate (CR)
پیگیری درصد کاربرانی که استفاده از محصول شما را در یک دوره زمانی مشخص متوقف کرده‌اند.

🔴شاخص خالص ترویج‌کنندگان
Net Promoter Score (NPS)
روشی برای دریافت بازخورد از کاربران و سنجش رضایت کلی آنها از محصول.

🟢نرخ جذب
Acquisition Rate (AR)
روشی برای دریافت بازخورد از کاربران و سنجش رضایت کلی آنها از محصول.

🔴نرخ حفظ مشتری
Client Retention Rate (CRR)
نشان‌دهنده توانایی محصول در حفظ کاربران و تعامل با آنها در یک دوره زمانی طولانی است.

⬇️
همچنین اگر علاقه‌مند به یادگیری گام به گام و پروژه‌محور مهارت‌های ساخت و ارزیابی محصول هستید دوره‌ آنلاین مدیریت محصول برای شما طراحی شده‌است. اطلاعات بیشتر در:
🔗 d-learn.ir/pdmn

📞 تماس:

📲t.iss.one/dlearnsup
📱 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
🙂 دوره‌های آنلاین مدرسه دقیقه در بهار ۱۴۰۴

🔵 یادگیری ماشین با پایتون

Saeed Majidi | Hamideh Hosseinzadeh

https://d-learn.ir/mlpy

🔴 استفاده از هوش مصنوعی در زندگی حرفه‌ای

Alireza Chamanzar | Majid Pourkashani | Saeed Majidi | Hesam Mohammad Hosseini

https://d-learn.ir/mlpy

🟢 استخراج داده از وب

Majid Pourkashani

https://d-learn.ir/wbsp
🟠 پردازش بهینه با pandas و polars

Hesam Mohammad Hosseini

https://d-learn.ir/pyps

🔵 مدیریت محصول

AmirKhosro Bahadori

https://d-learn.ir/pdmn


برای استفاده از تخفیف‌‌های زیر تا ۲۲ فروردین ۱۴۰۴ ثبت‌نام کنید.

🙂 کد تخفیف 30% برای پرداخت کامل: SpfR30
🙂 کد تخفیف 20% برای پرداخت قسطی: SpfR20

شروع از دوره‌ها از نیمه اردیبهشت‌ ۱۴۰۴

📲 تماس:
@dlearnsup
09103209837
02188349244

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
Photo
💰 نگاهی بر گزارش حقوق و دستمزد جاب‌ویژن ١۴٠۴
در حوزه‌های مرتبط با داده

پلتفرم خدمات کاریابی و #استخدام جاب‌ویژن از از سال 1399، پیوسته گزارش‌هایی را با عنوان حقوق و دستمزد با نظرسنجی از نیروهای کار در سراسر کشور منتشر می‌کند. گزارش حقوق و دستمزد 1404 با شرکت بیش از 100هزار نفر، در 600 خانواده شغلی به تفکیک گروه شغلی، سطح ارشدیت و جغرافیا اخیرا منتشر شده‌است.
در این نوشته، اطلاعات و نکات مهم این گزارش و به صورت اختصاصی مشاغل مربوط به داده بازنشر شده.

💡 مهم‌ترین یافته‌های گزارش

کارفرماها و کارجویان اعتقاد دارند که به‌دلیل وجود شرایط تورمی در کشور، حقوق افراد باید متناسب با تورم افزایش یابد تا قدرت خریدشان ثابت بماند.
بنا به دلایل مختلف از جمله گروه شغلی، مدت حضور در بازار کار و… حقوق #زنان ٪۲۸ کمتر از مردان است.
سطح ارشدیت مهم‌ترین عامل برای افزایش حقوق است، درحالی‌که سابقه کار در میانه مسیر شغلی بی‌تاثیر می‌شود.
اکثر مشاغلی که مرتبط با تکنولوژی بوده‌اند (مانند توسعه نرم‌افزار، مدیر محصول و تحلیل‌گر کسب‌و‌کار، هوش مصنوعی و علوم داده و ...) حقوق‌های بالایی دارند و رشد زیادی را تجربه کرده‌اند.
نوع #دانشگاه محل تحصیل #کمترین تاثیر را بر حقوق دریافتی دارد.

🌐اعداد حقوق ۱۴۰۳ و ۱۴۰۴ شغل‌های مرتبط با حوزه داده به دلیل محدودیت تلگرام در اینستاگرام مدرسه ببینید.

همچنین می‌توانید گزارش کامل را از سایت جاب‌ویژن دانلود کنید.

🔴🔴🔴🔴
تا ۲۲ فروردین وقت دارید تا دوره‌های بهار مدرسه دقیقه را با تخفیف خریداری کنید؛
+  یادگیری ماشین با پایتون
*  استفاده از هوش مصنوعی در زندگی حرفه‌ای
+  استخراج داده از وب
* پردازش بهینه با pandas و polars

🟢 اطلاعات بیشتر:
https://t.iss.one/dlearn_ir/575

برای استفاده از تخفیف‌‌های زیر تا ۲۲ فروردین ۱۴۰۴ ثبت‌نام کنید.

🙂  کد تخفیف 30% برای پرداخت کامل: SpH30
🙂  کد تخفیف 20% برای پرداخت قسطی: FGh20

شروع از دوره‌ها از نیمه اردیبهشت‌ ۱۴۰۴

📲 تماس:
@dlearnsup
09103209837
02188349244

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
🔴 یادگیری ماشین با پایتون

🖥 جزئیات بیشتر و لینک ثبت نام:

d-learn.ir/mlpy

Machine Learning with Python 

🎓 Saeed Majidi 
🎓 Hamideh Hosseinzadeh


#دوره_آموزشی_آنلاین

📽️ ویدئوی اول معرفی دوره 📽️
📽️ ویدئوی دوم معرفی دوره 📽️


📆  یکشنبه‌ها ۱۸:۰۰ تا ۲۱:۱۵
🗓  از ۱۴ اردیبهشت ۱۴۰۴
⏺️ ۳۰ ساعت (۱۰ هفته)
🎞 با دسترسی به ویدئوی جلسات
🏅 گواهی پایان دوره (قابل استعلام)

 برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂  کد تخفیف 30% برای پرداخت کامل: SpH30
🙂  کد تخفیف 20% برای پرداخت قسطی: FGh20

🔴 ثبت نام با تخفیف تا ۲۲ فروردین ۱۴۰۴:

d-learn.ir/mlpy

تماس:
@dlearnsup
09103209837
02188349244

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
👇 بهترین فرصت برای یادگیری اصول پردازش بهینه و شروع دست‌ورزی با داده‌های حجیم در پایتون!

🟠 پردازش بهینه داده با pandas و polars

#دوره_آموزشی_آنلاین

🎓 حسام محمدحسینی | مدیر ارشد مهندسی داده و پلتفرم مدیریت ارزش مشتری در ایرانسل

📽️ ویدئوی معرفی دوره 📽️


🖥 جزئیات بیشتر و لینک ثبت نام:

d-learn.ir/pyps

✍️ آشنایی با کتابخانه پانداس (pandas):

d-learn.ir/what-is-pandas

برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: SpH30
🙂 کد تخفیف 20% برای پرداخت قسطی: FGh20

🔴 ثبت نام با تخفیف تا ۲۲ فروردین ۱۴۰۴:

d-learn.ir/mlpy

تماس:
@dlearnsup
09103209837
02188349244

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
👇 بسیاری از فعالیت‌های ما در محیط کار تکراری هستند و با کمک گرفتن از هوش مصنوعی با سرعت و دقتی به مراتب بیشتر انجام می‌شوند. با تمرین کار با ابزارهای هوش مصنوعی بهره‌وری سازمان خود را بالا ببرید!

🔵 استفاده از هوش مصنوعی (AI) در زندگی حرفه‌ای

مجیدپورکاشانی | علیرضا چمن‌زار | سعید مجیدی | حسام محمدحسینی

#دوره_آموزشی_آنلاین

برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: SpH30
🙂 کد تخفیف 20% برای پرداخت قسطی: FGh20

🔴 ثبت نام با تخفیف تا ۲۲ فروردین ۱۴۰۴:

🔗 لینک ثبت نام:

d-learn.ir/ai4p

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
👇 یکی از مهم‌ترین مزیت‌های تحلیلگران داده به‌کارگیری داده‌های برون‌سازمانی در پروژه‌های تحلیل‌ داده است؛ با یادگیری روش‌ها و ابزارهای وب‌اسکرپینگ برای خود در بازار کار تحلیل داده مزیت ایجاد کنید!

🙂 استخراج داده از وب

#دوره_آموزشی_آنلاین

🎓 مجید پورکاشانی 🎓
🎥 ویدئوی معرفی دوره 🎥

✍️ وب اسکرپینگ چیست:

d-learn.ir/p/what-is-web-scraping


برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: SpH30
🙂 کد تخفیف 20% برای پرداخت قسطی: FGh20

🔴 ثبت نام با تخفیف تا ۲۲ فروردین ۱۴۰۴

🔗 لینک ثبت نام:

d-learn.ir/wbsp

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
👇 مدیریت محصول یکی از بهترین فرصت‌های شغلی برای علاقه‌مندان تحلیل داده و تحلیل کسب‌و‌کار است. مهم‌ترین مفاهیم و روش‌های مدیریت محصول را در به صورت فشرده فرا بگیرید:

🔵 مدیریت محصول

#دوره_آموزشی_آنلاین

✍️ شاخص‌های کلیدی عملکرد در مدیریت محصول:

t.iss.one/dlearn_ir/569

✍️ مزایای درآمدی مدیران محصول:

t.iss.one/dlearn_ir/576

برای استفاده از تخفیف بیشتر زودتر ثبت‌نام کنید:

🙂 کد تخفیف 30% برای پرداخت کامل: SpH30
🙂 کد تخفیف 20% برای پرداخت قسطی: FGh20

🔴 ثبت نام با تخفیف تا ۲۲ فروردین ۱۴۰۴

🔗 لینک ثبت نام:

d-learn.ir/pdmn

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
مدرسه دقیقه | تحلیل داده، هوش مصنوعی، علوم داده، هوش تجاری، داده‌کاوی و یادگیری ماشین
👇 مدیریت محصول یکی از بهترین فرصت‌های شغلی برای علاقه‌مندان تحلیل داده و تحلیل کسب‌و‌کار است. مهم‌ترین مفاهیم و روش‌های مدیریت محصول را در به صورت فشرده فرا بگیرید: 🔵 مدیریت محصول #دوره_آموزشی_آنلاین ✍️ شاخص‌های کلیدی عملکرد در مدیریت محصول: t.iss.one/dlearn_ir/569…
Media is too big
VIEW IN TELEGRAM
معرفی دوره مدیریت محصول
#دوره_آموزشی_آنلاین

🎓 امیرخسرو بهادری | مدیر محصول شرکت استرالیایی Dirodi، مدیـر سـابق در تیم‌های برنامه‌ریزی و تحقیقات بازار پاکشوما، BAT و هولدینگ کوبل‌دارو، فارغ‌التحصیل کارشناسی ارشد مهندسی صنایع از  دانشگاه صنعتی شریف

موفقیت یک محصول تنها به ایده‌های خلاقانه بستگی ندارد. مدیریت درست محصول از مرحله ایده‌پردازی تا عرضه و توسعه، نقش حیاتی در موفقیت آن دارد. دوره آموزشی «مدیریت محصول» طراحی شده است تا شما را با اصول، ابزارها و تکنیک‌های کلیدی این حوزه آشنا کند و در یک دوره زمانی فشرده، شما را برای تبدیل‌شدن به یک مدیر محصول حرفه‌ای آماده سازد. اگر می‌خواهید محصولاتی بسازید که نیاز واقعی کاربران را برآورده کند و حضوری موثر در بازار داشته باشد، این دوره بهترین نقطه شروع برای شماست.

🔗 لینک ثبت نام:

d-learn.ir/pdmn

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM
↗️پاک‌سازی داده‌ها با پانداس (Pandas)

در فرایند تحلیل معمولا داده‌ها نیاز به پیش‌پردازش و پاکسازی دارند تا به قالب مناسبی برای تحلیل نهایی برسند.

فرایند پاکسازی معمولا این چند مرحله است:
+ تغییر نام ستون‌ها
+ تغییر جنس ستون‌ها
+ مشاهده و حذف داده‌های تکراری
+ حذف داده‌های حاوی NaN
+ حذف سطر و ستون

⬇️تغییر نام ستون‌ها

DataFrame.rename(columns = {dict}, inplace = True)

عبارت columns: یک دیکشنری که نام فعلی ستون‌ها Key و نام جدید آنها Valueهای این دیکشنری هستند.
عبارت inplace: بیان می‌کند که این تغییرات بلافاصله بر روی DataFrame فعلی و بدون نیاز به یک کپی از آن انجام شود (True) یا خیر (False).

🔴تغییر نوع ستون‌ها

#بررسی نوع ستون‌ها
print(provincesDF.dtypes)

'''
province      object
center        object
region        float64
population    float64
area          float64
dtype: object
'''
#تغییر نوع ستون انتخابی
provincesDF['region'] = provincesDF['region'].astype(str)

print(provincesDF.dtypes) #خروجی

'''
province      object
center        object
region        object
population    float64
area          float64
dtype: object
'''


🟡مشاهده داده‌های تکراری
برای پی‌بردن به اینکه آیا DataFrame حاوی سطری تکراری است، از تابع زیر استفاده می‌شود:

DataFrame.duplicated(keep = ['first', 'last'])


این تابع یک لیست حاوی مقادیر Boolean و به‌اندازه تعداد سطرها برمی‌گرداند. به هر‌سطری که تکراری باشد مقدار True نسبت داده می‌شود. دقت داشته باشید که دو سطر درصورتی تکرار هم درنظرگرفته می‌شوند، که در تمامی ستون‌ها مقادیر آنها دقیقا مشابه یکدیگر باشد.

عبارت keep: فرض کنید که دوسطر i و j تکراری باشند و i قبل از j قرار گرفته باشد. درصورتی‌که 'keep = 'first باشد، Pandas سطر i را نگه‌داشته و سطر j را تکراری اعلام می‌کند. درصورتی که 'keep = 'last باشد، برعکس این اتفاق رخ می‌دهد و سری i تکراری درنظر گرفته می‌شود.

🔵حذف داده‌های تکراری
پس از تشخیص وجود داده، سطر، تکراری می‌توانیم، درصورت نیاز، با استفاده از تابع زیر اقدام به حذف آن سطور کنیم :

DataFrame.drop_duplicates(inplace, keep = ['first','last'])


این تابع یک لیست حاوی مقادیر Boolean و به‌اندازه تعداد سطرها برمی‌گرداند. به هر‌سطری که تکراری باشد مقدار True نسبت داده می‌شود. دقت داشته باشید که دو سطر درصورتی تکرار هم درنظرگرفته می‌شوند، که در تمامی ستون‌ها مقادیر آنها دقیقا مشابه یکدیگر باشد.
عبارت inplace: یک مقدار Boolean که مشخص می‌کند که عمل حذف بر روی خود DataFrame انجام شود ('inplace = 'True) و یا DataFrame بدون تغییر مانده و عمل حذف بر روی یک کپی از آن اعمال شود ('inplace = 'False). مقدار پیش‌فرض برابر با False است.
عبارت keep: بیان می‌کند که از اعضای تکراری، مورد اول ('first') و یا مورد آخر('last') نگه‌داشته شوند.

🟠 کشف و مشاهده داده‌های ناموجود
در مرحله اول باید بررسی کنیم که آیا DataFrame حاوی مقدار Null است یا خیر. برای این‌ امر از تابع ()isnull استفاده می‌کنیم:

DataFrame.isnull()


خروجی این تابع یک DataFrame به اندازه‌ی DataFrame اصلی است که محتوای آن مقادیر  True/False می‌باشد. اگر مقدار خانه‌ای برابر با True باشد، به این معنی است که خانه‌ی متناظر در DataFrame اصلی حاوی مقدار Null است.

🟢 حذف داده‌های ناموجود
ساده‌ترین رویکرد برخورد با داده‌های ناموجود، حذف سطرها و یا ستون هایی است که  حداقل در یکی از خانه‌ها مقداری ندارند. Pandas برای این روش از تابع ()dropna استفاده می‌کند:

DataFrame.isnull(inplace, axis = {0,1})


عبارت inplace: یک مقدار Boolean که مشخص می‌کند که عمل حذف بر روی خود DataFrame انجام شود ('inplace = 'True) و یا DataFrame بدون تغییر مانده و عمل حذف بر روی یک کپی از آن اعمال شود ('inplace = 'False). مقدار پیش‌فرض برابر با False است.
عبارت axis: درصورتی که 0 باشد بیانگر حذف سطر و 1 بیانگر حذف ستون است. مقدار پیش‌فرض آن برابر با 0 (حذف سطر) است.

📷 به دلیل محدودیت تعداد کلمات  در تلگرام می‌توانید ادامه بحث را در اینستاگرام مدرسه دقیقه دنبال کنید.

💡  این آموزش بخشی از درسنامه پردازش و تبدیل داده با پانداس pandas که از بخش درسنامه‌ها می‌توانید از آن استفاده کنید.

👇
همچنین اگر علاقه‌مند به یادگیری مهارت‌های پردازش و تحلیل داده‌های حجیم در پایتون هستید، دوره آموزشی  پردازش بهینه با pandas و polars برای شما طراحی شده‌است.

🙂  کد تخفیف 25% برای پرداخت کامل: HpCd25
🙂  کد تخفیف 15% برای پرداخت قسطی: DphC15

🔴 اعتبار کدهای تخفیف تا ۵ اردیبهشت ۱۴۰۴

لینک ثبت‌نام:
🔗 d-learn.ir/pyps

تماس:
📱 t.iss.one/dlearnsup
📞 02188349244
📲 09103209837

@dlearn_ir
Please open Telegram to view this post
VIEW IN TELEGRAM