Data Science
2.29K subscribers
108 photos
62 videos
17 files
104 links
آموزش نوین علم داده و رویکردهای داده محور
@DataScience :: Machine Learning, Statistics, Econometrics, BI and big data
#data_science
#Machine_learning
Download Telegram
Forwarded from Hossein Khandani
Topology
Forwarded from Hossein Khandani
R vs Revolution R

مقایسه سرعت پردازش R و MS R در حجم داده های مختلف
Forwarded from Hossein Khandani
معماری Machine learning services

#Machine_Learning_Services
#R_Server
#Python
#RTVS::R Tools Visual studio
#sql_R_server
#R_Revolution
#Microsoft_R_open
Forwarded from Hossein Khandani
MS R Server Topology

🌐 @Data_ScienceR
Forwarded from Hossein Khandani
Media is too big
VIEW IN TELEGRAM
H2O platform_data Science
پیاده سازی نیمه اتوماتیک فرآیند داده کاوی در پلت فرم H2O
#H2O
#AI
#R
#Java
#python
#sparkR
#AWS
پرکارترین کتابخانه ها در R, Scala, python:

@Data_ScienceR
🏷 ETL vs ELT

🌐 @Data_ScienceR
Data Warehouse vs Data Lake

🌐 @Data_ScienceR
امکان ایجاد سناریو نویسی و طراحی الگوریتم در قالب پلاگین در R:

افزونه R AnalyticFlow یکی از افزونه‌هایی است که به منظور ایجاد Workflow در آر طراحی شده است. این ابزار به کاربر اجازه می‌دهد که پروژه‌های تحلیلی خود را در نمای شماتیک طراحی و اجرا کند.
کارکرد این ابزار مانند ابزارهای
Knime and Rapidminer
است با این تفاوت که نرم افزار کد پشت طراحی جریان سناریو و پلاگین را به شما میدهد و بنوعی شما بصورت شماتیک کد نویسی می نمایید.
برای توضیحات بیشتر به تارنمای این افزونه مراجعه فرمایید:

🔗 https://r.analyticflow.com/en/


🌐 @Data_ScienceR
برترین زبان ها در 3 زمینه:

📌1) تکنیک های آماری
زبان های برنامه نویسی
R و SAS
برترین زبان ها در پوشش تکنیک های آماری و رگرسیونی است و در زمینه ابزارهای محاوره ای یا دو حالته نرم افزارهای
IBM SPSS و Stata
پیشرو هستند.

📌2) یادگیری ماشین و یادگیری عمیق:
در زمینه یادگیری ماشین زبان پایتون یکی از بهترین زبان های موجود با عملکرد بالاست و در کنار آن زبان R قرار دارد. در یادگیری عمیق نیز با توجه به تکنولوژی‌ها و بسترهای
Tensorflow and Keras
زبان پایتون نسبت به R پیشرو تر ست و نسبتا توسعه بیشتری پیدا کرده است. هرچند این تکنولوژی در هر دو زبان قابل استفاده و بهره برداری است. اما اقبال بیشتری نسبت به پایتون وجود دارد.

#python
#R
#SAS
#Stata

🌐 @Data_ScienceR
Data Science
برترین زبان ها در 3 زمینه: 📌1) تکنیک های آماری زبان های برنامه نویسی R و SAS برترین زبان ها در پوشش تکنیک های آماری و رگرسیونی است و در زمینه ابزارهای محاوره ای یا دو حالته نرم افزارهای IBM SPSS و Stata پیشرو هستند. 📌2) یادگیری ماشین و یادگیری عمیق:…
📌3) مصورسازی داده
در زمینه مصورسازی اطلاعات و ایجاد چارت های
Interactive
زیرساخت
D3 (JavaScript)
یکی از انعطاف پذیر ترین و بهترین ابزارهای موجود است که بسیار مورد استفاده قرار میگیرد و رواج دارد.
اما در زمینه علوم داده
Data Science
و مصورسازی آماری و استنتاجی تکنولوژی زبان یا گرامر گرافیکی در قالب توابع
geom
که در قالب
grammar of graphics (ggplot)
در زبان R در دسترس و یکی از بهترین و جامع ترین تکنولوژی های موجود است. علاوه بر آن, این تکنولوژی در قالب تکنولوژی و بستر
shiny
امکان ایجاد داشبورد و
web app
را فراهم می نماید که علاوه بر زبان
R
در حوزه تصویرسازی آماری میتوان به ابزاری های مصورسازی در پایتون و sas نیز اشاره نمود.

#ggplot
#plotly
#shiny
#D3
#python

🌐 @Data_ScienceR
📌 مقایسه ابزارها و زیرساخت‌های مختلف داشبوردسازی (مصورسازی) در شاخص های مختلف
که از مزیت های R shiny میتوان در شاخص های
DB / API Connection
Statistical Calculations
ML Implementation
اشاره نمود.
اما همانطور که گفته شد در ایجاد نمودارهای پویا و تعاملی و تنوع، بستر D3 بسیار غنی است و ضعف آن در زمینه پشتیبانی از تکنیک ها و تحلیل های آماری و یادگیری ماشین است که البته این تکنولوژی برای این کارکرد توسعه پیدا نکرده و کارکرد کمی متفاوتی دارد.

#Dashboard
#data_visualization
#R_shiny
#D3_JavaScript

🌐 @Data_ScienceR
📊 رده بندی ابزاری های مصورسازی در حوزه علوم داده
Data Viz for Data Science

با دو شاخص سهولت یادگیری و قابلیت پوشش نیازمندی ها و ظرفیت

#data_visualization
#DataViz


https://t.iss.one/Data_ScienceR
🌐 @Data_ScienceR
ویژگی‌های یک متخصص یا دانشمند علوم داده و تولباکس های مورد نیاز

#R
#python
#Sql

https://t.iss.one/Data_ScienceR
🌐 @Data_ScienceR
📌 سخن مدیر
در این کانال سعی در تبیین 2 مساله و محور وجود دارد.

1) مورد اول سعی در معرفی کارکردها و جایگاه تکنولوژی های مختلف درون نرم افزار R و سایر نرم افزارهای مرتبط یا مشابه در حوزه علوم داده

2) دوم سعی در بیان مرزها و تشریح تفاوت ها و شباهت های علوم مختلف مرتبط با تحلیل داده و ارتباط آنها با یکدیگر و جایگاه هر یک از آنها ست.
همانطور که می دانید یکی از گام ها در فرآیند داده کاوی مرتبط با تبدیل داده های خام به اطلاعات و سپس تبدیل اطلاعات به دانش و خرد است. برای استخراج اطلاعات و دانش ابزارهای مختلفی وجود دارد و لزوما نیاز به استفاده از متدولوژی های خاص و پیشرفته نیست. گاه یک نمودار یا ضریب همبستگی یا یک نرخ رشد ساده میتواند دانشی را در اختیار شما قرار دهد. پس داده کاوی شما را محدود به ابزار و متد خاصی نمی کند بلکه فرآیند استاندارد و گام های انجام یک فرآیند کسب دانش را به شما پیشنهاد میکند.
عموما ابزار و تکنیک ی که بصورت پیش فرض در این گام تصور میشود استفاده از متدهای یادگیری ماشین بمنظور استنتاج روی داده هاست. اما این دیدگاه میتواند گمراه کننده و ناقص باشد و ذهن دانشمند علوم داده را محدود به یک یا چند متد و ابزار خاص نماید.
عموما ابزارهای قابل استفاده و مرتبط با داده را میتوان در چهار دانش داده محور زیر معرفی نمود:
1- علم آمار (علم مادر و پایه)
2- علم یادگیری ماشین ( یکی از قله های علم آمار و ریاضی-کامپیوتر)
3- علم اقتصادسنجی (یکی دیگر از قله های علم آمار و ریاضی)
4 علم تحلیل اطلاعات جغرافیایی (ترکیب علوم هوا فضا، جغرافیا و آمار)

در پست های بعد هر یک از ابعاد مذکور بیشتر باز میشود.

https://t.iss.one/Data_ScienceR
🌐 @Data_ScienceR
Data Science
#Statistics #Machine_Learning #Econometrics #GIS
📌 ML vs Econometrics

🛠 یادگیری ماشین و اقتصادسنجی دو علم کاملا متضاد و متفاوت!! یا همراستا و با کارکردهای مشابه؟!

آیا تکنیک‌های این دو علم قابل تلفیق جهت بهبود الگوریتم ها و پیشبینی متغیرها می باشد یا خیر؟

🔜 در ادامه به این سوالات پاسخ داد میشود.
📝 Data Science Questions:
When?
Why?
What?
Where?
How?
Who?


https://t.iss.one/Data_ScienceR
🌐 @Data_ScienceR