Python_Labs🐍

#خبر #مجموعه_داده

اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30

https://research.cafebazaar.ir/visage/datasets/

19 viewsAlireza Akhavan, 06:56

Python_Labs🐍

#fun

180 viewsAlireza Akhavan, 11:17

Python_Labs🐍

#آموزش

میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.

در sklearn دو روش اصلی موجود است.

روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو می‌کند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.

from sklearn.model_selection import GridSearchCV

روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.

from sklearn.model_selection import RandomizedSearchCV

#GridSearch #RandomizedSearch

213 viewsAlireza Akhavan, 15:18

Python_Labs🐍

نمونه کد GridSearch .در این مساله 2160 ترکیب مختلف از هایپرپارامترهایی که در دیکشنری xg_cl_param_grid مشاهده میشود.
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.

https://t.iss.one/PyLab/347

238 viewsAlireza Akhavan, edited 15:22

Python_Labs🐍

This media is not supported in your browser

VIEW IN TELEGRAM

تولید داکیومنت از روی نوت بوک jupyter

https://pandoc.org/releases.html

214 viewsAlireza Akhavan, edited 07:23

Python_Labs🐍

RNA-Seq Differential Expression Analysis
کورس جدید تحلیل RNA در datacamp
https://www.datacamp.com/courses/rna-seq-differential-expression-analysis

DataCamp

RNA-Seq with Bioconductor in R

Use RNA-Seq differential expression analysis to identify genes likely to be important for different diseases or conditions.

220 viewsAlireza Akhavan, edited 17:44

Python_Labs🐍

#خبر #حقوق
چرا استخدام یک تحلیلگر داده گران است؟! دلیل حقوق 140 هزار دلاری تحلیلگر داده در امریکا...

Data Scientists: Why are they so expensive to hire?
https://www.kdnuggets.com/2019/02/data-scientists-expensive-hire.html

2.27K viewsAlireza Akhavan, edited 06:57

Python_Labs🐍

#خطای_رایج
این دو کد فقط و فقط در دو خط اول و مقدار دهی اولیه ی a و b فرق دارند.
اما جوابشون از زمین تا آسمان تفاوت دارد...
چرا؟!

275 viewsAlireza Akhavan, 08:04

Python_Labs🐍

https://stackoverflow.com/a/54308748/4409764

251 viewsAlireza Akhavan, 16:41

About

Blog

Apps

Platform