#fun
This new Google Translate update is really helpful
https://www.reddit.com/r/ProgrammerHumor/comments/ajf4w0/this_new_google_translate_update_is_really_helpful/
This new Google Translate update is really helpful
https://www.reddit.com/r/ProgrammerHumor/comments/ajf4w0/this_new_google_translate_update_is_really_helpful/
#sample_code #pandas #sklearn
Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
Python_Labs🐍
#sample_code #pandas #sklearn Encode any categorical columns in the dataset using one-hot encoding so that they are encoded numerically...
خروجی نمونه قبل و بعد از این کار.
خاطرتون هست چرا encode میکردیم؟
خاطرتون هست چرا encode میکردیم؟
#sample_code partII
در ادامه کد قبل. تبدیل encode شده ها به عدد به فرمت one hot
در ادامه کد قبل. تبدیل encode شده ها به عدد به فرمت one hot
This media is not supported in your browser
VIEW IN TELEGRAM
#vscode
IPython console in VS Code! The update to the code #Python extension extended the Python Interactive window to allow code to be typed in and executed directly in the window! Check it out 👉 https://blogs.msdn.microsoft.com/pythonengineering/2019/01/29/python-in-visual-studio-code-january-2019-release/
IPython console in VS Code! The update to the code #Python extension extended the Python Interactive window to allow code to be typed in and executed directly in the window! Check it out 👉 https://blogs.msdn.microsoft.com/pythonengineering/2019/01/29/python-in-visual-studio-code-january-2019-release/
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#خبر #مجموعه_داده
اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30
https://research.cafebazaar.ir/visage/datasets/
اولین #دیتاست دیوار ریلیز شد.
این دیتاست شامل حدوداً یک میلیون پست در سایت دیوار است.
Published on 2019/01/30
https://research.cafebazaar.ir/visage/datasets/
#آموزش
میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.
در sklearn دو روش اصلی موجود است.
روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو میکند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.
روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.
#GridSearch #RandomizedSearch
میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.
در sklearn دو روش اصلی موجود است.
روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو میکند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.
from sklearn.model_selection import GridSearchCV
روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.
from sklearn.model_selection import RandomizedSearchCV
#GridSearch #RandomizedSearch
نمونه کد GridSearch .در این مساله 2160 ترکیب مختلف از هایپرپارامترهایی که در دیکشنری xg_cl_param_grid مشاهده میشود.
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.
https://t.iss.one/PyLab/347
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.
https://t.iss.one/PyLab/347
RNA-Seq Differential Expression Analysis
کورس جدید تحلیل RNA در datacamp
https://www.datacamp.com/courses/rna-seq-differential-expression-analysis
کورس جدید تحلیل RNA در datacamp
https://www.datacamp.com/courses/rna-seq-differential-expression-analysis
DataCamp
RNA-Seq with Bioconductor in R
Use RNA-Seq differential expression analysis to identify genes likely to be important for different diseases or conditions.
#خبر #حقوق
چرا استخدام یک تحلیلگر داده گران است؟! دلیل حقوق 140 هزار دلاری تحلیلگر داده در امریکا...
Data Scientists: Why are they so expensive to hire?
https://www.kdnuggets.com/2019/02/data-scientists-expensive-hire.html
چرا استخدام یک تحلیلگر داده گران است؟! دلیل حقوق 140 هزار دلاری تحلیلگر داده در امریکا...
Data Scientists: Why are they so expensive to hire?
https://www.kdnuggets.com/2019/02/data-scientists-expensive-hire.html
#خطای_رایج
این دو کد فقط و فقط در دو خط اول و مقدار دهی اولیه ی a و b فرق دارند.
اما جوابشون از زمین تا آسمان تفاوت دارد...
چرا؟!
این دو کد فقط و فقط در دو خط اول و مقدار دهی اولیه ی a و b فرق دارند.
اما جوابشون از زمین تا آسمان تفاوت دارد...
چرا؟!