Python_Labs🐍
590 subscribers
267 photos
11 videos
28 files
204 links
Download Telegram
#آموزش

میدانید که اکثر الگوریتم های یادگیری ماشین دارای یک سری هایپرپارامترها هستند که توسط دانشمند داده یا برنامه نویس باید برای آن مساله تعیین شود.
روش های کلاسیک اغلب سرعت خیلی بیشتری از روش های عمیق دارند و می توانیم فضای وسیعی از حالات مختلف مقادیر متفاوت هایپرپارامترهای را جست و جو کنیم.

در sklearn دو روش اصلی موجود است.

روش اول (GridSearchCV) که تمام ترکیب ها را جست و جو می‌کند.
مثلا اگر 3 تا هایپر پارامتر داشته باشیم و برای یکی 3 مقدار، برای یکی 5 و برای یکی 10 مقدار مختلف مد نظر داشته باشیم
3*5*10 حالت مختلف را برایمان جست و جو میکند.

from sklearn.model_selection import GridSearchCV


روش دوم (RandomizedSearchCV) که تعدادی از حالات را به صورت تصادفی بررسی میکند.
این روش اغلب برای حالاتی است که فضای حالات مختلف برای هایپر پارامترهای مختلف خیلی بزرگ است و اصلا امکان جست و جوی تمامی حالات را نداریم. ناچاریم از این فضا تعدادی را تصادفی بررسی کنیم و بهترین کارایی روی داده dev را به عنوان بهترین مدل انتخاب کنیم.

from sklearn.model_selection import RandomizedSearchCV



#GridSearch #RandomizedSearch
نمونه کد GridSearch .در این مساله 2160 ترکیب مختلف از هایپرپارامترهایی که در دیکشنری xg_cl_param_grid مشاهده میشود.
چون 10-fold استفاده شده، هر کدام از حالات 10 بار اجرا میشود و در کل قرار است 21600 بار مدل fit شود.

https://t.iss.one/PyLab/347
This media is not supported in your browser
VIEW IN TELEGRAM
تولید داکیومنت از روی نوت بوک jupyter

https://pandoc.org/releases.html
#خبر #حقوق
چرا استخدام یک تحلیلگر داده گران است؟! دلیل حقوق 140 هزار دلاری تحلیلگر داده در امریکا...

Data Scientists: Why are they so expensive to hire?
https://www.kdnuggets.com/2019/02/data-scientists-expensive-hire.html
#خطای_رایج
این دو کد فقط و فقط در دو خط اول و مقدار دهی اولیه ی a و b فرق دارند.
اما جوابشون از زمین تا آسمان تفاوت دارد...
چرا؟!
پیام linkedin ی کیان کتانفروش، استاد ایرانی استنفورد، پیرامون پایتون:

https://www.linkedin.com/feed/update/urn:li:activity:6499845813601128448

#python #tensorflow #numpy #pandas #scikit_kearn #flask ...
#pytrick

پایتون 3 اجازه میدهد نام متغیرهای شما unicode باشند. اما باید حتما کاراکترهای مثل حروف باشند...
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#منبع #سورس_کد

اسلایدها و کدهای دوره ی 12 ساعته یادگیری ژرف مقدماتی دانشگاه شهید رجایی روی گیت هاب قرارداده شد.

https://github.com/Alireza-Akhavan/SRU-deeplearning-workshop?1
اینم یه نوع کد زدنه!
Oh my god😔
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
#توئیت قابل تامل دکتر رضازداه، استاد ایرانی دانشگاه استنفورد.
اولین ریتوئیت که در عکس مشخص است هم بخوانید.

https://twitter.com/Reza_Zadeh/status/1098085978189647872
Forwarded from Tensorflow(@CVision) (Alireza Akhavan)
توئیت Andrej Karpathy، خطاب به توسعه دهندگان زبان پایتون،
اگر ارور معنی دار تری برگردونید وقت کمتری برای اروریابی برنامه نویسها صرف میشه.

https://twitter.com/karpathy/status/1099793055853375489

این مثالی که در توئیت زده فکر کنم همه باهاش مواجه شدند :)
#خبر

#python 3.8 news: The second alpha release out today. Please try it out. One major feature that we've needed for a long time is shared memory for multiprocessing. Our story for multi-core just got a lot better ;-) Thank you Davin Potts!

https://www.python.org/downloads/release/python-380a2/
در اینجا دیدیم Andrej Karpathy در توئیتی به اروری که به اندازه کافی مشخص نبود اعتراض کرده بود، حالا توئیت کرده که پیام معنی دار را خودش اضافه کرده و رفته به گیت هاب numpy درخواست pull بده، اما 9 ساعت قبلش یکی دیگه هم دقیقا همین اصلاحو انجام داده و فرستاده :)


MAINT: Better error messages for zeros, ones, empty.
https://github.com/numpy/numpy/pull/13048
https://twitter.com/xamat/status/1101026768666812417

طرف این جور گفته: هر از گاهی با یک آدم خبره مصاحبه می‌کنم که می‌گه پایتون بده چون مقیاس‌پذیر نیست. بعد ازش می‌پرسم فکر می‌کنی چه‌طوری یکی از ۵۰ سایت پیچیده مثل کورا رو فقط با پایتون درست کردیم؟ اینجاست که معمولاً جواب درست درمونی نمی‌گیرم.