دیتاهاب
2.11K subscribers
184 photos
35 videos
125 files
320 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
موقع دفاع پایان نامه یا تحویل پروژه، خیلی مهمه که بتونید از روشی که برای مدلسازی انتخاب کردید، دفاع کنید.
در بالاترین سطح، لازمه بدونید مرز بین هوش مصنوعی، یادگیری ماشین و داده کاوی کجاست.

☑️ توی این مقاله، جایگاه هر کدام را در علوم کامپیوتر مشخص می کنیم.

لینک مقاله: https://data-hub.ir/?p=2867

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_یادگیری_ماشین
👍1
مقاله قبلی کاربردهای خفن NLP دیدیم. ولی واقعیت اینه که هر کاری مشکلات خودش داره. پس لازمه با چالش های NLP آشنا بشیم.

لینک مقاله: https://data-hub.ir/?p=6565

وعدهٔ ما سه شنبهٔ هر هفته با یک مقاله از NLP

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_nlp
1
شاید یکم کار با عبارات منظم بدقلق به نظر برسه ولی تقلب از روی این فایل آموزشی، مشکلات هموار می کنه.

لینک دانلود: https://data-hub.ir/cheat-sheet

وعدهٔ ما پنج‌شنبهٔ هر هفته با یک چیت‎شیت کاربردی✌️

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#چیت_شیت
👍2
توی این مقاله فرایند یادگیری ماشین توضیح می دهیم و خیلی مختصر و مفید با مدل داده و داده های آموزش و تست آشنا می شویم.

لینک مقاله: https://data-hub.ir/?p=3093

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین✌️

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_یادگیری_ماشین
👍1
مقاله امروز کاملا کاربردی هست و دونستن آن برای هر متخصص NLP از نون شب واجب تره.
توی این مقاله معروف ترین کتابخانه های NLP در پایتون معرفی می کنیم و امکانات، کاربرد، مزایا و معایب هر کدام مقایسه می کنیم.

لینک مقاله: https://data-hub.ir/?p=7214

وعدهٔ ما سه شنبهٔ هر هفته با یک مقاله از NLP ✌️

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#مقاله_nlp
اگر یادگیری پایتون شروع کردید، این چیت شیت حتما لازمتون میشه.
اساسی ترین مباحثی که باید درباره برنامه نویسی شی گرا (Object Oriented programming) بدونید، به صورت یکجا و خلاصه دانلود کنید. توی این فایل هم تعاریف و ویژگی های مهم گفته شده و هم کدها را با مثال توضیح داده.

لینک دانلود: https://data-hub.ir/cheat-sheet

وعدهٔ ما پنج‌شنبهٔ هر هفته با یک چیت‎شیت کاربردی✌️

آدرس وب‌سایت:
Data-hub.ir

آدرس کانال یوتیوب:
youtube.com/c/datahub1?sub_confirmation=1

آدرس لینکدین:
https://www.linkedin.com/company/data-hub-ir/

آدرس تلگرام:
@data_hub_ir

#چیت_شیت
انتخاب الگوریتم مناسب و یا ترکیب الگوریتم‌ها برای انجام یک کار، چالشی همیشگی در هوش مصنوعیه😔.

ولی جای نگرانی نیست. با دسته‌بندی الگوریتم‌ها و دونستن ویژگی‌های هر دسته، کار راحت‌تر می‌شود😉.

الگوریتم‌های یادگیری ماشین در سه دسته قرار دارند که شامل یادگیری بانظارت (Supervised)، یادگیری بدون نظارت (Unsupervised) و یادگیری تقویتی (Reinforcement) می‌باشد. در این مقاله نحوه دسته بندی یادگیری ماشین و الگوریتم هایش، بررسی می شود.

لینک مقاله: https://data-hub.ir/?p=2662

وعدهٔ ما شنبهٔ هر هفته با یک مقاله از یادگیری ماشین✌️

برای اطلاعات بیشتر درباره دسته های یادگیری ماشین، این جلسه از دوره یادگیری ماشین در کانال یوتیوب دیتاهاب مشاهده کنید.

لینک جلسه: https://www.youtube.com/watch?v=Wn4x13wgtSw&list=PLhXlv288E_Aej6qy6MnDLYb7xtmjAc79p&index=2

#مقاله_یادگیری_ماشین
👍1
🔶 در مقالات قبل، NLP (پردازش زبان طبیعی) را تعریف کردیم و با مفاهیم آن آشنا شدیم.

🔶 در ادامه می‌خواهیم دست به کد بشیم و کارهای جالب و باحالی روی متون فارسی انجام بدهیم. شاید خیلی از کتابخانه‌های پردازش متن معروف باشند، اما برای متون فارسی دقت بالایی ندارند.

🔶 در قدم اول لازمه با کتابخانه‌های پردازش متون فارسی آشنا بشیم که در این مقاله کار با کتابخانه پردازش متون فارسی پارسی ور (Parsivar) را شروع می‌کنیم.

لینک مقاله: https://data-hub.ir/?p=7295

برای انجام این پروژه‌ها لازمه با زبان برنامه نویسی پایتون آشنا باشید، که هر چه باید بدونید در دوره پایتون مقدماتی بهتون یاد می‌دهیم. این دوره را به صورت رایگان از لینک زیر ببینید.

لینک دوره پایتون: https://www.youtube.com/watch?v=uzOPfS6lB3M&list=PLhXlv288E_AcrZxsbxQCG1Z4V37pXaH1z

اگر می‌خواهید حرفه‌ای تر وارد دنیای NLP شوید و Parivar تخصصی یاد بگیرید، دوره آموزش پردازش زبان طبیعی مقدماتی را از سایت دیتاهاب تهیه کنید.

لینک دوره آموزش پردازش زبان طبیعی مقدماتی: https://data-hub.ir/product/nlp

#مقاله_nlp
🔶 کتابخانه keras بهترین نقطه شروع برای افراد تازه‌کار، برای ورود به پروژه‌های یادگیری عمیق هست و همه دوستش دارن. چون مفاهیم پیچیده شبکه عصبی به ساده‌ترین شکل ممکن پیاده‌سازی کرده و هر آدمی با هر میزان تجربه می‌تونه از آن برای کارهایش (چه تحقیقاتی و چه تجاری) استفاده کند. (برخلاف جناب PyTorch)

برای ساخت یک شبکه عصبی، کافیه از لینک زیر فایل Keras دانلود کنید و فقط چند خط کد بزنید.
https://data-hub.ir/cheat-sheet/

🔶 خود Keras خیلی راحت و ساده هست، کافیه با کتابخانه‌های Pandas و Numpy آشنا باشید. از طریق لینک های زیر در ۳ ساعت، هر ۲ کتابخانه را کاملا کاربردی یاد بگیرید.

لینک آموزشPandas:
https://www.youtube.com/watch?v=49yoDZnhEGg&list=PLhXlv288E_AcrZxsbxQCG1Z4V37pXaH1z&index=5

لینک آموزش Numpy:
https://www.youtube.com/watch?v=SbYZxd0Wefg&list=PLhXlv288E_AcrZxsbxQCG1Z4V37pXaH1z&index=10

#چیت_شیت
👍2
🔶 شما هم شنیدین که "وقتی نمیدونی کجا میخوای بری، چه فرقی داره از کدوم راه بری".
ولی اگه مقصد مشخص باشه، دیگه همه چی تمومه؟ معلومه که نه، اون موقع مهمه که ابزار درستی همراتون باشه. برای یادگیری ماشین هم همینه. وقتی می‌دونین مشکل چیه، اول لازمه بدونین چه ابزارهایی وجود داره و بعد مشکل حل کنین.

🔶 ابزارهای یادگیری ماشین در 3 دسته اصلی داده، زیرساخت و الگوریتم قرار می گیرن. داده ورودی لازم برای انجام پیش‌بینی‌هاست، مهمترین قسمت زیرساخت انتخاب زبان برنامه‌نویسی مناسبه و الگوریتم‌ها که مشکل حل میکنن.

هر دسته جزییات مهمی دارن که توی مقاله زیر بررسی کردیم و برای انتخاب ابزار درست، خیلی به کارتون میاد.
لینک مقاله: https://data-hub.ir/?p=2680

پایتون بهترین انتخاب برای زبان برنامه‌نویسیه. با آموزش زیر، برای همیشه خیال خودتون از بابت این ابزار راحت کنین. https://www.youtube.com/watch?v=uzOPfS6lB3M&list=PLhXlv288E_AcrZxsbxQCG1Z4V37pXaH1z&index=1

الگوریتم های یادگیری ماشین در دوره زیر یاد بگیرین:
https://www.youtube.com/watch?v=qUAlXdU-zJM&list=PLhXlv288E_Aej6qy6MnDLYb7xtmjAc79p

#مقاله_یادگیری_ماشین
👍1
رازهای پردازش متن فارسی

🔶 برخی از فیلسوفان تعریفی از معجزه دارن که میگن "معجزه اتفاقیه که علم هنوز دلیلش پیدا نکرده". بعضی وقتا توی هوش مصنوعی داستان‌های قهرمانانه‌ای از کارهای بقیه می‌شنوین و با خودتون میگین چطور این کار انجام میدن و براتون مثل معجزه میمونه. ما قراره کم‌کم این اسرار براتون فاش کنیم.

🔶 توی ۳ مقاله آینده، سراغ متن فارسی میریم و یاد میگیرین با چه کدهایی متون فارسی پردازش کنین.

🔶 با کتابخانه پارسی‌ور شروع می‌کنیم و توی این مقاله، نرمال‌سازی، تبدیل متن به جملات، تبدیل جملات به کلمات و چندتا کار باحال دیگه انجام میدین. حتی یاد میگیرین چطور تاریخ داخل متن تبدیل کنین. قسمت جالب ماجرا اینه که هر کدوم از این کارا فقط با "یک خط کد" انجام میدین.

پس روی لینک زیر کلیک کنین و اولین قدم بردارین:
لینک مقاله: https://data-hub.ir/?p=7432

اگر پایتون و پارسی ور نصب نکردین، توی لینک زیر آموزش دادیم:
لینک آموزش: https://data-hub.ir/?p=7295

اگر دوست دارین کاملا تخصصی وارد حوزه NLP بشین و تمرکزتون روی این قسمت باشه، دوره آموزشی زیر از دست ندین:
لینک دوره: https://data-hub.ir/product/nlp/

#مقاله_nlp
👍2
مهمترین دستورات کتابخانه scipy به صورت یکجا

🔶 توی دنیا همیشه آدمای دقیق و وسواسی هستند که انتخاب‌های ساده و معمولی قانعشون نمی‌کنه. دلشون میخواد وارد جزئیات ریاضیات روش‌ها بشن و گاهی از صفر، چرخ از نو بسازن. خب تبریک میگیم، کتابخانه scipy مناسب سلیقه شماست.

🔶 کتابخانه scipy از کتابخانه‌های اصلی برای انجام محاسبات ریاضیه و یکی از جاهایی که خیلی بکار میاد برای کارهای جبر خطیه (همون ماتریس خودمون).

توی چیت شیت زیر، کدهای مهمی که لازمتون میشه فقط در یک صفحه گفته شده. کاملا مختصر و کاربردی. این چیت شیت دانلود کنین و ترفندهای اصلی یاد بگیرین.

لینک دانلود: https://data-hub.ir/cheat-sheet/

تمام مفاهیم جبر خطی که برای هوش مصنوعی لازم دارین، در دوره جبر خطی گفتیم و روی کانال یوتیوب گذاشتیم. این آموزش از لینک زیر ببینین.

آموزش جامع و رایگان جبر خطی برای علم داده:
https://www.youtube.com/watch?v=7HGs3DnfwMg&list=PLhXlv288E_Af5wiQwfYOTxuRRN2N8mbLi

#چیت_شیت
برای تنوع هم که شده موقتاً از دنیای بی‌کلام‌ها به سمت با کلام‌ها مهاجرت می‌کنیم و چه کلامی شیواتر از آقا، شادمهر عقیلی.
شادمهر عقیلی علاوه بر صدای دلنشین و نبوغ درآهنگ‌سازی (مثلا آلبوم "از خدا خواسته" با صدای روان‌شاد بانو مهستی)، فردی هست که در زمینه کاری خودش صاحب‌سبک هست
یعنی دوستان کپی کار همیشه دنبال کپی از ایشون هستن
و خب آرزوی هرکسی این هست که در زمینه کاری خودش به نقطه‌ای برسد که ازش تقلید کنن

پ.ن: لطفاً با هدفون یا هندزفری و در فضای آرام و بدون صدا با تمرکز حداکثری گوش بدین
پ.ن 2: بخشی از این اجرا زنده و بخشی ضبط استودیویی هست و مربوط به اثر "بی‌احساس" هست

https://www.youtube.com/watch?v=K7aNs30CkAE&list=RDK7aNs30CkAE&index=2
👎43
🔶 یک قسمت از سریال فرندز (فصل 2 قسمت 4)، جویی معنی یک کلمه رو نمیدونه. راس بهش میگه فکر میکردی چه معنی میده؟ و جویی جواب میده:
I don't know. You see something, you hear a word, I thought that's what it was

🔶 مدتی هست توی حوزه کامپیوتر هم همین شده. یک سری کلمات که مدام می‌بینین و فهم دقیقی از معنیشون ندارین (مثل چابک، اسکرام، الگوهای طراحی، SOLID و ...). لازمه یک لحظه فکر کنین که این کلمات واقعا چه معنی دارن و چرا مطرح میشن. اصلا کجا لازمشون دارین؟

🔶 اگه بخایم توی حوزه هوش مصنوعی از این کلمات بگیم، اینجاست که بیگ دیتا و GPU وارد می‌شوند. حتما در این حد می‌دونین که برای پروژه‌های بزرگ‌تر و کاربردهای مهم‌تر مثل پزشکی، بانکداری، سیستم‌های توصیه‌گر، تحلیل رفتار مشتریان و حتی سئو، شما به داده‌های بیشتر و توان پردازشی بالاتر نیاز دارین. ولی باید یکم تخصصی‌تر با این مباحث آشنا بشین چون برای حل مسائل کاربردی، این اطلاعات لازمتون میشه.

پس مقاله زیر حتما بخونین. البته زیاد وارد جزییات نشدیم و خیلی کوتاه و فشرده، هر آن چه لازمه بدونین گفتیم.

لینک مقاله: https://data-hub.ir/?p=2697

#مقاله_یادگیری_ماشین
9 ترفند مهم پردازش متن فارسی همراه با کد👩‍💻🧑‍💻

در ادامه صحبت درباره پردازش متن فارسی، توی این مقاله کارهای جدیدی یاد میگیرین، مثلا:
چطور غلط‌های املایی تصحیح کنین (نه اینکه فقط تشخیص بدین، بتونین درستش کنین)
فضاهای خالی بین کلمات حذف کنین
مشخص کنین کدوم کلمه اسمه، کدوم فعله و ...
با ایموجی‌ها و شکلک‌های توی متن چکار کنین
و کارهای دیگه...

🔸 مزیت بزرگ این مقاله اینه که هر کدوم از ترفندها با مثال و کد گفته شده و شما همین الان می‌تونین این روش‌ها روی هر متن فارسی اجرا کنین، کد زیادی هم لازم نیس بنویسین، فقط چند خط که کامل بهتون میگیم.
لینک مقاله: https://data-hub.ir/?p=7518

🔸 مقاله قبل چندتا ترفند مهم دیگه گفته بودیم، از لینک زیر بخونین تا تسلط خوبی روی پردازش متن فارسی پیدا کنین.
لینک مقاله قبل: https://data-hub.ir/?p=7432

🔸 شما میدونین دوره های آموزشی باید کلی پروژه داشته باشن تا به صورت عملی کار یاد بگیرین. دوره پردازش متن پیشرفته زیر دقیقا همین ویژگی داره. از لینک زیر سرفصل ها رو ببینین و از آموزش ها استفاده کنین.
لینک دوره NLP پیشرفته: https://data-hub.ir/product/nlp-advance-course/

#مقاله_nlp
👍1
یادگیری ماشین در ۵ دقیقه: فست‌فود دیتاهاب

🔶 برای پایان‌نامه وقت زیادی داریم که روش‌های مختلف بررسی کنیم. ولی توی کار خیلی وقتا باید سریع نتیجه را مشخص کنیم. اینجاست که PyCaret به کمکمون میاد.

🔶 کتابخانه PyCaret الگوریتم‌های مختلف یادگیری ماشین با کمترین کد در اختیارمون می‌ذاره و از پیش‌پردازش داده‌ها تا آموزش مدل را انجام می‌دهد.

از لینک زیر، چیت‌شیت PyCaret دانلود کنین.
لینک دانلود: https://data-hub.ir/cheat-sheet

#چیت_شیت
👍2
به کار خودتون و کاربرد هر روش نگاه کنین، نه اینکه هر کی چی میگه.

🔸 میگه چطور همه کتابخانه‌های پایتون سریع یاد بگیرم؟
🔹 میگم برا چی میخای همشون یاد بگیری؟
🔸 آخه با هر کی حرف میزنم یک اسمی میگه، حتما لازم میشن
🔹 باید بدونی هر کدوم چیه و کجا استفاده میشه. طبق کاری که میخای انجام بدی، اونی که مناسبه رو عمیق بشی.

🔸 خب از کجا بدونم هر کدوم چیه و کدوم خوبه؟
🔹 فعلا مقاله زیر بخون و کتابخانه‌های اصلی مثل تنسورفلو و کراس بشناس. بقیه نکات هم شنبه هر هفته میگیم.
https://data-hub.ir/?p=2699

#مقاله_یادگیری_ماشین
با ربات‌ها رسمی چت کنیم یا محاوره‌ای؟؟ 🤔

🔶 زبان فارسی هر چقدر هم شیرین باشه پیچیدگی‌های خاص خودشُ داره که گاهی فهمیدن منظور بقیه برای خودمونم سخته، چه برسه به ربات‌ها. برای اینکه اثر این پیچیدگی‌ها کم بشه لازمه یک سری پیش‌پردازش روی متن انجام بشه.

🔶 خبر خوب اینه که کارهای قشنگی برای پردازش زبان فارسی داره انجام میشه و کتابخونه هضم (Hazm) قطعا یکی از اوناس. هضم یکی از ابزارهای پیش‌پردازش متن فارسیه که بر اساس NLTK طراحی شده و امکانات زیادی داره.

در مقاله زیر برای اولین‌بار جامع‌ترین آموزش کتابخانه هضم به زبان فارسی رو تقدیم شما خواهیم کرد.
https://data-hub.ir/?p=7608

#مقاله_nlp
1👍1
🎯 کل یادگیری ماشین، توی یک کتابخانه

چیت شیت sklearn رو از لینک زیر دانلود کنین و از ابزارهای این کتابخانه مثل رگرسیون، خوشه‌بندی، SVM و PCA استفاده کنین.
https://data-hub.ir/cheat-sheet

#چیت_شیت
👍1
🔸 این روزا خیلیا دوست دارن هوش مصنوعی یاد بگیرن ولی بین انتخاب دوره‌های مختلف سردرگم هستن. یوتیوب دوره‌های رایگان زیادی حتی به زبان فارسی داره که بهتره با اونا شروع کنیم.

🔸 توی یک دوره فشرده ۷ ساعته پایتون، میتونی مهارت حداقلی برای ورود به دنیای هوش مصنوعی رو بدست بیاری.

همین الان روی لینک زیر کلیک کن و دوره رایگان پایتون ویژه هوش مصنوعی رو ببین:
https://youtube.com/c/datahub1?sub_confirmation=1

#آموزش_پایتون
👍6