PyTorch Howsam
3K subscribers
340 photos
48 videos
5 files
475 links
از هوش مصنوعی میگیم...

ارتباط با ادمین
@howsam_support
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
کتابخانه پایتورچی imaginaire

یک کتابخونه پایتورچی مخصوص GAN که توسط Nvidia توسعه داده شده.

متدهای متنوعی از GAN برای تصویر و ویدئو در این کتابخونه پیاده‌سازی شده. ویدئوی بالا رو ببینید تا بخشی از قابلیت‌های این کتابخونه رو ببینید. عالیه...

صفحه Github

@pytorch_howsam
#transformer #vision

ترنسفورمرها در کامپیوتر ویژن

ترنسفورمرها وارد حوزه ویژن شدن و کم‌کم داره حضورشون پررنگ‌تر میشه. قبلا مقالاتی مثل DetR (تشخیص اشیا) رو بهتون معرفی کردیم.

اما یک مقاله جدیدی اومده که از ترنسفورمر برای کلاس‌بندی تصویر استفاده شده. به نظر میرسه مقاله مهمیه. مقاله برای ICLR21 فرستاده شده و هنوز Under Review هست...

لینک مقاله | ویدئوی تشریح مقاله | کد پایتورچ

افراد زیادی درباره این مقاله صحبت کردن. مثلا افرادی گفتن که قدمی به سمت حذف شبکه‌های کانولوشنی! یا گفته شده نزدیک شدن NLP و Vision اتفاق خوبیه، اگه هردو بر پایه ترنسفورمر بشن.

خب نگرانی اینجاست که شبکه‌های مبتنی بر ترنسفورمر بسیار بزرگ هستن و ممکنه محقق‌های با امکانات معمولی امکان کار نداشته باشن. البته زوده برای این حرفا ولی می‌تونیم ماهم بریم دنبال این بحث جدید در ویژن...

نظر شما چیه؟

@pytorch_howsam
📣📣📣 همراهان هوسم سلام،

‼️دوره یادگیری عمیق Yann LeCun برای دانلود در سایت قرار گرفت.

** 8 جلسه از این دوره در سایت قرار داده شده و به مرور بقیه جلسات هم آپلود خواهند شد.

برای دانلود دوره روی لینک زیر کلیک کنید:👇👇👇

دانلود دوره



@howsam_org

🌐 www.howsam.org
#آموزش_یادگیری_عمیق

لیست جلسات آموزش یادگیری عمیق هوسم که تا امروز منتشر کردیم:

📕 جلسه اول: ساختار نورون مصنوعی

📕 جلسه دوم: یادگیری نورون مصنوعی

📕 جلسه سوم: شبکه عصبی mlp

📕 جلسه چهارم: پروژه رگرسیون با mlp و تنسورفلو 2-کراس

📕 جلسه پنجم: پروژه کلاس‌بندی fashion-mnist با mlp و تنسورفلو 2-کراس

📕 جلسه ششم: شبکه‌ عصبی کانولوشنی

📕 جلسه هفتم: شبکه عصبی بازگشتی

همچنین بخونید:
📕 پرسپترون چیست؟

نظرتون درباره این پست‌ها چیه؟ این پست‌ها رو تا حالا خوندید؟ توی کامنت همین تلگرام نظرتون رو لطفا بگید.

@pytorch_howsam
از این به بعد در arxiv می‌تونید چک کنید که یک مقاله کدش موجود هست یا نه 👌

مطابق تصویر بالا، یک تب جدید به‌نام Code وجود داره که کدهای موجود برای مقاله رو نشون میده.

این کار با همکاری paperswithcode انجام شده.

10 سال پیش این اندازه کد منتشر نمیشد و اگه هم کدی بود در صفحه شخصی خود مولف بود. قطعا الان اوضاع برای پیشرفت کردن بهتر شده. اما یک سوال، به نظرتون باعث نشده که تنبل هم بشیم؟ مثلا میاییم دو تا کد رو به هم میچسبونیم و میگیم محصول تجاری ساختیم. یا اینکه، کدهای یک مقاله رو برمیداریم یک مقداری تغییر میدیم و با همون دفاع میکنیم. نظر شما چیه؟

@pytorch_howsam
وبینار تشخیص اشیا با Faster RCNN

حضور در وبینار کاملا رایگان هست. همچنین، میتونید ویدئوی وبینار رو با 80 درصد تخفیف پیش‌خرید کنید.

لینک ثبت‌نام

@howsam_org
Forwarded from Deep Brain
Media is too big
VIEW IN TELEGRAM
This AI Learned to Summarize Videos 🎥

@MLIPUN
Deep Brain
This AI Learned to Summarize Videos 🎥 @MLIPUN
خلاصه‌سازی ویدئو

احتمالا با Image Captioning آشنا هستید. این ویدئو رو ببینید؛ خیلی کوتاه خلاصه‌سازی ویدئو رو توضیح میده. موضوع جالبیه... باید به سری سوال از ویدئو هم جواب بده 👌

انگلیسیه ولی ببینید ارزش داره.

چطوره از این به بعد از موضوع‌های تحقیقاتی و تجاری جدید در هوش مصنوعی بیشتر ویدئو و تصویر بذاریم و معرفی‌شون کنیم؟
ديگه دیتکشن، دسته‌بندی و اینجور موارد رو همه میشناسن. یک عالمه موضوعهای جالب و جدید وجود داره.
آیفون 12 و هوش مصنوعی

آیفون 12 به‌تازگی معرفی شده و میخواییم درمورد قدرت Neural Engine اپل صحبت کنیم. از اسمش مشخص هست که پردازشگر شبکه عصبی هست.

پردازشگری که در آیفون 2020 گذاشته شده، بر پایه INT8 میتونه 12TOPS محاسبات انجام بده! ساده‌تر بگم، میتونه 12 ترا عملیات روی اعداد صحیح 8 بیتی در یک ثانیه انجام بده!

بیایید مقایسه کنیم با کارت گرافیک RTX 2080؛ این GPU حدود 13 ترافلاپس محاسبات (برپایه FP32) انجام میده. یعنی 13 ترا عملیات اعشاری 32 بیتی انجام میده.

بله، طبیعتا GPU هم بخواد روی اعداد 8 بیتی محاسبات رو انجام بده اعدادش بسیار بزرگتر از آیفون میشه. اما نکته اینجاست که شما میتونید شبکه آموزش‌دیده 32 بیتی اعشاری رو به شبکه 8 بیتی اعداد صحیح کوانتایز کنی و با سرعتی بسیار بالا روی آیفون اجرا کنی. 👌

نکته آخر اینکه، قدرت Neural Engine در آیفون 11 (2019) حدود 6 تاپس بود. یعنی در عرض 1 سال قدرت پردازش رو دوبرابر کردن. 👌

@pytorch_howsam
فراخوان همکاری
تشخیص دستور پخت غذا از روی تصویر!

شاید اسمش این حس رو ایجاد کنه که یک پروژه سطح پایین هست. اما اینطور نیست، این پروژه یک کار بزرگ هست که با همکاری محقق‌های دانشگاه MIT انجام شده. برای این کار بیش از 1 میلیون دستور پخت و 13 میلیون تصویر غذا جمع‌آوری شده! دیتاست قابل دانلوده.

تصویر بالا، چند نمونه تصویر تشخیص دستور پخت از روی تصویر غذا هست. شبکه پیشنهادی هم ترکیبی از CNN و شبکه بازگشتیه...

سایت | گیتاب | مقاله

@pytorch_howsam
وبینار تشخیص اشیای Faster RCNN برگزار شد و خدا رو شکر جلسه خوبی بود.

هم تئوری گفته شد و هم کدنویسی انجام شد. خیلی فیدبک‌های خوبی گرفتیم از دوستانی که شرکت کرده بودن. تلاش میکنیم وبینارها رو ادامه بدیم.

چند تا ویدئوی کوتاه از جلسه رو آپلود کردیم توی آپارات که میتونید ببینید. لیست پخش ویدئوها در لینک زیر:
https://www.aparat.com/v/Sd4bL?playlist=593185

کل آموزش 4 ساعت هست که در سایت قرار گرفته و با 60درصد قابل خریده.
لینک آموزش Faster RCNN در سایت

@pytorch_howsam
آموزش رایگان پایتورچ

مدت زمان: 2 ساعت و 30 دقیقه
مدرس: سید سجاد اشرفی

مناسب برای افرادی که با پایتورچ آشنایی ندارند.

https://www.aparat.com/v/Ow1bM

@pytorch_howsam
This media is not supported in your browser
VIEW IN TELEGRAM
یک پروژه جالب و عملی کامپیوتر ویژنی با پایتورچ

کشاورزهای هندی با آفت‌هایی در محصول پنبه مواجه هستن. یکسری حشره و...
حالا برحسب نوع و حجم حشره‌ها، باید جلوگیری‌هایی انجام بشه و...

حالا یک گروهی با یک شبکه مولتی تسک (کلاسیفای و دیتکشن) و پایتورچ، سیستمی رو توسعه دادن که وجود/عدم‌وجودآفت رو براساس تصاویر ورودی اعلام میکنه تا کشاورزها اقدام مناسبی انجام بدن. خروجی سیستم سه حالت فعلابیخیال/گوش‌به‌زنگ‌باش/اوضاع‌خرابه‌سم‌رو‌بیار داره. سیستم در دو حالت آفلاین/آنلاین میتونه کار کنه.

در حالت آفلاین، سیستم با استفاده از پایتورچ موبایل روی موبایل اجرا میشه.

در حالت آنلاین، شبکه روی آمازون کلود اجرا میشه و صرفا سیستم درخواست (تصویر) رو ارسال و خروجی رو دریافت میکنه. برای اینکار از torchserve استفاده شده.

اطلاعات کامل از مراحل کار: لینک

خب برنامه ما مشخص شد، یکی باید این رو مطالعه کنه و به بقیه اعضای هوسم توضیح بده. پیشنهاد میکنم شما هم در قالب گروه‌های چندنفره به همدیگه آموزش بدید.

@pytorch_howsam
#machinelearning

لیستی از کورس‌های ویدیویی یادگیری ماشین در رشته توئیت زیر:

لینک توئیتر

اگر توییتر دارید، اکانت این آقای Elvis رو دنبال کنید، همیشه مباحث و کورس‌های آموزشی خوب معرفی میکنه.

@pytorch_howsam
علمی مثل یادگیری ماشین ابعاد مختلفی داره. مثلا یک بعد یادگیری ماشین، الگوریتم‌ها و تئوری هست که خب باید بلد باشیم. یک بخش دیگه این هست که با فرض دونستن تئوری میتونیم کدنویسی کنیم و یک مدلی آموزش بدیم یا نه؟ پس کدنویسی باید بلد باشیم.

اما ابعاد دیگه‌ای هم در یادگیری ماشین مطرح هست. اینکه در پروژه‌های بزرگ با داده‌های حجیم چطور باید یک سیستم یادگیری ماشین طراحی کنیم؟ اصلا برای یک پروژه خاص که به ما محول شده، چطوری داده جمع‌آوری کنیم؟ چطوری دیتاست آموزش و ارزیابی بسازیم؟ حالا دیتاست رو ساختیم، چطوری مدل رو انتخاب کنیم؟ چطوری آموزش بدیم؟ چطوری بهینه‌ش کنیم؟ چطوری بهترین جواب رو بگیریم؟ حالا چطوری ببریم توی فاز عملی ازش استفاده کنیم؟ چطور عملکردش رو در عمل رصد کنیم؟ و ...

خلاصه اینکه، تمام سوالات بالا میگه که باید مهارت تئوری و کدنویسی رو ترکیب کنیم. بهش دانش و تجربه پروژه‌های عملی رو هم اضافه کنیم تا یک بتونیم یک پروژه عملی رو موفقیت آمیز بالا بیاریم. در واقع طراحی یک سیستم یادگیری ماشین رو بلد باشیم.

همه اینها رو گفتم، تا برسم به اینجا که یک کورسی در استنفورد قراره برگزار بشه که در لینک زیر میتونید سیلابس کورس رو ببینید. جالب این هست که برای پیش‌نیازها گفته باید درک خوبی از یادگیری ماشین داشته باشید و حداقل با یکی از فریمورک‌های کدنویسی مثلا تنسورفلو و پایتورچ آشنا باشید. پیشنهاد میکنم فهرست مطالبش رو بخونید. آموزنده هست...

https://huyenchip.com/2020/10/27/ml-systems-design-stanford.html

@pytorch_howsam
PyTorch Howsam
علمی مثل یادگیری ماشین ابعاد مختلفی داره. مثلا یک بعد یادگیری ماشین، الگوریتم‌ها و تئوری هست که خب باید بلد باشیم. یک بخش دیگه این هست که با فرض دونستن تئوری میتونیم کدنویسی کنیم و یک مدلی آموزش بدیم یا نه؟ پس کدنویسی باید بلد باشیم. اما ابعاد دیگه‌ای هم…
این بخش از توضیحات خارج از هوش مصنوعی هست!

مدرس دوره بالا، توی پیج شخصیش یک لیست گذاشته از 100 کاری که قبل مردن می‌خوام انجام بدم. هرکدوم رو که انجام میده تیک میزنه! نگاهی بهش بندازید بد نیست 😊
خیلی موردهای جالبی داره، مثلا 100 تا کشور رو بره ببینه! رانندگی هم بلد نیست 😁

https://huyenchip.com/list-100/