Machine Learning NLP + CV
286 subscribers
223 photos
53 videos
42 files
474 links
مطالب مفید در حوزه های یادگیری ماشین و بینایی کامپیوتر
Download Telegram
Switch Transformers: Scaling to Trillion Parameter Models with Simple and Efficient Sparsity

توضیح مقاله: در عنوان مقاله ذکر شده که تعداد پارامترهای ترسفورمر به یک تریلیون افزایش یافته است (تعداد پارامترهای مدل #GPT_3، صدوهفتاد و پنج بیلیون بود!)
سوالی که در اینجا پیش می آید این است که آیا واقعا تعداد پارامترها، در مقایسه با ترنسفورمرهای قبلی به این نسبت (تقریبا ۵.۵ برابر) افزایش پیدا کرده است؟!
بله، ولی اینجا به روش متفاوتی از پارامترها استفاده میشه. یک روش sparse (در عنوان مقاله هم کلمه sparsity قید شده)

در این کار از یک معماری به اسم Switch-Tramsformers استفاده کرده اند. معماری که بر اساس MoE عمل میکنه‌ (خود MoE یا Mixture of Experts هم مفهوم با ارزشی است که اخیرا داره مطرح میشه)
لایه فیدفوروارد شبکه به این expert ها تقسیم بندی میشه و سوئیچ-ترنسفورمر، هر توکِن رو فقط به یک اکسپرت route میکنه (اسپارسیتی یا تُنُک بودن اینجا هست)
روشهای قبلی مبتنی بر MoE ادعا میکردند برای اینکه یک سیگنال آموزشی باثبات داشته باشیم حداقل به دو تا expert نیاز داریم. اما معماری ترسفورمری که اینجا ارائه شده این تعداد را به یک عدد کاهش داده است.
نتیجه: امکان scaling اکسپرت ها، و در واقع امکان افزایش تعداد پارامترهای مدل، اون هم بدون اینکه مدل مجبور به محاسبات بیشتری باشد، فراهم شده است (این فرض و مفهومی خیلی مهم و باارزش محسوب می شود)
به همین دلیل در ابتدا عرض شد که تعداد یک تریلیون پارامتر عنوان شده در این مقاله، لزوما قابل قیاس با ۱۷۵ بیلیون پارامتر مدل GPT-3 نمیباشد!
راهکارهایی که در این مقاله برای با ثبات کردن آموزش ارائه شده:
• Selective Dropout
• Selective Casting of Parameters to Defferent Precisions
• Better initializiong

اینم لینک این مقاله جالب و نسبتا طولانی، تقدیم به شما:

https://arxiv.org/abs/2101.03961

@ml_nlp_cv
Forwarded from NLP stuff
سایت paperswithcode (که توصیه می‌کنیم توی این سایت بخوابید) اومده مقاله‌های قبول شده‌ی ICLR 2021 را به همراه کدشون گذاشته و می‌تونید با استفاده از تسک و نویسنده و keyword فیلتر کنید.

https://paperswithcode.com/conference/iclr-2021-1

#link

@nlp_stuff
This media is not supported in your browser
VIEW IN TELEGRAM
روش جدید ارائه شده توسط جورجیاتک و مرکز هوش مصنوعی فیس بوک، برای فشرده سازی مدل های توصیه گر عمیق که منجر به کاهش قابل توجه میزان مصرف حافظه و استفاده از آنها در مقیاس بزرگ تر می شود. نوآوری کلیدی این روش جایگزینی جداول تعبیه سازی بزرگ DLRM با دنباله ای از ضرب های ماتریسی با استفاده از روش تجزیه tensor train میباشد.

TTc-Rec: Tensor Train Compression for Deep Learning Recommendation Models.  paper, Github and blog post.

@ml_nlp_cv
Forwarded from PyTorch Howsam
و این گوگل کولب دوست داشتنی!

کولب امکانی رو اضافه کرده که بعد از اینکه اجرا تموم شد، به شما نوتیف میده! مناسب برای زمانی که اجرا گذاشتید و مشغول کار دیگری هستید.

نحوه فعال‌سازی:
Tools -> Settings -> Site -> Show desktop notif...

@pytorch_howsam
Forwarded from آرمان بهنام (آرمان بهنام)
This media is not supported in your browser
VIEW IN TELEGRAM
#کرونا #شهر_هوشمند #اینترنت_اشیا
دستگیره درب هوشمند

🖌این دستگیره خودش را ضدعفونی می‌کند.
________
📚@BigDataServe
Forwarded from PyTorch Howsam
This media is not supported in your browser
VIEW IN TELEGRAM
CharacterGAN

تولید کاراکتر همراه با انیمیشن با استفاده از GAN

مقاله‌ای که طی روزهای اخیر ترند شده و موردتوجه قرار گرفته. کار قشنگیه...

مقاله | کد پایتورچ

@pytorch_howsam
Forwarded from PyTorch Howsam
Deep-Learning-with-PyTorch.pdf
44.7 MB
یک کتاب خوب برای پایتورچ
Forwarded from NLP stuff
This media is not supported in your browser
VIEW IN TELEGRAM
توضیح خلاصه‌ی ViT

در چند روز اخیر سیلی عظیمی از مدل‌های ترنسفورمری برای vision به راه افتاده‌اند. اگر هنوز مقاله An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale را نخوندید و حوصله خوندن پیپرش را هم هنوز ندارید، ده دقیقه این پست را مشاهده کنید تا بفهمید چه خبره و از قافله بعدی عقب نمونید.

https://theaisummer.com/vision-transformer/

پ.ن. قبلا این مقاله را در این پست (https://t.iss.one/nlp_stuff/82) معرفی کرده بودیم.
#read
#blog

@nlp_stuff
پیدا کردن دیتاست برای پروژه یادگیری ماشین

@ml_nlp_cv
اهمیت زمان برای بچه‌های هوش مصنوعی😜
#Fun
@ml_nlp_cv
Media is too big
VIEW IN TELEGRAM
پنجم اسفندماه هر سال به مناسبت بزرگداشت خواجه نصیرالدین طوسی، روز مهندس نامیده میشود.
خواجه نصیر از بزرگترین دانشمندان قرون وسطی است. تصویر مربوط به "زوج طوسی" است که خواجه توسط آن حرکات سیارات را توصیف کرد.
فیلم در مورد نقش طوسی در کشفیات کوپرنیک درباره حرکت اجسام سماوی است.
https://www.dailymotion.com/video/x6t81rn

اصل توصیف "زوج طوسی" را در کتاب "تحریر المجسطی" در زیر بخوانید.

'اذا كانت هناك دائرتان متحدتا المستوى، قطر الاولى يساوي نصف قطر الاخرى،وتكون متلامستان من الداخل بنقطة،وأخذت نقطة معينة من الدائرة الصغرى-ولتكن نقطة التماس مع الدائرة الكبرى-،الان لو تحركت الدائرتين حركة بسيطة وباتجاهين متعاكسين بحيث تكون سرعة الصغرى ضعف سرعة الكبرى بحيث تكمل الصغرى دورتين عندما تكمل الكبرى دورة واحدة، أذن سوف نرى ان النقطة سوف تتحرك على قطر الدائرة الكبرى والتي مرت في البداية من نقطة التماس، متذبذبة بين الطرفين"

#روز_مهندس_مبارک
#نوابغ_علم

در کانال اخلاق نشر و منابع علمی در تلگرام عضو شوید

https://t.iss.one/pubethicsmums/936
پیاده سازی یادگیری ماشین در ابزارهای هوش تجاری مایکروسافت Power BI و Tableau توسط #pycaret!

در لینک‌های زیر آموزش اتصال و نحوه فعال‌سازی بصورت تفکیک شده شرح گردیده، با دوستان علاقه‌مند به اشتراک بگذارید.

▪️ Topic Modeling in Power BI
yun.ir/b8sia6

▪️ Implement Clustering in Power BI using PyCaret
yun.ir/ha3wz6

▪️ Build your first Anomaly Detector in Power BI using PyCaret
yun.ir/2wgj7f

▪️ Machine Learning in Power BI using PyCaret
yun.ir/w7q5x6

▪️Machine Learning in Tableau with PyCaret
yun.ir/99fvu3

@ml_nlp_cv
💠ژنوم هایی که با استفاده از #هوش_مصنوعی ساخته شده اند

این روزها دیگر #تشخیص_چهره انسان معمولی از چهره‌ای که توسط هوش مصنوعی تولید شده، دشوار است.

برخی علائم از جمله حالت چشمان زیر عینک، لکه‌های روی پوست و حالت موها می‌تواند کمک کند تا در این تشخیص موفق‌تر عمل کنیم.

اما اگر تفاوت‌ها دیگر منحصر به پوست نباشند چه ؟ اگر هوش مصنوعی موفق به ساخت ژنوم شده باشد چه؟ اگر انسان‌هایی که توسط رایانه خلق شده‌اند در سطح ژنتیکی توصیف شوند، چه می‌شود؟

📌 برای خواندن متن کامل مقاله به لینک زیر مراجعه کنید:
🔗 yun.ir/humpe2
جدیدترین اخبار و مقالات هوش مصنوعی را در کانال هوشیو بخوانید:
🆔@hooshio
Hands-On Image Generation with TensorFlow: A practical guide to generating images and videos using deep learning

کتابی که اخیرا منتشر شده و خیلی هم مورد توجه قرار گرفته... اینم توئیت فرانسوا شوله که کلی از کتاب تعریف کرده:

https://twitter.com/fchollet/status/1366582819175026689?s=09

#GANs

@ml_nlp_cv