Machine Learning NLP + CV
286 subscribers
223 photos
53 videos
42 files
474 links
مطالب مفید در حوزه های یادگیری ماشین و بینایی کامپیوتر
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
A core challenge in #DeepLearning is the disconnect between the theory of how models generalize and how they perform in practice. A new theoretical framework demonstrates how to understand model generalization through optimization behavior. Check it out at https://ai.googleblog.com/2021/03/a-new-lens-on-understanding.html?m=1

@ml_nlp_cv
Forwarded from PyTorch Howsam
SpeechBrain is an open-source and all-in-one speech toolkit based on PyTorch.

یک لایبرری خوب پایتورچی برای speech

داکیومنت

@pytorch_howsam
گفتگو با اندرو ان-جی (استاد دانشگاه استنفورد) -چهارشنبه هفته آینده

لینک ثبت نام رایگان:
yun.ir/z03a3g

@ml_nlp_cv
🎥ویدیو جلسه دوازدهم #کدنویسی_هوش_مصنوعی_با_فیلاگر آپلود شد!

🔺موضوع این جلسه:
"پیش‌بینی قیمت بیت‌کوین با هوش مصنوعی"


💻در رویداد کدنویسی هوش مصنوعی با فیلاگر، قدم به قدم، به صورت آنلاین و گروهی، برنامه نویسی هوش مصنوعی رو یاد میگیریم.

🔸حضور در این رویداد کاملا رایگان است.

📌برای تماشای رایگان ویدیو این جلسه به همراه تمام جلسات قبلی با ترافیک نیم‌بها و دانلود کدها، به لینک زیر مراجعه کنید:

🔺🔗ویدیو جلسات کدنویسی هوش‌مصنوعی با فیلاگر

🎟برای شرکت در جلسات بعدی، کانال تلگرام فیلاگر رو دنبال کنید.
👉🏻@filoger_com

💜با به اشتراک‌گذاری این برنامه رایگان، در نشر دانش سخاوتمند باشید:)
#فیلاگر_تی_وی

🧠فیلاگر|جامعه هوش‌مصنوعی ایران
@filoger_com
وبینار NVIDIA
با حضور مدیر عامل NVIDIA، بزرگان یادگیری عمیق و دیگر صنایع از شرکت‌های بزرگ

ثبت نام

@ml_nlp_cv
گوگل، کد Lyra را Open Source کرد.

https://opensource.googleblog.com/2021/04/lyra-enabling-voice-calls-for-next-billion-users.html?m=1

این Audio codec که مبتنی بر یادگیری ماشین می باشد، کیفیت تماس صوتی رو حتی در جاهایی که سیگنال تماس ضعیف باشد، بالا نگه میدارد.

@ml_nlp_cv
Forwarded from Programming Resources
This media is not supported in your browser
VIEW IN TELEGRAM
Make your code clearer, more concise, and more Pythonic with Sourcery's coding assistant.
ابزار sourcery کد پایتون‌تون رو ریفکتور و تمیز می‌کنه. برای PyCharm و VSCode هم addOn آماده داره.

#python #refactor #clean #cleancode #refactoring #tools #pycharm #vscode
@pythony

https://sourcery.ai
This media is not supported in your browser
VIEW IN TELEGRAM
یک کمپانی اومده با پردازش تصویر و هوش مصنوعی، فیلم‌ها دوبله میکنه.لحن و صدای بازیگرا عوض نمیشه ولی زبان اونها عوض میشه. دیالوگها با حرکات دهان بازیگرا تو فیلم‌ها و مدت دیالوگ‌شون هماهنگ میشه

خب کم کم با زیر نویس و دوبلاژ بی کیفیت خداحافظی کنید.


#خبرهای_تکنولوڑی_را_بخوانید_و_شگفت_زده_شوید👇👇👇👇
@iAPtel
Forwarded from NLP stuff
معماری تماما MLP برای پردازش تصویر

پست امروز درباره یک معماری ساده است که همین دو روز پیش مقاله‌اش منتشر شده. این معماری برای تسک دسته‌بندی تصاویر ارائه شده و بر خلاف شبکه‌های نامداری مثل ResNet و ViT هیچ گونه کانولوشن و اتنشی درون خودش نداره و تماما از MLP تشکیل شده. خیلی خلاصه بخوایم توضیح بدیم، ابتدا مثل ViT میاد و تصویر رو به تکه (patch) هایی تقسیم می‌کنه، سپس بعد از عبور دادن این پچ‌ها از لایه‌ی امبدینگ و به دست آوردن یک وکتور برای هر یک از تکه‌ها، اونها رو از N تا لایه به اسم MixerLayer می‌گذرونه. این MixerLayer درون خودش از دو تا شبکه MLP تشکیل شده که اولیش میاد یک فیدفوروارد روی یک جنبه از تماما تصویر‌ها میزنه (در واقع یک فیچر از روی یک فیچر تمامی تکه‌ها درست می‌کنه) و دومین MLP هم میاد یک فیدفوروارد از روی فیچر‌های یک تکه درست می‌کنه (شکل پیوست شده رو اگر ببینید درکش بسیار راحته، به اون T یا Transpose ها فقط باید دقت کنید) در نهایت هم به یک شبکه رسیدند و آزمایش‌های مختلف پیش‌آزمایش و فاین تیون رو روش انجام دادند.
شبکه اش از نظر دقتی خاص و برجسته نیست و البته پرت هم نیست. نقطه مثبتش رو میشه نرخ توان عملیاتی بالاش (throughput) دونست که خیلی از شبکه‌های مثل ViT بهتره (یک دلیلش میتونه این باشه که توی ViT به خاطر وجود اتنشن با افزایش رزولشن و در نتیجه افزایش تعداد تکه‌ها و طول ورودی، میزان نیاز به حافظه به صورت توان دویی زیاد میشه ولی اینجا این اتفاق به صورت خطی رخ میده).
کلا مقاله جالبیه و خب البته سوالاتی رو هم برمی‌انگیزه که چطوری بدون سوگیری القایی (inductive bias) خاصی به این نتیجه رسیده.

مثل همیشه یانیک کیلچر هم به سرعت یک ویدئو در توضیح این مقاله بیرون داده که می‌تونید تماشا کنید:
https://www.youtube.com/watch?v=7K4Z8RqjWIk

لینک مقاله:
https://arxiv.org/abs/2105.01601v1

#read
#paper
#watch

@nlp_stuff
#سخنرانی

"Making Sense of Limited Resources in Cross-Lingual NLP"


‼️سخنرانی به‌صورت آنلاین می‌باشد. لطفا جهت دریافت لینک سخنرانی و شرکت در رویداد، از طریق لینک زیر ثبت‌نام فرمایید.


📆 دوشنبه ١٧ خردادماه ۱۴۰۰

🕚 ساعت ١۶:٠٠

ثبت‌نام(الزامی):

https://teias.institute/rasooli-talk202106/

‼️مهلت ثبت‌نام: ١٢ خردادماه ۱۴٠٠

@pasargadschools
یادگیری ماشین در صنعت؛ یا چگونه‌ یک مساله‌ی هوش مصنوعی را در دستگاه نوا بنوازیم!

یادداشت عارف قدمایی

در این نوشته، سعی دارم تجربیات خود را به عنوان یک مهندس یادگیری ماشین با شما به اشتراک بگذارم. عنوان را درست خوانده‌اید، تمرکز من در این نوشته، اصلا در مورد یادگیری هوش مصنوعی نیست. اگر کلیات حل یک مسئله‌ی ماشین لرنینگ را بلدید و می‌خواهید با فضای این‌کار در صنعت و نحوه‌ی استفاده از دانش خود در محیط‌های کاری آشنا شوید، این مقاله مخصوص شماست.
Forwarded from NLP stuff
بخش Dataset Loaders از سایت paperswithcode!

سایت paperswithcode (قبلا این پست و این پست و این پست را درباره‌اش گذاشته بودیم) که بخش دیتاست‌ها را قبلا به سایتش اضافه کرده بود، حالا جدیدا بخشی رو اضافه کرده که برای هر دیتاست، کد لود کردنش رو با کتابخونه‌های مختلف مثل huggingface datasets, TensorFlow datasets, OpenMMLab, AllenNLP آورده؛ خیلی کاربردی و یک جا.

لینک یک دیتاست مثال:
https://paperswithcode.com/dataset/sst

#link

@nlp_stuff
Forwarded from PyTorch Howsam
تز دکترای Andrej Karpathy که درباره کانکشن بین پردازش زبان طبیعی و کامپیوتر ویژن نوشته شده.

به طور خاص مبحث image captioning
که برای علاقمندان این حوزه می تونه مفید باشه.

https://cs.stanford.edu/people/karpathy/main.pdf

با تشکر از امیررضا عزیز

@pytorch_howsam
طراحی نسل بعدی پردازنده های گوگل بر اساس یادگیری تقویتی خواهد بود و امروز مقاله ش در نیچر چاپ شد https://www.nature.com/articles/s41586-021-03544-w طراح پروژه هم یک خانم ایرانی است که در ایران کارشناسی گرفت.
@ml_nlp_cv