Seq2seq modeling is the de facto tool for advanced semantic parsers. However, the latency of auto-regressive generation (token by token) makes such models prohibitive for on-device modeling. In two new papers, we propose a
model for on-device assistants
and we show how we can
make larger server-side models
less computationally expensive.
These two new works make seq2seq modeling more efficient while retaining scalability. In our first work, we propose non-autoregressive semantic parsing, a new model to decode all tokens in parallel. Our work overcomes the latency burden of seq2seq modeling through parallel decoding, showcasing significant latency reductions (up to 81 percent benchmarked on a 2017-era Android smartphone with an eight-core processor a cell phone) along with accuracy equivalent to autoregressive models.
https://ai.facebook.com/blog/building-a-conversational-parser-for-on-device-voice-assistants
@ml_nlp_cv
model for on-device assistants
and we show how we can
make larger server-side models
less computationally expensive.
These two new works make seq2seq modeling more efficient while retaining scalability. In our first work, we propose non-autoregressive semantic parsing, a new model to decode all tokens in parallel. Our work overcomes the latency burden of seq2seq modeling through parallel decoding, showcasing significant latency reductions (up to 81 percent benchmarked on a 2017-era Android smartphone with an eight-core processor a cell phone) along with accuracy equivalent to autoregressive models.
https://ai.facebook.com/blog/building-a-conversational-parser-for-on-device-voice-assistants
@ml_nlp_cv
Facebook
Log in or sign up to view
See posts, photos and more on Facebook.
Forwarded from Ai Events️ (حمید محمودآبادی)
مقاله خوانی در حوزه یادگیری ماشین و یادگیری عمیق
موضوع چهارمین ارائه:
Vehicle behavior prediction for autonomous driving robots, a generalization perspective
ارائه دهنده: محمدحسین بهاری (دانشجو دکتری دانشگاه EPFL)
زمان ارائه: چهارشنبه 8 دی ساعت 10:00
محل برگزاری: اتاق مجازی دکتر رهبان
@RIMLLab
@Ai_Events
موضوع چهارمین ارائه:
Vehicle behavior prediction for autonomous driving robots, a generalization perspective
ارائه دهنده: محمدحسین بهاری (دانشجو دکتری دانشگاه EPFL)
زمان ارائه: چهارشنبه 8 دی ساعت 10:00
محل برگزاری: اتاق مجازی دکتر رهبان
@RIMLLab
@Ai_Events
Training Machine Learning Models More Efficiently with Dataset Distillation
https://ai.googleblog.com/2021/12/training-machine-learning-models-more.html
@ml_nlp_cv
https://ai.googleblog.com/2021/12/training-machine-learning-models-more.html
@ml_nlp_cv
research.google
Training Machine Learning Models More Efficiently with Dataset Distillation
Posted by Timothy Nguyen1, Research Engineer and Jaehoon Lee, Senior Research Scientist, Google Research For a machine learning (ML) algorithm to b...
Swin Transformers: The most powerful tool in Computer Vision
https://sieunpark77.medium.com/swin-transformers-the-most-powerful-tool-in-computer-vision-659f78744871
@ml_nlp_cv
https://sieunpark77.medium.com/swin-transformers-the-most-powerful-tool-in-computer-vision-659f78744871
@ml_nlp_cv
Medium
Swin Transformers: The most powerful tool in Computer Vision
The title is catchy, but it is true(at least for now). Swin transformers seem to be a game-changer in many computer vision tasks including…
Forwarded from Sajjad Ayoubi
چند ماه پیش OpenAI مدل ای معرفی کرد به اسم CLIP که می تونه تصاویر و متن رو به صورت معنایی بهم وصل کنه. مثلا تصویر بارون روی شیشه با متن "قطرات باران روی شیشه" بازنمایی های نزدیکی رو در فضای برداری تولید می کنند.
خب به چه دردی می خوره؟
با این مدل می تونید بازیابی تصویر انجام بدید (تصاویر رو با متن سرچ کنید)
یک عکس و چند تا کلاس بدید و به صورت zero shot تشخیص می ده عکس متعلق به کدوم کلاس است.
یک کاربرد دیگش چیزی شبیه به analogies در word2vec هست مثلا بازنمایی برداری تصویر یک سیب قرمز رو با بازنمایی کلمه "سبز" جمع می کنید و بازنمایی نهایی شبیه به تصویر یک سیب سبز می شه.
نسخه ای فارسی این مدل رو با ۴۰۰ هزار (جفت تصویر و متن) آموزش دادیم. که قطعا قدرت مدل انگیلیسی رو نداره ولی به دقت خوبی رسیده و همه می تونند ازش استفاده کنن. توضیحات بیشتر راجب مدل، دیتاست، کاربردها و نحوه دسترسی بهشون به گیتهاب زیر سربزنید و با استار حمایت کنید🙏 سوالی هم هست بفرمایید.
https://github.com/sajjjadayobi/CLIPfa
خب به چه دردی می خوره؟
با این مدل می تونید بازیابی تصویر انجام بدید (تصاویر رو با متن سرچ کنید)
یک عکس و چند تا کلاس بدید و به صورت zero shot تشخیص می ده عکس متعلق به کدوم کلاس است.
یک کاربرد دیگش چیزی شبیه به analogies در word2vec هست مثلا بازنمایی برداری تصویر یک سیب قرمز رو با بازنمایی کلمه "سبز" جمع می کنید و بازنمایی نهایی شبیه به تصویر یک سیب سبز می شه.
نسخه ای فارسی این مدل رو با ۴۰۰ هزار (جفت تصویر و متن) آموزش دادیم. که قطعا قدرت مدل انگیلیسی رو نداره ولی به دقت خوبی رسیده و همه می تونند ازش استفاده کنن. توضیحات بیشتر راجب مدل، دیتاست، کاربردها و نحوه دسترسی بهشون به گیتهاب زیر سربزنید و با استار حمایت کنید🙏 سوالی هم هست بفرمایید.
https://github.com/sajjjadayobi/CLIPfa
GitHub
GitHub - sajjjadayobi/CLIPfa: CLIPfa: Connecting Farsi Text and Images
CLIPfa: Connecting Farsi Text and Images. Contribute to sajjjadayobi/CLIPfa development by creating an account on GitHub.
Forwarded from Sajjad Ayoubi
نمونه جستجوی "گل صورتی"
دموی لایو اش رو می تونید با لینک زیر تست کنید.
https://huggingface.co/spaces/SajjadAyoubi/CLIPfa-Demo
دموی لایو اش رو می تونید با لینک زیر تست کنید.
https://huggingface.co/spaces/SajjadAyoubi/CLIPfa-Demo
Masked image modeling with Autoencoders
https://keras.io/examples/vision/masked_image_modeling/
@ml_nlp_cv
https://keras.io/examples/vision/masked_image_modeling/
@ml_nlp_cv
keras.io
Keras documentation: Masked image modeling with Autoencoders
Forwarded from DLeX: AI Python (Farzad🦅)
✅ آموزش برگزار شده
Tutorial on Adversarial Robustness: Theory and Practice
در 31امین کنفرانس
NeurIPS
پردازش اطلاعات با شبکه های عصبی
#هوش_مصنوعی #منابع #آموزش #کنفرانس
🌎 Link Review
❇️ @AI_Python
✴️ @AI_Python_EN
Tutorial on Adversarial Robustness: Theory and Practice
در 31امین کنفرانس
NeurIPS
پردازش اطلاعات با شبکه های عصبی
#هوش_مصنوعی #منابع #آموزش #کنفرانس
🌎 Link Review
❇️ @AI_Python
✴️ @AI_Python_EN
Forwarded from آی تبلیغ | ITABLIGH
⭕️ علم داده، پرتقاضاترین حرفه بازارکار رو آسان یاد بگیر!
📍📍 علم داده یکی از شغلهای پردرآمد دنیاست! همین حالا که این مطلب رو میخونین، خیلیها در حال یادگیری اون هستن تا بتونن هر چه سریعتر وارد بازارکار بشن و زندگیشون رو تغییر بدن.
▫️ نقشه راه یادگیری علم داده
▫️ ویدئوهای آموزشی برای هر رشتهای
▫️ وبینارهای رایگان پرسش و پاسخ
🔸 برای شروع کافیه عضو کانال زیر بشین:
👉🔗 https://t.iss.one/+auLRQUYLjd4yZWQ0
📍📍 علم داده یکی از شغلهای پردرآمد دنیاست! همین حالا که این مطلب رو میخونین، خیلیها در حال یادگیری اون هستن تا بتونن هر چه سریعتر وارد بازارکار بشن و زندگیشون رو تغییر بدن.
▫️ نقشه راه یادگیری علم داده
▫️ ویدئوهای آموزشی برای هر رشتهای
▫️ وبینارهای رایگان پرسش و پاسخ
🔸 برای شروع کافیه عضو کانال زیر بشین:
👉🔗 https://t.iss.one/+auLRQUYLjd4yZWQ0
Forwarded from پردازش تصویر ایران (A)
🌟 پردازش تصویر ایران🌟
🧠مرجع رسمی هوش مصنوعی ایران
📕 بینایی ماشین و یادگیری عمیق در سیستم عامل ویندوز
📅سال چاپ: 2021
📝چاپ کننده: APress
🧷لینک دانلود:
Imageprocessing.ir
#یادگیری_عمیق #دیپ_لرنینگ #بینایی_ماشین #ماشین_ویژن #هوش_مصنوعی #پایتون #آناکوندا #پردازش_تصویر #پردازش_ویدیو #یادگیری_تقویتی
#DeepLearning #MachineVision #AI #Python #Anaconda #CNN #OpenCV #MNIST #TransferLearning #Reinforcement #ImageProcessing #VideoProcessing
@Digital_Image_Processing
🧠مرجع رسمی هوش مصنوعی ایران
📕 بینایی ماشین و یادگیری عمیق در سیستم عامل ویندوز
📅سال چاپ: 2021
📝چاپ کننده: APress
🧷لینک دانلود:
Imageprocessing.ir
#یادگیری_عمیق #دیپ_لرنینگ #بینایی_ماشین #ماشین_ویژن #هوش_مصنوعی #پایتون #آناکوندا #پردازش_تصویر #پردازش_ویدیو #یادگیری_تقویتی
#DeepLearning #MachineVision #AI #Python #Anaconda #CNN #OpenCV #MNIST #TransferLearning #Reinforcement #ImageProcessing #VideoProcessing
@Digital_Image_Processing
Forwarded from پردازش تصویر ایران (A)
Deep Learning on Windows.pdf
14.7 MB
Forwarded from رضا شکرزاد - علمداده و هوش مصنوعی
Natural Language Processing with Python_compressed.pdf
4.4 MB
📚 معرفی کتاب: Natural Language Processing with Python از Steven Bird
این کتاب برای اونهایی مناسبه که دوس دارن تو حوزه پردازش زبان طبیعی یا NLP فعالیت کنن و رو تسکهای معروفی مثل فیلتر کردن ایمیلهای اسپم یا تحلیل احساسات کاربر رو از روی متنی که نوشته و تسکهایی شبیه به این کار کنن. این حوزه در کنار بینایی ماشین یکی از حوزههای پرطرفدار محسوب میشه.
🔶 قبل از شروع کتاب، مطالعه مقاله معرفی پردازش زبان طبیعی هم ایده خوبیه:
👉🔗 https://ctdrs.ir/ds0010
#NLP
@DSLanders | دیاسلندرز
این کتاب برای اونهایی مناسبه که دوس دارن تو حوزه پردازش زبان طبیعی یا NLP فعالیت کنن و رو تسکهای معروفی مثل فیلتر کردن ایمیلهای اسپم یا تحلیل احساسات کاربر رو از روی متنی که نوشته و تسکهایی شبیه به این کار کنن. این حوزه در کنار بینایی ماشین یکی از حوزههای پرطرفدار محسوب میشه.
🔶 قبل از شروع کتاب، مطالعه مقاله معرفی پردازش زبان طبیعی هم ایده خوبیه:
👉🔗 https://ctdrs.ir/ds0010
#NLP
@DSLanders | دیاسلندرز
Forwarded from دستاوردهای یادگیری عمیق(InTec)
این سری لایوهایی که OpenCV توی لینکدین قرار میده رو از دست ندید (حتی اگر لایو رو ندید)
توی این سری موضوع YOLOv5 هست؛ و البته پارت اول
Opencv yolov5 series
توی این سری موضوع YOLOv5 هست؛ و البته پارت اول
Opencv yolov5 series
Linkedin
#opencv #computervision #artificialintelligence #ai #webinar | OpenCV | 39 comments
On this week's episode, OpenCV CEO Satya Mallick shows us the ropes of the powerful YOLOv5 system, with the goal of building a snowman detector. Learn how to find frosty in this fun, educational, episode. #OpenCV #ComputerVision #ArtificialIntelligence #AI…
Patterns for Personalization in Recommendations and Search
https://eugeneyan.com/writing/patterns-for-personalization/
@ml_nlp_cv
https://eugeneyan.com/writing/patterns-for-personalization/
@ml_nlp_cv
eugeneyan.com
Patterns for Personalization in Recommendations and Search
A whirlwind tour of bandits, embedding+MLP, sequences, graph, and user embeddings.
Forwarded from NLP stuff
خطکشی برای سنجش کیفیت document understanding
در این پست میخوایم به معرفی benchmark برای تسک document undestanding بپردازیم. این benchmark تسک document undestaning رو تبدیل به سه مساله اصلی کرده:
- تسک اول Document QA است که از روی layout داکیومنت میتونه سوال بپرسه و مدل باید جواب بده. در این حالت سوالها به صورت زبان طبیعی پرسیده میشه اما کانتکست درواقع یه داکیومنته که layout داره (متنی که استایل داره یعنی فونت یا سایزهای متفاوتی داره). مثلا از مدل میپرسند که دو نوع تاریخی که در این داکیومنت وجود داره چه چیزهایی هستند؟ و مدل هم باید مثلا بگه تاریخ فاکتور و تاریخ پرداخت.
- تسک دوم key information extraction است که شبیه تسک اوله با این تفاوت که دیگه query با زبان طبیعی مطرح نمیشه بلکه مدل اطلاعات کلیدی این داکیومنت رو باید بیرون بکشه. مثلا مجموع فاکتور برابر با ۲۰۰۰ دلاره.
- تسک سوم هم Table QA/NLI هست که کار QA و یا NLI رو بر روی جداول انجام میده. این تسک مشخصا بر روی جداول تمرکز داره و سعی میکنه برخی از عبارات رو با استفاده از جدول موجود در داکیومنت verify کنه. مثلا یه جمله ورودی میگیره که آیتم شماره ۱ به مقدار ۲۰۰ قلم فروخته شده و مدل باید بگه که این جمله درسته یا نه. البته میشه از روی جدول، سوال هم پرسید و مدل باید بتونه جواب بده.
یه صفحه هم در نظر گرفته شده که leaderboard است و امتیاز مدلهای مختلف رو گذاشته و حالت overall روی این سه تا تسک داره. اگه در این زمینه کار میکنید خوبه به این بنچمارک توجه کنید و نتایجتون رو با leaderboard مقایسه کنید. در تصویر مثالهای بهتری از هر یک از این سه تسک آورده شده که میتونید مشاهده کنید.
لینک benchmark:
https://duebenchmark.com/leaderboard
لینک github:
https://github.com/due-benchmark
لینک مقاله:
https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/069059b7ef840f0c74a814ec9237b6ec-Paper-round2.pdf
#read
#paper
@nlp_stuff
در این پست میخوایم به معرفی benchmark برای تسک document undestanding بپردازیم. این benchmark تسک document undestaning رو تبدیل به سه مساله اصلی کرده:
- تسک اول Document QA است که از روی layout داکیومنت میتونه سوال بپرسه و مدل باید جواب بده. در این حالت سوالها به صورت زبان طبیعی پرسیده میشه اما کانتکست درواقع یه داکیومنته که layout داره (متنی که استایل داره یعنی فونت یا سایزهای متفاوتی داره). مثلا از مدل میپرسند که دو نوع تاریخی که در این داکیومنت وجود داره چه چیزهایی هستند؟ و مدل هم باید مثلا بگه تاریخ فاکتور و تاریخ پرداخت.
- تسک دوم key information extraction است که شبیه تسک اوله با این تفاوت که دیگه query با زبان طبیعی مطرح نمیشه بلکه مدل اطلاعات کلیدی این داکیومنت رو باید بیرون بکشه. مثلا مجموع فاکتور برابر با ۲۰۰۰ دلاره.
- تسک سوم هم Table QA/NLI هست که کار QA و یا NLI رو بر روی جداول انجام میده. این تسک مشخصا بر روی جداول تمرکز داره و سعی میکنه برخی از عبارات رو با استفاده از جدول موجود در داکیومنت verify کنه. مثلا یه جمله ورودی میگیره که آیتم شماره ۱ به مقدار ۲۰۰ قلم فروخته شده و مدل باید بگه که این جمله درسته یا نه. البته میشه از روی جدول، سوال هم پرسید و مدل باید بتونه جواب بده.
یه صفحه هم در نظر گرفته شده که leaderboard است و امتیاز مدلهای مختلف رو گذاشته و حالت overall روی این سه تا تسک داره. اگه در این زمینه کار میکنید خوبه به این بنچمارک توجه کنید و نتایجتون رو با leaderboard مقایسه کنید. در تصویر مثالهای بهتری از هر یک از این سه تسک آورده شده که میتونید مشاهده کنید.
لینک benchmark:
https://duebenchmark.com/leaderboard
لینک github:
https://github.com/due-benchmark
لینک مقاله:
https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/069059b7ef840f0c74a814ec9237b6ec-Paper-round2.pdf
#read
#paper
@nlp_stuff
Telegram
stuff
Forwarded from کتابخانه مهندسی کامپیوتر و پایتون
Mastering Transformers: Build state-of-the-art models from scratch with advanced natural language processing techniques
Author : Savaş Yıldırım, Meysam Asgari-Chenaghlu
Publisher : Packt Publishing
Year : 2021
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Author : Savaş Yıldırım, Meysam Asgari-Chenaghlu
Publisher : Packt Publishing
Year : 2021
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Forwarded from کتابخانه مهندسی کامپیوتر و پایتون
Sava_Y_ld_r_m,_Meysam_Asgari_Chenaghlu_Mastering_Transformers_Build.pdf
13.9 MB
Mastering Transformers (2021)
▪️What you will learn
Explore state-of-the-art NLP solutions with the Transformers library
Train a language model in any language with any transformer architecture
Fine-tune a pre-trained language model to perform several downstream tasks
Select the right framework for the training, evaluation, and production of an end-to-end solution
Get hands-on experience in using TensorBoard and Weights & Biases
Visualize the internal representation of transformer models for interpretability
▪️Who this book is for
This book is for deep learning researchers, hands-on NLP practitioners, as well as ML/NLP educators and students who want to start their journey with Transformers. Beginner-level machine learning knowledge and a good command of Python will help you get the best out of this book.
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
▪️What you will learn
Explore state-of-the-art NLP solutions with the Transformers library
Train a language model in any language with any transformer architecture
Fine-tune a pre-trained language model to perform several downstream tasks
Select the right framework for the training, evaluation, and production of an end-to-end solution
Get hands-on experience in using TensorBoard and Weights & Biases
Visualize the internal representation of transformer models for interpretability
▪️Who this book is for
This book is for deep learning researchers, hands-on NLP practitioners, as well as ML/NLP educators and students who want to start their journey with Transformers. Beginner-level machine learning knowledge and a good command of Python will help you get the best out of this book.
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Real-time machine learning challenges and solutions
https://huyenchip.com/2022/01/02/real-time-machine-learning-challenges-and-solutions.html
https://huyenchip.com/2022/01/02/real-time-machine-learning-challenges-and-solutions.html
Chip Huyen
Real-time machine learning: challenges and solutions
[Twitter discussion, LinkedIn]