Patterns for Personalization in Recommendations and Search
https://eugeneyan.com/writing/patterns-for-personalization/
@ml_nlp_cv
https://eugeneyan.com/writing/patterns-for-personalization/
@ml_nlp_cv
eugeneyan.com
Patterns for Personalization in Recommendations and Search
A whirlwind tour of bandits, embedding+MLP, sequences, graph, and user embeddings.
Forwarded from NLP stuff
خطکشی برای سنجش کیفیت document understanding
در این پست میخوایم به معرفی benchmark برای تسک document undestanding بپردازیم. این benchmark تسک document undestaning رو تبدیل به سه مساله اصلی کرده:
- تسک اول Document QA است که از روی layout داکیومنت میتونه سوال بپرسه و مدل باید جواب بده. در این حالت سوالها به صورت زبان طبیعی پرسیده میشه اما کانتکست درواقع یه داکیومنته که layout داره (متنی که استایل داره یعنی فونت یا سایزهای متفاوتی داره). مثلا از مدل میپرسند که دو نوع تاریخی که در این داکیومنت وجود داره چه چیزهایی هستند؟ و مدل هم باید مثلا بگه تاریخ فاکتور و تاریخ پرداخت.
- تسک دوم key information extraction است که شبیه تسک اوله با این تفاوت که دیگه query با زبان طبیعی مطرح نمیشه بلکه مدل اطلاعات کلیدی این داکیومنت رو باید بیرون بکشه. مثلا مجموع فاکتور برابر با ۲۰۰۰ دلاره.
- تسک سوم هم Table QA/NLI هست که کار QA و یا NLI رو بر روی جداول انجام میده. این تسک مشخصا بر روی جداول تمرکز داره و سعی میکنه برخی از عبارات رو با استفاده از جدول موجود در داکیومنت verify کنه. مثلا یه جمله ورودی میگیره که آیتم شماره ۱ به مقدار ۲۰۰ قلم فروخته شده و مدل باید بگه که این جمله درسته یا نه. البته میشه از روی جدول، سوال هم پرسید و مدل باید بتونه جواب بده.
یه صفحه هم در نظر گرفته شده که leaderboard است و امتیاز مدلهای مختلف رو گذاشته و حالت overall روی این سه تا تسک داره. اگه در این زمینه کار میکنید خوبه به این بنچمارک توجه کنید و نتایجتون رو با leaderboard مقایسه کنید. در تصویر مثالهای بهتری از هر یک از این سه تسک آورده شده که میتونید مشاهده کنید.
لینک benchmark:
https://duebenchmark.com/leaderboard
لینک github:
https://github.com/due-benchmark
لینک مقاله:
https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/069059b7ef840f0c74a814ec9237b6ec-Paper-round2.pdf
#read
#paper
@nlp_stuff
در این پست میخوایم به معرفی benchmark برای تسک document undestanding بپردازیم. این benchmark تسک document undestaning رو تبدیل به سه مساله اصلی کرده:
- تسک اول Document QA است که از روی layout داکیومنت میتونه سوال بپرسه و مدل باید جواب بده. در این حالت سوالها به صورت زبان طبیعی پرسیده میشه اما کانتکست درواقع یه داکیومنته که layout داره (متنی که استایل داره یعنی فونت یا سایزهای متفاوتی داره). مثلا از مدل میپرسند که دو نوع تاریخی که در این داکیومنت وجود داره چه چیزهایی هستند؟ و مدل هم باید مثلا بگه تاریخ فاکتور و تاریخ پرداخت.
- تسک دوم key information extraction است که شبیه تسک اوله با این تفاوت که دیگه query با زبان طبیعی مطرح نمیشه بلکه مدل اطلاعات کلیدی این داکیومنت رو باید بیرون بکشه. مثلا مجموع فاکتور برابر با ۲۰۰۰ دلاره.
- تسک سوم هم Table QA/NLI هست که کار QA و یا NLI رو بر روی جداول انجام میده. این تسک مشخصا بر روی جداول تمرکز داره و سعی میکنه برخی از عبارات رو با استفاده از جدول موجود در داکیومنت verify کنه. مثلا یه جمله ورودی میگیره که آیتم شماره ۱ به مقدار ۲۰۰ قلم فروخته شده و مدل باید بگه که این جمله درسته یا نه. البته میشه از روی جدول، سوال هم پرسید و مدل باید بتونه جواب بده.
یه صفحه هم در نظر گرفته شده که leaderboard است و امتیاز مدلهای مختلف رو گذاشته و حالت overall روی این سه تا تسک داره. اگه در این زمینه کار میکنید خوبه به این بنچمارک توجه کنید و نتایجتون رو با leaderboard مقایسه کنید. در تصویر مثالهای بهتری از هر یک از این سه تسک آورده شده که میتونید مشاهده کنید.
لینک benchmark:
https://duebenchmark.com/leaderboard
لینک github:
https://github.com/due-benchmark
لینک مقاله:
https://datasets-benchmarks-proceedings.neurips.cc/paper/2021/file/069059b7ef840f0c74a814ec9237b6ec-Paper-round2.pdf
#read
#paper
@nlp_stuff
Telegram
stuff
Forwarded from کتابخانه مهندسی کامپیوتر و پایتون
Mastering Transformers: Build state-of-the-art models from scratch with advanced natural language processing techniques
Author : Savaş Yıldırım, Meysam Asgari-Chenaghlu
Publisher : Packt Publishing
Year : 2021
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Author : Savaş Yıldırım, Meysam Asgari-Chenaghlu
Publisher : Packt Publishing
Year : 2021
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Forwarded from کتابخانه مهندسی کامپیوتر و پایتون
Sava_Y_ld_r_m,_Meysam_Asgari_Chenaghlu_Mastering_Transformers_Build.pdf
13.9 MB
Mastering Transformers (2021)
▪️What you will learn
Explore state-of-the-art NLP solutions with the Transformers library
Train a language model in any language with any transformer architecture
Fine-tune a pre-trained language model to perform several downstream tasks
Select the right framework for the training, evaluation, and production of an end-to-end solution
Get hands-on experience in using TensorBoard and Weights & Biases
Visualize the internal representation of transformer models for interpretability
▪️Who this book is for
This book is for deep learning researchers, hands-on NLP practitioners, as well as ML/NLP educators and students who want to start their journey with Transformers. Beginner-level machine learning knowledge and a good command of Python will help you get the best out of this book.
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
▪️What you will learn
Explore state-of-the-art NLP solutions with the Transformers library
Train a language model in any language with any transformer architecture
Fine-tune a pre-trained language model to perform several downstream tasks
Select the right framework for the training, evaluation, and production of an end-to-end solution
Get hands-on experience in using TensorBoard and Weights & Biases
Visualize the internal representation of transformer models for interpretability
▪️Who this book is for
This book is for deep learning researchers, hands-on NLP practitioners, as well as ML/NLP educators and students who want to start their journey with Transformers. Beginner-level machine learning knowledge and a good command of Python will help you get the best out of this book.
#یادگیری_عمیق #NLP
🆔 @Programming4all_0to100
Real-time machine learning challenges and solutions
https://huyenchip.com/2022/01/02/real-time-machine-learning-challenges-and-solutions.html
https://huyenchip.com/2022/01/02/real-time-machine-learning-challenges-and-solutions.html
Chip Huyen
Real-time machine learning: challenges and solutions
[Twitter discussion, LinkedIn]
Forwarded from DLeX: AI Python (Meysam Asgari)
https://ai.facebook.com/blog/the-first-high-performance-self-supervised-algorithm-that-works-for-speech-vision-and-text/
@ai_python
@ai_python
Meta
Data2vec: The first high-performance self-supervised algorithm that works for speech, vision, and text
We’ve built data2vec, the first general high-performance self-supervised algorithm for speech, vision, and text. When applied to different modalities, it matches or outperforms the best self-supervised algorithms.
Forwarded from DLeX: AI Python (Meysam Asgari)
271974914_483120576492438_4239522333319653600_n.pdf
758.3 KB
Knowledge Distillation
آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدلهای یادگیری عمیق
https://hooshio.com/?p=7988
فشرده سازی شبکه عصبی: مقدمهای بر هرس وزن، کوانتیزه کردن و تقطیر دانش
https://hooshio.com/?p=10268
آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدلهای یادگیری عمیق
https://hooshio.com/?p=7988
فشرده سازی شبکه عصبی: مقدمهای بر هرس وزن، کوانتیزه کردن و تقطیر دانش
https://hooshio.com/?p=10268
هوشیو
آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدلهای یادگیری عمیق - هوشیو
تقطیر دانش روشی ساده برای بهبود عملکرد مدلهای یادگیری عمیق روی دستگاههای موبایل است. در این فرآیند یک شبکهی بزرگ و پیچیده یا یک مدل گروهی آموزش .......
Forwarded from InstaSave
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 گوگل یک "شبکه هوش مصنوعی پرنده شناس" ساخته که پرندگان را از آواز خواندن آنها با دقت یک متخصص تشخیص می ده. این هوش مصنوعی به محیط بانان کمک میکنه تا وضعیت پرندگان رو در جنگلها و سواحل را بررسی کنند.
- مجید میرزایی
»unk«
ربات دانلود از اینستاگرام :
🤖 @Instasave_Bot 🤖
- مجید میرزایی
»unk«
ربات دانلود از اینستاگرام :
🤖 @Instasave_Bot 🤖
🎯 امیدواری گوگل به توسعه محصول اصلی این شرکت یعنی موتور جستجو، به شکلی که بتواند کارکردی شبیه دستیار صوتی گوگل داشته باشد.
https://www.wired.com/story/google-hopes-ai-turn-search-conversation/
@ml_nlp_cv
https://www.wired.com/story/google-hopes-ai-turn-search-conversation/
@ml_nlp_cv
WIRED
Google Hopes AI Can Turn Search Into a Conversation
The tech giant wants its core product to infer meaning from human language, answer multipart questions—and look more like Google Assistant sounds.
Forwarded from RecommenderSystems
2021 Deep learning principles concepts and approaches.pdf
7.7 MB
2021 Deep learning: principles, concepts and approaches
یادگیری عمیق: اصول، مفاهیم و رویکردها، ویرایش نخست، تهران، میعاد اندیشه، ۱۳۹۹
https://miladvazan.ir
#یادگیری_عمیق #مفاهیم #وزان #میلاد_وزان
#Deep #DeepLearning #Deep_Learning #Principles #Concepts #Approaches #Principle #Concept #Approache
@Recommender_Systems
یادگیری عمیق: اصول، مفاهیم و رویکردها، ویرایش نخست، تهران، میعاد اندیشه، ۱۳۹۹
https://miladvazan.ir
#یادگیری_عمیق #مفاهیم #وزان #میلاد_وزان
#Deep #DeepLearning #Deep_Learning #Principles #Concepts #Approaches #Principle #Concept #Approache
@Recommender_Systems
یادگیری_ماشین_و_علم_داده_مبانی_مفاهیم_الگوریتمها_و_ابزارها.pdf
15.4 MB
کتاب یادگیری ماشین و علم داده: مبانی، مفاهیم، الگوریتمها و ابزارها
چاپ اول 1400
دانلود نسخه الکترونیکی به صورت رایگان:
https://www.researchgate.net/profile/Milad-Vazan/publication/358263339_yadgyry_mashyn_w_lm_dadh_mbany_mfahym_algwrytmha_w_abzarha/links/61f90216007fb504472c5dc1/yadgyry-mashyn-w-lm-dadh-mbany-mfahym-algwrytmha-w-abzarha.pdf
miladvazan.ir
#Machine_Learning #MachineLearning #Free #eBook #Vazan #Tools #Algorithm #Tabriz #Python #Mathematical #Model #Mathematical_Models
@Recommender_Systems
چاپ اول 1400
دانلود نسخه الکترونیکی به صورت رایگان:
https://www.researchgate.net/profile/Milad-Vazan/publication/358263339_yadgyry_mashyn_w_lm_dadh_mbany_mfahym_algwrytmha_w_abzarha/links/61f90216007fb504472c5dc1/yadgyry-mashyn-w-lm-dadh-mbany-mfahym-algwrytmha-w-abzarha.pdf
miladvazan.ir
#Machine_Learning #MachineLearning #Free #eBook #Vazan #Tools #Algorithm #Tabriz #Python #Mathematical #Model #Mathematical_Models
@Recommender_Systems
This media is not supported in your browser
VIEW IN TELEGRAM
تولید نما(View Synthesis) زمینهای تحقیقاتی است، در مورد تولید نماهایی تازه از یک منظره، با موجود داشتن تعدادی تصویر از آن.
در پستی از وبلاگ گوگل میخوانیم که چطور دو مدل مبتنی بر ترنسفورمر در این زمینه پیشرفت داشتهاند.
#Transformer #NLP
#Synthesis #Computer_Vision
@ml_nlp_cv
در پستی از وبلاگ گوگل میخوانیم که چطور دو مدل مبتنی بر ترنسفورمر در این زمینه پیشرفت داشتهاند.
#Transformer #NLP
#Synthesis #Computer_Vision
@ml_nlp_cv
Forwarded from انجمن علمی دانشکده مهندسی کامپیوتر
🔵 معاونت پژوهشی دانشکده مهندسی کامپیوتر به مناسبت هفتهی پژوهش سخنرانیهای علمی زیر را امروز برگزار میکند:
🔹مهندسی ثابتافزار و برخی از حوزههای فعالیت در آن
ساعت ۱۳ - ۱۳:۳۰
دکتر علیرضا اجلالی
🔹تطبیق نوری رشتههای DNA توسط پردازنده نوری
ساعت ۱۳:۳۰ - ۱۴
دکتر سمیه کوهی
🔹چالشهای حفظ حریم خصوصی در اینترنت اشیاء
ساعت ۱۴ - ۱۴:۳۰
دکتر مرتضی امینی
🔹حاکمیت بهینه برای خوشحالی جمعی در بازارهای شبکهای
ساعت ۱۴:۳۰ - ۱۵
دکتر محمدامین فضلی
🔹سوی تعمیمپذیری خارج از توزیع
ساعت ۱۵ - ۱۵:۳۰
دکتر مهدیه سلیمانی
🔹تحقیقات پردازش زبانهای ایرانی و علومانسانی محاسباتی به همراهی گزارشهایی از تجربه آموزش در حین
پژوهش و حل مسئله
ساعت ۱۵:۳ - ۱۶
دکتر احسانالدین عسگری
🔹تشخیص ناهنجاری نزدیک به توزیع در تصاویر
ساعت ۱۶ - ۱۶:۳۰
دکتر محمدحسین رهبان
تاریخ : چهارشنبه، ۳۰ آذر
لینک برگزاری: https://vc.sharif.edu/ch/ce-talks
چکیدهی ارائهها و اطلاعات بیشتر در فایل پیوست
〰️〰️〰️〰️〰️〰️〰️
🆔 @SSC_Public
🔹مهندسی ثابتافزار و برخی از حوزههای فعالیت در آن
ساعت ۱۳ - ۱۳:۳۰
دکتر علیرضا اجلالی
🔹تطبیق نوری رشتههای DNA توسط پردازنده نوری
ساعت ۱۳:۳۰ - ۱۴
دکتر سمیه کوهی
🔹چالشهای حفظ حریم خصوصی در اینترنت اشیاء
ساعت ۱۴ - ۱۴:۳۰
دکتر مرتضی امینی
🔹حاکمیت بهینه برای خوشحالی جمعی در بازارهای شبکهای
ساعت ۱۴:۳۰ - ۱۵
دکتر محمدامین فضلی
🔹سوی تعمیمپذیری خارج از توزیع
ساعت ۱۵ - ۱۵:۳۰
دکتر مهدیه سلیمانی
🔹تحقیقات پردازش زبانهای ایرانی و علومانسانی محاسباتی به همراهی گزارشهایی از تجربه آموزش در حین
پژوهش و حل مسئله
ساعت ۱۵:۳ - ۱۶
دکتر احسانالدین عسگری
🔹تشخیص ناهنجاری نزدیک به توزیع در تصاویر
ساعت ۱۶ - ۱۶:۳۰
دکتر محمدحسین رهبان
تاریخ : چهارشنبه، ۳۰ آذر
لینک برگزاری: https://vc.sharif.edu/ch/ce-talks
چکیدهی ارائهها و اطلاعات بیشتر در فایل پیوست
〰️〰️〰️〰️〰️〰️〰️
🆔 @SSC_Public