Machine Learning NLP + CV
286 subscribers
223 photos
53 videos
42 files
474 links
مطالب مفید در حوزه های یادگیری ماشین و بینایی کامپیوتر
Download Telegram
Forwarded from NLP stuff
یادگیری قلق‌های ریسرچ هوش با کورس CS197 هاروارد

عموما اگر هم صنعت و هم آکادمی را تجربه کرده باشید این تفاوت را مشاهده کرده‌اید که به نظر فضای صنعت فضای سرراست‌تری است و روند آغاز تا انجام یک تسک یا پروژه بسیار شفاف‌تر و آشناتر است تا روند اجرای یک پژوهش در آکادمی. به علاوه در فضای صنعت نیروها به علت پیش‌زمینه مهندسی که دارند آشنا به رعایت یکسری قواعد و الگووار‌ه‌هایی هستند، حال آن که این قواعد و الگوها در سمت ریسرچ به صورت مدونی وجود ندارد. حال آقای Rajpurkar استادیار دانشگاه هاروارد آمده و یک کتاب الکترونیکی از درسی که تحت عنوان "تجربیات پژوهشی هوش مصنوعی"در هاروارد ارائه کرده، منتشر کرده است. در این کتاب راجع به مباحثی همچون استفاده درست و موثر از python و pytorch و lightning و HF و streamlite و vscode و git و ... توضیحات خوبی داده شده است. اما این کل ماجرا نیست، بلکه کتاب در ادامه صحبت کرده که چگونه می‌توان به صورت سیستماتیک مقالات را خواند، ایده‌های جدید زد، یک مقاله را ساختاربندی و منتشر کرد و اسلایدهای باکیفیتی ساخت. اما باز هم این تمام ماجرا نیست و راجپورکار برایمان راجع به نحوه مدیریت زمان و انرژی‌مان و همچنین نحوه مدیریت تعاملاتمان با استاد راهنما و یا سایر اعضای تیم نیز توضیح داده است. این منبع عالی را از دست نباید داد.

لینک کتاب:
https://docs.google.com/document/d/1uvAbEhbgS_M-uDMTzmOWRlYxqCkogKRXdbKYYT98ooc


#link
#coach
#course

@nlp_stuff
Media is too big
VIEW IN TELEGRAM
بازار کار و مسيرهای شغلی هوش‌مصنوعی

🆔 @Ai_Tv
Transformer models: an introduction and catalog

کاتالوگی ساده و کامل از مقایسه و طبقه‌بندی محبوب‌ترین مدل‌های ترنسفورمر

جدول: https://docs.google.com/spreadsheets/d/1ltyrAB6BL29cOv2fSpNQnnq2vbX8UrHl47d7FkIf6t4/

@ml_nlp_cv
​​Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models

ChatGPT is a language interface with distinctive conversational competency and reasoning capabilities across many domains. However, it is currently unable to process or generate images from the visual world. To address this limitation, the authors propose a system called Visual ChatGPT that incorporates different Visual Foundation Models to enable users to interact with ChatGPT using both language and images. The system is capable of handling complex visual questions or instructions that require multiple AI models and steps. Additionally, it allows for feedback and corrections.

Rather than creating a new multimodal ChatGPT from scratch, the authors propose building Visual ChatGPT by incorporating various (22) Visual Foundation Models (VFMs) directly into ChatGPT. To facilitate the integration of these VFMs, the authors introduce a Prompt Manager that supports several functions. These include specifying the input-output formats of each VFM, converting visual information to language format, and managing the histories, priorities, and conflicts of different VFMs. With the Prompt Manager's help, ChatGPT can use these VFMs iteratively and receive their feedback until it satisfies the users' requirements or reaches the end condition.

Paper: https://arxiv.org/abs/2303.04671

Code link: https://github.com/microsoft/visual-chatgpt

A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-palme

@ml_nlp_cv
کورس جدید دانشگاه استنفورد:
Stanford CS330: Deep Multi-Task and Meta Learning.
برنامه و محتوای کلاس در این لینک:

https://cs330.stanford.edu/

مشاهده ویدیوی جلسات برگزار شده

@ml_nlp_cv
​​Scaling Transformer to 1M tokens and beyond with RMT

Imagine extending the context length of BERT, one of the most effective Transformer-based models in natural language processing, to an unprecedented two million tokens! This technical report unveils the Recurrent Memory Transformer (RMT) architecture, which achieves this incredible feat while maintaining high memory retrieval accuracy.

The RMT approach enables storage and processing of both local and global information, allowing information flow between segments of the input sequence through recurrence. The experiments showcase the effectiveness of this groundbreaking method, with immense potential to enhance long-term dependency handling in natural language understanding and generation tasks, as well as enable large-scale context processing for memory-intensive applications.

Paper link: https://arxiv.org/abs/2304.11062
Code link: https://github.com/booydar/t5-experiments/tree/scaling-report

A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-rmt-1m

@ml_nlp_cv
A Brief History of LLaMA Models

The #LLaMA base model was released in February 2023 , and since then, we've seen a flurry of new fine-tuned LLaMA models hit the scene. It's been an exciting time for natural language processing, so let's take a quick trip down memory lane and review some of the key developments.

✔️ The LLaMA base model
✔️ The Alpaca model
✔️ The Vicuna model
✔️ The Koala model
✔️ The GPT4-x-Alpaca model
✔️ The WizardLM model
✔️ The OpenAssistant model
✔️ Software to run LLaMA models locally

https://agi-sphere.com/llama-models/

@ml_nlp_cv
This media is not supported in your browser
VIEW IN TELEGRAM
⭕️ تشخیص همزمان احساسات در ویدیو با استفاده از هوش مصنوعی (AI)

🔰 ویل اسمیت در این ویدیو بسیار سرد به نظر می رسد!
آیا می توانیم فریب حالات چهره افراد را بخوریم؟

در انجمن علوم داده با ما همراه باشید 🌱
|
@DataScience_Association |
ابزارهای تولید محتوای متنی با هوش مصنوعی
·       
Openai.com/api
·        Rytr.me
·        Wiritersonic.com
·        Anyword.com
·        Simplified.com
·        Deepstory.ai
·        Bing
ابزار های تولید محتوای صوتی با هوش مصنوعی
·       
Avia.ai
·        Ampermusic.com
·        Infinitealbum.io
·        Voicemaker.in
·        Virtualspeech.com
ابزارهای تولید محتوای ویدئویی با هوش مصنوعی
·       
Veed.io
·        Lumens.com
·        Wave.video
·        Runway
ابزارهای تولید موزیک بک‌گراند با هوش مصنوعی
·       
Aiva.ai
·        Soundraw.io
تبدیل متن به عکس و ایجاد تصاویر با هوش مصنوعی
·        Midjourney
·        AI Picasso
·        Craiyon
·        Bing Image creator
·        Dall.E

@ml_nlp_cv
Forwarded from NLP stuff
مخزنی از مقالات کلیدی هوش/یادگیری‌ماشین به ترتیب سال

آقای آمان چادها، اومدن و در این لینک لیستی کامل و جامع از مقالات کلیدی در حوزه‌های بینایی کامپیوتر و پردازش متن و صوت و سیستم‌های توصیه‌گر و یادگیری مولتی مودال و ... رو به ترتیب سال گذاشتند. اما تمام هنر آمان آقا به این جا خلاصه نمیشه و ایشون چیزهای دیگه رو هم تو سایتشون قرار دادند که شامل یک‌سری لکچرنوت‌های نیکو از کورس‌های معروف، لکچرنوت‌های راجع به کتابخانه‌های مربوط به کارهای هوش مصنوعی،‌ لیستی از بلاگ‌ها و کورس‌ها و یوتیوب‌های دیدنی و خلاصه هر چیزی که مربوط به هوش می‌شه و باید خوند و دید، رو قرار دادند. قشنگ استفاده کنید و حظش رو ببرید.

لینک لیست مقالات:
aman.ai/papers
لینک سایت:
aman.ai

پی‌نوشت: با دنبال‌کردن #coach می‌تونید منابع آموزشی معرفی‌شده رو بیابید.

#coach
#link

@nlp_stuff
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 اولین مجری هوش مصنوعی در شبکه سحر

🔵 این مجری موفقیت‌های ایران در زمینه‌ی پویانمایی و نرم‌افزار را معرفی می‌کند.

@ml_nlp_cv
جایزه Test of time کنفرانس ICML-2023 هم به این مقاله تعلق گرفته:

https://icml.cc/Conferences/2023/Test-of-Time

جایزه‌ای که به مهم‌ترین کاری که ۱۰ سال پیش در کنفرانس ارائه شده تعلق می‌گیره. پژوهشی که ارزشمندی‌ دستاوردهاش در این سال‌ها کاملا مشخص شده باشه

@ml_nlp_cv
📚نقد و بررسی کتاب: «Hands-On Large Language Models» نوشته جی آلمار و مارتن گروتندورست

🖌در این کتاب به پیشرفت‌های چشمگیر در سیستم‌های هوش مصنوعی زبانی می‌پردازد که توسط یادگیری عمیق هدایت می‌شوند.

🖌در این کتاب می آموزید که چگونه از pre-trained LLMs برای کارهایی مانند کپی رایت، خلاصه سازی و جستجوی معنایی بیش از traditional keyword matching استفاده کنید.همچنین میتوانید تکنیک‌هایی را برای ایجاد advanced LLM pipelines که موضوعات را در اسناد متنی خوشه‌بندی وجستجو  می‌کند یاد بگیرید.

🖌 در ساخت semantic search engines با استفاده از روش‌هایی مانند dense retrieval و rerankers یاد میگیرید که بتوانید جستجوی دقیق‌تر و آگاه‌تر از متن داشته باشید.

🖌در این کتاب زیربنای مدل‌های ترانسفورماتور مانند BERT و GPT را که باعث پیشرفت هوش مصنوعی زبانی می‌شوند، را یاد میگیرید.

🖌این کتاب برای توسعه دهندگان پایتون که به دنبال یادگیری LLM و گنجاندن آنها در پروژه های خود هستند، به شدت توصیه می شود.


شتابدهنده هوش مصنوعی اسمارتک

📢 @smartech_ir
☎️ +989936511388
🌐 www.iransmartech.com

•┈┈••••✾•🌿🌺🌿•✾•••┈┈•
Rethinking Medical Report Generation: Disease Revealing Enhancement with Knowledge Graph

Github: https://github.com/wangyixinxin/mrg-kg

Paper: https://arxiv.org/pdf/2307.12526v1.pdf

Dataset: https://paperswithcode.com/dataset/mimic-cxr

@ml_nlp_cv
Forwarded from Deep Time
functime: Time-series machine learning and embeddings at scale

کتابخانه نسبتا جدید و تحسین شده برای Time Series و ML هست که به نظر موارد جالبی نسبت به Prophet، Nixtla و Darts داره. حتما بررسی کنید. از polars استفاده کردن و البته اگر نمیکردن عجیب بود. ما هم در کار خودمون برای feature eng و پردازش داده سری زمانی از polars استفاده میکنیم که شدیدا سرعت بالاتری نسبت به pandas داره. پیشنهاد میکنم حتما کار با polars رو یاد بگیرید.

Github

@deeptimeai
🟠 معرفی مقاله
📝 The economic potential of generative AI: The next productivity frontier (2023)

🔸 می دانیم که Generative Al یک موضوع داغ است و صدها برنامه کاربردی و مدل‌های جدید در 6 ماه گذشته در صحنه ظاهر شده‌اند، با این حال، بسیاری از مردم هنوز در مورد کاربرد Al مولد به خصوص وقتی صحبت از صنعت و مشاغل می‌شود،  نمی‌دانند. اخیرا  McKinsey & Company یک مقاله عالی در مورد کاربردهای اقتصادی GenerativeAl منتشر کرده است. تحقیقات آنها تخمین می‌زند که Al مولد می‌تواند سالانه معادل 2.6 تریلیون دلار تا 4.4 تریلیون دلار ارزش اقتصادی ایجاد کند.

🔗 لینک مقاله:

https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-economic-potential-of-generative-ai-the-next-productivity-frontier#introduction

@ml_nlp_cv
This media is not supported in your browser
VIEW IN TELEGRAM
ویرایش‌گر عکس AI خیلی‌ام تمیز و راحت
https://photoeditor.ai

شما فقط شیء مورد نظر رو انتخاب کنید. #هوش_مصنوعی خودش بقیه‌اش رو ردیف می‌کنه. کارهایی مثل روتوش چهره، حذف کامل اجسام و غیره.
@ml_nlp_cv