اجرای LLM ها به روی دسکتاپ

پلتفرم lmstudio.ai یه ابزار رایگانه که اجازه میده تا مدل‌های بزرگ زبانی (#LLM) رو روی دسکتاپتون  اجرا کنید. آپشنایی که این پلتفرم ارائه میده خیلی کاربردیه:
🤖 - اجرای آفلاین LLM ها رو کامپیوتر لوکال
👾 - اتصال به سرور #openai و استفاده کردن از مدل هاش
📂 - اتصال به مدل های #HuggingFace 🤗
🔭 - اطلاع از مدل های LLM جدید

سخت افزار مورد نیازشم به این صورته:
16GB+ of RAM is recommended.
For PCs, 6GB+ of VRAM is recommended
NVIDIA/AMD GPUs


🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
👍6🔥1
نظر #Andrew_NG در مورد آینده LLM ها:

معتقدم امسال این 4 زمینه در دارتباط با #LLM پیشرفت قابل‌توجهی خواهند داشت:
#Reflection,
Tool use, Planning , Multi-agent collaboration
در روش Reflection به جای اینکه یک LLM خروجی نهایی خود را مستقیماً تولید کند، چندین بار از LLM درخواست می کند و به آن فرصت می دهد تا گام به گام خروجی با کیفیت بالاتر ایجاد کند. دیده ام که این روش منجر به افزایش کارایی مدل میشود.

گاهی اوقات این روش باعث می شود که LLM مشکلات را تشخیص دهد و پیشنهادهای سازنده ارائه دهد. این فرآیند خود انعکاس به LLM اجازه می دهد تا شکاف ها را شناسایی کند و خروجی خود را در کارهای مختلف از جمله تولید کد، نوشتن متن و پاسخ به سؤالات بهبود بخشد.
لینک

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
فاین تیون کردن، هزینه ها، منابع و زمان مورد نیاز

برخلاف باور عمومی، فاین تیونینگ (#fine_tuning) به منابع محاسباتی عظیمی نیاز نداره. به شرطی که عوامل مورد نیاز رو خوب بشناسیم مثل نوع مدل، دامنه کاربرد، اندازه داده و قدرت مدل پایه. با این حال، دو عامل اصلی در فاین تیون #LLM ها مدل و داده هستن

این نمودار برآوردهای هزینه، محاسبات و زمان مورد نیاز را بسته به مدل و اندازه داده در سطح بالا برای مدل های #Llama خلاصه کرده

چیزی که در تصویر بالا مشخصه، داده کم/زیاد و مدل کوچک هست. مدل TinyLlama حدود 1.1 میلیارد پارامتر داره، اما میتونیم این مدل رو تنها با یک GPU فاین‌تیون کنیم. به عنوان نمونه، با داده کم (حداکثر 500 هزار توکن)، تنها با 100 دلار میشه این مدل رو فاین‌تیون کرد. و به نظرم این مدل با این هزینه کار خیلی از بیزینس ها رو راه میندازه


🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
تنظیم هایپرپارمترها با افزایش Batch Size

شاید شنیده باشید که در هنگام آموزش شبکه‌های عصبی، وقتی اندازه‌ی #batch ها را x برابر می‌کنید، به‌تر‌ست نرخ آموزش را نیز x برابر (اگر الگوریتم آموزش #SGD است) و یا x√ برابر (اگر الگوریتم آموزش #Adam است) کنید.

مثلا در #LLM ها که بیش‌تر از الگوریتم آموزشی Adam استفاده می‌شود، اندازه‌ی batch ها را تا حدی که #GPU شما خطای Out_Of_Memory نمی‌دهد (به صورت توانی از ۲) افزایش دهید. هر بار که اندازه batch را ۲ برابر می‌کنید، نرخ آموزش را ۱/۴ برابر کنید.

این مقاله‌ی جالب از دانشگاه پرینستون، به کمک معادلات دیفرانسیل تصادفی، الگوی کارایی برای تغییر هایپرپارامترها (مثل learning rate) با افزایش #batch_size ارائه می‌دهد.
لینک

معمولا در عمل، نرخ آموزش هرچقدر هم که باشد، در طی #epoch ها، ابتدا از 0.1 نرخ آموزش شروع کرده و در ده درصد ابتدایی مسیر آموزش، این نرخ را به‌صورت خطی زیاد کرده تا وقتی ده درصد epoch ها طی شد، به نرخ اصلی رسیده باشیم. از آن‌جا به بعد (۹۰ درصد باقی epoch ها) نرخ آموزش به‌صورت کسینوسی کم می‌شود.
The LLM Scientist Roadmap

#Roadmap #LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
LLM Cheatsheet.pdf
3.5 MB
LLM cheatsheet

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

#LLM

@MrArtificialintelligence
The LLM Scientist Roadmap

Ready to become an LLM Scientist? Follow this roadmap to unlock your potential and master the art of Large Language Models.

#LLM #DataScience #Roadmap

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
🗂 A collection of the best free courses

📝 For data science, data engineering, MLOps, ML and GenAI

💠 data science

1️⃣ Python for Everybody Course : A great course for beginners to learn Python.

2️⃣ Data analysis with Python course : This course introduces you to data analysis techniques with Python.

3️⃣ Databases & SQL course : You will learn how to manage databases with SQL.

4️⃣ Intro to Inferential Statistics course : This course teaches you how to make predictions by learning statistics.

5️⃣ ML Zoomcamp course : a practical and practical course for learning machine learning.


🔺 Data engineering

1️⃣ Data Engineering Course : Learn the basics of data engineering.

2️⃣ Data Engineer Learning Path course : a comprehensive road map to become a data engineer.

3️⃣ Database Engineer course : get a specialized degree in database engineering.

4️⃣ Big Data Specialization Course : Get to know big data technologies and their applications.

5️⃣ The Data Eng Zoomcamp course : a practical course to learn data engineering.


🔺 machine learning

1️⃣ Intro to ML course : an introductory and self-paced course to start machine learning.

2️⃣ ML for Everybody course : A simple approach to learning machine learning concepts.

3️⃣ ML in Python course : focus on machine learning with Python and Scikit-Learn.

4️⃣ ML Crash Course : A quick but comprehensive introduction to machine learning.

5️⃣ CS229 : ML : An advanced course for those who want to deepen their knowledge.


🔻
Machine Learning Operations (MLOps)

1️⃣ Python Essentials for MLOps course : an essential course for MLOps enthusiasts..

2️⃣ MLOps for Beginners Course : A great starting point for MLOps newbies.

3️⃣ ML Engineering Course : A set of courses for deep entry into the world of MLOps.

4️⃣ MLOps Specialization Course : Focus on operational aspects of machine learning.

5️⃣ Made With ML course : a special course that combines machine learning with practical applications.


🔹 Generative artificial intelligence

1️⃣ Generative AI for Beginners course : building generative artificial intelligence apps.

2️⃣ Generative AI Fundamentals course : getting to know the basic principles of generative artificial intelligence.

3️⃣ Intro to Gen AI course : from learning large language models to understanding the principles of responsible artificial intelligence.

4️⃣ Generative AI with LLMs course : Learn business applications of artificial intelligence with AWS experts in a practical way.

5️⃣ Generative AI for Everyone course : This course tells you what generative artificial intelligence is, how it works, and what uses and limitations it has.


☕️ #MachineLearning #Python #COURSES #GenerativeAI #LLM

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
explaining the concept of RAG (Retrieval-Augmented Generation) in a simple and easy-to-understand way.

Is it useful to you

📂 Tags: #ML #Ai #RAG #LLM

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Mathematics of an Artificial Neural Network

Is it useful to you

📂 Tags: #ML #Ai #RAG #LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
7👍1👎1
This media is not supported in your browser
VIEW IN TELEGRAM
✍️  تفکر انتقادی در LLM

  #هوش_مصنوعی
#LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
کارگاه ضروری آنلاین «ابزارهای هوش مصنوعی در تحقیق و پژوهش» دوره ششم

ویژه دانشجویان تحصیلات تکمیلی، اساتید دانشگاه و محققین


📚 سرفصل‌های کارگاه:
۱. مقدمه‌ای بر هوش مصنوعی در پژوهش
۲.ابزارهای تخصصی در نوشتن پروپوزال
۳.ابزارهای پیشرفته ترجمه علمی

پلتفرم اسکای روم

https://meshkat.iau.ir/courses/12639

تخفیف 60 درصدی

کد تخفیف : N601

09904987510

  #هوش_مصنوعی
#LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
2👍1
OmniGen: Unified Image Generation

Paper: https://arxiv.org/pdf/2409.11340v1.pdf

Code: https://github.com/vectorspacelab/omnigen

Datasets:  DreamBooth - MagicBrush

  #هوش_مصنوعی
#LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
This media is not supported in your browser
VIEW IN TELEGRAM
🐔 SeedEdit: T2I foundational model 🐔

👉ByteDance unveils a novel T2I foundational model capable of delivering stable, high-aesthetic image edits which maintain image quality through unlimited rounds of editing instructions. No code announced but a Demo is online💙

👉Review https://t.ly/hPlnN
👉Paper https://arxiv.org/pdf/2411.06686
👉Project team.doubao.com/en/special/seededit
🤗Demo https://huggingface.co/spaces/ByteDance/SeedEdit-APP
  #هوش_مصنوعی
#LLM
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
This media is not supported in your browser
VIEW IN TELEGRAM
Safe and Reliable AI via Guardrails

Enroll Free: https://learn.deeplearning.ai/courses/safe-and-reliable-ai-via-guardrails

#DataScience #Python #ML #AI #LLM #BIGDATA #Courses

🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ مدل های زبانی بزرگ چطور آموزش می بینند

مدل‌های زبان بزرگ (LLM) با استفاده از مجموعه داده‌های بزرگی از نمونه‌های متنی از کتاب‌ها، مقالات، وب‌سایت‌ها و سایر منابع آموزش داده می‌شوند.

در طول آموزش، مدل این مثال ها را پردازش می کند و کلمه یا دنباله کلمات بعدی را بر اساس ورودی پیش بینی می کند.

هنگامی که پیش بینی آن از پاسخ صحیح منحرف می شود، یک خطا محاسبه می شود و از پس انتشار برای تنظیم پارامترهای داخلی مدل (وزن) استفاده می شود.

این شامل انتشار خطا به عقب در شبکه و به روز رسانی وزن ها با استفاده از الگوریتم های بهینه سازی مانند نزول گرادیان است که به تدریج توانایی مدل برای تولید متن را بهبود می بخشد.
#مدل_زبانی_بزرگ #LLM #chatgpt
#هوش_مصنوعی 
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
👍2
📚 Python For Large Language Models (2025)

💬 Tags: #LLM
#علم_داده #هوش_مصنوعی 
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
This media is not supported in your browser
VIEW IN TELEGRAM
✍️ هوش انسان در مقابل AGI

#علم_داده #هوش_مصنوعی
  #AGI #LLM
🌑 آقای هوش مصنوعی

@MrArtificialintelligence
👍4👎31