Python3
200 subscribers
100 photos
6 videos
26 files
518 links
🎓 آموزش و پروژه‌های Python
آموزش‌های کاربردی و پروژه‌های عملی Python برای همه سطوح. 🚀
Download Telegram
🎓 آموزش معماری Mamba

📍 قسمت ۲: Mamba چطوری کار می‌کنه؟ (بدون پیچوندن ذهن!)

سلام مجدد رفقای مشتاق یادگیری! 🌱
تو قسمت قبل فهمیدیم چرا باید Mamba رو جدی گرفت، مخصوصاً اگه سیستم‌مون معمولیه و می‌خوایم مدل زبان بسازیم یا اجرا کنیم.

اما حالا وقتشه بریم سراغ اصل ماجرا:
Mamba چجوری کار می‌کنه؟



🧠 اول یه مرور سریع:

ترنسفورمر چی کار می‌کنه؟
به هر کلمه نگاه می‌کنه و اونو با *همه‌ی کلمات قبل و بعدش* مقایسه می‌کنه
(یعنی self-attention)

این کار باعث می‌شه حافظه و زمان مصرفی مدل، به‌شدت بالا بره مخصوصاً برای متن‌های طولانی.



اما Mamba چی کار می‌کنه؟

Mamba از یه مفهوم به اسم State Space Model استفاده می‌کنه.
ولی نگران نباش... نمی‌خوایم بریم تو ریاضی سنگین!

بیایید ساده تصور کنیم:

فرض کن یه نفر داره قصه گوش می‌ده.
اون نمی‌خواد کل داستانو همزمان حفظ کنه.
فقط همین براش مهمه:

> «تا این لحظه چی شنیدم، و الان دارم چی می‌شنوم؟»

🧩 این دقیقاً کاریه که Mamba انجام می‌ده.



🎯 یه مثال ساده:

فرض کن یه مدل زبانی می‌خوای بسازی برای جمله زیر:

> «من امروز خیلی خوشحال بودم چون امتحانمو خوب دادم.»

ترنسفورمر می‌ره کلمه «خوشحال» رو با «من»، «امروز»، «بودم»، «چون»، «امتحان»، «خوب»، «دادم»... همه رو با هم مقایسه می‌کنه 😵

اما Mamba فقط نگاه می‌کنه به اینکه:

* قبلش چی بوده؟
* الان چی اومده؟
* وضعیت حافظه‌اش در حال حاضر چیه؟

مثل یه ذهن خلاصه‌ساز!
اون فقط یه حالت (state) تو حافظه‌اش نگه می‌داره، و با اومدن هر کلمه جدید، این حالت به‌روزرسانی می‌شه.



📦 مغز Mamba چیه؟

تو معماری داخلی، Mamba چند تا چیز داره:

1. Input Projection – تبدیل توکن ورودی به بردار عددی
2. State Update – به‌روزرسانی وضعیت حافظه (state)
3. Gating – مشخص می‌کنه چقدر اطلاعات جدید وارد بشه، چقدر از قبلی‌ها حفظ بشه
4. Output – تولید خروجی نهایی برای هر توکن

ولی همه‌ی اینا رو با یک الگوریتم خطی انجام می‌ده!
و این یعنی:
سرعت بالا
حافظه کم
پردازش ترتیبی (مثل RNN ولی هوشمندتر)



🧪 تشبیه نهایی:

فکر کن داری دفتر خاطرات می‌نویسی
هر روز یه جمله می‌نویسی، ولی فقط آخرین جمله رو مرور می‌کنی برای نوشتن بعدی

💡 این همون چیزیه که Mamba داره انجام می‌ده
نه به جدول مقایسه نیاز داره
نه حافظه رو با اطلاعات همه‌ی روزها پر می‌کنه



📌 چرا این مهمه؟

چون باعث می‌شه مدل حتی اگه روی یه CPU ساده اجرا بشه، بتونه متن‌های بلند رو بدون هنگ کردن پردازش کنه.

👨‍💻 واسه همین Mamba تبدیل شده به یه گزینه جدی برای ساخت مدل‌های زبانی آفلاین، سبک و پرسرعت.



🛠 تو قسمت بعد می‌ریم سراغ یه مثال عملی و واقعی از Mamba:
چطور یه جمله ساده رو با استفاده از ساختار Mamba تحلیل می‌کنه؟

حاضری بریم سراغ مغز واقعی Mamba؟ 🤖
2
Forwarded from گوربه
🎓 آموزش معماری Mamba

📍 قسمت ۳: یک مثال واقعی – Mamba چطور یه جمله رو می‌فهمه؟

سلام به هوش‌مصنوعی‌بازهای آینده! 🧠
تو قسمت قبل فهمیدیم Mamba برخلاف ترنسفورمر، متن رو به شکل ترتیبی و کم‌هزینه پردازش می‌کنه.

حالا بیایید با یه مثال واقعی ببینیم دقیقاً چه اتفاقی داخل Mamba می‌افته وقتی یه جمله ساده واردش می‌کنیم.



📝 جمله‌ای که می‌خوایم بررسی کنیم:

> «علی امروز فوتبال بازی کرد.»

می‌خوایم ببینیم مدل Mamba چطور این جمله رو مرحله‌به‌مرحله پردازش می‌کنه.



🔄 مرحله ۱: تبدیل کلمات به بردار

هر کلمه اول تبدیل می‌شه به یه بردار عددی (مثل ترنسفورمرها)

مثلاً:

* «علی» → \[0.3, 0.1, 0.9, ...]
* «امروز» → \[0.7, 0.2, 0.4, ...]
* و همین‌طور بقیه

🔹 این کار با Embedding Layer انجام می‌شه. یعنی متن رو به زبان ریاضی تبدیل می‌کنیم.



🔄 مرحله ۲: به‌روزرسانی حافظه (State Update)

حالا Mamba شروع می‌کنه هر کلمه رو به‌ترتیب بررسی کردن:

1. اول «علی» وارد می‌شه → مدل یه "وضعیت اولیه" (state) براش می‌سازه
2. بعد «امروز» میاد → با وضعیت قبلی ترکیب می‌شه → وضعیت جدید ساخته می‌شه
3. بعد «فوتبال» میاد → دوباره وضعیت قبلی به‌روزرسانی می‌شه
4. همین‌طور ادامه می‌ده تا به «کرد» برسه

🔁 تو هر مرحله فقط یه وضعیت کوچیک (یه بردار چندعددی) به‌روزرسانی می‌شه، نه اینکه کل جمله بازنگری بشه!



🔄 مرحله ۳: گیت‌ها (Gating)

Mamba از یه چیزی شبیه دریچه (gate) استفاده می‌کنه که تصمیم می‌گیره:

* چه مقدار از اطلاعات جدید وارد حافظه بشه
* چه مقدار از اطلاعات قبلی حفظ بشه
* و چی باید از بین بره

این باعث می‌شه فقط چیزای مهم باقی بمونن. مثل حافظه‌ی فعال مغز ما که چیزای بی‌ربط رو فراموش می‌کنه!



🔄 مرحله ۴: تولید خروجی

وقتی همه‌ی کلمات خونده شدن، مدل می‌تونه برای هر کلمه یه خروجی بده.
مثلاً:

* تصمیم بگیره جمله درباره کیه (علی)
* چه کاری انجام داده (بازی کرده)
* کِی (امروز)

و این خروجی می‌تونه تو کارهای مختلف استفاده بشه:

* پیش‌بینی کلمه بعدی
* خلاصه‌سازی
* ترجمه
* یا تولید پاسخ تو چت‌بات



🧠 تفاوت کلیدی با ترنسفورمر:

ترنسفورمر به کل جمله همزمان نگاه می‌کنه.
Mamba ولی یه حافظه‌ی زنده داره که دائم آپدیت می‌شه.

🌊 شبیه یه جریان هست، نه یه عکس از کل جمله!
و این یعنی سرعت و مصرف کمتر، بدون افت عملکرد.



📌 نتیجه‌گیری پارت ۳:

* هر کلمه به‌ترتیب وارد مدل می‌شه
* یه وضعیت کوچیک (state) با هر ورودی آپدیت می‌شه
* مدل فقط اطلاعات لازم رو حفظ می‌کنه
* در نهایت خروجی دقیق و با معنا تولید می‌کنه
* بدون نیاز به attention یا محاسبات سنگین!



🔜 در قسمت بعد (پارت ۴):
می‌ریم سراغ ساختار داخلی Mamba به زبان خیلی ساده
تا بفهمیم دقیقاً این «state update» و «gate» چطور توی کد کار می‌کنن!
3
سلام خدمت تمامی عزیزان این کانال❤️
من AmirRM هستم و میخوام بزرگترین و فعال ترین کانال آپارات برنامه نویسی پایتون رو بهتون معرفی کنم🤓❤️
این کانال هر روز فعاله و برای خودم هست🤑
حتما حتما حتما فالوش کنید و ویدیو هاشو ببینید و اگر خوشتون اومد لایکشون کنید✌️
لینک کانال:
https://www.aparat.com/Amir_1234_ka

لینک گروه برنامه نویسان پایتون:
https://t.iss.one/programming_languages_390

لینک کانال برنامه نویسی پایتون:
https://t.iss.one/programming_languages390
آموزش نصب کدوم رو بزاریم؟؟؟ همشون به همراه کرک هست😁
Anonymous Poll
30%
IntelliJ : Java, Kotlin, Dart
24%
PHPStorm : PHP, Js, HTML
51%
Pycharm : Python, Typescript, Django
39%
VS Code insider
محیط IntelliJ برای جاوا و کاتلین و اندروید نویسی:
https://www.aparat.com/v/nnv03j7
محیط PHPStorm برای پی اچ پی و وردپرس:
https://www.aparat.com/v/qgkb68f
محیط Pycharm برای پایتون و جنگو:
https://www.aparat.com/v/fiqn76j
محیط VS Code Insider برای همه زبان ها:
https://www.aparat.com/v/ymqwhdz
بالا بردن کیفیت دوربین شیائومی | ترفند جدید برای کیفیت عکس و فیلم در شیائومی:

https://aparat.com/v/emtl6z6

کانال آپارات رو فالو کن تا ویدیو های بعدی رو از دست ندی😎:
https://www.aparat.com/Amir_1234_ka
آموزش کامل کار با گیت هاب دسکتاپ:
https://aparat.com/v/ijt89ds

کانال رو فالو کنید ممنون🌸:
https://www.aparat.com/Amir_1234_ka
سلام دوستان عزیز🔥
من امیر هستم و حدود سه ساله برنامه نویسی کار میکنم.
تجربه همه زبان های برنامه نویسی رو دارم.
طراح سایتم.
جنگو و پایتون و فلسک و اینا کار میکنم.
فول استکم و هم فرانت کار میکنم و هم بک اند.
من اومدم داخل آپارات یک چنل زدم برای برنامه نویسی .
هرکس مایل بود می‌تونه به چنلم بپیونده و کلی آموزش خفن ببینه📚🙏
ممنون میشم حتما فالوم کنید و لایک و کامنت یادتون نره❤️
https://www.aparat.com/Amir_1234_ka

و همچنین یک گروه و یک کانال هم توی تلگرام داریم برای لینک ها و آموزش ها و سوال و پرسش ها:

https://t.iss.one/programming_languages_390

https://t.iss.one/programming_languages390

ممنون از کسانی که من رو حمایت میکنند🙏❤️
6 تا از بهترین سایت های رزومه ساز آنلاین:
https://aparat.com/v/uti681e

کانال ما فراموش نشه فالو داشته باشید❤️:
https://aparat.com/Amir_1234_ka
آموزش صفر تا صد ساخت پروژه React:
https://aparat.com/v/vbg76bk
آموزش مقدماتی جنگو پارت 1 | معرفی و نکاتی درباره جنگو و اینکه چرا جنگو؟
https://aparat.com/v/luw17iu

کانال مارو فالو داشته باشید تا دوره جنگو رو از دست ندید:
https://aparat.com/Amir_1234_ka
آموزش مقدماتی جنگو پارت 2 | ساخت اولین پروژه جنگو به نام mysite:
https://aparat.com/v/bis09r5

کانال آپارات ما و آموزش های دیگه:
https://www.aparat.com/Amir_1234_ka
آموزش مقدماتی جنگو پارت 3 | ساخت اپ در جنگو:
https://aparat.com/v/lzp17pv

کانال مارو فالو داشته باشید:
https://www.aparat.com/Amir_1234_ka