Forwarded from ASafaeirad
Forwarded from Reza Jafari
معماری Mixture of Experts به زبان ساده
معماری Mixture of Experts (MoE) رو اگه بخوایم ساده و خودمونی توضیح بدیم، شبیه اینه که یه تیم از متخصصهای مختلف داریم و برای هر کاری فقط همون متخصصی رو صدا میزنیم که بلده، نه اینکه کل تیم رو همزمان درگیر کنیم. توی مدلهای زبانی بزرگ هم همین اتفاق میافته؛ یعنی بهجای اینکه همه پارامترهای مدل فعال بشن، فقط چند کارشناس انتخابی وارد عمل میشن و نتیجه رو میدن. این کار رو یه بخش به اسم router یا gate انجام میده که تصمیم میگیره کدوم کارشناس برای اون ورودی مناسبتره.
این ایده هم خیلی تازه نیست؛ اولین بار اوایل دههی نود مطرح شد، ولی الان با رشد مدلهای عظیم دوباره جون گرفته. مدلهایی مثل Switch Transformers یا Mixtral نمونههای معروفی هستن که از MoE استفاده میکنن. جذابیت این معماری اینجاست که بدون اینکه هزینه پردازشی خیلی بالایی تحمیل کنه، ظرفیت مدل رو زیاد میکنه. مثلاً Mixtral 8×7B انگار ۴ برابر پارامتر داره ولی سرعت پیشبینیش تقریبا اندازهی یه مدل ۱۲B عادیه، چون در هر لحظه فقط دو کارشناس فعال میشن.
مزیت بزرگ MoE اینه که هم آموزش و هم استفاده از مدل سریعتر میشه، چون همهی بخشها با هم کار نمیکنن. در عین حال، ظرفیت بیشتری برای یادگیری الگوهای پیچیده در اختیار داریم. اما مثل هر ایدهی دیگه، چالشهایی هم داره. اول اینکه همهی کارشناسا باید داخل حافظهی کارت گرافیک بار بشن، حتی اگر توی اون لحظه فعال نشن، پس مصرف VRAM بالاست. دوم اینکه باید مطمئن بشیم بار کاری بین کارشناسا منصفانه تقسیم میشه، چون ممکنه بعضیا همیشه درگیر باشن و بقیه بیکار بمونن. این مشکل رو معمولا با تکنیکهایی مثل load balancing یا جریمههای خاص حل میکنن. سومین سختی هم فاینتیون یا آموزش دوبارهی این مدلهاست که نسبت به مدلهای سادهتر پیچیدگی بیشتری داره.
در نهایت، اگه بخوایم جمعبندی کنیم، MoE مثل یه سیستم مدیریتی هوشمنده که همیشه بهترین فرد رو برای انجام کار انتخاب میکنه. همین ویژگی باعث شده برای مدلهای زبانی خیلی بزرگ کاربردی و کارآمد باشه. ولی همونطور که یک تیم بزرگ نیاز به مدیریت درست داره، این معماری هم نیاز به روشهای دقیق برای تعادل و آموزش پایدار داره. پژوهشهای اخیر نشون داده که با تنظیم درست، میشه از MoE بهترین بهره رو برد و آیندهی مدلهای بزرگ هوش مصنوعی احتمالا بیشتر به این سمت خواهد رفت.
🔤 🔤 🔤 🔤 🔤 🔤 🔤
🥇 اهورا اولین اپراتور هوش مصنوعی راهبردی ایران در حوزه ارائه خدمات و سرویسهای زیرساخت هوش مصنوعی
🛍 کد تخفیف ۱۰ درصدی محصولات اهورا برای اعضای کانال
🌐 لینک وبسایت اهورا
@reza_jafari_ai
معماری Mixture of Experts (MoE) رو اگه بخوایم ساده و خودمونی توضیح بدیم، شبیه اینه که یه تیم از متخصصهای مختلف داریم و برای هر کاری فقط همون متخصصی رو صدا میزنیم که بلده، نه اینکه کل تیم رو همزمان درگیر کنیم. توی مدلهای زبانی بزرگ هم همین اتفاق میافته؛ یعنی بهجای اینکه همه پارامترهای مدل فعال بشن، فقط چند کارشناس انتخابی وارد عمل میشن و نتیجه رو میدن. این کار رو یه بخش به اسم router یا gate انجام میده که تصمیم میگیره کدوم کارشناس برای اون ورودی مناسبتره.
این ایده هم خیلی تازه نیست؛ اولین بار اوایل دههی نود مطرح شد، ولی الان با رشد مدلهای عظیم دوباره جون گرفته. مدلهایی مثل Switch Transformers یا Mixtral نمونههای معروفی هستن که از MoE استفاده میکنن. جذابیت این معماری اینجاست که بدون اینکه هزینه پردازشی خیلی بالایی تحمیل کنه، ظرفیت مدل رو زیاد میکنه. مثلاً Mixtral 8×7B انگار ۴ برابر پارامتر داره ولی سرعت پیشبینیش تقریبا اندازهی یه مدل ۱۲B عادیه، چون در هر لحظه فقط دو کارشناس فعال میشن.
مزیت بزرگ MoE اینه که هم آموزش و هم استفاده از مدل سریعتر میشه، چون همهی بخشها با هم کار نمیکنن. در عین حال، ظرفیت بیشتری برای یادگیری الگوهای پیچیده در اختیار داریم. اما مثل هر ایدهی دیگه، چالشهایی هم داره. اول اینکه همهی کارشناسا باید داخل حافظهی کارت گرافیک بار بشن، حتی اگر توی اون لحظه فعال نشن، پس مصرف VRAM بالاست. دوم اینکه باید مطمئن بشیم بار کاری بین کارشناسا منصفانه تقسیم میشه، چون ممکنه بعضیا همیشه درگیر باشن و بقیه بیکار بمونن. این مشکل رو معمولا با تکنیکهایی مثل load balancing یا جریمههای خاص حل میکنن. سومین سختی هم فاینتیون یا آموزش دوبارهی این مدلهاست که نسبت به مدلهای سادهتر پیچیدگی بیشتری داره.
در نهایت، اگه بخوایم جمعبندی کنیم، MoE مثل یه سیستم مدیریتی هوشمنده که همیشه بهترین فرد رو برای انجام کار انتخاب میکنه. همین ویژگی باعث شده برای مدلهای زبانی خیلی بزرگ کاربردی و کارآمد باشه. ولی همونطور که یک تیم بزرگ نیاز به مدیریت درست داره، این معماری هم نیاز به روشهای دقیق برای تعادل و آموزش پایدار داره. پژوهشهای اخیر نشون داده که با تنظیم درست، میشه از MoE بهترین بهره رو برد و آیندهی مدلهای بزرگ هوش مصنوعی احتمالا بیشتر به این سمت خواهد رفت.
AHURA5@reza_jafari_ai
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Future Pulse Persian
ارتباط IPv6 از سمت زیرساخت کشور دچار اختلال و قطعی شده است.
Forwarded from Gopher Academy
🔵 عنوان مقاله
a fantastic illustrated introduction to Big O notation
🟢 خلاصه مقاله:
** این مقاله معرفیای تصویری و روان از نمادگذاری Big O ارائه میدهد و با تکیه بر مثالها، تفاوت مرتبههایی مانند O(1)، O(log n)، O(n) و موارد رایج دیگر را توضیح میدهد. هدف آن نشاندادن مفهوم رشد با بزرگشدن ورودی و مقایسهٔ مقیاسپذیری الگوریتمهاست، بدون درگیرشدن با جزئیات پیادهسازی یا ثابتها. برای هر کسی که تا به حال معنی O(1) و O(log n) برایش سؤال بوده، این نوشته یک شروع عالی است.
🟣لینک مقاله:
https://golangweekly.com/link/173358/web
➖➖➖➖➖➖➖➖
👑 @gopher_academy
a fantastic illustrated introduction to Big O notation
🟢 خلاصه مقاله:
** این مقاله معرفیای تصویری و روان از نمادگذاری Big O ارائه میدهد و با تکیه بر مثالها، تفاوت مرتبههایی مانند O(1)، O(log n)، O(n) و موارد رایج دیگر را توضیح میدهد. هدف آن نشاندادن مفهوم رشد با بزرگشدن ورودی و مقایسهٔ مقیاسپذیری الگوریتمهاست، بدون درگیرشدن با جزئیات پیادهسازی یا ثابتها. برای هر کسی که تا به حال معنی O(1) و O(log n) برایش سؤال بوده، این نوشته یک شروع عالی است.
🟣لینک مقاله:
https://golangweekly.com/link/173358/web
➖➖➖➖➖➖➖➖
👑 @gopher_academy
Forwarded from کانال مهرداد لینوکس
🚀 نسخهی جدید Linux Mint 22.2 "Zara" منتشر شد!
🔒یک نسخه LTS پشتیبانی تا ۲۰۲۹
⚙️ هسته لینوکس 6.14 + Mesa 25.0.7
🆔 احراز هویت با اثر انگشت با اپ جدید Fingwit — ورود، sudo، صفحهی قفل و اپهای مدیریتی با لمس!
🎨 ظاهر مدرنتر:
– تم Mint-Y با تم خاکستری خنک و حالت تاریک نرمتر
– پشتیبانی کامل از تمها و رنگهای برجسته برای اپهای GTK4/libadwaita
🗒 Sticky Notes بهروز شده:
– گرد بودن گوشهها + سازگاری Wayland
– اپ اندروید StyncyNotes برای همگامسازی یادداشتها
📺 Hypnotix هوشمندتر:
– حالت Theater و Borderless برای پخش راحتتر
– عملکرد سریعتر، حجم ثابت صدا و جلوگیری از قفل شدن جلسه
🛠 ابزارهای بهتر: Xviewer، AIFF thumbnailer، WebApp توضیحپذیر، Rename حرفهای، Software Manager خوشآمدگو، و دکمهی reboot در Update Manager
⏭️ سادگی مهاجرت — بدون Snap، با قابلیت ارتقاء ساده از نسخهی 22.1
🔥لینک دانلود و جزئیات در :
لینک Hash ها
از سایت اصلی
با همین Hash میتوانید از soft98 از اینجا دانلود کنید
🔒یک نسخه LTS پشتیبانی تا ۲۰۲۹
⚙️ هسته لینوکس 6.14 + Mesa 25.0.7
🆔 احراز هویت با اثر انگشت با اپ جدید Fingwit — ورود، sudo، صفحهی قفل و اپهای مدیریتی با لمس!
🎨 ظاهر مدرنتر:
– تم Mint-Y با تم خاکستری خنک و حالت تاریک نرمتر
– پشتیبانی کامل از تمها و رنگهای برجسته برای اپهای GTK4/libadwaita
🗒 Sticky Notes بهروز شده:
– گرد بودن گوشهها + سازگاری Wayland
– اپ اندروید StyncyNotes برای همگامسازی یادداشتها
📺 Hypnotix هوشمندتر:
– حالت Theater و Borderless برای پخش راحتتر
– عملکرد سریعتر، حجم ثابت صدا و جلوگیری از قفل شدن جلسه
🛠 ابزارهای بهتر: Xviewer، AIFF thumbnailer، WebApp توضیحپذیر، Rename حرفهای، Software Manager خوشآمدگو، و دکمهی reboot در Update Manager
⏭️ سادگی مهاجرت — بدون Snap، با قابلیت ارتقاء ساده از نسخهی 22.1
🔥لینک دانلود و جزئیات در :
لینک Hash ها
از سایت اصلی
با همین Hash میتوانید از soft98 از اینجا دانلود کنید
Forwarded from Laravel News
Simplifying Form Validation with Laravel Livewire's #Validate Attribute https://laravel-news.com/validate-attribute
Laravel News
Simplifying Form Validation with Laravel Livewire's #[Validate] Attribute - Laravel News
Laravel Livewire's #[Validate] attribute revolutionizes form validation by placing rules directly on component properties, creating more readable code while maintaining powerful validation capabilities for modern web applications.
Forwarded from محتوای آزاد سهراب (Sohrab)
Forwarded from 🎄 یک برنامه نویس تنبل ( MΞ)
Forwarded from Linuxor ?
دیجی کالا برای فروش گوشی دست دوم یه سرویسی بالا آورده بود حالا مدیر عاملش پایان فعالیتش رو اعلام کرده، به گفته مدیر عاملش به سه دلیل این کارو کرده: مقیاسپذیری محدود، حاشیه سود پایین و عملیات گسترده و پیچیده.
این یه درس جالبی داره اونم اینه که هرچقدر هم بزرگ باشی ممکنه توی یه موقعیت دیگه تجربه ها و قدرتت به کار نیاد و شکست بخوری!
@Linuxor
این یه درس جالبی داره اونم اینه که هرچقدر هم بزرگ باشی ممکنه توی یه موقعیت دیگه تجربه ها و قدرتت به کار نیاد و شکست بخوری!
@Linuxor
Forwarded from Laravel News
In-depth guide on documenting API responses with Scramble https://laravel-news.com/in-depth-guide-on-documenting-api-responses-with-scramble
Laravel News
In-depth guide on documenting API responses with Scramble - Laravel News
An in-depth guide on documenting API responses with Scramble.
Forwarded from Regrambot ™
This media is not supported in your browser
VIEW IN TELEGRAM
#️⃣ #extrabeen
📅 1404/06/12, 19:36:44
👤 extrabeen
❤️ 1,212
▶️ 27,290
💬 1,801
🔃 993
👥 nima.click
دی ان اس های پینگ پایین رو با برگُزین پیدا کن ✌🏻🎮
🔄 1404/06/13, 16:40:58
📥 @Regrambot
📅 1404/06/12, 19:36:44
👤 extrabeen
❤️ 1,212
▶️ 27,290
💬 1,801
🔃 993
👥 nima.click
دی ان اس های پینگ پایین رو با برگُزین پیدا کن ✌🏻🎮
🔄 1404/06/13, 16:40:58
📥 @Regrambot
Forwarded from Geek Alerts
مرورگر Comet از Perplexity پیشثبتنامش برای اندروید شروع شده، از تجربه نسخه دسکتاپش اینکه میشه باهاش کارهایی مثل انجام تحقیقات، گشتن توی فرومها، خرید از سایتها و کلا کارهایی که قبلا خودتون انجام میدادید رو براتون انجام بده.
نسخه اندرویدی هم قراره کارهای مشابهی بکنه و توی توضیح گوگل پلی نوشتن این مرورگر میتونه خودش رو با الگوهای کاری فرد تطبیق بده و عادتهاشو یاد بگیره تا کارهارو بهتر انجام بده.
برای پیشثبتنام میتونید از این لینک رسمی گوگلپلی اقدام کنید. [L]
🤓 @geekalerts
نسخه اندرویدی هم قراره کارهای مشابهی بکنه و توی توضیح گوگل پلی نوشتن این مرورگر میتونه خودش رو با الگوهای کاری فرد تطبیق بده و عادتهاشو یاد بگیره تا کارهارو بهتر انجام بده.
برای پیشثبتنام میتونید از این لینک رسمی گوگلپلی اقدام کنید. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from 🎄 یک برنامه نویس تنبل ( MΞ)
اخیرا جابویژن یه راهنمای انتخاب رشته منتشر کرده که کلا به نظرم چیز خیلی خوبیه که کنکوریا یه نگاهی بهش بکنن.
این نمودار جالبم توش بود که میزان رضایت از دانشگاه و حقوق بعد از فارغالتحصیلی رو برای دانشگاهای مختلف نشون میده.
لینک گزارش کامل:
https://jobvision.ir/reports/education-field-selection
منبع:
https://x.com/MohammadSh377/status/1962934013854679356
@TheRaymondDev
این نمودار جالبم توش بود که میزان رضایت از دانشگاه و حقوق بعد از فارغالتحصیلی رو برای دانشگاهای مختلف نشون میده.
لینک گزارش کامل:
https://jobvision.ir/reports/education-field-selection
منبع:
https://x.com/MohammadSh377/status/1962934013854679356
@TheRaymondDev
Forwarded from Geek Alerts
رژه نظامی چین حاشیههای زیادی داشت، از صحبتهای «شی» رهبر چین در مورد اینکه نظم جهانی باید تغییر کنه تا باز بودن میکروفون و شنیده شدن بخشی از صحبتهاش با پوتین. توی این گفتگو مترجم رهبر چین میگه «توی گذشته کمتر کسی هفتاد سالش میشد، ولی این روزا میگن آدم هفتاد ساله هنوز بچهست.» و در ادامه مترجم پوتین میگه: «با پیشرفت بیوتکنولوژی، اعضای بدن انسان رو میشه به طور مداوم پیوند زد، و آدما میتونن جوانتر و جوانتر زندگی کنن، و حتی به جاودانگی برسن.»
بعد مترجم شی میگه «پیشبینیها میگن که تو این قرن، این شانس وجود داره که آدما تا صد و پنجاه سال هم عمر کنن.» بعد از این ماجراها پوتین تو صحبت با رسانهها میگه آره وقعا این حرفهارو زدیم ولی بیشتر بحث رو میبره سمت مردم و میگه میتونه امید به زندگی رو بیشتر کنه.
حواشی بیشتر اینه که میگن این دو تا بحثشون برای افزایش طول عمر خودشون بوده تا مردم، شی و پوتین هر دو ۷۲ ساله هستن و به ترتیب ۱۳ و ۲۵ ساله که توی قدرتن، هیچ تمایلی هم برای کنار رفتن ندارن، هر دو قوانین کشورشون رو تغییر دادن و شی میتونه مادامالعمر و پوتین هم میتونه تا سال ۲۰۳۶ توی قدرت بمونه. [L]
🤓 @geekalerts
بعد مترجم شی میگه «پیشبینیها میگن که تو این قرن، این شانس وجود داره که آدما تا صد و پنجاه سال هم عمر کنن.» بعد از این ماجراها پوتین تو صحبت با رسانهها میگه آره وقعا این حرفهارو زدیم ولی بیشتر بحث رو میبره سمت مردم و میگه میتونه امید به زندگی رو بیشتر کنه.
حواشی بیشتر اینه که میگن این دو تا بحثشون برای افزایش طول عمر خودشون بوده تا مردم، شی و پوتین هر دو ۷۲ ساله هستن و به ترتیب ۱۳ و ۲۵ ساله که توی قدرتن، هیچ تمایلی هم برای کنار رفتن ندارن، هر دو قوانین کشورشون رو تغییر دادن و شی میتونه مادامالعمر و پوتین هم میتونه تا سال ۲۰۳۶ توی قدرت بمونه. [L]
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Software Engineer Labdon
امروز یکی از همکارانم سوال خوبی پرسید که فکر میکنم دغدغه خیلیهاست:
"فرق واقعی Async و Concurrency چیه؟ مگه هر دو به معنی انجام همزمان کارها نیستن؟"
این دو مفهوم اغلب با هم اشتباه گرفته میشن. بذارید با یک مثال ساده تفاوتشون رو باز کنم:
۱. Synchronous vs. Asynchronous
این مفاهیم درباره انتظار کشیدن هستن.
Sync
مثل اینه که بری کافه، قهوه سفارش بدی و همونجا جلوی پیشخوان منتظر بمونی تا آماده بشه و تحویل بگیری.
تا قهوه رو نگیری، هیچ کار دیگهای نمیکنی.
Async
سفارش میدی، یک پیجر (Pager) میگیری و میری سر میزت مینشینی.
در این فاصله میتونی ایمیلهاتو چک کنی.
هر وقت قهوهات آماده شد، پیجر بهت خبر میده.
تو منتظر نموندی و از زمانت استفاده کردی.
۲. Concurrency
این مفهوم درباره مدیریت چند کار در یک بازه زمانی هست.
باریستای کافه رو در نظر بگیرید:
اون همزمان هم سفارش شما رو آماده میکنه، هم سفارش نفر بعدی رو میگیره و هم شیر رو برای یک سفارش دیگه گرم میکنه.
در واقع اون با جابجایی سریع بین کارها (Context Switching)، چند وظیفه رو پیش میبره.
این یعنی همروندی.
نکته کلیدی
برنامهنویسی Async یکی از راههای رسیدن به Concurrency هست.
درک این تفاوت، در طراحی سیستمهای مدرن مثل میکروسرویسها یا پایپلاینهای پردازش دیتا، یک مزیت فوقالعاده است.
این درک به شما کمک میکنه تا بین ابزارهایی مثل Kafka, gRPC یا WebSockets انتخاب درستی داشته باشید و سیستمی بسازید که هم Scalable و هم Reliable باشه.
@ | <Ali Naseri/>
"فرق واقعی Async و Concurrency چیه؟ مگه هر دو به معنی انجام همزمان کارها نیستن؟"
این دو مفهوم اغلب با هم اشتباه گرفته میشن. بذارید با یک مثال ساده تفاوتشون رو باز کنم:
۱. Synchronous vs. Asynchronous
این مفاهیم درباره انتظار کشیدن هستن.
Sync
مثل اینه که بری کافه، قهوه سفارش بدی و همونجا جلوی پیشخوان منتظر بمونی تا آماده بشه و تحویل بگیری.
تا قهوه رو نگیری، هیچ کار دیگهای نمیکنی.
Async
سفارش میدی، یک پیجر (Pager) میگیری و میری سر میزت مینشینی.
در این فاصله میتونی ایمیلهاتو چک کنی.
هر وقت قهوهات آماده شد، پیجر بهت خبر میده.
تو منتظر نموندی و از زمانت استفاده کردی.
۲. Concurrency
این مفهوم درباره مدیریت چند کار در یک بازه زمانی هست.
باریستای کافه رو در نظر بگیرید:
اون همزمان هم سفارش شما رو آماده میکنه، هم سفارش نفر بعدی رو میگیره و هم شیر رو برای یک سفارش دیگه گرم میکنه.
در واقع اون با جابجایی سریع بین کارها (Context Switching)، چند وظیفه رو پیش میبره.
این یعنی همروندی.
نکته کلیدی
برنامهنویسی Async یکی از راههای رسیدن به Concurrency هست.
درک این تفاوت، در طراحی سیستمهای مدرن مثل میکروسرویسها یا پایپلاینهای پردازش دیتا، یک مزیت فوقالعاده است.
این درک به شما کمک میکنه تا بین ابزارهایی مثل Kafka, gRPC یا WebSockets انتخاب درستی داشته باشید و سیستمی بسازید که هم Scalable و هم Reliable باشه.
@ | <Ali Naseri/>