PyTorch Howsam
3.09K subscribers
347 photos
48 videos
6 files
482 links
از هوش مصنوعی میگیم...

ارتباط با ادمین
@howsam_support
Download Telegram
Media is too big
VIEW IN TELEGRAM
از مهدی. ببینید، جالبه...
We Built an Auto-aiming Trash Can
This media is not supported in your browser
VIEW IN TELEGRAM
وبلاگ درباره Embedding

این وبلاگ در هاگینگ‌فیس منتشر شده و درباره روش‌های مختلف امبدینگ به‌صورت تعاملی توضیح داده.

در X این پست رو معرفی کرده بودن و یک ویدئو هم براش گذاشته بودن. میخوام بخونمش. اتفاقا باید برای امبدینگ وبلاگ بنویسم. امبدینگ واقعا موجود جذابی هست...

https://huggingface.co/spaces/hesamation/primer-llm-embedding
دو تا کورس خوب و جدید برای بینایی کامپیوتر

کورس معروف CS231n: Deep Learning for Computer Vision از دانشگاه استنفورد که در بهار 2025 برگزار شده. امسال کورس CS231n ده ساله شد! 🔥 متاسفانه ویدئوهای این کورس فقط برای دانشجوهای استنفورد باز هست و ما فقط به اسلایدها دسترسی داریم. اگرچه، خیلی ارزشمند هست، اما ویدئوها یک چیز دیگه هست. دکتر Justin Johnson هم یکی از مدرس‌های این کورس هست. چند سال پیش، کورسی مشابه با همین CS231 رو در دانشگاه میشیگان به تنهایی برگزار می‌کرد. چه کورسی بود واقعا! چقدر ویدئوهاش خوب و پربار بود. لینک

کورس Computer Vision - CSCI-GA.2271-001 از دانشگاه نیویورک که در 2023 برگزار شده. من این کورس رو مطالعه نکردم، اما نگاهی به اسلایدها انداختم و بسیار پرمحتوا و باجزئیات بود. لینک

این کورس‌ها سنگین هستن. تا جایی که من مخاطب‌های عزیز هوش مصنوعی در ایران رو می‌شناسم، خیلی از علاقه‌مندان به بینایی کامپیوتر دنبال آموزش دادن شبکه یولو و این نوع کارها هستن. این کورس‌ها توی این فضا نیستن.
قبل از این دوره "مسابقه کگل"، من برای مسابقات کگل کم‌وبیش وقت میذاشتم. مثلا، توی دوره دیپ کاتالیست یک پروژه بزرگ برای سگمنت تصاویر دستگاه گوارش داشتیم. ولی، این مسابقه به خاطر زنده بودنش، جذابیت بیشتری برام داره. به واسطه مسئولیتی که به عنوان مدرس دارم، مجبور بودم از صفر (ساخت اکانت در کگل) تا ثبت اولین نتیجه در کگل رو با نظم و ساختار مناسب مستند و ضبط کنم. خیلی لذت می‌برم و برای خودم هم بسیار آموزنده هست. فرصت کنم، یکی از سوپرنکته‌های آموزنده این مسئله رو اینجا به اشتراک میذارم...

هر موقعی که خودم رو به شکلی به چالش کشیدم، رشد کردم. هرچند زحمت داره، اما لذت رشد و تغییر بسیار شیرین هست.

تا الان حدود 15 ساعت آموزش برای این دوره منتشر کردم. رسیدیم به اینجا که با اسکوری ناچیز وارد لیدربرد شدیم! :) حتی یک بهبود داشتیم؛ مدل رو کمی تغییر دادم و در شرایطی که امید داشتم حدود 3 4 درصد نتیجه بهتر بشه، 10 درصد بهتر شد! چشمام قلبی شده بود! :)

الان، مدام ذهنم درگیر این هست که کار رو بهبود بدیم.

البته، انگیزه زیادی برای شرکت در سایر مسابقه‌های کگل دارم. چند نمونه مسابقه خوب از نظر خودم رو انتخاب کردم:
* آنوریسم‌ مغزی
* پیش‌بینی قیمت کالا
Audio
یک وبلاگی خوبی در roadmap.sh با موضوع مصاحبه (Top 60+ Data Science Interview Questions and Answers) دیدم و پادکستش کردم. ارزیابی کنید که چقدر از مطالب گفته‌شده رو بلدید...

پادکست‌های کانال داره زیاد میشه. می‌تونید توی مسیرهاتون پلی‌لیستش رو گوش بدید.
یک نفر توی سایت کامنت گذاشته:
با فرض اینکه اطلاعات کاملا درست بوده باشه، واقعا قشنگ توضیح دادید و باعث افتخاره که به زبان فارسی هم داریم این محتواهای با کیفیت رو میبینیم.

کامنت عجیبیه. وضعیت برزخیه! اصلا منو یاد فیلم Inception میندازه. چطوری میشه "قشنگ توضیح دادن" رو منوط به فرض "کاملا درست بودن اطلاعات" کرد؟! 🧐
امسال به عنوان مدرس به مجموعه تهران دیتا دعوت شدم. معمولا پنج‌شنبه‌ها رو تمام وقت مشغول تدریس برای دانشجوهای تهران دیتا هستم. فکر نمی‌کردم کشش 8 ساعت تدریس در یک روز رو داشته باشم! با صدای محمد اصفهانی شروع می‌کنم و با محسن چاوشی تموم...
دو نشان نقره و دو نشان برنز در المپیاد جهانی، هوش مصنوعی 2025 چین، برای ایران.

علی شایان (نقره)
آرش یوسف نژاد (نقره)
پارسا گلستانی (برنز)
رادین رحمانی (برنز)

المپیاد جهانی هوش مصنوعی یکی از معتبرترین رقابت‌های علمی بین‌المللی در حوزه هوش مصنوعی و یادگیری ماشین است که با حضور برترین دانش‌پژوهان جهان برگزار می‌شود.
سِکا شدیم که :)
گوگل مدل جدیدی بنام Gemma 3 270M معرفی کرده؛ همونطور که از اسمش مشخص هست، این مدل فقط 270 میلیون پارامتر داره و طبیعتا در دسته مدل‌های زبانی کوچک (SLM) قرار میگیره. این مدل‌ها خوراک دیوایس‌های کوچک مثل موبایل‌ها، بردهای امبدد و غیره هستن. این مدل به خاطر عملکرد خوب و مصرف انرژی بهینه مورد توجه قرار گرفته.

همونطور که در تصویر بالا آوردم، در تست IFEval عملکرد بهتری از مدل معروف و قدرتمند SmolLM2 هاگینگ‌فیس (یکی از بهترین‌ها در SLM) داشته.

همچنین، روی گوشی Pixel 9 Pro، نسخه کوانتایز شده (INT4) این مدل تنها ۰.۷۵٪ از باتری رو بعد از ۲۵ مکالمه مصرف کرد.

آقای راشکا هم مثل همیشه معماری مدل رو به تصویر کشیده و اون رو با یک مدل معروف دیگه مقایسه کرده. به Pre RMS Norm و Post RMS Norm دقت کنید.

این مدل در X ترند شده و یکسری از افراد دارن این مدل رو روی دیوایس‌های کوچک اجرا میکنن. مثلا فردی نسخه 8 بیتی این مدل رو روی iPad Air M3 با سرعت پردازش 200 توکن بر ثانیه اجرا کرده.

منم که عاشق SLM هستم! :) مطالعه مطالب زیر رو پیشنهاد می‌کنم:
- مدل MobileLLM: لینک 1 | لینک 2 | لینک 3
- مدل SmolLM: لینک
- دوره LLM هوسم: لینک
در پانزدهمین سال برگزاری، استک‌اورفلو بیش از ۴۹,۰۰۰ پاسخ از ۱۷۷ کشور دریافت کرد که شامل ۶۲ سؤال متمرکز بر ۳۱۴ فناوری مختلف بود.
این نظرسنجی سالانه با تمرکز ویژه بر ابزارهای هوش مصنوعی، مدل‌های زبانی بزرگ (LLM) و پلتفرم‌های اجتماعی، تصویری حیاتی از نیازهای جامعه جهانی توسعه‌دهندگان ارائه می‌دهد و بر ابزارها و فناوری‌هایی که استفاده می‌کنند یا تمایل به یادگیری آن‌ها دارند، متمرکز است.

https://survey.stackoverflow.co/2025?utm_medium=referral&utm_source=stackoverflow-community&utm_campaign=dev-survey-2025&utm_content=results-announcement-banner
Python: The Documentary | An origin story

مستند پایتون:
این داستان محبوب‌ترین زبان برنامه‌نویسی جهان یعنی پایتون است.
چیزی که به عنوان یک پروژه جانبی در آمستردام در دهه ۱۹۹۰ آغاز شد، به نرم‌افزاری تبدیل شد که هوش مصنوعی، علم داده و برخی از بزرگ‌ترین شرکت‌های جهان را قدرت می‌بخشد.
اما آینده پایتون قطعی نبود؛ در یک برهه زمانی تقریباً از بین رفت.

این مستند ۹۰ دقیقه‌ای با حضور گیدو فان روسوم، تراویس اولیفانت، بری ورشو و بسیاری دیگر، داستان ظهور پایتون، تکامل جامعه‌محور آن، درگیری‌هایی که تقریباً آن را از هم پاشید و تأثیر این زبان بر همه چیز را روایت می‌کنند.
PyTorch Howsam
کورس معروف CS231n: Deep Learning for Computer Vision از دانشگاه استنفورد که در بهار 2025 برگزار شده. امسال کورس CS231n ده ساله شد! 🔥 متاسفانه ویدئوهای این کورس فقط برای دانشجوهای استنفورد باز هست و ما فقط به اسلایدها دسترسی داریم. اگرچه، خیلی ارزشمند هست، اما ویدئوها یک چیز دیگه هست. دکتر Justin Johnson هم یکی از مدرس‌های این کورس هست. چند سال پیش، کورسی مشابه با همین CS231 رو در دانشگاه میشیگان به تنهایی برگزار می‌کرد. چه کورسی بود واقعا! چقدر ویدئوهاش خوب و پربار بود. لینک
خبر خیلی خوب اینکه آخرین نسخه کورس CS231n در یوتوب منتشر شده. این کورس خیلی ارزشمنده‌ها، ساده از کنارش رد نشید. متن کوت‌شده رو بخونید؛ اصلا چند سال بود که ویدئوهای این کورس دیگه منتشر نمیشد.

https://www.youtube.com/playlist?list=PLoROMvodv4rOmsNzYBMe0gJY2XS8AQg16

جاستین هم موهاشو بلند کرده! :)
ساختمان سازمان ملی هوش‌مصنوعی اجاره داده می‌شود 👀

ساختمان ملی هوش‌مصنوعی از یک شخص اجاره شده است اما پرداخت‌های سازمان به مالک ساختمان با مشکل و تعویق مواجه شده بود؛
دلیل این تاخیر نبود منبع مالی مشخص برای این سازمان است.

طی جلسه‌ای که با مالک ساختمان برگزار شده است، این مشکل و اختلاف نظر موقتاً حل شده است و این موضوع به معنی بسته شدن سازمان نیست.
اما باید دید که در نهایت کدام نهاد متولی هوش‌مصنوعی می‌شود.

یکی نیست گردن بگیره 🤦🏻‍♂️
PyTorch Howsam
مسابقه Detect Behavior with Sensor Data به‌تازگی در کگل معرفی شده. این مسابقه 3 ماه زمان داره و تازه 5 روزه که ازش گذشته. حجم داده هم زیاد نیست و زیر 1 گیگ هست. باتوجه به اینکه تعطیلی تابستون رو در پیش داریم، فرصت خوبی هست که برای این مسابقه وقت بذارید. ما…
امیدوارم خاطرتون باشه که قبلا درباره مسابقه‌ای در کگل صحبت کرده بودم (پیام ریپلای‌شده) و پیشنهاد کردم که تابستون روی این پروژه وقت بذارید. اتفاقا، یکی از بچه‌های کانال بنام حمید بعدا اومد پیام داد و گفت که من این کار رو انجام دادم و خوشحال بود.

اما، ما فراتر از صرفا معرفی مسابقه رفتیم و یک دوره با عنوان مسابقه کگل در هوسم برگزار کردیم (لینک). هدفم این بود که مسابقه رو از صفر تا ثبت اولین اسکور در کگل به‌صورت ویدئویی توضیح بدم و بعد در گروه دوره با سایر اعضای گروه فعالیت کنیم تا کار رو بهبود بدیم و اسکور رو بالاتر ببریم. خب، فکر کنم دو هفته‌ای هست که مسابقه تموم شده و من تا الان فرصت نکردم که درباره‌ش بنویسم. اما، می‌خوام در قالب چند پیام درباره اتفاقاتی که افتاد و تجاربی که بدست آوردیم، بنویسم.

به صورت کلی بگم که تجربه خیلی خوبی بود. ما بدون اینکه از کدهای آماده کپی کنیم، از اسکور پایین 0.55 شروع کردیم و به اسکور بالای 0.83 رسیدیم. فعالیت بچه‌های گروه هم بسیار جذاب بود. از 0.55 به 0.83 صرفا حاصل کار من نبود، بچه‌های گروه روی بخش‌های مختلف روشمون کار میکردن و دستاوردهاشون رو به اشتراک میذاشتن. یکی روی مقادیر ازدست‌رفته کار میکرد، یکی روی مدل‌سازی، یکی روی مهندسی ویژگی، یکی روی آگمنتیشن، پیش‌پردازش و ...

وقتمون کم بود، اما با اینحال تمام تلاشمون رو می‌کردیم که وقتی باز کنیم و کمی کار کنیم. بعضی‌هامون حتی دیرتر می‌خوابیدم، برای اینکه یکمی آخر شب بتونیم روی مسابقه کار کنیم.

ما رتبه بالایی بدست نیاوردیم. پیشرفت‌هامون تا هفته آخر طوری بود که به برنز گرفتن امیدواریم بودیم. اما، خب نشد و رتبه مطلوبی بدست نیاوردیم. البته، ما از اول مسابقه رو با نیت جایزه و مدال شروع نکرده بودیم و هدفمون یادگیری و کسب تجربه بود (لینک). اما، خب انقدر جو گروه مثبت بود و نتایج رو به بهبود بود که به مدال برنز امیدوار بودیم. خب، اینکه مدال نگرفتیم، دلایل زیادی داشت؛ یکی از دلایلش هم این بود که من نتونستم هفته آخر وقت زیادی بذارم. در واقع، از 7 روز آخر مسابقه، من فقط 1 روز تونستم کار کنم. قطعا یکی دیگه از دلایلش، اشتباهاتمون بود. خصوصا یک اشتباه استراتژیک از من! این مدت خیلی به اشتباهم فکر کردم. به موقع درموردش صحبت می‌کنم...
PyTorch Howsam
امیدوارم خاطرتون باشه که قبلا درباره مسابقه‌ای در کگل صحبت کرده بودم (پیام ریپلای‌شده) و پیشنهاد کردم که تابستون روی این پروژه وقت بذارید. اتفاقا، یکی از بچه‌های کانال بنام حمید بعدا اومد پیام داد و گفت که من این کار رو انجام دادم و خوشحال بود. اما، ما فراتر…
می‌خوام درباره رتبه در کگل صحبت کنم؛

معمولا توی مسابقات کگل، عده بسیار زیادی سیاهی لشکر هستن! یعنی، افرادی که صرفا نوتبوک‌های اشتراکی دیگران رو اجرا میکنن. فکر کنید، عده‌ای نوتبوک‌های با اسکور نسبتا بالا به اشتراک میذارن و خب افراد زیادی این نوتبوک‌ها رو اجرا و سابمیت میکنن و خیلی راحت همون اسکور رو بدست میارن.

اگه بتونی اسکور بهتری نسبت به بهترین اسکور اشتراکی بدست بیاری، احتمالا به رتبه خیلی خوبی می‌رسی. چه بسا حتی به مدال هم برسی.

تصویر زیر رو مهدی (از بچه‌های فعال این مسابقه) در گروه به اشتراک گذاشت. ببینید، بین پرتکرارترین اسکورهای پابلیک، 0.855 چقدر بیشتر از بقیه هست. حدود 400 نفر این اسکور رو داشتن. این بهترین اسکوری بود که نوتبوکش حین مسابقه به اشتراک گذاشته شده بود. بنابراین، افراد زیادی این رو سابمیت کردن تا اون اسکور رو بدست بیارن. حالا اگه بتونی این سد 0.855 رو بشکونی، احتمالا رتبه خیلی خوبی خواهی داشت. چون سد سیاهی لشکر رو شکوندی که البته کار سختیه...