دیتاهاب
2.11K subscribers
184 photos
35 videos
125 files
318 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
واقعیت تلخ:
کسانی که الان آماده نشن، توی موج بعدی از دست می‌رن!

راه نجات؟
باید یاد بگیریم چطور با هوش مصنوعی همکاری کنیم، نه اینکه ازش بترسیم.

خبر خوب:
ما توی دیتاهاب وبیناری طراحی کردیم که نقشه راه واقعی تبدیل شدن به تحلیلگر داده حرفه‌ای رو نشون می‌ده - اونی که شرکت‌ها برای استخدامش رقابت می‌کنن.

بورسیه ۱۰۰٪ بدون قرعه‌کشی:
فقط کافیه پوستر وبینار رو توی شبکه‌های اجتماعیت share کنی و ما رو تگ کنی. همین!

جزئیات کامل:
https://zaya.io/f1bss
👍41😁1
سلام مجدد، این روزها داشتم به یک موضوع جالب فکر می‌کردم 🤔
یکی از چیزهایی که خیلی توجهم رو جلب کرده، اینه که شرکت‌های بزرگ تک چقدر دارن روی بخش hardware و chip های مختص هوش مصنوعی سرمایه گذاری می‌کنند
من مطمئنم تا دو سال دیگه، همین لپ تاپ‌های متوسط ما قابلیت اجرای مدل‌های پیچیده رو خواهند داشت
یعنی دیگه نیازی نباشه که API گرون قیمت بخریم یا دسترسی آنچنانی به اینترنت داشته باشیم
تمام محاسبات روی دستگاه خودمون انجام بشه
این یعنی چی؟
یعنی کسب‌وکارهای کوچک هم میتونن از قدرت AI بهره ببرن بدون اینکه ماهی صدها دلار API cost پرداخت کنن
و از نظر privacy هم چیز فوق‌العاده‌ای میشه
چون دیگه داده‌هامون به سرورهای خارجی ارسال نمیشه
👍92
#خبر_داغ
ماکروسافت همین چند وقت پیش اعلام کردش که قراره Copilot رو عمیق‌تر توی Office Suite ادغام کنه
منظورش اینه که دیگه فقط Word و Excel نیست
بلکه تمام workflow کاری را قراره تغییر بده
پیش خودتون یک لحظه تصور کنید Outlook خودکار ایمیل‌هاتون رو طبقه‌بندی کنه، پاسخ‌های مناسب پیشنهاد بده، حتی جلسات رو براساس محتوای ایمیل‌ها تنظیم کنه

پاورپوینت که خودش presentation بسازه فقط با دادن چند کلید واژه
یا Teams که خلاصه جلسات رو به صورت خودکار استخراج کنه و action item ها رو تشخیص بده

سوال مهم ولی اینجاست: آیا این یعنی کارمندان اداری کمتری نیاز خواهیم داشت؟ وضعیت کارمندای ایرانی چی میشه؟ دیگه می تونن بگن برو سیستم قطعه😂 یا سرم شلوغه و بعدا بیا
شاید الان یکم دور از دسترس باشه ولی کارمند با تعریف امروزی به تاریخ خواهد پیوست.
👍9😁31
امروز داشتم یک paper می خوندم که ذهنم رو به هم ریخت 🤯
محققای دانشگاه Stanford نشون دادن که میشه مدل‌های زبانی رو طوری تیون کرد که حافظه‌شون selective باشه
یعنی بتونی بگی این اطلاعات رو یادت نره، اون یکی رو فراموش کن
این یعنی چی؟
یعنی میتونیم AI هایی داشته باشیم که مثلاً همه چیز درباره پزشکی میدونن ولی هیچی از ساخت سلاح نمیدونن
یا مدل‌هایی که expertise توی coding دارن ولی اطلاعات حساس امنیتی ندارن

به نظرم (حالا نکه نظرم خیلی مهمه😂) این یکی از مهم‌ترین breakthrough های اخیر هست
چون مسئله کنترل و safety رو تا حد زیادی حل می‌کنه که واقعا چالش سیاست گذارهای امروزی هستش، تا دلتون بخواد قراره قانون تعریف کنن که جلوی رشد بی رویه هوش مصنوعی بگیره.
البته هنوز خیلی ابتدایی و در مرحال آزمایشی و تحقیقاتی هست و نیاز به تست‌های بیشتری داره
ولی اگر عملی بشه، کاملاً game changer میشه
🔥10👍4
این مدت یک چیز عجیب متوجه شدم 😐
توی کامیونیتی‌های مختلف AI، بحث‌های زیادی درباره "AI safety" و "alignment" هست
ولی خیلی کم کسی درباره مسائل اجتماعی و اقتصادی این تحولات صحبت می‌کنه
مثلاً وقتی می‌گیم تا ۵ سال دیگه AI جایگزین انسان توی کلی کار میشه، خب بعدش چی؟
میلیون‌ها نفر بیکار میشن؟
یا اینکه جامعه باید ساختارش رو کاملاً عوض کنه؟
حس می‌کنم همه فقط روی جنبه تکنیکی تمرکز دارن
ولی کسی نمی‌گه اگر ۷۰ درصد مشاغل فعلی از بین برن، قراره اون نیروها کجا مشغول بشن
چون تغییرات خیلی سریع‌تر از چیزی که فکر می‌کنیم در راهه
👍5
تو این مدت که داشتم با مدل‌های مختلف کار می‌کردم، متوجه شدم که خیلی‌شون توی زبان فارسی ضعف جدی دارن
نه فقط از نظر grammar، بلکه از نظر درک context فرهنگی
مثلاً وقتی ازشون می‌پرسی درباره شعر حافظ، یا مسائل اجتماعی ایران، یا حتی غذاهای محلی
جواب‌هاشون خیلی generic و بی‌روحه انگار که واقعا از حفظ داره یک چیزایی میگه

این یعنی چی؟
یعنی هنوز فرصت زیادی هست که روی fine-tuning مدل‌ها برای زبان و فرهنگ فارسی کار کنیم
شاید بتونیم مدل‌هایی بسازیم که واقعاً متوجه ما باشن
نه اینکه فقط ترجمه کننده باشن
فکر می‌کنم این میتونه یک حوزه کاری خوب باشه برای کسانی که می‌خوان توی AI کار کنن
7
گزارش‌های اخیر نشون میده که OpenAI قراره تا پایان سال جاری، ChatGPT رو به صورت رایگان برای تمام دانش‌آموزان دبیرستانی آمریکا در دسترس قرار بده.

پ.ن: مقایسه کنید با وضعیت خودمون و ... جدی گریه آوره که چقدر توی تکنولوژی عقب هستیم و هر روز داره فاصله مون از جهان بیشتر میشه
11👍5😁1
یک پروژه با RAG پیاده‌سازی می‌کردم
و متوجه شدم چرا همه این قدر روی vector database ها مانور میدن
یک knowledge base ساده از ۵۰۰ تا PDF ساختم، Embedding ازشون گرفتم و توی ChromaDB ریختم
حالا هر سوالی بپرسم، دقیقاً از همون PDF مربوطه جواب میده
یعنی عملاً می‌تونم یک chatbot متخصص بسازم که روی داده‌های خودم کار کنه
نه اینکه بره ChatGPT عمومی استفاده کنم که نصف حرفاش اشتباهه😎
مشکل اینجاس که embedding quality خیلی مهمه
اگه sentence transformer ضعیفی استفاده کنی، کل سیستم می‌ره تو فاز هذیون‌گویی
و chunk size هم باید دقیق تنظیم کنی وگرنه context گم میشه
👍116
تعداد «متخصص هوش مصنوعی»ها توی ایران داره از تعداد «متخصص کرونا»ی سال ۱۴۰۰ هم بیشتر میشه!

یک زمانی یک شوخی رایج بود که توی ایران به ازای هر شنونده، 5تا خواننده پاپ هست. الان باید بگیم به ازای هر دانشجو کامپیوتر، 10تا مدرس و متخصص هوش مصنوعی
😁15👍6
رفقا یه حرف مهم بهتون میگم
بازار کار حساسه و بی‌رحمه
یک عمر مهارت یاد می‌گیری ولی به خاطر یه تغییر تکنولوژیکی همه چیز از بین میره (همیشه HTML و CSS کار می‌کردی ولی یهو همه چی شد React)
کسب و کار هم همینطوره
یک اشتباه ممکنه کل اعتبارت رو نابود کنه (همیشه پروژه‌هات به موقع تحویل می‌دادی ولی یه بار دیر کردی)
پس مراقب باش و از این فکر خطرناک فاصله بگیر:
"فقط یه باره" یا "من که همیشه به‌روز بودم، حالا این یک بار که پشت تکنولوژی نمونم، چیزی نمیشه"
هوش مصنوعی اومده، چه بخوای چه نخوای، حالا تصمیم با خودته
👍181
This media is not supported in your browser
VIEW IN TELEGRAM
یک حرف مهم هستش که در قالب یک تجربه مطرح بشه بهتره

اون حرف هم اینه:
"AI Agents are 90% engineering, 10% AI."

و خب اصل داستان:

چند روز پیش داشتم یک ویدیو توی یوتیوب در مورد AI Agent می دیدم و متوجه شدم چرا همه میگن ۹۰ درصدش engineering هست
مدل زبانی که فقط ۱۰ درصد کل ماجراس، مثل مغز آدم
ولی بقیه سیستم چی؟ اون بدن، سیستم عصبی، تنفس و قلب که نگهش می‌داره کجان؟
این نگاه که یک API call به GPT و یکم prompt engineering کافیه، خب لزوما درست نیست


باید database برای memory بسازی تا بتونه چیزایی که یاد گرفته رو یادش بمونه
باید infrastructure بچینی که بتونه scale کنه و crash نکنه
باید observability پیاده‌سازی کنی تا بدونی کجا گیر داده
باید security لحاظ کنی تا کسی hack نکنه
باید orchestration بنویسی تا بتونه با چندتا model مختلف کار کنه
یعنی اگه فکر می‌کنی AI Agent یعنی ChatGPT + prompt، خیلی ساده‌انگارانه فکر می‌کنی

پس
اصل کار توی اون ۹۰ درصد engineering هست
👍102
این روزا و از سر کنجکاوی ذهنم درگیر Fine-tuning مدل‌های کوچیکه
دیدم می‌شه یک Llama 7B رو روی dataset خودمون tune کرد که عملکرد بهتری نسبت به GPT-4 داشته باشه
البته برای domain specific tasks
من یک dataset از ۱۰ هزار sample سوال و جواب پزشکی جمع کردم، با LoRA fine-tune کردم
نتیجه‌ش جالب بود، توی medical queries دقت ۸۵ درصدی داشت
در حالی که GPT-4 حدود ۷۲ درصد می‌زد
نکته مهم اینه که GPU requirement خیلی کمتره
با یک RTX 4090 می‌شه fine-tune کرد
ولی data preparation اصل ماجراس، اگه quality dataset نداشته باشی، هر چی train کنی بی‌فایده‌س
11👍5
هوش مصنوعی، علم prompt نیست که صد تا technique یاد بگیریم
مهم حل مسئله است
شرکت بهت مشکل میده
مهم نیست با GPT-4 حلش کنی یا Claude یا Gemini
ولی قطعا مهمه مشکل اون شرکت حل بشه
یا مثلا هزینه‌هاش نصف بشه
الان متاسفانه مد شده دوره‌های چند صد ساعته با هزینه نجومی برگزار می‌کنن ولی فقط آموزش ابزاره
مثل آشپزی که یک آشپزخونه پر از ابزار داره
ولی بلد نیست یه غذای خوشمزه درست کنه
👍102
دیشب تا ۳ صبح داشتم با یکی از این AI voice assistants کار می‌کردم
تقریبا قطعی شد برام به زودی دیگه نیازی نیست call center داشته باشیم
این سیستم می‌تونه با هزاران مشتری همزمان صحبت کنه، سوالاتشون رو جواب بده، حتی شکایتشون رو رسیدگی کنه
صدای طبیعی داره، احساسات رو تشخیص میده، حتی وقتی مشتری عصبانیه می‌تونه آرومش کنه
یعنی اون ۲۰-۳۰ نفری که توی call center کار می‌کنن الان چیکار کنن؟
یک شبه هزاران شغل نابود میشه
و ما هنوز داریم فکر می‌کنیم تکنولوژی فقط برنامه‌نویس‌ها رو تهدید می‌کنه
نه، همه مشاغل توی خط نشونه‌اس

پ.ن: این پست برای روحیه دادن به برنامه نویسا بود😂
😁145👍5
همکاری Meta و Ray-Ban و عینک‌های هوشمندشون جالبه

آدم می‌پوشتش و می‌تونه با دیدن هر چیزی، سوال بپرسه و جواب بشنوه
مثلاً نگاه می‌کنی به یک ساختمان و می‌پرسی چند سال قدمته، یا نگاه می‌کنی به یک گل و می‌گی اسمش چیه
ولی نکته دارکش اینجاس که این عینکیه ی سری چیزارو ضبط می‌کنه
یعنی اگه کسی این عینک رو بپوشه و باهات حرف بزنه، تمام گفتگوتون داره ذخیره میشه
حریم شخصی صفر😂 (واقعا حریم شخصی دچار چالش جدی میشه)
تصور کنین همه با عینک راه برن و هر کسی که ببینن، تشخیص بدن کیه، کجا کار می‌کنه، چی خریده
دیگه فقط خدا نیست که از عیوب ما باخبره، همه از خوب و بد هم باخبریم😁
👍7🔥1😁1
یه چیز عجیبی (و البته خیلی شایع) دیدم امروز یک دانشجوی سال آخر کارشناسی کامپیوتر داشت CV می‌نوشت نوشته بود:
"مسلط به 5 زبان برنامه‌نویسی"

پرسیدم: "یه پروژه با Go نوشتی؟" گفت: "نه ولی Hello World زدم!"

بازار کار الان شرایط عجیبیه HR یا تکنیکال اینتروری که مقابلت میشینه حرفه‌ای‌تر از قبله تو ۵ دقیقه می‌فهمه واقعا بلدی یا فقط اسم بلدی

بهتره بنویسی: "تخصص در پایتون - ۳ پروژه عملی انجام دادم
" تا اینکه بنویسی: مسلط به Python, Java, C++, JavaScript, Go, Rust, ...
حداقل از دید من مصاحبه کننده حس بهتری میگیرم تا یک لیست بالا بلند

میدونم کلیشه ای هست ولی یک مهارت عمیق بهتر از ۱۰ تا مهارت سطحی‌ه مخصوصا تو دورانی که همه چیز در دسترسه کیفیت مهمه، کمیت نه
👍181
داشتم با یک استارتاپ صحبت می‌کردم، گفت ما ۳ ماهه داریم ChatGPT Plus می‌خریم برای تیممون ولی نمی‌دونیم چرا هنوز نتایج کارمون بهتر نشده!
سوال کردم: "پرامپت‌هاتون چطوریه؟"
جواب: "سلام، لطفا این کد را بررسی کن"

فارغ از اینکه که از نسخه 5 استفاده می کرد که یکم خنگ تر شده ولی
بهش گفتم، هوش مصنوعی جادو نیست یک پرامپت خوب مثل یک دستور العمل آشپزیه وقتی به آشپز میگی "غذا درست کن" انتظار نداری شاهکار بسازه ولی وقتی میگی "برای ۴ نفر خورشت قیمه با گوشت چرخ کرده، نصف کیلو عدس، رب گوجه تند، زعفران..."
معلومه بهتر عمل کنه و غذای خوشمزه تری می پزه
یک پرامپت خوب ترجیحا یعنی:

زمینه مشخص (تو یک برنامه‌نویس سینیورهستی)
هدف روشن (میخوام این کد بهینه‌تر بشه و بهینه از چه نظر)
محدودیت‌ها (با زبان پایتون، حداکثر ۵۰ خط)
مثال (مثل این نمونه که میفرستم)



پند اخلاقی😉: ابزار خوبی داری؟ عالی. حالا یاد بگیر ازش حرفه‌ای استفاده کنی.
👍9