اگه دوست دارین با Llama3 و یک سری دیگه از مدل های اوپن سورس راحت چت کنین
میتونین از قابلیت چت سایت هاگینگ فیس استفاده کنین
هم امکان استفاده از ۷ ۸تا از مدل های عمده اوپن سورس رو دارید هم کاربرهای مختلف چیزی شبیه Custom GPT ها روی این سایت درست کردن به اسم assistant ها
میتونین از این دستیارها هم استفاده کنید. هم چنین میتونین خودتون system prompt چت رو بنویسید
منظور از system prompt یک پرامپت هدایت کننده رفتار هوش مصنوعی هست مثلا میتونین توی سیستم پرامپت بنویسین که تو یک برنامه نویس خفنی و هر سوالی ازت میپرسم باید بهترین کد رو بهم بدی
بعد دیگه هر سوالی که ازش بپرسین با این رویکرد بهتون جواب میده، البته این یک مثال خیلی ساده بود برای سیستم پرامپت.
کسایی که ایفون دارن هم میتونن اپ huggingchat رو از اپ استور دانلود کنن و اونجا از این قابلیت ها استفاده کنن
لینک چت هاگینگ فیس
لینک اپ استور
میتونین از قابلیت چت سایت هاگینگ فیس استفاده کنین
هم امکان استفاده از ۷ ۸تا از مدل های عمده اوپن سورس رو دارید هم کاربرهای مختلف چیزی شبیه Custom GPT ها روی این سایت درست کردن به اسم assistant ها
میتونین از این دستیارها هم استفاده کنید. هم چنین میتونین خودتون system prompt چت رو بنویسید
منظور از system prompt یک پرامپت هدایت کننده رفتار هوش مصنوعی هست مثلا میتونین توی سیستم پرامپت بنویسین که تو یک برنامه نویس خفنی و هر سوالی ازت میپرسم باید بهترین کد رو بهم بدی
بعد دیگه هر سوالی که ازش بپرسین با این رویکرد بهتون جواب میده، البته این یک مثال خیلی ساده بود برای سیستم پرامپت.
کسایی که ایفون دارن هم میتونن اپ huggingchat رو از اپ استور دانلود کنن و اونجا از این قابلیت ها استفاده کنن
لینک چت هاگینگ فیس
لینک اپ استور
👍3
AI Pulse
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤2🔥1👏1
خوب بریم یه پست اموزشی به صورت ELI5 (explain like I'm 5)
میخوام درمورد مفهوم RAG توی LLM ها صبحت کنم
Retrieval Augmented Generation
مدل های زبانی فعلی از نوع ترنسفورمرها هستن این مدل ها ویژگی بسیار مهمی دارن. این ویژگی "درک context یا فضایی که داخلش داره صحبت میشه" هست. یعنی چی؟
مثلا شما میگین بهش که:
یک لیوان شیر خوردم
در جنگل یک شیر دیدم
اینجا مدل های ترنسفورمر درک میکنن که اولی رو منظورتون شیر نوشیدنی هست و دومی حیوان شیر هست در صورتی که مدل های قبلی این توانایی رو نداشتن
اما خود این مدل هام محدودیت دارن و گاهی اطلاعاتی که روش ترین شدن قدیمی ان یا حتی کلا اون اطلاعات رو ندارن و یه جورایی توهم میزنن یا hallucinate میکنن.
اینجاست که RAG وارد عمل میشه چطوری؟
درواقع مدل زبانی رو با یک سیستم بازیابی اطلاعات خارج از این مدل زبانی ترکیب میکنه و اینطوری مدل به جدیدترین اطلاعات و داکیومنت ها دسترسی داره که بتونه توی جواب هاش ازش استفاده کنه
یه جورایی LLM بدون RAG شبیه یه دانشجوعه که داره امتحان معمولی میده و با RAG انگار داره امتحان اوپن بوک میده
حالا RAG چطوری اینکارو میکنه؟
درواقع خود رگ از دو بخش تشکیل شده یک مدل که اطلاعات رو بازیابی میکنه و یکی که تولید میکنه
کار بخش اول اینه که براساس سوالی که ازش پرسیده شده بره و توی یه دیتاست بزرگ اطلاعات مرتبط رو پیدا کنه
حالا وقتی این اطلاعات رو پیدا کرد مدل دوم که کارش تولید هست شروع به ایجاد یه متن قابل درک میکنه براساس اون اطلاعات
@aipulse24
میخوام درمورد مفهوم RAG توی LLM ها صبحت کنم
Retrieval Augmented Generation
مدل های زبانی فعلی از نوع ترنسفورمرها هستن این مدل ها ویژگی بسیار مهمی دارن. این ویژگی "درک context یا فضایی که داخلش داره صحبت میشه" هست. یعنی چی؟
مثلا شما میگین بهش که:
یک لیوان شیر خوردم
در جنگل یک شیر دیدم
اینجا مدل های ترنسفورمر درک میکنن که اولی رو منظورتون شیر نوشیدنی هست و دومی حیوان شیر هست در صورتی که مدل های قبلی این توانایی رو نداشتن
اما خود این مدل هام محدودیت دارن و گاهی اطلاعاتی که روش ترین شدن قدیمی ان یا حتی کلا اون اطلاعات رو ندارن و یه جورایی توهم میزنن یا hallucinate میکنن.
اینجاست که RAG وارد عمل میشه چطوری؟
درواقع مدل زبانی رو با یک سیستم بازیابی اطلاعات خارج از این مدل زبانی ترکیب میکنه و اینطوری مدل به جدیدترین اطلاعات و داکیومنت ها دسترسی داره که بتونه توی جواب هاش ازش استفاده کنه
یه جورایی LLM بدون RAG شبیه یه دانشجوعه که داره امتحان معمولی میده و با RAG انگار داره امتحان اوپن بوک میده
حالا RAG چطوری اینکارو میکنه؟
درواقع خود رگ از دو بخش تشکیل شده یک مدل که اطلاعات رو بازیابی میکنه و یکی که تولید میکنه
کار بخش اول اینه که براساس سوالی که ازش پرسیده شده بره و توی یه دیتاست بزرگ اطلاعات مرتبط رو پیدا کنه
حالا وقتی این اطلاعات رو پیدا کرد مدل دوم که کارش تولید هست شروع به ایجاد یه متن قابل درک میکنه براساس اون اطلاعات
@aipulse24
👍7🔥4❤1
Media is too big
VIEW IN TELEGRAM
قراره توی انجام کارای خونه هم حس ناکافی بودن بگیریم🥺 😊 😊
این عزیز دل محصول شرکت stardust هست و با تقلید یادمیگیره!
تو همین ۲۰۲۴ به بازار عرضه خواهد شد
کاملا humanoid نیست مثل بقیه مدل ها پایین تنه چرخه:)) بالاتنه ادم😐 😐
نحوه کارش به این صورت هست که انواع مختلفی از داده رو جمع میکنه و با استفاده از یادگیری تقویتی میتونه تقلید کنه
@aipulse24
این عزیز دل محصول شرکت stardust هست و با تقلید یادمیگیره!
تو همین ۲۰۲۴ به بازار عرضه خواهد شد
کاملا humanoid نیست مثل بقیه مدل ها پایین تنه چرخه:)) بالاتنه ادم
نحوه کارش به این صورت هست که انواع مختلفی از داده رو جمع میکنه و با استفاده از یادگیری تقویتی میتونه تقلید کنه
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥3👎1😍1
خوب میخوام درمورد یه مفهموم خیلی جدید و جذاب ولی کمی پیچیده صحبت کنم
امیدوارم بتونم به خوبی ساده اش کنم
☕️ پرده اول: در حال حاضر وضعیت رایانش برای هوش مصنوعی مناسب نیست.
منظور از رایانش چیه؟ تمام منابع سخت و نرم افزاری هست که برای اجرای تسک نیازه. مثلا یه مدل یادگیری ماشینی نیاز به CPU, رم، برق، شبکه و چیزای دیگه داره به اینا میگیم رایانش.
و هوش مصنوعی برای توسعه بیشتر به یه عالمه از اینا نیاز داره که همه یا تولیدشون کمه یا گرونن و در دسترس همه نیست
☕️ پرده دوم: در حال حاضر دو مدل رایانش داریم باینری و کوانتمی
به طور خلاصه باینری یعنی صفر و یک اما کوانتومی از قوانین فیزیک کوانتوم پیروی میکنه یعنی میتونه در آن واحد چند حالت داشته باشه یعنی هم صفر باشه و هم یک
که خوب پیشرفت از باینری به کوانتومی خیلی قابل ملاحظه بود اما حالا باز هم کوانتومی برای رسیدن به سرعت تغییرات هوش مصنوعی کمه!
☕️ پرده سوم: رایانش ترمودینامیکی وارد میشود!!!🏃♂️ 🏃♂️
یعنی چی؟ یادتونه که توی فیزیک میخوندیم اتم ها درجایی که هستن بندری میرقصن؟😵💫
حالا یه شرکت کانادایی به نام Extropic قصد داره که از این بندری رقصیدن اتم ها استفاده کنه و رایانش کنه🤯
در واقع به جای رویکرد صفرو یکی برای پردازش اطلاعات، رایانش ترمودینامیکی از گستره ای از حالات استفاده میکنه و این اتفاقا به بسیاری از مشکلات دنیای واقعی خیلی نزدیک تره!!
😀 مزیت دیگه؟
چون باید در دمای پایین بر روی الکترون ها کار بشه، مصرف انرژی کارهای مرتبط با هوش مصنوعی خیلیییی کاهش پیدا میکنه!
در همین رابطه البته مقالاتی هم نوشته شده که اخرینش دسامبر ۲۰۲۳ بوده و توی اون محققان از سخت افزار جدیدی به نام SPU نام میبرن که خلاصه
stochastic processing unit
هست
که درواقع میشه اولین کامپیوتر ترمودینامیکی با متغییر های پیوسته (به جای صفر و یکی) هست
امیدوارم تونسته باشم اهمیت و جذابیت این خبرو به خوبی به شما هم منتقل کنم
در ضمن این شرکت برای یه عالمه پوزیشن استخدام میکنه و جالبه که به خاطر عمق کاربرد فیزیک در این روش یه عالمه متخصص فیزیک کاربردی نیاز دارن😄 😄
@aipulse24
امیدوارم بتونم به خوبی ساده اش کنم
منظور از رایانش چیه؟ تمام منابع سخت و نرم افزاری هست که برای اجرای تسک نیازه. مثلا یه مدل یادگیری ماشینی نیاز به CPU, رم، برق، شبکه و چیزای دیگه داره به اینا میگیم رایانش.
و هوش مصنوعی برای توسعه بیشتر به یه عالمه از اینا نیاز داره که همه یا تولیدشون کمه یا گرونن و در دسترس همه نیست
به طور خلاصه باینری یعنی صفر و یک اما کوانتومی از قوانین فیزیک کوانتوم پیروی میکنه یعنی میتونه در آن واحد چند حالت داشته باشه یعنی هم صفر باشه و هم یک
که خوب پیشرفت از باینری به کوانتومی خیلی قابل ملاحظه بود اما حالا باز هم کوانتومی برای رسیدن به سرعت تغییرات هوش مصنوعی کمه!
یعنی چی؟ یادتونه که توی فیزیک میخوندیم اتم ها درجایی که هستن بندری میرقصن؟
حالا یه شرکت کانادایی به نام Extropic قصد داره که از این بندری رقصیدن اتم ها استفاده کنه و رایانش کنه
در واقع به جای رویکرد صفرو یکی برای پردازش اطلاعات، رایانش ترمودینامیکی از گستره ای از حالات استفاده میکنه و این اتفاقا به بسیاری از مشکلات دنیای واقعی خیلی نزدیک تره!!
چون باید در دمای پایین بر روی الکترون ها کار بشه، مصرف انرژی کارهای مرتبط با هوش مصنوعی خیلیییی کاهش پیدا میکنه!
در همین رابطه البته مقالاتی هم نوشته شده که اخرینش دسامبر ۲۰۲۳ بوده و توی اون محققان از سخت افزار جدیدی به نام SPU نام میبرن که خلاصه
stochastic processing unit
هست
که درواقع میشه اولین کامپیوتر ترمودینامیکی با متغییر های پیوسته (به جای صفر و یکی) هست
امیدوارم تونسته باشم اهمیت و جذابیت این خبرو به خوبی به شما هم منتقل کنم
در ضمن این شرکت برای یه عالمه پوزیشن استخدام میکنه و جالبه که به خاطر عمق کاربرد فیزیک در این روش یه عالمه متخصص فیزیک کاربردی نیاز دارن
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍5🔥4❤1
امروز یه پست ژانر میستیری داریم:)))
کتابی هست نوشته آقای دگلاس ادامز با عنوان
The hitch-hiker's guide to the galaxy
کتاب ژانر بسیار سمی علمی تخیلی کمدی😳 داره به فارسی هم ترجمه شده و البته فیلم هم براساسش ساخته شده
توی اینکتاب یک سوپر کامپیوتر ساخته شده به اسم deep thought و یک سری موجودات فوق هوشمند از این کامپیوتر میخوان که بهشون
The Answer to the Ultimate Question of Life, The Universe, and Everything
بده. این کامپیوتر ۷.۵ میلیون سال پردازش میکنه و پاسخ به این سوال رو "۴۲" اعلام میکنه!!
حالا یک بررسی انجام شده و مشخص شده که اگر از هوش مصنوعی های مختلف توی دفعات زیاد (با استفاده از api) این سوال رو بپرسی که بین ۰ تا ۱۰۰ یک عدد رو انتخاب کن عددی که بیشتر از همه انتخاب میکنن ۴۲ عه:))))
@aipulse24
کتابی هست نوشته آقای دگلاس ادامز با عنوان
The hitch-hiker's guide to the galaxy
کتاب ژانر بسیار سمی علمی تخیلی کمدی
توی اینکتاب یک سوپر کامپیوتر ساخته شده به اسم deep thought و یک سری موجودات فوق هوشمند از این کامپیوتر میخوان که بهشون
The Answer to the Ultimate Question of Life, The Universe, and Everything
بده. این کامپیوتر ۷.۵ میلیون سال پردازش میکنه و پاسخ به این سوال رو "۴۲" اعلام میکنه!!
حالا یک بررسی انجام شده و مشخص شده که اگر از هوش مصنوعی های مختلف توی دفعات زیاد (با استفاده از api) این سوال رو بپرسی که بین ۰ تا ۱۰۰ یک عدد رو انتخاب کن عددی که بیشتر از همه انتخاب میکنن ۴۲ عه:))))
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2😁1
This media is not supported in your browser
VIEW IN TELEGRAM
جوری که شرکت ها تلاش میکنن به همه چی یه ai بچسبونن:)))
🤣15👍4🙊2
The_Big_Book_of_Prompts_AiTuts_240502_163656.pdf
28.6 MB
این کتابچه پرامپت خوب برای سبک های مختلف تولید عکس توی میدجرنی هست
میتونین برای بقیه سرویس هام استفاده کنین
@aipulse24
میتونین برای بقیه سرویس هام استفاده کنین
@aipulse24
🔥2
توی یادگیری ماشینی شما وقتی میخواین یک مدل رو بسازین داده هایی که دارین رو به دو بخش تقسیم میکنین یکی بخشی که به مدل میدین تا ترین بشن و یک بخشی که بهش نمیدین و بعد از اون ها استفاده میکنین تا ارزیابی کنین که چقدر مدل خوب یاد گرفته
به طور مثال میخواین یه مدل بسازین که قیمت خونه توی تهران رو پیش بینی کنه و دیتاست شما هم شامل اطلاعات کامل ۵۰۰۰ تا واحد خونه توی تهرانه حالا مثلا ۳۰۰۰ تا از این هارو بهش میدین تا ترین بشه و بعد با ۲۰۰۰ تاش ارزیابی میکنین که ببینین ایا قیمتی که پیش بینی میکنه با قیمتی که توی دیتا ست شما هست یکیه یا نه
و شما هیچ وقت نباید مدلتون رو روی داده ای که باهاش ترین کردین ارزیابی کنین چون اون داده رو میشناسه و با درصد بالایی درست جواب میده و شمام خوشحال میشین که ایول مدلم چقدر دقیقه
مثل امتحان های مدرسه که مثلا میخواستن جمع رو یاد بدن ۲+۲ رو میگفتن ولی توی امتحان ۵+۶ رو امتحان میگرفتن
مدل های هوش مصنوعی هم یه جور سیستم های یادگیری ماشی هستن پس وقتی میخوایم benchmark روشون انجام بدیم و چک کنیم چقدر خوبن نباید روی داده هایی که ترین شدن تستشون کنیم اما متاسفانه فعلا چون یه هایپ زیادی دور هوش مصنوعی هست یه سری کارها داره غیر اصولی و بیشتر تبلیغاتی و تجاری انجام میشه
بنچ مارک ها هم شامل این قضیه میشن اغلب مدل ها روی بنچ مارک ها ترین شدن واسه همین شاید دقیق نشه کیفیت این مدل هارو فهمید
حالا برای حل این مشکل یه گروه اومدن و یک بنچ مارک از صفر ساختن که هیچ مدلی روش ترین نشده
که درنهایت بهترین عملکرد رو کلاد داشته و بدترین هم میسترال و Phi
دیتا ست این تست ها هم میتونین توی هاگینگ فیس دانلود کنین و اگر خواستین باهاش کار کنین
@aipulse24
به طور مثال میخواین یه مدل بسازین که قیمت خونه توی تهران رو پیش بینی کنه و دیتاست شما هم شامل اطلاعات کامل ۵۰۰۰ تا واحد خونه توی تهرانه حالا مثلا ۳۰۰۰ تا از این هارو بهش میدین تا ترین بشه و بعد با ۲۰۰۰ تاش ارزیابی میکنین که ببینین ایا قیمتی که پیش بینی میکنه با قیمتی که توی دیتا ست شما هست یکیه یا نه
و شما هیچ وقت نباید مدلتون رو روی داده ای که باهاش ترین کردین ارزیابی کنین چون اون داده رو میشناسه و با درصد بالایی درست جواب میده و شمام خوشحال میشین که ایول مدلم چقدر دقیقه
مثل امتحان های مدرسه که مثلا میخواستن جمع رو یاد بدن ۲+۲ رو میگفتن ولی توی امتحان ۵+۶ رو امتحان میگرفتن
مدل های هوش مصنوعی هم یه جور سیستم های یادگیری ماشی هستن پس وقتی میخوایم benchmark روشون انجام بدیم و چک کنیم چقدر خوبن نباید روی داده هایی که ترین شدن تستشون کنیم اما متاسفانه فعلا چون یه هایپ زیادی دور هوش مصنوعی هست یه سری کارها داره غیر اصولی و بیشتر تبلیغاتی و تجاری انجام میشه
بنچ مارک ها هم شامل این قضیه میشن اغلب مدل ها روی بنچ مارک ها ترین شدن واسه همین شاید دقیق نشه کیفیت این مدل هارو فهمید
حالا برای حل این مشکل یه گروه اومدن و یک بنچ مارک از صفر ساختن که هیچ مدلی روش ترین نشده
که درنهایت بهترین عملکرد رو کلاد داشته و بدترین هم میسترال و Phi
دیتا ست این تست ها هم میتونین توی هاگینگ فیس دانلود کنین و اگر خواستین باهاش کار کنین
@aipulse24
👍6🔥1
AI Pulse
یک چت بات جدید اومده روی سایت رنکینگ LMSys به اسم gpt2-chatbot که به شدت در دستوراتی که نیاز به استدلال داره خوب عمل میکنه حتی بهتر از GPT4 و کلاد۳
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤1
لینک گیت هاب و هاگینگ فیس مدل هارو میگذارم توی کامنت ها
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
میتونین از طریق جمنای با ویدیوهای یوتوب چت کنین
برین توی بخش اکستنشن هاش و یوتوب رو روشن کنین
بعد برگردین به صفحه چت جمنای و با این فرمت پرامپت بدین بهش:
@youtube Summarize the following video [Youtube URL]
@aipulse24
برین توی بخش اکستنشن هاش و یوتوب رو روشن کنین
بعد برگردین به صفحه چت جمنای و با این فرمت پرامپت بدین بهش:
@youtube Summarize the following video [Youtube URL]
@aipulse24
❤2👍2🔥1
AI Pulse
@aipulse24
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍2
کامیونیتی datatalks یک بوت کمپ گذاشته برای نحوه تولید و تجاری سازی محصولات و خدمات ML
اولین جلسه ۱۳ می بوده ولی ریکوردینگش موجوده
میتونین باهاشون استارت بزنین و کلی چیز یاد بگیرین
رایگان هم هست کانال تلگرام هم دارن
https://t.iss.one/dtc_courses
از این کانال اپدیت هاشون رو پیگیری کنین
اولین جلسه ۱۳ می بوده ولی ریکوردینگش موجوده
میتونین باهاشون استارت بزنین و کلی چیز یاد بگیرین
رایگان هم هست کانال تلگرام هم دارن
https://t.iss.one/dtc_courses
از این کانال اپدیت هاشون رو پیگیری کنین
❤🔥2
انتروپیک یک ابزار تولید پرامپت ساخته و حالا دیگه بدون دردسر میتونین با بهترین پرامپت ها با هوش مصنوعی ها کار کنین
دیگه این همه کورس و فایل مهندسی پرامپت هم نیازی بهشون نیست
سرعت تغییرات پشم ریزونه واقعا:))
https://console.anthropic.com
دیگه این همه کورس و فایل مهندسی پرامپت هم نیازی بهشون نیست
سرعت تغییرات پشم ریزونه واقعا:))
https://console.anthropic.com
❤2👍2👌1
AI Pulse
در کل این هفته با وجود اینکه خبرهای زیادی مطرح شد ولی خیلی هفته بورینگی بود برای هوش مصنوعی چون همه خبرها از شرکت های عمده و مطرح بود و اون حس رقابت شرکت های کوچیک اما قدرتمند با بزرگ تر ها وجود نداشت
هوش مصنوعی برای اینکه به singularity مارو نزدیک کنه و دموکراتیزه بشه نیاز به گزینه های اوپن سورس قوی داره که امیدوارم روندش مثل قبل ادامه پیدا کنه
@aipulse
Please open Telegram to view this post
VIEW IN TELEGRAM
👍7❤1
Media is too big
VIEW IN TELEGRAM
محققان دانشگاه واشنگتن درحال کار روی سیستم هوش مصنوعی برای هدفون هستن با عنوان Target Speech Hearing یا TSH
یعنی چی؟!
یعنی فردی که هدفون روی گوشش هست کافیه به اون منبع صدایی که میخواد گوش بده ۳ تا ۵ ثانیه خیره بشه و هدفون متوجه میشه که باید کدوم صداهارو کنسل کنه و کدوم صدا رو توی هدفون پخش کنه
نکته "چه جالب" (پشم ریزون) ماجرا اینه که حتی اگر از اون شخص هم فاصله بگیری و جدا بشی باز صدای همون رو پخش میکنه
(خوراک جاسوسیه)
البته محقق ها صرفا کد رو منتشر کردن و قصد تجاری سازی ندارن اما به صورت عمومی کد در دسترس هست برای بقیه که محصولاتشون رو به این تکنولوژی مجهز کنن
جزئیات بیشتر رو میتونین روی سایت دانشگاه واشنگتن بخونین
@aipulse24
یعنی چی؟!
یعنی فردی که هدفون روی گوشش هست کافیه به اون منبع صدایی که میخواد گوش بده ۳ تا ۵ ثانیه خیره بشه و هدفون متوجه میشه که باید کدوم صداهارو کنسل کنه و کدوم صدا رو توی هدفون پخش کنه
نکته "چه جالب" (پشم ریزون) ماجرا اینه که حتی اگر از اون شخص هم فاصله بگیری و جدا بشی باز صدای همون رو پخش میکنه
(خوراک جاسوسیه)
البته محقق ها صرفا کد رو منتشر کردن و قصد تجاری سازی ندارن اما به صورت عمومی کد در دسترس هست برای بقیه که محصولاتشون رو به این تکنولوژی مجهز کنن
جزئیات بیشتر رو میتونین روی سایت دانشگاه واشنگتن بخونین
@aipulse24
🔥8❤2