دیتاهاب
2.11K subscribers
184 photos
35 videos
125 files
318 links
موضوعات کانال:

Data Science
Machine Learning
Deep Learning
NLP

گروه تلگرامی ⬅️ @data_jobs
دیتاست ⬅️ @persian_data
ادمین ⬅️ @data_hub
Download Telegram
اگر در زمینه مدل های زبانی مثل برت و gpt و xlnet، دنبال یک مطلب چکیده و خلاصه هستین که خلاصه چندتا مقاله یکجا نوشته باشه، این مطلب از دست ندین https://www.topbots.com/leading-nlp-language-models-2020/?amp
👍8
افشین و شروین (دوقلوهای استنفورد) یکسری چیت شیت فارسی و تر و تمیز برای هوش مصنوعی و ریاضی و امار و احتمال آماده کردن که چون رنگی و شکل داره، میشه ازش پرینت گرفت و به عنوان خلاصه مطالب ازش استفاده کرد

https://stanford.edu/~shervine/l/fa/teaching
👍41
حقیقی برگ ریزون‌
مدل GPT3 چندتا ورژن داره
که بزرگترینش‌ همونطور ک میدونید ۱۷۵ میلیارد پارامتر داره حدود ۵۰۰ برابر مدل bert
ولی
اینو قطعا نمی دونستید
که batch sizeاش چنده؟

بله 3.2 میلیون😎
بعد مدل‌هایی ک ما میزنیم نهایت ۱۰۲۴تایی😂😂😂

لرنینگ ریت
0.00006
و تعداد توکن‌هاش
۳۰۰میلیارد(آخه مگه داریم؟)
👍3🤔1
البته فک نکنین ملت بی خیال شدن
چند ماه بعد از معرفی GPT3 یعنی سال ۲۰۲۲
مدل Megatron با ۵۳۰ میلیارد پارامتر train شد

قشنگ از بعد برت (۲۰۱۸) و تنها طی ۳ سال
رشد nlp چندین برابر شد و دیگه از اینجا ب بعدش داره وحشتناک میشه
👍6
گاهی بعضی دوستان سوال می کنن که مصاحبه شرکت های بزرگ ایرانی چطورین؟ چه سوال هایی می کنن و از همه مهم تر چه تسک های آزمایشی دارن؟
حالا یک نمونه از تسک مصاحبه با شرکت کافه بازار برای پوزیشن NLP با جواب هاش می بینیم.
https://github.com/AmirHoseein99/Persian_NLP_Task

نظر شخصی خودم: برای کسی که NLP در سطح متوسط میدونه، تسک نسبتا سبک و قابل انجام هست.
Ta Dir Nashode
Arsa
"تا دير نشده بهش بگو دوسش دارى"

رفقا میدونم هنوز ولنتاین نشده
ولی پیشاپیش خواستم یادآوری کنم☺️

گاهی نیازه بعضی چیزها گفته بشه
خواهر، برادر، پدر و مادر یا هر کسی که دوستش دارید
ممکنه عمرمون کفاف نده‌ها
خلاصه قدر بدونیم و بیان کنیم🙏

پ.ن: اینقدر این موزیکِ میکس‌شده، زیبا و پردیالوگ بود که حیفم اومد نزارم😎
9👎2👍1
درود رفقا
تا حالا شده بخواین توی محیط گوگل کولب روی یک دیتاست از کگل کار کنین و مجبور بشین اول از کگل دانلودش کنین بعد از روی سیستمتون توی کولب اپلود کنین؟ یکم سخت و اعصاب خرد کن نیست؟
یا تا حالا شده یکی بیاد پایتون ببره زیر سوال و بگه R بهتره و شمام تن و بدنتون بلرزه ک نکنه درست بگه؟ دوست داشته باشین یکی بیاد با عدد و آمار و منطق دوتا زبان مقایسه کنه؟
یا کلی کد خوب نوشته باشین ولی بلد نباشین با گیتهاب کار کنین و به عنوان رزومه ازش استفاده کنین؟

خیلی وقت بود دوره جدید ضبط نکرده بودم و دلم واقعا تنگ تدریس بود
یک دوره جدید داریم به اسم "پایتون برای علوم داده" که یک سالی هست درگیرشیم و در حال ادیت و به روزرسانی بود تا یک محتوای تر و تمیز و کاربردی تهیه بشه
بنا به دلایلی تصمیم گرفته شد که هر هفته یک جلسه اش داخل سایت منتشر بشه و بتونین داخل خود سایت مشاهده کنین
رفقا این دوره مثل خیلی از دوره های دیگه رایگانه، ما از پول بدمون نمیاد ولی شرایط کشور خوب نیست، خواستیم یک حالی بهتون داده باشیم (طرف میاد پایتون مقدماتی میگه 5 میلیون)
لطفا ازمون حمایت کنین و تا می تونین معرفیش کنین

مشاهده آنلاین دوره پایتون برای علوم داده
31👍5
دیتاهاب
یکمی ذوق بچمون دیتاهاب بکنیم این آمار آخرین پست لینکدینمونه‌ طول کشید و اذیت شدیم ولی ارزش داشت جا داره یک خسته نباشید هم به خانوم یزدان پرست گفته بشه🙏
۳هزارتا لایک هم رد کردیم😍
بیشترین لایک یک پست فارسی توی حوزه هوش مصنوعی توسط یک مجموعه😎
بدون هیچ حمایت و وابستگی ب نهاد یا سازمانی
خیلی لذت‌بخشه روی پای خودمون می‌ایستیم
شاید زمان پیشرفت طولانی‌تر کنه
ولی انتظار شیرینیه😉
و قطعا این تازه اول کاره✌️
13👍4
داریم ب لحظات عجب شکری خوردیم مهاجرت نکردیم نزدیک می‌شیم

پ.ن: البته عذر من یکی موجه بود و خیلی غصه نمی‌خورم ولی شما که سالم بودین چرا نرفتین🤔

پ.ن ۲: حدس اولم درست از اب دراومد و ۵۰تایی شد
اگر شرایط به همین شکل باشه
پیش بینی دلار ۱۰۰، تا نهایت اول تابستون می‌کنم
پیش بینی شما چیه؟
😢18👎2
وقتی میریم سراغ برنامه‌نویسی، گزینه‌های زیادی از زبان‌های مختلف پیش رومونه. برای علم داده هم پایتون و R زیاد مطرح میشن.

ولی تفاوت پایتون و R چیه و از کجا بفهمیم کدوم بهتره؟

اگه هنوز نمی‌دونی چرا باید پایتون رو انتخاب کنی، این جلسه از دوره پایتون برای علم داده رو ببین و با اطمینان انتخاب کن 👇🏻
آموزش رایگان پایتون برای علوم داده

#دوره_پایتون
👍5👎2
از سال 94 تا 1400 یک تیم ول نکن، روی یک داکیومنت آموزش پایتون به زبون فارسی کار کردن و به مرور آپدیتش کردن و خوبیش اینه موضوع به موضوع هست و مثال و کد هم داره.
تقریبا تمام مباحث مهمی که یک برنامه نویس پایتون مقدماتی باید بدونه توضیح دادن و مرجع خوبی محسوب میشه.
https://python.coderz.ir
👍7
مسمومیت های شیمیایی از عجیب ترین چیزهایی که هنوز بعد از 3 ماه قابل هضم نیستش؛ احساس می کنم دیوار کوتاه تر از مردم نیست، هر کسی ناراحت بود سر مردم مظلوم خالی می کنه. فقط یک سوال مدام توی ذهنمه؟ به چه جرمی به چه دلیل؟ تاوان چی داریم پس میدیم...
👍22👎2
رفقا
قندشکن پولی خوب سراغ ندارید؟
اگه پیشنهادی دارین لطفا به این آی دی بفرستین
@data_hub
تا حالا شده موقع نصب کتابخونه های پایتون خطاهای رنگارنگ و عجیب پیش بیاد و ندونین چکار کنین؟ با کلی استرس دنبال راه حل بگردین و توی گوگل هر لینکی دیدین کلیک کنین و درست ک نشه تازه گیج تر هم بشین؟
ناامیدانه برین توی یوتیوب و برادران هندی هم راهگشا نباشن و چیزی از لهجه زیباشون متوجه نشین!

🔸 توی این قسمت از آموزش پایتون، خیلی راحت پیش نیازهای لازم رو نصب میکنیم.
🔸 با Pycharm آشنا میشیم و مفسرش رو فعال می کنیم.
🔸 هر جایی که ممکنه خطا پیش بیاد رو هم بهتون میگیم.

این قسمت رو به صورت آنلاین توی سایت دیتاهاب ببینید (نیازی به ثبت نام در دوره نیست)
آموزش رایگان پایتون برای علوم داده

#دوره_پایتون
👍3
"مرا هیچ از وطن محبوب‌تر نیست"

پ.ن: نمی‌دونم نویسندش کیه ولی ناامیدی امروزمون قابل تحمل‌تر می‌کنه
👍51👎316
دیتاهاب
"مرا هیچ از وطن محبوب‌تر نیست" پ.ن: نمی‌دونم نویسندش کیه ولی ناامیدی امروزمون قابل تحمل‌تر می‌کنه
چرا ی جمله در مورد وطن و کشور باید دیسلایک بشه؟
یکی به من بگه منم در جریان قرار بگیرم

پ.ن: اینقدر دیسلایک کنید که حالتون جا بیاد
من یکی که با آرامش دارم میوه می‌خورم😂
👍25👎22😁3
دیتاهاب
چرا ی جمله در مورد وطن و کشور باید دیسلایک بشه؟ یکی به من بگه منم در جریان قرار بگیرم پ.ن: اینقدر دیسلایک کنید که حالتون جا بیاد من یکی که با آرامش دارم میوه می‌خورم😂
برید خداروشکر کنید تلگرام اجازه نمیده ببینم کی دیسلایک کرده
وگرنه به سبب علاقم به ایران سریع ریمو می‌کردم
شوخی نداریم
هر کسی ایران عزیز دوست نداره با یک خداحافظی خوشحالمون کنه
👍38👎33😁2
رقابت تنگاتنگ و پرفشاری بین لایک و دیسلایکیون بوده و احتمالا باشه😊

ولی دو نکته بیانش ضروریه
۱.این کانال چندسالی هست به صورت تخصصی در حوزه علوم داده فعالیت می‌کنه ولی گاهی متناسب شرایط و وضعیت جامعه برخی مسائل حیاتی که دغدغه یکی از ادمین‌ها باشه هم داخل کانال بیان می‌شود. به هر حال کانال مربوط به نهاد دولتی یا سازمانی نیست پس اختیار تام در انتشار هر نوع محتوایی داریم.

۲. هر فرد یا نهادی یکسری خطوط قرمز دارد مثل وطن و میهن
البته متاسفانه حق می‌دهیم که به تناسب شرایط اقتصادی و رفاهی افتصاح جامعه، شدت وطن‌خواهی کم شده باشد و شوربختانه عملا وطن دغدغه برخی نباشد.

پ.ن: برخلاف یکسری کانال‌ها که امکان کامنت‌گذاری و دیسلایک غیرفعال کردند، فعلا چنین رویکردی نداشته و به گردش آزاد اطلاعات و بیان صریح عقاید همچنان معتقدیم.
👍30👎5
سلام بر ژورنال ✌🏻BMC Bioinformatics
آخر سالی خبر خوبی بود ☺️و خوشحالم 😍تونستم به کمک دو تا از اساتید داخل و خارج، یک کار جالب توی "هوش مصنوعی در علوم پزشکی" کار کنم (اونم توی یه ژورنال خوش نام)
پ.ن: اطلاعات بیشتر در مورد نحوه دسترسی به paper به زودی اطلاع میدم.
پ.ن2: خیلی فکر کردم چه شیرینی بهتون بدم که کامتون شیرین بشه و تصمیم گرفتم طی همین چند روز آینده شروع کنم و تجریباتمو در حوزه مقاله نویسی به اشتراک بگذارم.
👍2212