علم داده و سواد آماری
952 subscribers
146 photos
10 videos
32 files
153 links
در این کانال مطالبی در راستای پروژه بین المللی علم داده و سواد آماری، جهت توسعه فرهنگ بکارگیری داده و تحلیل صحیح آن به اشتراک گذاشته می شود.
Download Telegram
دقیقترین مجموعه داده و دیتاست کوید19 را در لینک زیر در دسترس قرار دادیم.

https://dx.doi.org/10.17632/nw5m4hs3jr.3#file-5f842455-e9d8-404b-bc0e-441442207d63

این مجموعه داده با بررسی و حذف خطاهای اندازه گیری سیستماتیک داده های رسمی منتشر شده از سه سازمان بین المللی تهیه شده و از نتایج یک مقاله علمی در مجله علمی آمارهای رسمی اروپا بهره می برد.

مقاله اصلی ما را اینجا مطالعه فرمایید.
https://doi.org/10.3233/SJI-200674

به این لحاظ می توان ادعا کرد دقیقترین مجموعه داده کوید19 تا کنون را در اختیار محققین قرار می دهد که می تواند توسط مدیران حوزه سلامت و نویسندگان مقالات علمی مورد استفاده قرار گیرد. در صورت استفاده، موجب امتنان تهیه کنندگان خواهد بود که در فهرست مراجع به مجموعه داده و مقاله مرتبط ارجاع داده شود./ آشفته

🆔 @IASE_ISLP
This media is not supported in your browser
VIEW IN TELEGRAM
افرادی که علاقه مند به میزان محبوبیت زبان های برنامه نویسی در طی زمان هستند یا می خواهند یک زبان برنامه نویسی تحلیل داده را برای یادگیری انتخاب کنند حتما ببینند.

برای عضویت در کانال از لینک زیر استفاده کنید.
🆔 @IASE_ISLP
سلام. مقاله ما در رابطه با کیفیت داده ها و اطلاعات رسمی کوید۱۹ در عرض یک هفته به بیش از یکصد مطالعه توسط محققین رسید.
در صورت علاقه به آدرس زیر مراجعه کنید:
https://doi.org/10.3233/SJI-200674

کیفیت داده ها و آمارهای رسمی کوید۱۹ چه نقشی در مدیریت این پاندمی و تحقیقات مرتبط ایفا می کنند؟

به زودی به این مطلب و مطالب مرتبط دیگر با محوریت انجمن های علمی کشوری و پلتفرم دانشگاه تهران در وبینارهایی بصورت رایگان خواهم پرداخت.

جهت اطلاع از زمان دقیق، کانال زیر را می توانید دنبال کنید.
🆔 @IASE_ISLP

ارادتمند./آشفته
اگر وبیناری رایگان در رابطه با سواد داده و آمار برگزار شود امکان و علاقه به شرکت خواهید داشت؟
Final Results
86%
بله، شرکت خواهم کرد.
14%
خیر، امکان شرکت در وبینار را ندارم.
سلام. لطفا در این نظرسنجی شرکت فرمایید تا برآوردی از تعداد شرکت کنندگان داشته باشیم. دوستانی که در چند لحظه اول رای داده بودند به علت اصلاحی در متن و پاک شدن نتیجه، لطفا مجدد رای خود را اعلام کنند. سپاسگزارم.
افتخار آمار و ریاضی استاد فرزانه جواد بهبودیان. خدایش بیامرزاد. یادش گرامی.
وقتی اطلاع دادند که از کتابم به عنوان مرجعی در کتب درسی دبیرستان استفاده شده خوشحال شدم. وقتی صفحه را نگاه کردم و کتاب مرجع دیگر را کتاب استاد جواد بهبودیان یافتم درونی خجالت کشیدم. یاد زمان دانشجویی افتادم که تالیفات استاد را لغت به لغت می خواندم و مزه مزه می کردم تا راه را از چاه تشخیص دهم. انسان های بزرگ جایشان بد خالی می شود وقتی می روند.
سلام.
در جلسه وبینار روز چهارشنبه که به دعوت انجمن آمار ایران، انجمن انفورماتیک ایران و دانشگاه تهران برگزار می شود در خدمت دوستان خواهم بود. این جلسه رایگان است و ظرفیت شرکت کنندگان برای سیستم دانشگاه تهران ۲۰۰ نفر است. بقیه شرکت کنندگان می توانند بصورت آنلاین از فضای ابری معرفی شده بطور همزمان استفاده کنند.
به امید دیدار در روز چهارشنبه/آشفته

اطلاعات تکمیلی در کانال زیر اطلاع رسانی می شود.
🆔 @IASE_ISLP
امروز چهارشنبه ۲۱ خردادماه ساعت: ۱۸ به وقت ایران

بخش اول وبینار عمومی "علم داده ها" توسط اینجانب و به همت انجمن علمی آمار ایران، انجمن علمی انفورماتیک ایران و دانشگاه تهران برگزار خواهدشد. این وبینار عمومی و به زبان ساده سعی می کند سوالات اصلی علم داده ها را در زمانی محدود پاسخ دهد

زمان: ساعت ۶ بعدازظهر به وقت ایران

هزینه: رایگان

گروه لیندکین جهت بحث و پرسش و پاسخ در مورد علم داده ها
https://www.linkedin.com/groups/12424311/

آدرس برگزاری وبینارها بر روی سرور دانشگاه تهران:
https://vclas9.ut.ac.ir/irstat

همچنین وبینار علم داده‌ها از طریق لینک زیر نیز به صورت اجرای زنده پخش خواهد شد
https://derak.live/stream/irstat

کانال تلگرام
🆔 @IASE_ISLP
پخش زنده وبینار ساعت 18 از آدرس
https://derak.live/stream/irstat
حضور بیش از ۵۰۰ نفر از دوستان در وبینار "علم داده ها" توسط سیستم دانشگاه تهران (۲۰۰ نفر)و فضای موازی آنلاین (۳۱۲ نفر)، باعث افتخار بنده بود. خوشحال می شم در این گروه لینکدین که در زیر آدرس آن داده شده نظر شما رو در رابطه با مباحث داشته باشم. در این گروه فیلم بخش هایی از وبینار به اشتراک گذاشته خواهد شد و در مورد آن بخش از "علم داده ها" صحبت خواهیم کرد.

https://www.linkedin.com/groups/12424311/
فیلم 10 دقیقه ای از بخش "علم داده ها و هوش مصنوعی" از وبینار امروز در لینک زیر آپلود شد تا برای شروع در گروهی در لینکدین مورد بحث و بررسی قرار بگیرد.
https://www.linkedin.com/groups/12424311

با این لینک می توانید فیلم را ببینید و در بحث شرکت کنید.
منتظر علاقه مندان هستیم
.
برای اطلاعات بیشتر به این کانال مراجعه کنید.
🆔 @IASE_ISLP
https://www.linkedin.com/groups/12424311/
دانلود فیلم وبینار
آدرس فیلم سخنرانی "علم داده ها" به زبان ساده در گروه لینکدین زیر در دسترس قرار گرفته است. علاقه مندان می توانند ضمن مشاهده و دانلود فیلم در مباحث گروه با موضوع "علم داده ها، مفاهیم و چالش ها" شرکت کنند
https://www.linkedin.com/groups/12424311/

در ضمن برای پیگیری اخبار مرتبط در تلگرام در کانال زیر عضو شوید.
🆔 @IASE_ISLP
فیلم وبینار علم داده ها برای دانلود در سایت انجمن علمی آمار ایران.
https://irstat.ir/files/site1/files/webinar/Ashofteh_Webinar_DataScience_Final.mp4
علم داده ها...
علم آمار، علم کامپیوتر، علم ...؟!

سلام و عرض ادب. در ادامه وبینار بنده تحت عنوان "علم داده ها" مباحثی مطرح و مورد بحث و بررسی توسط اساتید قرار گرفت. مخصوصا وبینار اخیر انجمن آمار با حضور سه تن از اساتید دلسوز و توانا و نظرات سازنده ای که ارایه دادند بسیار جالب توجه بود.
حضور برخی اساتید آگاه و دلسوز در ایران باعث امیدواری به آینده است.

در ادامه اجازه می خواهم نکاتی را متذکر شوم.

۱- تقریبا هشت سال از زمانی که با برخی دوستان حاضر در کنفرانس ها و همچنین انجمن آمار در این راستا صحبت می کردم گذشته است. در کنفرانس یزد به صورت حضوری با بسیاری از اساتید صحبت حضوری کردم و نتایج رو جمع بندی و در اختیار انجمن های کشوری مرتبط از جمله انجمن آمار گذاشتم. شاید بعضی دوستان یادشان باشد. آن زمان عضو هیات مدیره انجمن بودم.
چه شد که هشت سال گذشت؟
بدنه اجرایی علم آمار و کامپیوتر کشور چرا تا این زمان به فکر نبودند و کماکان برخی نیستند؟
اختلاف ها کجا است که هر کسی ساز خودش را کوک می کند؟

نکته اول: همدلی و دست برداشتن از تمامیت خواهی و به جمع اندیشیدن بجای منافع شخصی باید از طرف بزرگان کنونی دانشگاهی کشور پذیرفته شود تا مبنای تغییر مثبت شود.

۲- از سال ۲۰۱۴ تا کنون، نام دانشکده ما که علم داده را تدریس می کند دو مرتبه تغییر کرده. چرا می توان نام آن و رشته ها را تغییر داد؟ چون این دانشکده جدای گروه آمار و کامپیوتر و ریاضی است. آمار و علوم کامپیوتر و ... جایگاه خودشون رو در گسترش مبانی علمی و محض دارند و ادبیات و رویکرد ما متفاوت و علم داده ای است. هنوز در ایران متوجه نشده اند که این دو  ادبیات و رویکرد متفاوت اند. جمعی از دانشکده های مختلف می خواهند علم داده تدریس کنند!
این نمی شود.
لغات و رویکرد علم داده با مهندسی کامپیوتر متفاوت است با علم آمار متفاوت است با علوم کامپیوتر متفاوت است. یک دانشجوی کارشناسی ارشد علم داده نمی تواند سر یک کلاس با استاد کامپیوتر یک سری لغات بیاموزد در کلاس آمار لغات دیگر بشنود در کلاس یادگیری ماشین لغات دیگر!! بعد بگوییم این همان است، آن لغت همین است، این لغت همان است.
روش های پارامتری و ناپارامتری در آمار یک معنی دارد در علم داده ها معنی دیگر.  اریبی در امار یک معنی دارد در یادگیری ماشین معنی دیگر. نتیجه این می شود که فارغ التحصیل شما در ایران چند زبان را باید یاد بگیرد و در آخر وقتی می خواهد صحبت کند باید بگوید اریبی با مفهوم آماریش! اریبی با مفهوم علم داده ای اش! فقط تصور کنید چقدر گیج کننده می شود برای دانشجو.

پس نکته دوم: علم داده ها ساختاری جدا از آمار و کامپیوتر و ... در دانشگاه نیاز دارد. یک گروه یا دانشکده جدید با ساختار و اساتید مستقل.

۳- برخی بزرگان قبول زحمت کرده اند و تدریس علم داده ها را علیرغم مشغولیت زیاد در ایران پذیرفته اند.
اگر پاسخ دهند چطور یک مدل یادگیری ماشین را دیپلوی می کنند و فقط یکی از پلتفرم هایی که با آن کار کرده اند را بگویند من خودم شاگرد آنها خواهم شد! اگر یک چلنج کگل بنده رو قبول کنند و نتیجه رو بصورت عمومی اعلام کنیم نتیجه جالب توجه خواهد بود. حداقل در نشان دادن صلاحیت خودمان برای تدریس آن.
سال ها است یک چیزی بلدیم هرچه پیش می آید می گوییم این همان است که من بلدم! این هم نمی شود.
علم داده ها دانش آموخته خودش را می خواهد. استاد آن باید کارش و علمش، علم داده باشد. باید پروژه واقعی علم داده در صنعت و خدمات انجام داده باشد.
فهرست پروژه های علم داده ای اساتید ما کجا است؟ لطفا فهرست کنید.
ساختن یک داشبورد و تحلیل یک سری داده که علم داده نیست. (به فیلم وبینار علم داده در سایت انجمن مراجعه کنید.) اگر قرار باشد جمعی از اساتید دانشکده های مختلف جمع شوند و علم داده یاد بدهند مانند این است که ساخت یک بنز را به جمعی متخصص بسپاریم که یکی متخصص پیچ گوشتی است، یکی متخصص آچار است، یکی متخصص ...
اینها همه با هم جمع شوند حاصل کار یک خودرو نخواهد شد.

پس نکته سوم: استاد متخصص علم داده لازم است داشته باشیم که تحصیل کرده این رشته و دارای تجربه کاری این رشته باشد.
ادامه در پیام بعدی ...

🆔 آدرس کانال
@IASE_ISLP
... ادامه پست قبلی

۴- علم داده ها، بستر فن آوری پیشرفته می خواهد. چه برای یادگیری چه برای کار. آیا این بسترها را در کشور داریم؟ آیا  یک پلتفرم یادگیری ماشین در فضای کلود  داریم؟
در وبیناری، فردی پرسید نیاز بازار کار علم داده را سنجیده اید که رشته آن را گذاشتید؟ جواب اساتید این بود که بازار کار آن را که همه می دانند خوب است!
خوب است ولی کجا؟
چند پروژه علم داده در کشور را نام ببرید.
حجم کل آن چقدر است؟
تعداد فارغ التحصیلان بی کار چقدر است؟
البته بازار آموزش آن گرم است! بعد فارغ التحصیلان بروند علم داده درس بدهند! اگر اژدها نداریم درس اژدهاکشی بدهند . بقیه هم تا آن موقع رشته جدیدی آمده بروند آن را بیاموزند!
کاری که با علم آمار و ریاضی شد.  یک عده استاد شدند، یک عده به سختی در سازمانها استخدام شدند، بقیه بروند علم داده بیاموزند!
دقت کنیم نیاز یک رشته و علم اول باید در صنعت و بازار کار ایجاد شود. چرا می خواهیم یک سری جوان مستعد و کل آموزش عالی رو سرکار بزاریم. اگر حقوق ثابت استاد دانشگاهی نداشتیم و مجبور بودیم دانشکده را با درآمدزایی سرپا نگاه داریم باز هم همین برخورد را داشتیم؟

پس نکته چهارم: اساتیدی که می خواهند این رشته را تدریس کنند اول باید سخنرانی های زیاد برای صنعت و خدمات برگزار کنند و بازار بسازند. باید اول پروژه بگیرند انجام دهند تا هم آگاهی ایجاد شود هم ظرفیت. بعد جوانها رو در تحصیلات عالی به این سمت هدایت کنند تا بیکار نمانند.

جمع بندی: دانشکده مستقل علم داده با حضور اساتید متخصص علم داده با بازار کار فراهم شده لازم است تا بگوییم رشته علم داده را داریم راه اندازی می کنیم.

در این راستا متخصصین و اساتید علم آمار، ریاضی و کامپیوتر با تلاش جهت برطرف کردن کمبودهای خود، بازآموزی و انجام پروژه های مرتبط می توانند به خوبی زمینه ساز این حرکت باشند.

در غیراینصورت لغت جدیدی به ادبیات بی مفهوم خود اضافه و دیگران را بخاطر منافع شخصی خودمان و دانشگاه مان گمراه کرده ایم./ ارادتمند. افشین آشفته

🆔 آدرس کانال
@IASE_ISLP
Media is too big
VIEW IN TELEGRAM
"علم داده ها، چالش ها و راه کارها"
این بحث ادامه دارد. در صورت علاقه عضو کانال علم داده و سواد آماری شوید.
🆔 @IASE_ISLP

گروه لینکدین جهت تبادل نظر
https://www.linkedin.com/groups/12424311/
بحث و بررسی علم داده ادامه دارد.
تلگرام:
🆔 @IASE_ISLP

مشارکت در بحث در لینکدین:
🆔https://www.linkedin.com/groups/12424311/
📚علم داده و توسعه.
چرا علم داده مهم است؟

📕بخش اول:

《رشد و توسعه》 برای دستیابی به زندگی بهتر همیشه مورد توجه بشر بوده، برای اینکه که بتونه نیازهای مادی و معنوی خودش رو به بهترین نحو برای حال و آینده پاسخ بده.
بنابراین توجه به موضوعات پیچیده توسعه به نوعی موتور محرکه پیشرفت و تعالی انسان محسوب می شه. رشد و توسعه نیاز به آدم هایی داره که توانایی 《حل مسئله》💬 داشته باشن و علم داده یک روش حل مسئله قدرتمنده.
در گذشته های خیلی دور، میزان رشد و توسعه جوامع به توان فکری و عملیاتی افراد اون جامعه خیلی وابسته بود و مدت زمان زندگی آدم های موثر خیلی مهم بود. چون زمانی که عمر بزرگان، علامه ها، دانشمندان و نیروی کار با تجربه تموم می شد جامعه هم از خدماتشون بی بهره می شد و این یک ضایعه بزرگ برای جامعه بود.
بنابراین پایه توسعه، انسان ها بودند. انسان هایی با میزان هوش، قدرت حافظه و مهارت های فردی بالا و توانایی توجیه هرآنچه در دنیا اتفاق می افتاد. اینها معیار شناسایی آدم های بزرگ و قدرتمند بود. بنابراین هرکس بچه باهوش تر و با حافظه قویتر داشت مکتب خونه می فرستاد تا آدم بزرگی بشه🎓. علم عمدتا از مطالعه کتاب و درک محضر اساتید بزرگ آموخته می شد و بعدا این بچه ها هرآنچه آموخته بودند رو با تجربه شخصی ترکیب می کردند و به توانایی حل مسئله می رسیدند.
توانایی حل مسایل اجتماعی، اقتصادی، فردی و غیره به این افراد مقبولیت و اعتبار، و برای جامعه هم توسعه مداوم و پایدار به ارمغان می اورد.
تو این دوران شاهد توسعه ادبیات، توسعه منطق، فلسفه، علوم انسانی و تکثر افراد همه چیز دان بودیم. انسان یاد می گرفت که مسایل خودش رو روی کاغذ به زبان ریاضی و علم پیاده کنه و با قدرت ذهن و فکر سعی در حل مشکلات بکنه.

در حدود قرن بیستم عوامل تاثیر گذار در توسعه یافتگی یک مقدار تغییر پیدا کرد. هنوز میزان هوش و قدرت حافظه مهم بود ولی توانایی درک فرآیندهای واقعی دنیا که ثابت نبودند و بصورت تصادفی تغییر می کردند مهم شد.
توانایی درک 《احتمال و عدم قطعیت》.
انسان متوجه شد قوانین ریاضی به تنهایی قابلیت پاسخگویی به سوالات و حل همه مسایل رو نداره. اینکه بتونیم اتفاق هایی رو که شاهدش بودیم توجیه کنیم و بفهمیم الان چه اتفاقی برای ما داره می افته نیاز به درک عدم قطعیت و اتفاق های احتمالی و واقعی دنیا داشت. به همین خاطر علم، 《رویکرد احتمالی》🎲 رو به ریاضی برای درک و حل مسایل اضافه کرد. ولی اضافه شدن پارامتر احتمال و عدم قطعیت باعث پیچیده شدن مسایل و طولانی شدن زمان حل اونها و در برخی موارد حتی غیرممکن شدن درک مسئله هم شد.
بنابراین هوش و حافظه انسان به تنهایی پاسخگو نبود. اینجا بود که برای تقویت هوش و حافظه به 《توسعه کامپیوتر》💻 روی اورده شد. ابزاری که با ماشین حساب و کامپیوترهای بزرگ شروع شد و الان به گوشی موبایل و لپ تاپ رسیده.
افراد مسئله حل کن مثل دانشمندان، علما و افراد ماهر، به درک آزمایش های تصادفی، نمونه گیری و ترکیب علوم با علم کامپیوتر روی اوردند و به ارایه محصول و ارایه روش های جدید برای حل مشکل مردم پرداختند و به این ترتیب مقبولیت و اعتبار خودشون رو تو جامعه حفظ کردند و جامعه هم به خاطر رشد و زندگی بهتر ممنون علم و عالم بود.
در این زمان شاهد توسعه علم آمار و احتمال، علوم کامپیوتر، توسعه شرکت های بزرگ کامپیوتری با سرمایه گذاری های عظیم روی فناوری بودیم و کماکان هم هستیم.
کشورهای پیشرو بعد از گذر از این مرحله به پتانسیلی رسیدند که میزان رشد و شکوفایی رو به مسایل دیگری مربوط بکنن.
تو این کشورها، توسعه پایدار دیگه تنها به قدرت هوش و حافظه چند فرد شاخص در جامعه بستگی نداشت. حالا قدرت محاسباتی کامپیوترها و استفاده چند کامپیوتر بطور همزمان در پردازش موازی باعث افزایش توان انسان در رابطه با شاخص هوش شد. حافظه های کامپیوترها هم توسعه پیدا کردن و با قیمت کم در اختیار همه قرار گرفتن. دیگه لازم نبود کسی شماره تلفن ها رو حفظ کنه یا اطلاعات شرکتش رو بصورت فیزیکی توی یک بایگانی بزرگ برای استفاده های کاری نگهداری کنه. قدرت جستجوی اطلاعات توسط گوگل و دستیابی ساده و سریع به اطلاعات، مقدار زیادی از نیاز روزمره انسان ها رو به دریافت پاسخ حل کرد و تعداد افراد پاسخگو به سوالات و حل مسایل روزانه مردم کم شد. کیفیت حل مسایل هم بالا رفت.

این بحث ادامه دارد.
🆔 @IASE_ISLP
📚علم داده و توسعه.
چرا علم داده مهم است؟

📗بخش دوم:
نکته دیگه اینکه، این عادت جدید استفاده از کامپیوترها باعث تولید مقدار زیادی 🔸داده🔸 واقعی شد که با قدرت محاسباتی کامپیوتر و داده کاوی تبدیل به مدل های دقیقی برای حل مسایل مختلف شدند. الان دیگه مشکل مدل کردن اتفاق های واقعی و حل اونها مثل سیل و زلزله و سونومی و هوای آلوده و وضعیت اقتصادی نیست بلکه افزایش میزان دقت این مدل ها است و دانشمندان و متخصصین علم داده روی بالابردن توان این مدل ها و ارایه راهکارهای جدید کار می کنن.
در حال حاضر ما هم توانایی توجیه گذشته رو داریم، هم اون چیزی که الان داره اتفاق می افته و از همه مهمتر اون چیزی که احتمالا در آینده اتفاق خواهد افتاد. به این ترتیب، قدرت پیش بینی کردن آینده، نقطه عطفی در مدیریت، حل مسئله و ایجاد توسعه شد.
علم، رویکرد احتمال، عدم قطعیت و علوم کامپیوتر رو در کنار علوم دیگه گذاشت و علم داده ها رو متولد کرد.
شبکه های گسترده کامپیوتری، حجم وسیعی از داده ها رو در اختیار این موتور محرکه قوی قرار دادند و 🔸معجزه🔸 اتفاق افتاد.

علم داده ها به تولید دلیل و ارایه راهکار برای مشکلات پیش روی کسب و کارها کمک کرد. این باعث شد که متخصصین علم داده ها تونستند مسایل رو بهتر و سریعتر از گذشته حل کنن و همون داستان بهره مندی مردم و صاحبان کسب وکار از رشد و زندگی بهتر ادامه پیدا کنه.
در حال حاضر چیزی که مورد توجه قرار گرفته، توسعه مدل های پیش بینی و آینده پژوهیه. به قول پیتر دراکر "نتایج خوب از طریق بهره برداری از فرصت ها حاصل می شن" و این یعنی داشتن قابلیت پیش بینی.
برای این قضیه، در حال حاضر زیرساخت های داده و اکوسیستم بیگ دیتا مورد توجه قرار گرفته و حافظه و قدرت پردازش کامپیوترها به صورت روزانه داره بالا می ره. اینا باعث می شه علم داده ها توانایی حل مسایل بیشتری رو پیدا کنه.

🗯 نتیجه:
دلیل اینکه علم داده ها اینقدر مهم شده اینه که مسئله تنها یک علم جدید نیست بلکه پیشرفت پارادایم توسعه یافتگی بشره. می تونیم پیش بینی کنیم که از دانشمندان علم داده و فناوری های جدید در آینده همون طور صحبت بشه که در گذشته از علامه ها و دانشمندان و بزرگان تاریخ و دست آوردهای آنها.

این بحث ادامه دارد.
🆔 @IASE_ISLP