Dataphile
2.97K subscribers
64 photos
7 videos
36 files
110 links
در این کانال مطالبی که دوست دارم رو قرار میدم و موضوع خاصی نداره. هر مطلبی دلم بخواد میذارم


https://twitter.com/vahidbaghi95
https://vahidbaghi.ir/blog
@VahidBaghi
Download Telegram
Forwarded from Clubhouse Dataset
Clubhouse_Dataset_v5.db
1.6 GB
This version of dataset (v5) contains 8,427,058 user profiles, as well as 8520 club information records.
https://www.kaggle.com/johntukey/clubhouse-dataset
2👏1
Clubhouse Dataset
Clubhouse_Dataset_v5.db
این آخرین نسخه دیتابیس کلاب هاوس است که دیگه آپدیتش نکردم
🔥3👍1
داستان دیتابیس کلاب هاوس رو توی مومنت زیر توضیح دادم 😁 :
https://twitter.com/i/events/1384567149872697348?s=20
👍4👏3
Live stream started
Live stream finished (1 hour)
Forwarded from Vahid
Media is too big
VIEW IN TELEGRAM
👍31
Vahid
Video
یکی از دوستان دیشب در مورد گرایش الگوریتم پرسیده بودند. این ویدئو معرفی گرایش الگوریتمه. کانال گرایش الگوریتم دانشگاه تهران :
https://t.iss.one/UTAlgorithms
This media is not supported in your browser
VIEW IN TELEGRAM
مصورسازی داده ها یکی از مهم ترین بخش های یک پروژه تحلیل دیتاست. ممکنه شما برای چند تا دیتاست مختلف ویژگی های آماری (میانگین، انحراف معیار، همبستگی و ... ) یکسانی رو محاسبه کنید ولی وقتی visualize می‌کنید ممکنه چند تا چیز کاملا متفاوت ببینید.

به عنوان مثال میشه به Anscombe's Quartet اشاره کرد که در سال 1973 میاد و 4 تا دیتاست معرفی می‌کنه که ویژگی های آماری کاملا یکسانی دارند ولی زمانی که مصورسازی می‌کنیم، می‌بینیم داده ها زمین تا آسمون با هم تفاوت دارند!

حالا مقاله زیر اومده و روشی رو ارائه کرده که بتونیم چنین دیتاست هایی رو تولید کنیم! یعنی دیتاست هایی که ویژگی های آماری یکسانی دارند ولی وقتی مصورسازی رو انجام می‌دیم، نتیجه کاملا متفاوتی رو مشاهده می‌کنیم
https://www.autodesk.com/research/publications/same-stats-different-graphs
👍11🥰1
واقعا ما به چند رقم بعد از اعشار عدد پی نیاز داریم؟
این سوالیه که از NASA-JPL پرسیده شده. به نظرتون جوابش چیه؟ ناسا میگه ما تا ۱۵ رقم بعد از اعشار رو استفاده می‌کنیم و به بیشترش نیاز نداریم. چرا؟ مثال میزنه. میگه شعاع جهان مرئی ۴۶ میلیارد سال نوری است.

برای اینکه محیط جهان مرئی رو با دقت برابر با قطر یک اتم هیدروژن محاسبه کنیم به چند رقم اعشار نیاز داریم؟ ۳۹ یا ۴۰ رقم اعشار!
بنابراین سوالی که هنوز جواب داده نشده اینه که چرا تا ۱ میلیارد رقم بعد از اعشار عدد پی رو محاسبه میکنن؟ (شوخی)
WTF?
https://www.jpl.nasa.gov/edu/news/2016/3/16/how-many-decimals-of-pi-do-we-really-need/
👍9😁4💩1
فیلم The Man Who Knew Infinity یک فیلم بریتانیایی در سبک درام و زندگینامه‌ای در سال ۲۰۱۵ است که بر اساس رمانی هندی به همین نام ساخته شده‌است و زندگی ریاضی‌دان هندی سرینیواسا رامانوجان می‌پردازد.
خیلی فیلم جذابیه. توصیه می‌کنم ببینید
Rotten Tomatoes : 63%
IMDb : 7.2
👍22
Dataphile
در این ویرگول قصد دارم یک سفر علمی-تفریحی به دنیای فرادرس داشته باشم و دیتای فرادرس رو بی‌خس کنم 😀 https://vrgl.ir/swEKH
لینک آموزش های فرادرس رو در https://web.archive.org جستجو کردم و هر چی در آرشیو بود رو استخراج کردم. نمودار بالا نشون میده در طول سالیان مختلف، قیمت آموزش ها چقدر تغییر کرده.
از این نمودار چی میشه فهمید؟
-اواسط سال ۲۰۱۵ قیمت همه آموزش ها یکدفعه به شکل یکنواختی کاهش پیدا میکنه و تا اواسط ۲۰۱۷ ثابت میمونه.
-تا اوایل سال ۲۰۲۱ قیمت ها با شیب خیلی ملایمی افزایش پیدا میکنن.
-دقیقا میانه سال ۲۰۲۱ یکدفعه قیمت ها با شیب تندی افزایش پیدا میکنن.
🔥15👍31
کمتر از نیم ساعت دیگه لایو رو شروع میکنم
https://discord.gg/8ZXq8kKKcX
👍15
Media is too big
VIEW IN TELEGRAM
ویدئو لایو دیشب
🙏3010👍7🥰3🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
🔞🎧
1/2
امروز ذهنم مشغول شده بود که kaggle یعنی چی؟ در این رشتو میخوام به این سوال پاسخ بدم. صوت و متن توییت رو بهتره با هم ببینید. اگر کلمه kaggle رو توی دیکشنری آکسفورد سرچ کنید، میگه کلا چنین کلمه ای نداریم!
کمی جستجو کردم و یه مصاحبه از موسس kaggle که متولد استرالیا هم هست پیدا کردم که به این سوال جواب داده بود. میگه با استفاده یک Phonetic algorithm یه لیستی از کلمات رو تولید کردم. بعد با همسرم لیست رو بررسی کردم و بالاخره kaggle رو انتخاب کردیم.
حالا Phonetic algorithm چیه و چیکار میکنه؟ اینجوریه که به ازای هر کلمه ای که بهش بدیم، یه کد تولید میکنه. حالا هدف چیه؟ اون کلماتی که تلفظ شبیه به هم دارند، کد یکسانی دارند و اینجوری میتونیم کلماتی که تلفظ مشابه دارند رو پیدا کنیم.
مثلا kaggle و haggle تلفظ شبیه به هم دارند. یکی از کاربرد های خاص این الگوریتم ها انتخاب نام شرکت و محصوله سایت های زیادی هم در همین راستا ساخته شدند که مثلا https://wordoid.com یکی از اونهاست. حالا در ادامه قضیه جالب تر هم میشه. با لهجه استرالیایی این کلمه کَگِل تلفظ میشه
👍231
2/2
اما آمریکایی ها این کلمه رو کِگِل (بر وزن bagel) تلفظ میکنن. حالا kegel چیه؟ روم به دیوار. kegel یه ورزشی برای تقویت عضلات کف لگن و اندام های تناسلیه. بعد میگه وقتی شرکت رو از استرالیا انتقال دادیم آمریکا این رو متوجه شدیم و به فاک رفتیم و همه مسخرمون میکردن.
https://twitter.com/vahidbaghi95/status/1427623911370469388
👍15