مهندسی داده
793 subscribers
112 photos
7 videos
24 files
315 links
BigData.ir کانال رسمی وب سایت
مطالبی راجع به مهندسی داده و طراحی زیرساخت‌های پردازش دیتا و ابزارهای مدرن دیتا
ارتباط با ادمین: @smbanaei
گروه تخصصی مهندسی داده 👇
https://t.iss.one/bigdata_ir_discussions2
کانال یوتیوب 👇
https://www.youtube.com/@irbigdata
Download Telegram
Forwarded from Mohammad Reza
💰 مشاغل: #مهندسـداده
🕰 مدل همکاری: #هم_بنیانگذار
📍⁣⁣ استان: #تهران


◀️ نام #استارتاپ: #سوشیالو

💭 درباره استارتاپ:
سوشیالو پلتفرم #تحلیل و مدیریت #شبکه_های_اجتماعی است و به جمع آوری و بررسی اطلاعات شبکه های اجتماعی در جهت اهداف دیجیتال مارکتینگ مشغول است
socialo.net

⚖️ شرایط:
- آشنایی با #python
- آشنایی #mongodb
- آشنایی elasticsearch#
- داشتن روحیه کارگروهی


💵 مزایا:
- #قابلیت_فعالیت_بصورت_هم_بنیانگذار
- شرایط #قابل_مذاکره
- حضور در محیط پویا و فعال کارآفرینی
- امکان فعالیت به صورت پاره وقت و دورکاری



☎️ اطلاعات تماس:
@mr_asg
09364232989
[email protected]
یادگیری عمیق بدون درد و خونریزی با لودویگ - https://is.gd/DVrYHc
ابزار و کتابخانه ها
, #اوبر, #پردازش_تصویر, #پردازش_زبان_طبیعی, #پردازش_متن, #لودویگ, #یادگیری_عمیق
در این نوشتار به بررسی کتابخانه جدید لودویگ که محصول تیم هوش مصنوعی شرکت اوبر است می‌پردازیم و می‌بینیم که چگونه می‌توان بدون یک خط کدنویسی، مدل‌های پیش‌گویی کننده حرفه‌ای به کمک یادگیری عمیق ساخت و از آنها در کاربردهای واقعی استفاده کرد.
دست به کد: تحلیل احساسی نظرات کاربران درباره یک فیلم - https://www.bigdata.ir/1396/04/%d8%aa%d8%ad%d9%84%db%8c%d9%84-%d8%a7%d8%ad%d8%b3%d8%a7%d8%b3%d8%a7%d8%aa-%d9%85%d8%af%d9%84%d8%b3%d8%a7%d8%b2%db%8c-%d8%b5%d9%86%d8%af%d9%88%d9%82%da%86%d9%87-%da%a9%d9%84%d9%85%d8%a7%d8%aa/
پردازش زبان طبیعی, دست به کد
, #NLP, #ScikitLearn, #Sentiment_Analysis, #Word2Vec, #بردار_ویژگی, #پردازش_متن, #تحلیل_احساس, #جنگل_تصادفی, #دست_به_کد, #دسته_بندی, #سنجش_احساسات, #عددی_سازی, #کگل, #مثال_کاربردی, #یادگیری_ماشین
در بخش اول از مجموعه مقالات آموزشی پردازش متن، با مفاهیم پایه متن کاوی و همچنین کتابخانه فارسی هضم برای کار با متون فارسی آشنا شدید. در ادامه این سری آموزشی با بررسی یکی از مسابقات پردازش متن سایت معروف کگل، به صورت عملی با جنبه های نوین این شاخه از علم داده و تحلیل …
آشنایی با استاندارد داده های مرتب (Tidy Data) - https://is.gd/Fot3Q7
پاکسازی و آماده سازی
, #استانداردهای_داده, #پاکسازی_داده, #پیش_پردازش_داده, #پیش_پردازش_داده_ها
اولین مرحله از کار با داده‌ها، پیش‌پردازش و آماده‌سازی داده‌هاست. این مرحله که زمان اصلی پردازش داده‌ها را به خود اختصاص می‌دهد تاثیر مهم و مستقیمی در کیفیت نتایج حاصل از تحلیل داده‌ها خواهد داشت. در این مقاله که به قلم محمد چناریان نخعی نگاشته شده است با استاندارد داده‌های مرتب یا Tidy Data آشنا می‌شویم
علم‌داده : جذاب‌ترین حوزه کاری در سال ۲۰۱۹ به انتخاب careercast - https://is.gd/5AIVbT
اخبار
, #آمار_و_احتمال, #علم_داده
سایت معتبر کاریابی careercast به عادت هر ساله، گزارش امتیازدهی مشاغل خود را منتشر کرده است که برای اولین بار، علم داده در این سایت بالاترین امتیاز را به خود اختصاص داده است و جذاب‌ترین شغل سال جاری معرفی شده است.
آشنایی با استاندارد داده‌های باز - https://is.gd/T83TAZ
ابزار و کتابخانه ها, استانداردها
, #استاندارد, #استانداردهای_داده, #داده_های_باز
حرکت به سمت یک جامعه پیشرو و توسعه‌یافته به ابزارهای مختلفی نیاز دارد که یکی از مهم‌ترین آنها، شفافیت داده‌ها و آمار در حوزه‌های مختلف کشور است که به کمک آن، دانشمندان و برنامه‌ریزان بتوانند با پایش و تحلیل درست این داده‌ها، راهکارهایی مناسب در حذف گلوگاه‌ها و شناسایی نقاط ضعف و قوت جامعه، ارائه دهند. در این راستا، استاندارد داده‌های باز در جهت گسترش فرهنگ به اشتراک گذاری داده‌ها توسط سازمانها و شرکتها، چندین سال است که در دنیای داده، رایج شده است. در این مقاله که توسط دکتر فرزاد مینویی در سایت وزین آنالیکا منتشر شده است، به بررسی این استاندارد می‌پردازیم.
دست به کد: جمع‌آوری خودکار توئیت‌های فارسی با استفاده از GitLab CI - https://is.gd/S7zPld
پردازش زبان طبیعی, دست به کد
, #پردازش_متون_فارسی, #توئیت, #توئیتر, #دست_به_کد, #گیت_لب, #گیت_هاب
در ادامه مباحث جمع آوری و پردازش توئیت‌های فارسی، به عنوان یک منبع عالی برای پردازش متن، در این مقاله قصد داریم به ایجاد یک خط تولید ساده جمع‌آوری توئیت بپردازیم که روزانه و بدون پرداخت هیچ هزینه‌ای، به جمع آوری توئیت‌های فارسی بپردازد. این خط تولید را با امکانات گیت‌لب راه‌اندازی می‌کنیم و توئیت‌های جمع‌آوری شده را روزانه در یک مخزن عمومی در گیت‌هاب به اشتراک می‌گذاریم.
آیا هدوپ در حال انقراض است؟ - https://is.gd/O3eGKB
اخبار
,
در این مقاله، به بررسی این موضوع میپردازیم که چرا امروزه به نظر می رسد هدوپ دیگر کارآیی گذشته را ندارد و باهم دلایل رواج این باور را بررسی کرده و سعی می کنیم حقیقت ماجرا و اینکه امروزه دنیای کلان‌داده به کدامین سمت در حال حرکت است را بفهمیم.
چگونه یک میلیون درخواست در ثانیه را با پایتون پاسخ دهیم ؟ - https://is.gd/BxsiZD
ابزار و کتابخانه ها
, #پایتون
در این نوشتار برای آنهایی که قصد دارند بخشی از کارهای یادگیری ماشین خود را از طریق وب سرویس به کاربران ارائه کنند، یک میکروفریمورک پایتون با نام Japronto معرفی شده است که طبق ادعای سازندگان آن، کارآیی آن بسیار بالاتر از سایر فریمورک‌ها و زبان‌های موجود در بازار است.
ساختاری استاندارد برای پروژه‌های علم داده - https://is.gd/wm17AC
ابزار و کتابخانه ها
, #ابزارهای_پایتون, #استاندارد, #پایتون, #پروژه_های_مهندسی_داده, #پروژه_های_علم_داده
پروژه‌های علم داده در سراسر دنیا ساختاری مشابه دارد و اگر با دقت به آنها نگاه کنید،‌ مولفه های زیر را در اکثر قریب به اتفاق آنها خواهید دید : داده‌‌ها . این داده‌ها معمولاً به داده‌های خام، داده‌های تست، داده‌های آموزش و مانند آن تقسیم می شوند. کتابچه‌ها : استفاده از Jupyrt Notebooks هم …
خیلی از تیم‌ها و استارتاپ‌ها با MySQL‌ شروع می‌کنند و به مرور زمان و با افزایش تعداد درخواست‌ها و داده‌ها با MySQL دچار چالش می‌شوندو مهاجرت از این دیتابیس و امتحان گزینه‌های دیگر، هزینه زیادی برای این شرکت‌ها دارد.
با توجه به اینکه یوتیوب بخش بزرگی از خدماتش از این دیتابیس محبوب یعنی MySQL سرویس دهی می شود در این نوشتار با معرفی وایتس به راز مقیاس پذیری مای اسکیوال در این بستر آنلاین اشتراک فیلم می پردازیم .
https://plink.ir/ofrHc
ویژوال استودیو کد، عنوان محبوبترین محیط برنامه نویسی را در سال 2019 از آن خود کرده است(در نظرسنجی استک اورفلو) چندی پیش افزونه پایتون این محیط برنامه نویسی پشتیبانی از کتابچه های پایتون یا همان IPython Notebooks را به مجموعه امکانات خود اضافه کرد.
یعنی امروزه می توانید این کتابچه ها مستقیما درون این محیط ایجاد کرده ، آنها را ویرایش نموده و نهایتاً خروجی آنها را در همان محیط مشاهده کنید.
تجمیع کتابچه های پایتون با یک محیط برنامه نویسی قدرتمند امکانات متنوعی را در اختیار ما می گذارد مانند مشاهده سریع متغیرها و مقادیر لحظه ای آن، اشکالزدایی حرفه ای، تلفیق با گیت . مجموعه این عوامل باعث می شود ویژوال استودیو کد را محیطی بسیار مناسب برای انجام پروژه های علم داده بیابیم. با هم این امکانات را مرور می کنیم .
yun.ir/jw5