Tensorflow(@CVision)
14.8K subscribers
1.26K photos
294 videos
80 files
2.46K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت دوره
https://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support
Download Telegram
پروژه ترسناک MIT : مطالعه ی کتابهای بسته!

Judging a book through its cover

از اهداف این پروژه تحقیقاتی ؛ مطالعه محتوای کتابهای خیلی قدیمی و محافظت از آنها است.
در حال حاضر با ارسال اشعه های x-ray و امواج رادیویی از بالای جلد کتاب بسته, موفق به خواندن 9 صفحه ی نخست کتابها شده اند...

لینک+فیلم:
https://news.mit.edu/2016/computational-imaging-method-reads-closed-books-0909

#خبر #mit
Mask R-CNN
https://arxiv.org/abs/1703.06870

detects objects in an image while simultaneously
generating a high-quality #segmentation mask for each instance.
#CNN #Convolutional #deep_learning
Integrating Object Detection Networks for Event Recognition
https://arxiv.org/abs/1703.07431
#CNN #Event_Recognition #deep_learning
جالبه! عکسی را آپلود کنید و سپس در مورد این تصویر از کامپیوتر سوال بپرسید:
Online #Visual_Dialog demo:

https://demo.visualdialog.org/

#CVPR_2017 #NLP #VQA #deep_learning
ACLU: Police used Twitter, Facebook to track protests

بنابر گزارش اتحادیه آزادیهای مدنی آمریکا ACLU ، مقامات پلیس آمریکا برای شناسایی و تعقیب تظاهرکنندگان معترض در مناطق آشوبزده از اطلاعات و داده های کاربران در شبکه های اجتماعی استفاده کرده اند.

🔗 https://www.usatoday.com/story/tech/news/2016/10/11/aclu-police-used-twitter-facebook-data-track-protesters-baltimore-ferguson/91897034/

🔗 https://www.aclunc.org/blog/facebook-instagram-and-twitter-provided-data-access-surveillance-product-marketed-target

Geofeedia used the company’s APIs to create real-time maps of social media activity in protest areas, maps which were subsequently used to identify, and in some cases arrest, protestors shortly after their posts became public. All three services have
Tensorflow(@CVision)
VQABQ: Visual Question Answering by Basic Questions 🔗 https://arxiv.org/abs/1703.06492 #VQA #deep_learning #computer_vision #NLP #Image_captioning #GRU #LSTM #CNN
مرتبط با مقاله: https://t.iss.one/cvision/198

نمونه سوالات:
i. طبقه بندی صحنه: آیا این یک روز بارانی است؟
ii. بازشناسی شیء: چه چیزی بر روی میز است.
iii. طبقه بندی ویژگی: زمین چه رنگی است؟
iv. شمارش: چند نفر در اتاق هستند؟
v. تشخیص شی: آیا سیبی در تصویر وجود دارد؟
vi. تشخیص فعالیت: مرد در حال انجام چه نوع ورزشی است ؟

مقالات مشابه:
https://t.iss.one/cvision/196

#VQA #deep_learning #computer_vision #NLP #Image_captioning
#GRU #LSTM #CNN
🌺🌺🌺🌺
میلاد با سعادت امام زمان مبارک باد
🌺🌺🌺🌺
صبحی گره از زمانه وا خواهد شد
راز شب تار بر ملا خواهد شد
در راه، عزیزی‌ست که با آمدنش
هر قطب‌نما،قبله‌نما خواهد شد

(میلاد عرفان پور)
#خبر #خبر_عمومی
pic: https://bit.ly/2pJvMSY
حل مشکل مصرف بیش از حد #دستمال_توالت در چین با الگوریتم #بازشناسی_چهره!🚽

کاسه ی صبر چینی ها از مواجه با رول های خالی دستمال توالت به دلیل مصرف بی رویه و یا دزدیده شدن آن‌ها لب‌ریز شده بود!
به همین دلیل در نهایت برای حل این مشکل دست به تولید دستگاه های هوشمند با استفاده از هوش مصنوعی و الگوریتم های بازشناسی چهره زدند!

در این روش در هر بار درخواست، چهره ی فرد #اسکن شده و سپس قطعه دستمالی به طول 60 سانتیمتر توسط دستگاه به وی داده میشود. دستگاه تصویر چهره فرد را برای 9 دقیقه ذخیره میکند و در طول این 9 دقیقه با استفاده از تطبیق چهره از ارائه مجدد دستمال به فرد خود داری میکند!!!

🔗 https://www.cbc.ca/news/technology/china-facial-recognition-toilet-paper-1.4052888
#Camera_Relocalization #PoseNet
pic:https://bit.ly/2rBqhaR

استنتاج این که شما الان کجا هستید؛ برای ربات‌های متحرک، ناوبری و واقعیت افزوده بسیار مهم است. این روش برای رفع مشکل رباتهای گم شده یا دزدیده شده معرفی شده است.
در این پروژه با تنها داشتن یک تصویر رنگی از محیط, تا 6 درجه و 2 متر، که در محیط های باز معادل 50.000 متر مربع است تصویر دیگر از آن محیط را می‌توان تخمین زد.
در پیاده سازی انجام شده توسط محققان دانشگاه کمبریج؛ تنها با آپلود یک تصویر, و استفاده از این الگوریتم, محل آن تصویر بر روی نقشه را یافته و مکان تصویر را بر روی نقشه پیدا می‌کند.

🔗 دموی آنلاین این پیاد سازی:
https://mi.eng.cam.ac.uk/projects/relocalisation/
🔗 سورس کد با فریم ورک #Caffe
https://github.com/alexgkendall/caffe-posenet

🔗 مقاله مربوط به این پیاده سازی:
https://arxiv.org/abs/1505.07427

#CNN #Deep_Learning #relocalization
پیش بینی صحنه‌ی بعدی فیلم
( میتواند برای سانسور خودکار فیلم در پخش زنده استفاده شود)

Anticipating Visual Representations with Unlabeled Video
https://web.mit.edu/vondrick/prediction/

#CNN
Generating Videos with Scene Dynamics
video: https://bit.ly/2q6THM9

تبدیل تصویر به فیلم.
هوش مصنوعی ای که قادر است تنها با یک تصویر ثابت، فیلم چند ثانیه ای حاوی حرکت خروجی دهد...

در این روش به صورت بدون ناظر دو سال ویدیوی جمع آوری از فلیکر به شبکه آموزش داده شده است، سپس شبکه توانسته که نگاشتی از تصاویر به فیلم های چند ثانیه ای ایجاد کند.

🔗 https://web.mit.edu/vondrick/tinyvideo/

#generative #adversarial #GAN #deep_learning
بهره گیری از کتابخانه قدرتمند یادگیری ماشین #تنسرفلو در نسخه جدید #اندروید
img: https://bit.ly/2r8BeDM

گوگل در جریان کنفرانس I/O 2017، از ویژگی‌های سیستم عامل #اندروید O رونمایی کرد.
...
#تنسورفلو_لایت

قابلیت نوآورانه‌ی #تنسورفلو لایت، نسخه‌ی ویژه‌ای از کتابخانه‌ی یادگیری ماشین منبع باز TensorFlow است که به سریع‌تر بودن و جای‌گیری کمتر نرم‌افزارها کمک خواهد کرد. در حقیقت شرکت گوگل با استفاده از کتابخانه‌ی یادگیری ماشین تنسورفلو لایت، هوش مصنوعی را به گوشی هوشمند هر کاربر خواهد آورد. شرکت گوگل در حال توسعه‌ی API #شبکه‌ی_عصبی جدیدی است که تنسورفلو لایت می‌تواند با بهره‌گیری از مزایای آن باعث شتاب دادن به پردازش‌ها و محاسبات شود.

https://www.zoomit.ir/2017/5/19/156625/android-o-new-features-overview/

https://techcrunch.com/2017/05/17/googles-tensorflow-lite-brings-machine-learning-to-android-devices/
هوش مصنوعی ای که تشخیص میدهد به کجا نگاه میکنید!

Where are they looking?

online demo:
https://gazefollow.csail.mit.edu/demo.html

#NIPS_2015 #GazeFollow #Deep_learning #CNN
#convolutional
This media is not supported in your browser
VIEW IN TELEGRAM
Following Gaze Across Views

🔗 https://web.mit.edu/vondrick/videogaze.pdf

Given one view with a person in it and
a second view of the scene, our model estimates a density for #gaze location...