Tensorflow(@CVision)
15.4K subscribers
1.29K photos
310 videos
81 files
2.53K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
https://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras
Download Telegram
#AGI
این واقع‌بینی François Chollet نسبت به #AGI باوجود اینکه خودش یکی از شناخته شده‌های یادگیری عمیقه خیلی جالبه.
بعضی ها با مشاهده پیشرفت های یادگیری عمیق خیلی تو خیال فرو رفتند! مدیران #OpenAI دقیقا نقطه مقابل هستند؛ از ایلان ماسک معروف گرفته تا ساموئل اچ التمن از اعضای هیات مدیره OpenAI که در این توئیت نقد chollet به این اظهارات را میبینیم که جالبه!

https://twitter.com/fchollet/status/1137788467591565312
#AGI
نقد chollet به اظهارات Sam Altman
در ارتباط با این پست،
تشبیه جالب François Chollet در پاسخ به اظهار نظر سم آلتمن، از اعضای هیئت مدیره اوپن ای‌آی!

فکر کن کلی هزینه کنی که یه پرینتر سه بعدی بسازی که همه چی پرینت کنه، بعد بگی سودم 100 درصد شده و هر چی تو دنیا بخوام برام پرینت سه بعدی میکنه 😁 ...

https://twitter.com/fchollet/status/1130296481745735680
کانال @unixmens کانالی برای ارتقا ساختار سازمانی و کارایی بالا بر مبنای تجارت و راهکار های متن باز و گنو/لینوکس می باشد ،این کانال کانالی در حوزه های مختلف IT است. کانال خود را به دیگران معرفی کنید .
PyTorch Hub!
Towards Reproducible Research with PyTorch Hub

https://pytorch.org/blog/towards-reproducible-research-with-pytorch-hub/
Forwarded from Python_Labs🐍 (Alireza Akhavan)
mamba is a drop-in replacement for conda.

just did: time conda/mamba install -yc bioconda mosdepth

with uninstall in between. 4.3 seconds for mamba, 31 for conda.

https://medium.com/@wolfv/mamba-development-news-29e32aaa8d6c
Tensorflow(@CVision)
PyTorch Hub! Towards Reproducible Research with PyTorch Hub https://pytorch.org/blog/towards-reproducible-research-with-pytorch-hub/
#خبر
در ادامه این خبر:
https://t.iss.one/cvision/1325
و معرفی این سایت:
https://t.iss.one/cvision/976
برای برخی از مقالات در سایت paperswithcode میتونید مستقیم به colab و pytorchhub برید...
https://paperswithcode.com/paper/bert-pre-training-of-deep-bidirectional
#مقاله
Object Discovery with a Copy-Pasting GAN
https://arxiv.org/pdf/1905.11369.pdf


#GAN
#مقاله #سورس_کد #مجموعه_داده

CVPR’19 paper on speech-to-gesture prediction. Given raw speech audio, predict arm/hand motion to go along with it. Check out video, or download 128 hours of video for 10 speakers
Learning Individual Styles of Conversational Gesture
https://people.eecs.berkeley.edu/~shiry/speech2gesture/

#CVPR2019
🙏Thanks to: @ArtificialIntelligenceArticles
#آموزش

چرا شبکه‌هایی مانند MobileNet بهینه و سریع هستند؟

Grouped convolution is a variant of convolution where the channels of the input feature map are grouped and convolution is performed independently for each grouped channels.

https://medium.com/@yu4u/why-mobilenet-and-its-variants-e-g-shufflenet-are-fast-1c7048b9618
#آموزش #pix2pix #GAN

همانطور که میدانید سایز وزودی شبکه U-Net در مدل pix2pix در مقاله آن به صورت 256x256 است. حالا اگر بخواهیم عکس هایی با سایز کوچکتر مثلا 32x32( مثلا در دیتاست Cifar10) به شبکه ورودی دهیم باید چه کنیم؟
یک راه ریسایز کردن عکس به سایز ورودی شبکه در هنگام فید کردن دیتا به شبکه است که این روش بسیار از لحاظ محاسباتی هزینه بر است.
راه دوم اصلاح معماری شبکه متناسب با سایز ورودی است و خب این راه به دلیل بزرگ بودن فضای مسئله و tricky بودن آموزش GANها کمی زمان بر است و ممکن است به بهترین جواب نرسیم.

جواب یکی از نویسندگان مقاله pix2pix به نحوه و منطق اصلاح معماری شبکه متناسب با سایز 32x32 :

Jun Yan Zhu:
"For the generator, you can remove the first two downsampling layers and their corresponding upsampling layers from defineG_unet_128. For the discriminator, remove one or two downsampling layers."

https://github.com/phillipi/pix2pix/issues/175


فیلم آموزش مربوط به این مبحث:
https://www.aparat.com/v/S9bcT
#مقاله

Text-based Editing of Talking-head Video

Editing talking-head video to change the speech content or to remove filler words is challenging.

Here is a method to edit talking head video based on its transcript to produce a realistic output video in which the dialogue of the speaker has been modified, while maintaining a seamless audio visual flow.

لینک مقاله:
https://www.ohadf.com/projects/text-based-editing/data/text-based-editing.pdf
لینک یوتیوب:
https://youtu.be/0ybLCfVeFL4
لینک مطالب تکمیلی:
https://drive.google.com/open?id=1iv9HHQ-Zd8BTMPsO7fq7op22cSEGSm37