This media is not supported in your browser
VIEW IN TELEGRAM
تولید نما(View Synthesis) زمینهای تحقیقاتی است، در مورد تولید نماهایی تازه از یک منظره، با موجود داشتن تعدادی تصویر از آن.
در پستی از وبلاگ گوگل میخوانیم که چطور دو مدل مبتنی بر ترنسفورمر در این زمینه پیشرفت داشتهاند.
#Transformer #NLP
#Synthesis #Computer_Vision
@ml_nlp_cv
در پستی از وبلاگ گوگل میخوانیم که چطور دو مدل مبتنی بر ترنسفورمر در این زمینه پیشرفت داشتهاند.
#Transformer #NLP
#Synthesis #Computer_Vision
@ml_nlp_cv
Forwarded from انجمن علمی دانشکده مهندسی کامپیوتر
🔵 معاونت پژوهشی دانشکده مهندسی کامپیوتر به مناسبت هفتهی پژوهش سخنرانیهای علمی زیر را امروز برگزار میکند:
🔹مهندسی ثابتافزار و برخی از حوزههای فعالیت در آن
ساعت ۱۳ - ۱۳:۳۰
دکتر علیرضا اجلالی
🔹تطبیق نوری رشتههای DNA توسط پردازنده نوری
ساعت ۱۳:۳۰ - ۱۴
دکتر سمیه کوهی
🔹چالشهای حفظ حریم خصوصی در اینترنت اشیاء
ساعت ۱۴ - ۱۴:۳۰
دکتر مرتضی امینی
🔹حاکمیت بهینه برای خوشحالی جمعی در بازارهای شبکهای
ساعت ۱۴:۳۰ - ۱۵
دکتر محمدامین فضلی
🔹سوی تعمیمپذیری خارج از توزیع
ساعت ۱۵ - ۱۵:۳۰
دکتر مهدیه سلیمانی
🔹تحقیقات پردازش زبانهای ایرانی و علومانسانی محاسباتی به همراهی گزارشهایی از تجربه آموزش در حین
پژوهش و حل مسئله
ساعت ۱۵:۳ - ۱۶
دکتر احسانالدین عسگری
🔹تشخیص ناهنجاری نزدیک به توزیع در تصاویر
ساعت ۱۶ - ۱۶:۳۰
دکتر محمدحسین رهبان
تاریخ : چهارشنبه، ۳۰ آذر
لینک برگزاری: https://vc.sharif.edu/ch/ce-talks
چکیدهی ارائهها و اطلاعات بیشتر در فایل پیوست
〰️〰️〰️〰️〰️〰️〰️
🆔 @SSC_Public
🔹مهندسی ثابتافزار و برخی از حوزههای فعالیت در آن
ساعت ۱۳ - ۱۳:۳۰
دکتر علیرضا اجلالی
🔹تطبیق نوری رشتههای DNA توسط پردازنده نوری
ساعت ۱۳:۳۰ - ۱۴
دکتر سمیه کوهی
🔹چالشهای حفظ حریم خصوصی در اینترنت اشیاء
ساعت ۱۴ - ۱۴:۳۰
دکتر مرتضی امینی
🔹حاکمیت بهینه برای خوشحالی جمعی در بازارهای شبکهای
ساعت ۱۴:۳۰ - ۱۵
دکتر محمدامین فضلی
🔹سوی تعمیمپذیری خارج از توزیع
ساعت ۱۵ - ۱۵:۳۰
دکتر مهدیه سلیمانی
🔹تحقیقات پردازش زبانهای ایرانی و علومانسانی محاسباتی به همراهی گزارشهایی از تجربه آموزش در حین
پژوهش و حل مسئله
ساعت ۱۵:۳ - ۱۶
دکتر احسانالدین عسگری
🔹تشخیص ناهنجاری نزدیک به توزیع در تصاویر
ساعت ۱۶ - ۱۶:۳۰
دکتر محمدحسین رهبان
تاریخ : چهارشنبه، ۳۰ آذر
لینک برگزاری: https://vc.sharif.edu/ch/ce-talks
چکیدهی ارائهها و اطلاعات بیشتر در فایل پیوست
〰️〰️〰️〰️〰️〰️〰️
🆔 @SSC_Public
Forwarded from انجمن علمی دانشکده مهندسی کامپیوتر
CE-Talks.pdf
276.6 KB
Forwarded from زانکو (Javad Amirian)
کتابخانه PyTorch نسخه 2.0 معرفی شده و فعلا نسخهی unstable منتشر شده. به گفتهی Yann Lecun یکی از مهمترین تغییرات ارائه شده امکان کامپایل کردن شبکههاست که ادعا شده میتونه سرعت مدلها رو بین 38-76% افزایش بده.
www.linkedin.com/posts/yann-lecun_pytorchconference-activity-7004476955819470849-86ip
@zankoo_ai
www.linkedin.com/posts/yann-lecun_pytorchconference-activity-7004476955819470849-86ip
@zankoo_ai
Linkedin
Yann LeCun on LinkedIn: PyTorch 2.0 is announced!
Main new feature:
cmodel =… | 54 comments
Main new feature:
cmodel =… | 54 comments
PyTorch 2.0 is announced!
Main new feature:
cmodel = torch.compile(model)
Faster training with no code modification.
Available in nightly build.
Stable… | 54 comments on LinkedIn
Main new feature:
cmodel = torch.compile(model)
Faster training with no code modification.
Available in nightly build.
Stable… | 54 comments on LinkedIn
در مورد کاربردهای #gpt_3 بسیار گفتهایم. یکی دیگر از موارد استفاده کاربردی و جالباش را میتوانید اینجا ملاحظه کنید.
#nlp #nlu
@ml_nlp_cv
#nlp #nlu
@ml_nlp_cv
Forwarded from Meysam
There is a claim that #ChatGPT is capable of writing a code based on a text input
Why does it matter: it potentially can lower the barrier for programmers and allow more tools for efficient software development to emerge.
Source: tweet
#GPT_3 #NLU #NLP #codegeneration
@ml_nlp_cv
Why does it matter: it potentially can lower the barrier for programmers and allow more tools for efficient software development to emerge.
Source: tweet
#GPT_3 #NLU #NLP #codegeneration
@ml_nlp_cv
For your next Google search, use this ChatGPT Google Chrome Extension.
✅ Found this Chatgpt extension few days back while browsing extensions for Chrome. I have since installed it and used it for Google searches.
https://chrome.google.com/webstore/detail/chatgpt-for-google/jgjaeacdkonaoafenlfkkkmbaopkbilf/related
✅ Found this Chatgpt extension few days back while browsing extensions for Chrome. I have since installed it and used it for Google searches.
https://chrome.google.com/webstore/detail/chatgpt-for-google/jgjaeacdkonaoafenlfkkkmbaopkbilf/related
Google
ChatGPT for Google - Chrome Web Store
Display ChatGPT response alongside search engine results
Forwarded from زانکو (Javad Amirian)
ایده اخیر Geoffrey Hinton برای شبکههای عمیق و پیشنهاد جایگزین کردن الگوریتم Forward Forward به جای backpropagation
این ایده اولین بار در حین سخنرانی امسال ایشون در کنفرانس #NeurIPS2022 مطرح شد. احتمال داره FF انقلاب جدیدی در زمینه یادگیری عمیق ایجاد کنه. دسترسی به این مقاله در سایت دانشگاه تورنتو
ضمنا قبل از این سخنرانی و در همین دوره از کنفرانس، هینتون و شاگردانش جایزهی Test of Time (این جایزه به یک مقاله مربوط به 10 سال پیش تعلق میگیره که گذر زمان بازگوکننده تاثیرگذریاش بوده) را هم به خاطر مقاله معروفشون یعنی ImageNet دریافت کرده بودند.
@ml_nlp_cv
این ایده اولین بار در حین سخنرانی امسال ایشون در کنفرانس #NeurIPS2022 مطرح شد. احتمال داره FF انقلاب جدیدی در زمینه یادگیری عمیق ایجاد کنه. دسترسی به این مقاله در سایت دانشگاه تورنتو
ضمنا قبل از این سخنرانی و در همین دوره از کنفرانس، هینتون و شاگردانش جایزهی Test of Time (این جایزه به یک مقاله مربوط به 10 سال پیش تعلق میگیره که گذر زمان بازگوکننده تاثیرگذریاش بوده) را هم به خاطر مقاله معروفشون یعنی ImageNet دریافت کرده بودند.
@ml_nlp_cv
Forwarded from NLP stuff
یادگیری قلقهای ریسرچ هوش با کورس CS197 هاروارد
عموما اگر هم صنعت و هم آکادمی را تجربه کرده باشید این تفاوت را مشاهده کردهاید که به نظر فضای صنعت فضای سرراستتری است و روند آغاز تا انجام یک تسک یا پروژه بسیار شفافتر و آشناتر است تا روند اجرای یک پژوهش در آکادمی. به علاوه در فضای صنعت نیروها به علت پیشزمینه مهندسی که دارند آشنا به رعایت یکسری قواعد و الگووارههایی هستند، حال آن که این قواعد و الگوها در سمت ریسرچ به صورت مدونی وجود ندارد. حال آقای Rajpurkar استادیار دانشگاه هاروارد آمده و یک کتاب الکترونیکی از درسی که تحت عنوان "تجربیات پژوهشی هوش مصنوعی"در هاروارد ارائه کرده، منتشر کرده است. در این کتاب راجع به مباحثی همچون استفاده درست و موثر از python و pytorch و lightning و HF و streamlite و vscode و git و ... توضیحات خوبی داده شده است. اما این کل ماجرا نیست، بلکه کتاب در ادامه صحبت کرده که چگونه میتوان به صورت سیستماتیک مقالات را خواند، ایدههای جدید زد، یک مقاله را ساختاربندی و منتشر کرد و اسلایدهای باکیفیتی ساخت. اما باز هم این تمام ماجرا نیست و راجپورکار برایمان راجع به نحوه مدیریت زمان و انرژیمان و همچنین نحوه مدیریت تعاملاتمان با استاد راهنما و یا سایر اعضای تیم نیز توضیح داده است. این منبع عالی را از دست نباید داد.
لینک کتاب:
https://docs.google.com/document/d/1uvAbEhbgS_M-uDMTzmOWRlYxqCkogKRXdbKYYT98ooc
#link
#coach
#course
@nlp_stuff
عموما اگر هم صنعت و هم آکادمی را تجربه کرده باشید این تفاوت را مشاهده کردهاید که به نظر فضای صنعت فضای سرراستتری است و روند آغاز تا انجام یک تسک یا پروژه بسیار شفافتر و آشناتر است تا روند اجرای یک پژوهش در آکادمی. به علاوه در فضای صنعت نیروها به علت پیشزمینه مهندسی که دارند آشنا به رعایت یکسری قواعد و الگووارههایی هستند، حال آن که این قواعد و الگوها در سمت ریسرچ به صورت مدونی وجود ندارد. حال آقای Rajpurkar استادیار دانشگاه هاروارد آمده و یک کتاب الکترونیکی از درسی که تحت عنوان "تجربیات پژوهشی هوش مصنوعی"در هاروارد ارائه کرده، منتشر کرده است. در این کتاب راجع به مباحثی همچون استفاده درست و موثر از python و pytorch و lightning و HF و streamlite و vscode و git و ... توضیحات خوبی داده شده است. اما این کل ماجرا نیست، بلکه کتاب در ادامه صحبت کرده که چگونه میتوان به صورت سیستماتیک مقالات را خواند، ایدههای جدید زد، یک مقاله را ساختاربندی و منتشر کرد و اسلایدهای باکیفیتی ساخت. اما باز هم این تمام ماجرا نیست و راجپورکار برایمان راجع به نحوه مدیریت زمان و انرژیمان و همچنین نحوه مدیریت تعاملاتمان با استاد راهنما و یا سایر اعضای تیم نیز توضیح داده است. این منبع عالی را از دست نباید داد.
لینک کتاب:
https://docs.google.com/document/d/1uvAbEhbgS_M-uDMTzmOWRlYxqCkogKRXdbKYYT98ooc
#link
#coach
#course
@nlp_stuff
Google Docs
Harvard CS197: AI Research Experiences – The Course Book
The Course Book Harvard CS197 AI Research Experiences GPT-3 · Large Language Models · VSCode · Git · Conda · Debugging · Linting · Reading AI papers · Literature Search · Hugging Face · Lightning · Vision Transformer · PyTorch · Autograd · Experiment Organization…
Transformer models: an introduction and catalog
کاتالوگی ساده و کامل از مقایسه و طبقهبندی محبوبترین مدلهای ترنسفورمر
جدول: https://docs.google.com/spreadsheets/d/1ltyrAB6BL29cOv2fSpNQnnq2vbX8UrHl47d7FkIf6t4/
@ml_nlp_cv
کاتالوگی ساده و کامل از مقایسه و طبقهبندی محبوبترین مدلهای ترنسفورمر
جدول: https://docs.google.com/spreadsheets/d/1ltyrAB6BL29cOv2fSpNQnnq2vbX8UrHl47d7FkIf6t4/
@ml_nlp_cv
Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models
ChatGPT is a language interface with distinctive conversational competency and reasoning capabilities across many domains. However, it is currently unable to process or generate images from the visual world. To address this limitation, the authors propose a system called Visual ChatGPT that incorporates different Visual Foundation Models to enable users to interact with ChatGPT using both language and images. The system is capable of handling complex visual questions or instructions that require multiple AI models and steps. Additionally, it allows for feedback and corrections.
Rather than creating a new multimodal ChatGPT from scratch, the authors propose building Visual ChatGPT by incorporating various (22) Visual Foundation Models (VFMs) directly into ChatGPT. To facilitate the integration of these VFMs, the authors introduce a Prompt Manager that supports several functions. These include specifying the input-output formats of each VFM, converting visual information to language format, and managing the histories, priorities, and conflicts of different VFMs. With the Prompt Manager's help, ChatGPT can use these VFMs iteratively and receive their feedback until it satisfies the users' requirements or reaches the end condition.
Paper: https://arxiv.org/abs/2303.04671
Code link: https://github.com/microsoft/visual-chatgpt
A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-palme
@ml_nlp_cv
ChatGPT is a language interface with distinctive conversational competency and reasoning capabilities across many domains. However, it is currently unable to process or generate images from the visual world. To address this limitation, the authors propose a system called Visual ChatGPT that incorporates different Visual Foundation Models to enable users to interact with ChatGPT using both language and images. The system is capable of handling complex visual questions or instructions that require multiple AI models and steps. Additionally, it allows for feedback and corrections.
Rather than creating a new multimodal ChatGPT from scratch, the authors propose building Visual ChatGPT by incorporating various (22) Visual Foundation Models (VFMs) directly into ChatGPT. To facilitate the integration of these VFMs, the authors introduce a Prompt Manager that supports several functions. These include specifying the input-output formats of each VFM, converting visual information to language format, and managing the histories, priorities, and conflicts of different VFMs. With the Prompt Manager's help, ChatGPT can use these VFMs iteratively and receive their feedback until it satisfies the users' requirements or reaches the end condition.
Paper: https://arxiv.org/abs/2303.04671
Code link: https://github.com/microsoft/visual-chatgpt
A detailed unofficial overview of the paper: https://andlukyane.com/blog/paper-review-palme
@ml_nlp_cv
Count anything
An empirical study on few-shot counting using 'segment anything' (SAM)
Github: https://github.com/vision-intelligence-and-robots-group/count-anything
Paper: https://arxiv.org/abs/2304.10817v1
Hugging face: https://huggingface.co/spaces/nebula/counting-anything
Dataset: https://drive.google.com/file/d/1ymDYrGs9DSRicfZbSCDiOu0ikGDh5k6S/view?usp=sharing
@ml_nlp_cv
An empirical study on few-shot counting using 'segment anything' (SAM)
Github: https://github.com/vision-intelligence-and-robots-group/count-anything
Paper: https://arxiv.org/abs/2304.10817v1
Hugging face: https://huggingface.co/spaces/nebula/counting-anything
Dataset: https://drive.google.com/file/d/1ymDYrGs9DSRicfZbSCDiOu0ikGDh5k6S/view?usp=sharing
@ml_nlp_cv
کورس جدید دانشگاه استنفورد:
Stanford CS330: Deep Multi-Task and Meta Learning.
برنامه و محتوای کلاس در این لینک:
https://cs330.stanford.edu/
مشاهده ویدیوی جلسات برگزار شده
@ml_nlp_cv
Stanford CS330: Deep Multi-Task and Meta Learning.
برنامه و محتوای کلاس در این لینک:
https://cs330.stanford.edu/
مشاهده ویدیوی جلسات برگزار شده
@ml_nlp_cv
cs330.stanford.edu
CS 330 Deep Multi-Task and Meta Learning