Tensorflow(@CVision)

Lumiere Google's multimodal AI video model لومیر یک مدل دیفیوژن متن به ویدیو است که توسط گوگل توسعه یافته. این مدل، برای ایجاد ویدیوهای واقع گرایانه و متنوع از توصیفات متنی کاربرد داشته و می توان از آن برای طیف گسترده ای از کاربردهای خلاقانه، از جمله فیلمسازی،…

1:54

Media is too big

VIEW IN TELEGRAM

LUMIERE

#lumiere

🔥11👍1

5.64K viewsrasoul, 10:32

Diffuse to Choose: Enriching Image Conditioned Inpainting in Latent Diffusion Models for Virtual Try-All

Project page: https://diffuse2choose.github.io/

👍8❤4

6.74K viewsAlireza Akhavan, 18:56

Tensorflow(@CVision)

سخنرانی اخیر جف هینتون در دانشگاه تورنتو که امروز منتشر شده.
عنوان سخنرانی:
Will digital intelligence replace biological intelligence?

https://www.youtube.com/watch?v=iHCeAotHZa4

👍18

5.77K viewsV, 15:59

Tensorflow(@CVision)

A decoder-only foundation model for time-series forecasting

مدل پایه ای (foundation model) فقط رمزگشا برای پیش بینی سری زمانی برای پیش بینی دقیق تر آینده، مدل جدیدی از هوش مصنوعی گوگل!

این مدل جدید هوش مصنوعی بدون نیاز به آموزش زیاد، پیش بینی های دقیقی از داده های جدید ارائه می دهد.

https://blog.research.google/2024/02/a-decoder-only-foundation-model-for.html?m=1

مدل‌های پایه ای یا foundation models از آنجایی که بر روی مجموعه داده‌های عظیم و متنوعی از پیش آموزش دیده‌اند به آنها دانش عمومی وسیعی می‌دهد که می‌توانند از آن برای پیش‌بینی داده‌های جدید بدون نیاز به آموزش اضافی استفاده کنند.

قبلا بیشتر تو زمینه متن و تصویر مقاله و مدل مشاهده میشد، این برای سری زمانیه!

research.google

A decoder-only foundation model for time-series forecasting

Posted by Rajat Sen and Yichen Zhou, Google Research Time-series forecasting is ubiquitous in various domains, such as retail, finance, manufacturi...

👌14👍5

5.42K viewsAlireza Akhavan, edited 03:47

Tensorflow(@CVision)

سخنرانی اخیر جف هینتون در دانشگاه تورنتو که امروز منتشر شده. عنوان سخنرانی: Will digital intelligence replace biological intelligence? https://www.youtube.com/watch?v=iHCeAotHZa4

https://x.com/tsarnick/status/1754439023551213845?s=46

#fun

👍6

4.36K viewsV, 16:55

Tensorflow(@CVision)

https://x.com/tsarnick/status/1754439023551213845?s=46 #fun

https://x.com/GaryMarcus/status/1754485544875417841?s=20

X (formerly Twitter)

Gary Marcus (@GaryMarcus) on X

Hinton is so wrong about this and so far behind the times that he doesn’t realize that @ylecun moved over to my side of this argument.

Tech bros don’t seem to realize that, either 🤷‍♂️

Given vast datasets, LLMs approximate well, but their understanding…

👍1😁1🤩1

4.54K viewsV, 17:22

Tensorflow(@CVision)

qualitative example of RRHF model

👍11

4K viewsAli B, 00:13

Tensorflow(@CVision)

Graph Convolutional Networks:
Unleashing the power of Deep Learning for Graph data

🗓زمان برگزاری (به صورت آنلاین): شنبه 28 بهمن ماه 1402
⏱ساعت 17:30 الی 19

📍آدرس اتاق مجازی: https://vc.sharif.edu/ch/cognitive

@irandeeplearning | @cvision

👍18❤2🔥1

5.3K viewsAlireza Akhavan, 13:31

Tensorflow(@CVision)

Physics-Encoded Graph Neural Networks for Deformation Prediction under Contact

https://mahdi-slh.github.io/DeformContact.html

#GNN #GCN #Graph

👍3

4.53K viewsAlireza Akhavan, 17:05

Tracking Any Point (TAP)
https://github.com/google-deepmind/tapnet

🖥Colab Demo:
Standard TAPIR | Online TAPIR | Rainbow Visualization

👍8

4.28K viewsAlireza Akhavan, edited 17:22

Tensorflow(@CVision)

تغییر نام هوش مصنوعی گوگل از «بارد» به
«جمینی»

هوش مصنوعی مکالمه‌ای بزرگ (LLM) گوگل که پیش‌تر با نام «بارد» شناخته می‌شد، از این پس با نام «جمینی» به فعالیت خود ادامه خواهد داد.
نام «جمینی» به معنی «دو قلو» است و به دو مدل زبانی قدرتمند LaMDA و PaLM اشاره دارد که این هوش مصنوعی بر پایه آنها ساخته شده است.
انتظار می‌رود با این تغییر نام، شاهد ارتقای توانایی‌های این هوش مصنوعی در زمینه‌های مختلفی مانند تولید متن‌های خلاقانه و جذاب، پاسخ به سوالات به صورت دقیق و آموزنده، ترجمه زبان‌ها به صورت روان و طبیعی و... باشیم.

همچنین در روز های آینده باید منتظر فعال شدن قابلیت خلق و تولید تصاویر با کمک مدل ImageFX این شرکت باشیم!

🔥18🙏1

4.27K views`Șίɴλ`, edited 14:53

Tensorflow(@CVision)

0:38

This media is not supported in your browser

VIEW IN TELEGRAM

ارتقای ویدئو ها به سطحی جدید با هوش مصنوعی

شبکه FMA-NET، یک شبکه عصبی عمیق مبتنی بر مکانیزم توجه است، که دنیای پردازش ویدئو را متحول می‌کند. این ابزار قدرتمند با سرعتی باورنکردنی و کیفیتی بی‌نظیر، ویدئوهای شما را ارتقا می‌دهد و به سطحی جدید از وضوح و شفافیت می‌برد.

شبکه FMA-NET چه مزایایی دارد؟

⚙ سرعت خیره‌کننده: FMA-NET با اتکا به هوش مصنوعی، ویدئوهای شما را در چشم به هم زدنی ارتقا می‌دهد و از این نظر، ابزاری بی‌نظیر محسوب می‌شود.

⚙ کیفیت بی‌مثال: FMA-NET با دقت و ظرافت بی‌نظیری، جزئیات تصاویر را مانند ادیتوری ماهر بازیابی می‌کند و
وضوحی کریستالی به آنها می‌بخشد.

⚙ رفع تاری: FMA-NET با قدرت جادویی خود، تاری ناشی از لرزش دوربین، حرکت، و کمبود نور را به طور کامل از بین می‌برد و ویدئوهایی شفاف و واضح به شما تحویل می‌دهد.

لینک گیت پروژه

👌11👍4❤1

5.42K views`Șίɴλ`, edited 15:25

Tensorflow(@CVision)

Forwarded from School of AI

This media is not supported in your browser

VIEW IN TELEGRAM

نسخه ۱ از TF-GNN (شبکه‌های عصبی گرافی در تنسورفلو) منتشر شد.

https://blog.tensorflow.org/2024/02/graph-neural-networks-in-tensorflow.html

👍7

4.11K viewsAlireza Akhavan, 15:38

Tensorflow(@CVision)

آیا واقعا مدل‌های هوش مصنوعی با گذشت زمان بدتر میشن؟

جمیز زو میگه مدل‌هایی مثل چت‌جی‌پی‌تی در طول زمان به مراتب بدتر میشن و عمدتا این به دلیل تعامل با انسان‌هاست.

https://youtu.be/bslcuhWVZ48?si=eXGwa-9vRwiZLJU0

مقاله:
https://arxiv.org/pdf/2307.09009.pdf

YouTube

James Zou: one of the most prolific and creative A.I. researchers in both life science and medicine

A podcast with James Zou, a Stanford computer scientist who is lighting it up in life science and medical A.I. Recent papers discussed in this podcast include degradation of GPT-4 performance, using large language models for peer review, and taking more than…

👍8😁6

5.47K viewsV, 12:26

Tensorflow(@CVision)

Forwarded from School of AI

This media is not supported in your browser

VIEW IN TELEGRAM

هوش مصنوعی گوگل (Bard) رسما به Gemini (نامی که برای خانواده‌ی مدل‌های مالتی‌مودال گوگل استفاده می‌شد) تغییرنام داد.

به‌علاوه، جدیدترین و قدرت‌مند‌ترین مدل این خانواده (Ultra 1.0) نیز از طریق محصول Gemini Advanced با هزینه‌ی ماهیانه ۲۰ دلار (۲ ماه نخست رایگان) در دسترس قرار گرفت.

همچنین، یک اپ اندرویدی نیز برای دسترسی ساده‌تر به Gemini منتشر شده‌ست.

سایت جدید:
https://gemini.google.com/

اپ اندرویدی:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard

ویدئوی معرفی:
https://youtu.be/b5Fh7TaTkEU?si=JEgqtIcffBABczsp

بلاگ‌پست معرفی:
https://blog.google/products/gemini/bard-gemini-advanced-app/

تکنیکال ریپورت مدل‌های Gemini:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

👍8❤3

5.72K viewsAlireza Akhavan, 10:36

Tensorflow(@CVision)

ضبط و تدوین دوره جدید "جامع دیپ لرنینگ" با سطح مقدماتی و متوسط بعد از چند ماه تلاش تمام شده است. ان شاء الله دوره بعد اصلاح خطاهای تدوینی به زودی تا ۱۵ روز پیش رو روی سایت برای فروش قرار خواهد گرفت این دوره نزدیک ۴۰ ساعت و در ۹ فصل ضبط شده است

شکر خدا کارهای دوره جدید به پایان رسیده و پس از آپلود فایلها روی سایت قرار میگیرد.
لینک دوره و جزئیات بیشتر اطلاع رسانی میگردد

❤24🔥4👏4👍2😱1

4.72K viewsAlireza Akhavan, edited 21:18

Tensorflow(@CVision)

Forwarded from School of AI

شرکت Nvidia یک نرم‌افزار چت‌بات قابل نصب برروی Windows 11، موسوم به NVIDIA Chat with RTX ارائه کرده که از محتوای فایل‌های داخل رایانه، برای RAG استفاده می‌کند. به عبارت دیگر پاسخ پرسش‌های شما را با بررسی فایل‌هایی که به‌ش معرفی می‌کنید می‌دهد.
این چت‌بات برای اجرا نیاز به واحد گرافیکی GeForce RTX دارد.

https://youtu.be/gdsRJZT3IJw

YouTube

Create A Personalized AI Chatbot with Chat With RTX

Create a personalized chatbot with the Chat with RTX tech demo. Accelerated by TensorRT-LLM and Tensor Cores, you can quickly get tailored info from your files and content. Just connect your data to an LLM on RTX-Powered PCs for local, fast, generative AI.…

🔥10👍2🤯1

4.48K viewsAlireza Akhavan, 16:06

Tensorflow(@CVision)

https://blog.roboflow.com/what-is-yolo-world/

Roboflow Blog

YOLO-World: Real-Time, Zero-Shot Object Detection

YOLO-World is a zero-shot, real-time object detection model.

🔥4

4.31K viewsAlireza Akhavan, 09:52

Tensorflow(@CVision)

Forwarded from School of AI

دیشب ساعت ۹ تصویر Yann LeCun دانشمند برجسته‌ی هوش مصنوعی بر روی برج خلیفه‌ی دوبی نقش بست.

لازم‌به‌ذکر است که ایشان در حال حاضر برای شرکت در نشست دولت جهانی (World Government Summit) در امارات متحده‌ی عربی حضور دارند.

👍18

3.67K viewsAlireza Akhavan, 15:15

Tensorflow(@CVision)

Forwarded from School of AI

شرکت Ultralytics مدل بنیادین YOLO-World که یک OVD یا Open-Vocabulary Detector است، را معرفی کرد.

این مدل، مبتنی بر YOLOv8 است و نیاز به کلاس‌های از پیش تعریف شده برای تشخیص ندارد، بلکه می‌تواند به‌صورت Zero-shot این کلاس‌ها را درقالب یک پرامپت متنی، هنگام inference دریافت کرده و در تصویر پیدا کند. مثلا در ورودی به آن می‌گویید: “حیوان جونده‌ی کوچک به رنگ سفید که نامش موش است را پیدا کن”

این مدل در مقایسه با مدل بنیادین فیس‌بوک (SAM) بسیار ساده‌تر است و بنابراین می‌توان به راحتی از آن برای اپلیکیشن‌های real-time استفاده کرد.

استفاده از این مدل به‌سادگی استفاده از Ultralytics YOLOv8 است.

https://docs.ultralytics.com/models/yolo-world/

👍8🔥4🤯2❤1

4K viewsAlireza Akhavan, 15:15

Tensorflow(@CVision)

مدل متن به ویدیو OpenAI معرفی شد!
این مدل که اسمش Sora هست میتونه ویدیو‌هایی به طول یک دقیقه تولید کنه!

https://openai.com/sora

https://x.com/sama/status/1758193609927721350?s=46

https://x.com/model_mechanic/status/1758196079663988823?s=46

https://x.com/gdb/status/1758193811489243408?s=46

https://x.com/mkbhd/status/1758200479224410420?s=46

https://x.com/sama/status/1758218820542763012?s=46

Openai

Sora

Turn your ideas into videos with hyperreal motion and sound.

❤6👍4

8.96K views(◕‿◕), 21:03