Tensorflow(@CVision)
Lumiere Google's multimodal AI video model لومیر یک مدل دیفیوژن متن به ویدیو است که توسط گوگل توسعه یافته. این مدل، برای ایجاد ویدیوهای واقع گرایانه و متنوع از توصیفات متنی کاربرد داشته و می توان از آن برای طیف گسترده ای از کاربردهای خلاقانه، از جمله فیلمسازی،…
Media is too big
VIEW IN TELEGRAM
🔥11👍1
Media is too big
VIEW IN TELEGRAM
Diffuse to Choose: Enriching Image Conditioned Inpainting in Latent Diffusion Models for Virtual Try-All
Project page: https://diffuse2choose.github.io/
Project page: https://diffuse2choose.github.io/
👍8❤4
سخنرانی اخیر جف هینتون در دانشگاه تورنتو که امروز منتشر شده.
عنوان سخنرانی:
Will digital intelligence replace biological intelligence?
https://www.youtube.com/watch?v=iHCeAotHZa4
عنوان سخنرانی:
Will digital intelligence replace biological intelligence?
https://www.youtube.com/watch?v=iHCeAotHZa4
👍18
A decoder-only foundation model for time-series forecasting
مدل پایه ای (foundation model) فقط رمزگشا برای پیش بینی سری زمانی برای پیش بینی دقیق تر آینده، مدل جدیدی از هوش مصنوعی گوگل!
این مدل جدید هوش مصنوعی بدون نیاز به آموزش زیاد، پیش بینی های دقیقی از داده های جدید ارائه می دهد.
https://blog.research.google/2024/02/a-decoder-only-foundation-model-for.html?m=1
مدلهای پایه ای یا foundation models از آنجایی که بر روی مجموعه دادههای عظیم و متنوعی از پیش آموزش دیدهاند به آنها دانش عمومی وسیعی میدهد که میتوانند از آن برای پیشبینی دادههای جدید بدون نیاز به آموزش اضافی استفاده کنند.
قبلا بیشتر تو زمینه متن و تصویر مقاله و مدل مشاهده میشد، این برای سری زمانیه!
مدل پایه ای (foundation model) فقط رمزگشا برای پیش بینی سری زمانی برای پیش بینی دقیق تر آینده، مدل جدیدی از هوش مصنوعی گوگل!
این مدل جدید هوش مصنوعی بدون نیاز به آموزش زیاد، پیش بینی های دقیقی از داده های جدید ارائه می دهد.
https://blog.research.google/2024/02/a-decoder-only-foundation-model-for.html?m=1
مدلهای پایه ای یا foundation models از آنجایی که بر روی مجموعه دادههای عظیم و متنوعی از پیش آموزش دیدهاند به آنها دانش عمومی وسیعی میدهد که میتوانند از آن برای پیشبینی دادههای جدید بدون نیاز به آموزش اضافی استفاده کنند.
قبلا بیشتر تو زمینه متن و تصویر مقاله و مدل مشاهده میشد، این برای سری زمانیه!
research.google
A decoder-only foundation model for time-series forecasting
Posted by Rajat Sen and Yichen Zhou, Google Research Time-series forecasting is ubiquitous in various domains, such as retail, finance, manufacturi...
👌14👍5
Tensorflow(@CVision)
https://x.com/tsarnick/status/1754439023551213845?s=46 #fun
X (formerly Twitter)
Gary Marcus (@GaryMarcus) on X
Hinton is so wrong about this and so far behind the times that he doesn’t realize that @ylecun moved over to my side of this argument.
Tech bros don’t seem to realize that, either 🤷♂️
Given vast datasets, LLMs approximate well, but their understanding…
Tech bros don’t seem to realize that, either 🤷♂️
Given vast datasets, LLMs approximate well, but their understanding…
👍1😁1🤩1
Graph Convolutional Networks:
Unleashing the power of Deep Learning for Graph data
🗓زمان برگزاری (به صورت آنلاین): شنبه 28 بهمن ماه 1402
⏱ساعت 17:30 الی 19
📍آدرس اتاق مجازی: https://vc.sharif.edu/ch/cognitive
@irandeeplearning | @cvision
Unleashing the power of Deep Learning for Graph data
🗓زمان برگزاری (به صورت آنلاین): شنبه 28 بهمن ماه 1402
⏱ساعت 17:30 الی 19
📍آدرس اتاق مجازی: https://vc.sharif.edu/ch/cognitive
@irandeeplearning | @cvision
👍18❤2🔥1
Physics-Encoded Graph Neural Networks for Deformation Prediction under Contact
https://mahdi-slh.github.io/DeformContact.html
#GNN #GCN #Graph
https://mahdi-slh.github.io/DeformContact.html
#GNN #GCN #Graph
👍3
Media is too big
VIEW IN TELEGRAM
Tracking Any Point (TAP)
https://github.com/google-deepmind/tapnet
🖥Colab Demo:
Standard TAPIR | Online TAPIR | Rainbow Visualization
https://github.com/google-deepmind/tapnet
🖥Colab Demo:
Standard TAPIR | Online TAPIR | Rainbow Visualization
👍8
تغییر نام هوش مصنوعی گوگل از «بارد» به
«جمینی»
هوش مصنوعی مکالمهای بزرگ (LLM) گوگل که پیشتر با نام «بارد» شناخته میشد، از این پس با نام «جمینی» به فعالیت خود ادامه خواهد داد.
نام «جمینی» به معنی «دو قلو» است و به دو مدل زبانی قدرتمند LaMDA و PaLM اشاره دارد که این هوش مصنوعی بر پایه آنها ساخته شده است.
انتظار میرود با این تغییر نام، شاهد ارتقای تواناییهای این هوش مصنوعی در زمینههای مختلفی مانند تولید متنهای خلاقانه و جذاب، پاسخ به سوالات به صورت دقیق و آموزنده، ترجمه زبانها به صورت روان و طبیعی و... باشیم.
همچنین در روز های آینده باید منتظر فعال شدن قابلیت خلق و تولید تصاویر با کمک مدل ImageFX این شرکت باشیم!
«جمینی»
هوش مصنوعی مکالمهای بزرگ (LLM) گوگل که پیشتر با نام «بارد» شناخته میشد، از این پس با نام «جمینی» به فعالیت خود ادامه خواهد داد.
نام «جمینی» به معنی «دو قلو» است و به دو مدل زبانی قدرتمند LaMDA و PaLM اشاره دارد که این هوش مصنوعی بر پایه آنها ساخته شده است.
انتظار میرود با این تغییر نام، شاهد ارتقای تواناییهای این هوش مصنوعی در زمینههای مختلفی مانند تولید متنهای خلاقانه و جذاب، پاسخ به سوالات به صورت دقیق و آموزنده، ترجمه زبانها به صورت روان و طبیعی و... باشیم.
همچنین در روز های آینده باید منتظر فعال شدن قابلیت خلق و تولید تصاویر با کمک مدل ImageFX این شرکت باشیم!
🔥18🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
ارتقای ویدئو ها به سطحی جدید با هوش مصنوعی
شبکه FMA-NET، یک شبکه عصبی عمیق مبتنی بر مکانیزم توجه است، که دنیای پردازش ویدئو را متحول میکند. این ابزار قدرتمند با سرعتی باورنکردنی و کیفیتی بینظیر، ویدئوهای شما را ارتقا میدهد و به سطحی جدید از وضوح و شفافیت میبرد.
شبکه FMA-NET چه مزایایی دارد؟
⚙ سرعت خیرهکننده: FMA-NET با اتکا به هوش مصنوعی، ویدئوهای شما را در چشم به هم زدنی ارتقا میدهد و از این نظر، ابزاری بینظیر محسوب میشود.
⚙ کیفیت بیمثال: FMA-NET با دقت و ظرافت بینظیری، جزئیات تصاویر را مانند ادیتوری ماهر بازیابی میکند و
وضوحی کریستالی به آنها میبخشد.
⚙ رفع تاری: FMA-NET با قدرت جادویی خود، تاری ناشی از لرزش دوربین، حرکت، و کمبود نور را به طور کامل از بین میبرد و ویدئوهایی شفاف و واضح به شما تحویل میدهد.
لینک گیت پروژه
شبکه FMA-NET، یک شبکه عصبی عمیق مبتنی بر مکانیزم توجه است، که دنیای پردازش ویدئو را متحول میکند. این ابزار قدرتمند با سرعتی باورنکردنی و کیفیتی بینظیر، ویدئوهای شما را ارتقا میدهد و به سطحی جدید از وضوح و شفافیت میبرد.
شبکه FMA-NET چه مزایایی دارد؟
⚙ سرعت خیرهکننده: FMA-NET با اتکا به هوش مصنوعی، ویدئوهای شما را در چشم به هم زدنی ارتقا میدهد و از این نظر، ابزاری بینظیر محسوب میشود.
⚙ کیفیت بیمثال: FMA-NET با دقت و ظرافت بینظیری، جزئیات تصاویر را مانند ادیتوری ماهر بازیابی میکند و
وضوحی کریستالی به آنها میبخشد.
⚙ رفع تاری: FMA-NET با قدرت جادویی خود، تاری ناشی از لرزش دوربین، حرکت، و کمبود نور را به طور کامل از بین میبرد و ویدئوهایی شفاف و واضح به شما تحویل میدهد.
لینک گیت پروژه
👌11👍4❤1
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
نسخه ۱ از TF-GNN (شبکههای عصبی گرافی در تنسورفلو) منتشر شد.
https://blog.tensorflow.org/2024/02/graph-neural-networks-in-tensorflow.html
https://blog.tensorflow.org/2024/02/graph-neural-networks-in-tensorflow.html
👍7
آیا واقعا مدلهای هوش مصنوعی با گذشت زمان بدتر میشن؟
جمیز زو میگه مدلهایی مثل چتجیپیتی در طول زمان به مراتب بدتر میشن و عمدتا این به دلیل تعامل با انسانهاست.
https://youtu.be/bslcuhWVZ48?si=eXGwa-9vRwiZLJU0
مقاله:
https://arxiv.org/pdf/2307.09009.pdf
جمیز زو میگه مدلهایی مثل چتجیپیتی در طول زمان به مراتب بدتر میشن و عمدتا این به دلیل تعامل با انسانهاست.
https://youtu.be/bslcuhWVZ48?si=eXGwa-9vRwiZLJU0
مقاله:
https://arxiv.org/pdf/2307.09009.pdf
YouTube
James Zou: one of the most prolific and creative A.I. researchers in both life science and medicine
A podcast with James Zou, a Stanford computer scientist who is lighting it up in life science and medical A.I. Recent papers discussed in this podcast include degradation of GPT-4 performance, using large language models for peer review, and taking more than…
👍8😁6
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
هوش مصنوعی گوگل (Bard) رسما به Gemini (نامی که برای خانوادهی مدلهای مالتیمودال گوگل استفاده میشد) تغییرنام داد.
بهعلاوه، جدیدترین و قدرتمندترین مدل این خانواده (Ultra 1.0) نیز از طریق محصول Gemini Advanced با هزینهی ماهیانه ۲۰ دلار (۲ ماه نخست رایگان) در دسترس قرار گرفت.
همچنین، یک اپ اندرویدی نیز برای دسترسی سادهتر به Gemini منتشر شدهست.
سایت جدید:
https://gemini.google.com/
اپ اندرویدی:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard
ویدئوی معرفی:
https://youtu.be/b5Fh7TaTkEU?si=JEgqtIcffBABczsp
بلاگپست معرفی:
https://blog.google/products/gemini/bard-gemini-advanced-app/
تکنیکال ریپورت مدلهای Gemini:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
بهعلاوه، جدیدترین و قدرتمندترین مدل این خانواده (Ultra 1.0) نیز از طریق محصول Gemini Advanced با هزینهی ماهیانه ۲۰ دلار (۲ ماه نخست رایگان) در دسترس قرار گرفت.
همچنین، یک اپ اندرویدی نیز برای دسترسی سادهتر به Gemini منتشر شدهست.
سایت جدید:
https://gemini.google.com/
اپ اندرویدی:
https://play.google.com/store/apps/details?id=com.google.android.apps.bard
ویدئوی معرفی:
https://youtu.be/b5Fh7TaTkEU?si=JEgqtIcffBABczsp
بلاگپست معرفی:
https://blog.google/products/gemini/bard-gemini-advanced-app/
تکنیکال ریپورت مدلهای Gemini:
https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf
👍8❤3
Tensorflow(@CVision)
ضبط و تدوین دوره جدید "جامع دیپ لرنینگ" با سطح مقدماتی و متوسط بعد از چند ماه تلاش تمام شده است. ان شاء الله دوره بعد اصلاح خطاهای تدوینی به زودی تا ۱۵ روز پیش رو روی سایت برای فروش قرار خواهد گرفت این دوره نزدیک ۴۰ ساعت و در ۹ فصل ضبط شده است
شکر خدا کارهای دوره جدید به پایان رسیده و پس از آپلود فایلها روی سایت قرار میگیرد.
لینک دوره و جزئیات بیشتر اطلاع رسانی میگردد
لینک دوره و جزئیات بیشتر اطلاع رسانی میگردد
❤24🔥4👏4👍2😱1
Forwarded from School of AI
شرکت Nvidia یک نرمافزار چتبات قابل نصب برروی Windows 11، موسوم به NVIDIA Chat with RTX ارائه کرده که از محتوای فایلهای داخل رایانه، برای RAG استفاده میکند. به عبارت دیگر پاسخ پرسشهای شما را با بررسی فایلهایی که بهش معرفی میکنید میدهد.
این چتبات برای اجرا نیاز به واحد گرافیکی GeForce RTX دارد.
https://youtu.be/gdsRJZT3IJw
این چتبات برای اجرا نیاز به واحد گرافیکی GeForce RTX دارد.
https://youtu.be/gdsRJZT3IJw
YouTube
Create A Personalized AI Chatbot with Chat With RTX
Create a personalized chatbot with the Chat with RTX tech demo. Accelerated by TensorRT-LLM and Tensor Cores, you can quickly get tailored info from your files and content. Just connect your data to an LLM on RTX-Powered PCs for local, fast, generative AI.…
🔥10👍2🤯1
Forwarded from School of AI
دیشب ساعت ۹ تصویر Yann LeCun دانشمند برجستهی هوش مصنوعی بر روی برج خلیفهی دوبی نقش بست.
لازمبهذکر است که ایشان در حال حاضر برای شرکت در نشست دولت جهانی (World Government Summit) در امارات متحدهی عربی حضور دارند.
لازمبهذکر است که ایشان در حال حاضر برای شرکت در نشست دولت جهانی (World Government Summit) در امارات متحدهی عربی حضور دارند.
👍18
Forwarded from School of AI
شرکت Ultralytics مدل بنیادین YOLO-World که یک OVD یا Open-Vocabulary Detector است، را معرفی کرد.
این مدل، مبتنی بر YOLOv8 است و نیاز به کلاسهای از پیش تعریف شده برای تشخیص ندارد، بلکه میتواند بهصورت Zero-shot این کلاسها را درقالب یک پرامپت متنی، هنگام inference دریافت کرده و در تصویر پیدا کند. مثلا در ورودی به آن میگویید: “حیوان جوندهی کوچک به رنگ سفید که نامش موش است را پیدا کن”
این مدل در مقایسه با مدل بنیادین فیسبوک (SAM) بسیار سادهتر است و بنابراین میتوان به راحتی از آن برای اپلیکیشنهای real-time استفاده کرد.
استفاده از این مدل بهسادگی استفاده از Ultralytics YOLOv8 است.
https://docs.ultralytics.com/models/yolo-world/
این مدل، مبتنی بر YOLOv8 است و نیاز به کلاسهای از پیش تعریف شده برای تشخیص ندارد، بلکه میتواند بهصورت Zero-shot این کلاسها را درقالب یک پرامپت متنی، هنگام inference دریافت کرده و در تصویر پیدا کند. مثلا در ورودی به آن میگویید: “حیوان جوندهی کوچک به رنگ سفید که نامش موش است را پیدا کن”
این مدل در مقایسه با مدل بنیادین فیسبوک (SAM) بسیار سادهتر است و بنابراین میتوان به راحتی از آن برای اپلیکیشنهای real-time استفاده کرد.
استفاده از این مدل بهسادگی استفاده از Ultralytics YOLOv8 است.
https://docs.ultralytics.com/models/yolo-world/
👍8🔥4🤯2❤1
مدل متن به ویدیو OpenAI معرفی شد!
این مدل که اسمش Sora هست میتونه ویدیوهایی به طول یک دقیقه تولید کنه!
https://openai.com/sora
https://x.com/sama/status/1758193609927721350?s=46
https://x.com/model_mechanic/status/1758196079663988823?s=46
https://x.com/gdb/status/1758193811489243408?s=46
https://x.com/mkbhd/status/1758200479224410420?s=46
https://x.com/sama/status/1758218820542763012?s=46
این مدل که اسمش Sora هست میتونه ویدیوهایی به طول یک دقیقه تولید کنه!
https://openai.com/sora
https://x.com/sama/status/1758193609927721350?s=46
https://x.com/model_mechanic/status/1758196079663988823?s=46
https://x.com/gdb/status/1758193811489243408?s=46
https://x.com/mkbhd/status/1758200479224410420?s=46
https://x.com/sama/status/1758218820542763012?s=46
Openai
Sora
Turn your ideas into videos with hyperreal motion and sound.
❤6👍4