Tensorflow(@CVision)

VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time
مایکروسافت یک هوش مصنوعی خیره کننده معرفی کرده که می تواند به طور واقعی عکس ها را متحرک کند.
شما چهره و صدای یک فرد را داده و در پایان یک پرتره متحرک با همگام سازی لب، احساسات و ژست های قابل باور را دریافت می کنید! همه اینها نیز قابل کنترل است.

https://www.microsoft.com/en-us/research/project/vasa-1/

🤯9👍4💯4❤1

6.84K viewsAlireza Akhavan, 19:03

Tensorflow(@CVision)

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

بوستون داینامیکس نسل جدیدی از روبات‌های اطلس را برای جایگزینی روبات‌های قدیمی به نمایش گذاشت!

در حال حاضر این رباتها کاملا برقی و بدون اجزای هیدرولیکی هستند.
این ربات جدید با دامنه حرکتی گسترده تر خواهد بود.

ضریب شکل انسان نما ربات اطلس به آن اجازه می دهد تا به طور موثر حرکت کند و وظایفی فراتر از توانایی های انسانی انجام دهد.🤖

اطلس جدید به طور مشترک با هیوندای توسعه داده شده و این روبات ها مونتاژ خودروها را در کارخانه های هیوندای آغاز خواهند کرد

https://bostondynamics.com/blog/electric-new-era-for-atlas/

🔥10👍3

4.39K viewsAlireza Akhavan, 05:30

Tensorflow(@CVision)

Forwarded from School of AI

This media is not supported in your browser

VIEW IN TELEGRAM

جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و ۷۰ میلیاردی منتشر شد!

این مدل با استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
https://ai.meta.com/blog/meta-llama-3

برای آزمون عمل‌کرد این مدل می‌توانید از دستیار هوشمند (چت‌بات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai

👍6❤2🤯1🙏1

4.98K viewsAlireza Akhavan, 06:23

Tensorflow(@CVision)

Forwarded from School of AI

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

این ویدئو، سرعت بالاتر Llama 3 نسبت به GPT3.5-turbo رو نشون می‌ده.

کیفیت متن تولیدشده توسط Llama 3 به خوبی GPT3.5-turbo هست.

مدل Llama 3 روی NVIDIA 4090 که یک کارت گرافیک consumer-grade محسوب می‌شود، اجرا شده‌ست.

👍10

4.2K viewsAlireza Akhavan, 06:23

Tensorflow(@CVision)

Forwarded from School of AI

یوشوا بنجیو جزو ۱۰۰ چهره‌ی تاثیرگذار سال در مجله‌ی TIMES قرار گرفت.

https://mila.quebec/en/yoshua-bengio-named-to-times-annual-time100-list-of-the-100-most-influential-people-in-the-world/

👍16😁2👌1💯1

5.46K viewsAlireza Akhavan, 08:08

Tensorflow(@CVision)

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

Transform your simple scribbles into architectural designs using style transfer with Stable Diffusion, LCM, IP Adapters and ControlNet. Scribble Architect combines creativity with generative AI technology, improving the inspiration process.

https://github.com/s-du/ScribbleArchitect

👍8

6.52K viewsAlireza Akhavan, 19:50

Tensorflow(@CVision)

Forwarded from School of AI

ابررایانه (Supercomputer) هوش مصنوعی جدید شرکت NVIDIA به‌نام DGX H200 امروز شخصا توسط Jensen Huang (مدیرعامل و موسس NVIDIA) به OpenAI برای پیش‌برد هوش مصنوعی، محاسبات و بشریت اهدا شد.

- 256 H100 GPUs,
- 32 Grace Neoverse V2 72-core CPUs,
- 32 OSFT single-port ConnectX-7 VPI of with 400Gb/s InfiniBand and 16 dual-port BlueField-3 VPI with 200Gb/s of Mellanox

🔥30👍3❤1

4.93K viewsAlireza Akhavan, 15:06

Tensorflow(@CVision)

MOMENT: A Foundation Model for Time Series Forecasting, Classification, Anomaly Detection

Git:
https://anonymous.4open.science/r/BETT-773F/README.md

Blog post:
https://towardsdatascience.com/moment-a-foundation-model-for-time-series-forecasting-classification-anomaly-detection-1e35f5b6ca76

👍5🔥1

6.3K viewsAlireza Akhavan, 10:23

Tensorflow(@CVision)

Top 10 out of 79 models by 134 k votes

👍4🔥3🙏2

8.61K viewsAli B, 13:04

Tensorflow(@CVision)

Forwarded from School of AI

پژوهش زیر به بررسی Graph Machine Learning در عصر LLMها می‌پردازد.

https://arxiv.org/pdf/2404.14928

👍7👏1

7.77K viewsAlireza Akhavan, 15:04

Tensorflow(@CVision)

[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement.

https://github.com/google-research/maxim

Online demo:
https://replicate.com/google-research/maxim

👌اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!

#blur

GitHub

GitHub - google-research/maxim: [CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for…

[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement. - google-research/maxim

👍2

8.64K viewsAlireza Akhavan, edited 20:33

Tensorflow(@CVision)

اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!

👍16👌7❤2👏2

8.17K viewsAlireza Akhavan, 20:34

Tensorflow(@CVision)

✳️ دوره‌های Deep-Learning گروه آموزشی class vision

📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision

اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره!

0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون

0️⃣ دوره رایگان Python(پایتون) برای هوش مصنوعی

1️⃣ دوره جامع یادگیری عمیق

2️⃣ دوره‌ی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN)
▫️مشاهده قسمت‌های رایگان

3️⃣ دوره شبکه عصبی گرافی (GNN و GCN)
▫️ویدیو‌ی معرفی دوره | فیلم ارائه معرفی GCN در دانشگاه شریف

4️⃣ دوره‌ی بازشناسی و تشخیص چهره
▫️ مشاهده قسمت‌های رایگان | ثبت‌نام

5️⃣بینایی کامپیوتر با OpenCV
▫️دوره منتشر شده در مکتب خونه

6️⃣وبینارهای مرتبط رایگان

🔺 اطلاعات بیشتر در کانال و یا سایت class.vision

🔻 هر گونه سوال: @classvision_support

برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید.

کانال دوره ها:
@class_vision

آپارات - سرویس اشتراک ویدیو

مصاحبه با شرکت کنندگان دوره دیپ لرنینگ

دوره تخصصی بکه های بازگشتی (rnnها) در صندوق شکوفایی و نوآوری ریاست جمهوری تهران برگزار شده و فیلم آفلاین این دوره در سایت https://class.vision/deeplearning2/

❤10👍7👏1

11.1K viewsAlireza Akhavan, edited 09:47

Tensorflow(@CVision)

Tensorflow(@CVision) pinned «✳️ دوره‌های Deep-Learning گروه آموزشی class vision 📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی…»

09:47

Tensorflow(@CVision)

📢جهت اطلاع برای علاقه مندان،
سایت مکتب‌خونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است.

مکتب‌خونه

آموزش پردازش تصویر و بینایی ماشین با OpenCV

دوره آموزش پردازش تصویر و بینایی ماشین با opencv برای ایجاد یک پایه قوی در بینایی کامپیوتر طراحی شده است. در این دوره شما درک کاملی از تقریبا تمام ابزارهای OpenCV برای پردازش تصویر، بینایی کامپیوتری، پردازش ویدئو و اصول اولیه هوش مصنوعی خواهید داشت.

❤8👍1

7.33K viewsAlireza Akhavan, 13:52

Tensorflow(@CVision)

دیتاست سایت باسلام

شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات.

🔗لینک دیتاست در هاگینگ فیس
🔗لینک دیتاست در کگل

#دیتاست #مجموعه_داده

huggingface.co

RadeAI/BaSalam_comments_products · Datasets at Hugging Face

We’re on a journey to advance and democratize artificial intelligence through open source and open science.

❤21👌3👍2🤩1

7.59K viewsAlireza Akhavan, edited 13:00

Tensorflow(@CVision)

BLIP3, a series of large multimodal models (LMMs) developed by Salesforce AI Research. It is a new SOTA model under 5B on few-shot learning and multimodal benchmarks.

Check out the HF release:

https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1

Key Takeaways:
BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data.
BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT.
BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less).

👍6❤1

5.1K viewsVahid, 15:29

Tensorflow(@CVision)

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

❌ دیگر از ویدیوهای تار خبری نیست

روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است.

[I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images
https://github.com/Chaphlagical/Deblur-GS

✴️مرتبط با MAXIM

#blur

👌6👍2❤1

4.35K viewsAlireza Akhavan, edited 09:16

Tensorflow(@CVision)

Forwarded from School of AI

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

فریم‌ورک FeatUp به‌طور مشترک توسط پژوهش‌گران MIT و Microsoft و Berkeley و Google در سمینار ICLR 2024 معرفی شده.

این فریم‌ورک فارق از تسک یا مدل، ویژگی‌های ازدست‌رفته‌ی داده‌ی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابل‌توجهی بازسازی می‌کند.

سایت:
https://mhamilton.net/featup.html

مقاله:
https://arxiv.org/pdf/2403.10516

کد:
https://github.com/mhamilton723/FeatUp

👍8🔥4

3.21K viewsAlireza Akhavan, 11:59

About

Blog

Apps

Platform