Tensorflow(@CVision)
15.3K subscribers
1.29K photos
310 videos
81 files
2.53K links
اخبار حوزه یادگیری عمیق و هوش مصنوعی
مقالات و یافته های جدید یادگیری عمیق
بینایی ماشین و پردازش تصویر

TensorFlow, Keras, Deep Learning, Computer Vision

سایت:
https://class.vision

👨‍💻👩‍💻پشتیبان دوره ها:
@classvision_support

لینک گروه:
@tf2keras
Download Telegram
Tensorflow(@CVision)
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time https://www.microsoft.com/en-us/research/project/vasa-1/
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time
مایکروسافت یک هوش مصنوعی خیره کننده معرفی کرده که می تواند به طور واقعی عکس ها را متحرک کند.
شما چهره و صدای یک فرد را داده و در پایان یک پرتره متحرک با همگام سازی لب، احساسات و ژست های قابل باور را دریافت می کنید! همه اینها نیز قابل کنترل است.

https://www.microsoft.com/en-us/research/project/vasa-1/
🤯9👍4💯41
This media is not supported in your browser
VIEW IN TELEGRAM
بوستون داینامیکس نسل جدیدی از روبات‌های اطلس را برای جایگزینی روبات‌های قدیمی به نمایش گذاشت!

در حال حاضر این رباتها کاملا برقی  و بدون  اجزای هیدرولیکی هستند.
این ربات جدید با دامنه حرکتی گسترده تر خواهد بود.

ضریب شکل انسان نما ربات اطلس به آن اجازه می دهد تا به طور موثر حرکت کند و وظایفی فراتر از توانایی های انسانی انجام دهد.🤖

اطلس جدید به طور مشترک با هیوندای توسعه داده شده و این روبات ها مونتاژ خودروها را در کارخانه های هیوندای آغاز خواهند کرد

https://bostondynamics.com/blog/electric-new-era-for-atlas/
🔥10👍3
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و ۷۰ میلیاردی منتشر شد!

این مدل با استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگ‌تر از داده‌ی استفاده‌شده در Llama 2) آموزش دیده‌ و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).

ارزیابی‌های انجام‌شده روی مجموعه‌داده‌های مختلف حاکی از عمل‌کرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
https://ai.meta.com/blog/meta-llama-3

برای آزمون عمل‌کرد این مدل می‌توانید از دستیار هوشمند (چت‌بات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai
👍62🤯1🙏1
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو، سرعت بالاتر Llama 3 نسبت به GPT3.5-turbo رو نشون می‌ده.

کیفیت متن تولیدشده توسط Llama 3 به خوبی GPT3.5-turbo هست.

مدل Llama 3 روی NVIDIA 4090 که یک کارت گرافیک consumer-grade محسوب می‌شود، اجرا شده‌ست.
👍10
Forwarded from School of AI
یوشوا بنجیو جزو ۱۰۰ چهره‌ی تاثیرگذار سال در مجله‌ی TIMES قرار گرفت.

https://mila.quebec/en/yoshua-bengio-named-to-times-annual-time100-list-of-the-100-most-influential-people-in-the-world/
👍16😁2👌1💯1
This media is not supported in your browser
VIEW IN TELEGRAM
Transform your simple scribbles into architectural designs using style transfer with Stable Diffusion, LCM, IP Adapters and ControlNet. Scribble Architect combines creativity with generative AI technology, improving the inspiration process.

https://github.com/s-du/ScribbleArchitect
👍8
Forwarded from School of AI
ابررایانه (Supercomputer) هوش مصنوعی جدید شرکت NVIDIA به‌نام DGX H200 امروز شخصا توسط Jensen Huang (مدیرعامل و موسس NVIDIA) به OpenAI برای پیش‌برد هوش مصنوعی، محاسبات و بشریت اهدا شد.

- 256 H100 GPUs,
- 32 Grace Neoverse V2 72-core CPUs,
- 32 OSFT single-port ConnectX-7 VPI of with 400Gb/s InfiniBand and 16 dual-port BlueField-3 VPI with 200Gb/s of Mellanox
🔥30👍31
👍5🔥1
Top 10 out of 79 models by 134 k votes
👍4🔥3🙏2
Forwarded from School of AI
پژوهش زیر به بررسی Graph Machine Learning در عصر LLMها می‌پردازد.

https://arxiv.org/pdf/2404.14928
👍7👏1
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement.


https://github.com/google-research/maxim


Online demo:
https://replicate.com/google-research/maxim

👌اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!

#blur
👍2
Tensorflow(@CVision)
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement. https://github.com/google-research/maxim Online demo: https://replicate.com/google-research/maxim…
اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!
👍16👌72👏2
✳️ دوره‌های Deep-Learning گروه آموزشی class vision

📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision

اگر
تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره!

0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون

0️⃣
دوره رایگان Python(پایتون) برای هوش مصنوعی

1️⃣ دوره جامع یادگیری عمیق

2️⃣ دوره‌ی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN)
▫️مشاهده قسمت‌های رایگان

3️⃣ دوره شبکه عصبی گرافی (GNN و GCN)
▫️ویدیو‌ی معرفی دوره | فیلم ارائه معرفی GCN در دانشگاه شریف

4️⃣ دوره‌ی بازشناسی و تشخیص چهره
▫️ مشاهده قسمت‌های رایگان | ثبت‌نام

5️⃣بینایی کامپیوتر با OpenCV
▫️دوره منتشر شده در مکتب خونه

6️⃣
وبینارهای مرتبط رایگان


🔺 اطلاعات بیشتر در کانال و یا سایت class.vision

🔻 هر گونه سوال: @classvision_support

برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید.

کانال دوره ها:
@class_vision
10👍7👏1
Tensorflow(@CVision) pinned «✳️ دوره‌های Deep-Learning گروه آموزشی class vision 📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی…»
دیتاست سایت باسلام

شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات.

🔗لینک دیتاست در هاگینگ فیس
🔗لینک دیتاست در کگل

#دیتاست #مجموعه_داده
21👌3👍2🤩1
BLIP3, a series of large multimodal models (LMMs) developed by Salesforce AI Research. It is a new SOTA model under 5B on few-shot learning and multimodal benchmarks.

Check out the HF release:

https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1

Key Takeaways:
BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data.
BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT.
BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less).
👍61
This media is not supported in your browser
VIEW IN TELEGRAM
دیگر از ویدیوهای تار خبری نیست

روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است.

[I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images
https://github.com/Chaphlagical/Deblur-GS


✴️مرتبط با MAXIM

#blur
👌6👍21
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
فریم‌ورک FeatUp به‌طور مشترک توسط پژوهش‌گران MIT و Microsoft و Berkeley و Google در سمینار ICLR 2024 معرفی شده.

این فریم‌ورک فارق از تسک یا مدل، ویژگی‌های ازدست‌رفته‌ی داده‌ی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابل‌توجهی بازسازی می‌کند.

سایت:
https://mhamilton.net/featup.html

مقاله:
https://arxiv.org/pdf/2403.10516

کد:
https://github.com/mhamilton723/FeatUp
👍8🔥4