Tensorflow(@CVision)
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time https://www.microsoft.com/en-us/research/project/vasa-1/
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
VASA-1: Lifelike Audio-Driven Talking Faces Generated in Real Time
مایکروسافت یک هوش مصنوعی خیره کننده معرفی کرده که می تواند به طور واقعی عکس ها را متحرک کند.
شما چهره و صدای یک فرد را داده و در پایان یک پرتره متحرک با همگام سازی لب، احساسات و ژست های قابل باور را دریافت می کنید! همه اینها نیز قابل کنترل است.
https://www.microsoft.com/en-us/research/project/vasa-1/
مایکروسافت یک هوش مصنوعی خیره کننده معرفی کرده که می تواند به طور واقعی عکس ها را متحرک کند.
شما چهره و صدای یک فرد را داده و در پایان یک پرتره متحرک با همگام سازی لب، احساسات و ژست های قابل باور را دریافت می کنید! همه اینها نیز قابل کنترل است.
https://www.microsoft.com/en-us/research/project/vasa-1/
🤯9👍4💯4❤1
This media is not supported in your browser
VIEW IN TELEGRAM
بوستون داینامیکس نسل جدیدی از روباتهای اطلس را برای جایگزینی روباتهای قدیمی به نمایش گذاشت!
در حال حاضر این رباتها کاملا برقی و بدون اجزای هیدرولیکی هستند.
این ربات جدید با دامنه حرکتی گسترده تر خواهد بود.
ضریب شکل انسان نما ربات اطلس به آن اجازه می دهد تا به طور موثر حرکت کند و وظایفی فراتر از توانایی های انسانی انجام دهد.🤖
اطلس جدید به طور مشترک با هیوندای توسعه داده شده و این روبات ها مونتاژ خودروها را در کارخانه های هیوندای آغاز خواهند کرد
https://bostondynamics.com/blog/electric-new-era-for-atlas/
در حال حاضر این رباتها کاملا برقی و بدون اجزای هیدرولیکی هستند.
این ربات جدید با دامنه حرکتی گسترده تر خواهد بود.
ضریب شکل انسان نما ربات اطلس به آن اجازه می دهد تا به طور موثر حرکت کند و وظایفی فراتر از توانایی های انسانی انجام دهد.🤖
اطلس جدید به طور مشترک با هیوندای توسعه داده شده و این روبات ها مونتاژ خودروها را در کارخانه های هیوندای آغاز خواهند کرد
https://bostondynamics.com/blog/electric-new-era-for-atlas/
🔥10👍3
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
جدیدترین نسخه از مدل زبانی اوپن-سورس شرکت Meta به نام Llama 3 در دو سایز ۸ میلیاردی و ۷۰ میلیاردی منتشر شد!
این مدل با استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگتر از دادهی استفادهشده در Llama 2) آموزش دیده و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).
ارزیابیهای انجامشده روی مجموعهدادههای مختلف حاکی از عملکرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
https://ai.meta.com/blog/meta-llama-3
برای آزمون عملکرد این مدل میتوانید از دستیار هوشمند (چتبات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai
این مدل با استفاده از ۱۵ تریلیون توکن داده (۷ برابر بزرگتر از دادهی استفادهشده در Llama 2) آموزش دیده و طول متنی معادل ۸۰۰۰ دارد (دو برابر Llama 2).
ارزیابیهای انجامشده روی مجموعهدادههای مختلف حاکی از عملکرد بهتر این مدل نسبت به Gemma 7B - It و Mistral 7B Instruct است.
https://ai.meta.com/blog/meta-llama-3
برای آزمون عملکرد این مدل میتوانید از دستیار هوشمند (چتبات) شرکت متا به آدرس زیر استفاده کنید:
https://www.meta.ai
👍6❤2🤯1🙏1
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
این ویدئو، سرعت بالاتر Llama 3 نسبت به GPT3.5-turbo رو نشون میده.
کیفیت متن تولیدشده توسط Llama 3 به خوبی GPT3.5-turbo هست.
مدل Llama 3 روی NVIDIA 4090 که یک کارت گرافیک consumer-grade محسوب میشود، اجرا شدهست.
کیفیت متن تولیدشده توسط Llama 3 به خوبی GPT3.5-turbo هست.
مدل Llama 3 روی NVIDIA 4090 که یک کارت گرافیک consumer-grade محسوب میشود، اجرا شدهست.
👍10
Forwarded from School of AI
یوشوا بنجیو جزو ۱۰۰ چهرهی تاثیرگذار سال در مجلهی TIMES قرار گرفت.
https://mila.quebec/en/yoshua-bengio-named-to-times-annual-time100-list-of-the-100-most-influential-people-in-the-world/
https://mila.quebec/en/yoshua-bengio-named-to-times-annual-time100-list-of-the-100-most-influential-people-in-the-world/
👍16😁2👌1💯1
This media is not supported in your browser
VIEW IN TELEGRAM
Transform your simple scribbles into architectural designs using style transfer with Stable Diffusion, LCM, IP Adapters and ControlNet. Scribble Architect combines creativity with generative AI technology, improving the inspiration process.
https://github.com/s-du/ScribbleArchitect
https://github.com/s-du/ScribbleArchitect
👍8
Forwarded from School of AI
ابررایانه (Supercomputer) هوش مصنوعی جدید شرکت NVIDIA بهنام DGX H200 امروز شخصا توسط Jensen Huang (مدیرعامل و موسس NVIDIA) به OpenAI برای پیشبرد هوش مصنوعی، محاسبات و بشریت اهدا شد.
- 256 H100 GPUs,
- 32 Grace Neoverse V2 72-core CPUs,
- 32 OSFT single-port ConnectX-7 VPI of with 400Gb/s InfiniBand and 16 dual-port BlueField-3 VPI with 200Gb/s of Mellanox
- 256 H100 GPUs,
- 32 Grace Neoverse V2 72-core CPUs,
- 32 OSFT single-port ConnectX-7 VPI of with 400Gb/s InfiniBand and 16 dual-port BlueField-3 VPI with 200Gb/s of Mellanox
🔥30👍3❤1
MOMENT: A Foundation Model for Time Series Forecasting, Classification, Anomaly Detection
Git:
https://anonymous.4open.science/r/BETT-773F/README.md
Blog post:
https://towardsdatascience.com/moment-a-foundation-model-for-time-series-forecasting-classification-anomaly-detection-1e35f5b6ca76
Git:
https://anonymous.4open.science/r/BETT-773F/README.md
Blog post:
https://towardsdatascience.com/moment-a-foundation-model-for-time-series-forecasting-classification-anomaly-detection-1e35f5b6ca76
👍5🔥1
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement.
https://github.com/google-research/maxim
Online demo:
https://replicate.com/google-research/maxim
👌اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!
#blur
https://github.com/google-research/maxim
Online demo:
https://replicate.com/google-research/maxim
👌اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!
#blur
GitHub
GitHub - google-research/maxim: [CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for…
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement. - google-research/maxim
👍2
Tensorflow(@CVision)
[CVPR 2022 Oral] Official repository for "MAXIM: Multi-Axis MLP for Image Processing". SOTA for denoising, deblurring, deraining, dehazing, and enhancement. https://github.com/google-research/maxim Online demo: https://replicate.com/google-research/maxim…
اگه عکسی دارید که دوسش دارید ولی دستتون لرزیده و مات شده، یا پلاک ماشینی از دوربین مدار بسته گرفتید و ناخوانا افتاده، سری به این ریپو بزنید!
👍16👌7❤2👏2
✳️ دورههای Deep-Learning گروه آموزشی class vision
📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی:
اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره!
0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون
0️⃣ دوره رایگان Python(پایتون) برای هوش مصنوعی
1️⃣ دوره جامع یادگیری عمیق
2️⃣ دورهی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN)
▫️مشاهده قسمتهای رایگان
3️⃣ دوره شبکه عصبی گرافی (GNN و GCN)
▫️ویدیوی معرفی دوره | فیلم ارائه معرفی GCN در دانشگاه شریف
4️⃣ دورهی بازشناسی و تشخیص چهره
▫️ مشاهده قسمتهای رایگان | ثبتنام
5️⃣بینایی کامپیوتر با OpenCV
▫️دوره منتشر شده در مکتب خونه
6️⃣وبینارهای مرتبط رایگان
🔺 اطلاعات بیشتر در کانال و یا سایت class.vision
🔻 هر گونه سوال: @classvision_support
برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید.
کانال دوره ها:
@class_vision
📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی:
cvisionاگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی ویدیوی رایگان دیگر نیز در کانال آپارات وجود داره!
0️⃣ ویدیوهای رایگان آشنایی با هوش مصنوعی و پایتون
0️⃣ دوره رایگان Python(پایتون) برای هوش مصنوعی
1️⃣ دوره جامع یادگیری عمیق
2️⃣ دورهی شبکه ها عصبی بازگشتی ( LSTM , GRU و RNN)
▫️مشاهده قسمتهای رایگان
3️⃣ دوره شبکه عصبی گرافی (GNN و GCN)
▫️ویدیوی معرفی دوره | فیلم ارائه معرفی GCN در دانشگاه شریف
4️⃣ دورهی بازشناسی و تشخیص چهره
▫️ مشاهده قسمتهای رایگان | ثبتنام
5️⃣بینایی کامپیوتر با OpenCV
▫️دوره منتشر شده در مکتب خونه
6️⃣وبینارهای مرتبط رایگان
🔺 اطلاعات بیشتر در کانال و یا سایت class.vision
🔻 هر گونه سوال: @classvision_support
برای خرید گروهی، یا خرید برای اعضای یک کلاس با پشتیبانی تماس بگیرید.
کانال دوره ها:
@class_vision
آپارات - سرویس اشتراک ویدیو
مصاحبه با شرکت کنندگان دوره دیپ لرنینگ
دوره تخصصی بکه های بازگشتی (rnnها) در صندوق شکوفایی و نوآوری ریاست جمهوری تهران برگزار شده و فیلم آفلاین این دوره در سایت https://class.vision/deeplearning2/
❤10👍7👏1
Tensorflow(@CVision) pinned «✳️ دورههای Deep-Learning گروه آموزشی class vision 📢🎉کد تخفیف 10 درصدی cvision ویژه اعضای محترم کانال تلگرامی: cvision اگر تا کنون دوره ها را تهیه نکرده اید توصیه میشه حتما فایل مصاحبه با شرکت کنندگان را ببینید و همچنین با قسمت های رایگان شروع کنید! کلی…»
📢جهت اطلاع برای علاقه مندان،
سایت مکتبخونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است.
سایت مکتبخونه روی دوره OpenCV فروش فوق العاده و تخفیف 55 درصدی گذاشته است.
مکتبخونه
آموزش پردازش تصویر و بینایی ماشین با OpenCV
دوره آموزش پردازش تصویر و بینایی ماشین با opencv برای ایجاد یک پایه قوی در بینایی کامپیوتر طراحی شده است. در این دوره شما درک کاملی از تقریبا تمام ابزارهای OpenCV برای پردازش تصویر، بینایی کامپیوتری، پردازش ویدئو و اصول اولیه هوش مصنوعی خواهید داشت.
❤8👍1
دیتاست سایت باسلام
شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات.
🔗لینک دیتاست در هاگینگ فیس
🔗لینک دیتاست در کگل
#دیتاست #مجموعه_داده
شامل اطلاعات فروش و مشخصات 2.4 میلیون محصول موجود در سایت باسلام به همراه دیتاست 3.3 میلیونی کامنت محصولات.
🔗لینک دیتاست در هاگینگ فیس
🔗لینک دیتاست در کگل
#دیتاست #مجموعه_داده
huggingface.co
RadeAI/BaSalam_comments_products · Datasets at Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.
❤21👌3👍2🤩1
BLIP3, a series of large multimodal models (LMMs) developed by Salesforce AI Research. It is a new SOTA model under 5B on few-shot learning and multimodal benchmarks.
Check out the HF release:
https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1
Key Takeaways:
BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data.
BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT.
BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less).
Check out the HF release:
https://huggingface.co/Salesforce/blip3-phi3-mini-instruct-r-v1
Key Takeaways:
BLIP3 is trained at scale on high-quality image caption data and image-text interleaved data.
BLIP3 exhibits strong few-shot learning capability as pre-trained base model and impressive visual chat ability after SFT.
BLIP3 supports more efficient token usage compared to methods like LLaVA (more than 5x less).
👍6❤1
This media is not supported in your browser
VIEW IN TELEGRAM
❌ دیگر از ویدیوهای تار خبری نیست
روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است.
[I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images
https://github.com/Chaphlagical/Deblur-GS
✴️مرتبط با MAXIM
#blur
روش جدید Deblur-GS ویدیوهای تار را بازیابی می کند. این روش ادعا میکند عملکرد و کیفیت رندر بالاتری را در مقایسه با روش های قبلی ارائه کرده است.
[I3D 2024] Deblur-GS: 3D Gaussian Splatting from Camera Motion Blurred Images
https://github.com/Chaphlagical/Deblur-GS
✴️مرتبط با MAXIM
#blur
👌6👍2❤1
Forwarded from School of AI
This media is not supported in your browser
VIEW IN TELEGRAM
فریمورک FeatUp بهطور مشترک توسط پژوهشگران MIT و Microsoft و Berkeley و Google در سمینار ICLR 2024 معرفی شده.
این فریمورک فارق از تسک یا مدل، ویژگیهای ازدسترفتهی دادهی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابلتوجهی بازسازی میکند.
سایت:
https://mhamilton.net/featup.html
مقاله:
https://arxiv.org/pdf/2403.10516
کد:
https://github.com/mhamilton723/FeatUp
این فریمورک فارق از تسک یا مدل، ویژگیهای ازدسترفتهی دادهی بینایی (تصویر) در ژرفای مدل را بدون تاثیر در semantic مدل، با دقت قابلتوجهی بازسازی میکند.
سایت:
https://mhamilton.net/featup.html
مقاله:
https://arxiv.org/pdf/2403.10516
کد:
https://github.com/mhamilton723/FeatUp
👍8🔥4