This media is not supported in your browser
VIEW IN TELEGRAM
هرروز کمپانی هایی که مدلهای LLM یا صوتی و تصویری را با سرعت بالا و قیمتهای خوب ارايه میدند بیشتر میشند. اینجوری دیگه نیازی به منج کردن مدلهای نیست و با API همه چی هندل میشه. این یکیش. سرعتش خیلی خوبه! شعارشون:
Build real-time AI apps with lightning fast inference (under ~120ms).
https://github.com/tldraw/tldraw
https://www.fal.ai/
#هوش_مصنوعی #ایده_جذاب #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Build real-time AI apps with lightning fast inference (under ~120ms).
https://github.com/tldraw/tldraw
https://www.fal.ai/
#هوش_مصنوعی #ایده_جذاب #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍5❤4
سیستمهای توزیع شده و هوش مصنوعی با multimodel شدن کارها و جهت پیشگام شدن آنها برای محقق شدن AGI چه اتفاقاتی رخ خواهد داد؟!
▪️ Sparks of Artificial General Intelligence: Early experiments with GPT-4
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Sparks of Artificial General Intelligence: Early experiments with GPT-4
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🆒3
اخیرا که در توئیتر گفتگوی داغی بین پژوهشگران برجسته #هوش_مصنوعی شکل گرفته است از اینکه ایا هوش مصنوعی مضر خواهد بود یا خیر ؟! تا پیشنهادات تاپیکهایی توسط دکتر لکون و بقیه که تحقیقاتی در این حیطه ها شکل بگیره پیشنهاد شده است و سوق داده شدن به سمت RL و تشویق پژوهشگران به این سمت و QLearning و Q*( QStar) و Self Supervised Learning انجام گرفته است اینکه این ها چی هستند منبع برای qlearning هست ولی کیو استارچیه این لینک توضیحاتی راجبش داده
https://youtu.be/ARf0WyFau0A?si=vRA0UxQGQwpQMlg1
پ.ن: دکتر لکون که قبلا از مرگ RLها میگفت و الان از تشویقش !
#ایده_جذاب #یادگیری_تقویتی #فیلم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://youtu.be/ARf0WyFau0A?si=vRA0UxQGQwpQMlg1
پ.ن: دکتر لکون که قبلا از مرگ RLها میگفت و الان از تشویقش !
#ایده_جذاب #یادگیری_تقویتی #فیلم
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥5👍4
Simplifying Transformer Blocks
https://arxiv.org/abs/2311.01906
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://arxiv.org/abs/2311.01906
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🆒1
جدیدترین ورژن ویرایش شده مقاله
▪️ A Survey of Large Language Models
▪️ GitHub
تعداد مقالات بیشتری مورد بررسی قرار گرفته است.
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ A Survey of Large Language Models
▪️ GitHub
تعداد مقالات بیشتری مورد بررسی قرار گرفته است.
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
استارت اپ Pika معرفی شد هرچیزی که رو میخوایید کافیه بنویسید تا به فیلم تولید بشه. وقتی از ساختن بازیهای کامپیوتری با #هوش_مصنوعی میگفتم داریم یه گام نزدیکتر میشیم. ایدههاتون رو خلق کنید!
https://pika.art
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://pika.art
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍13❤2
جدیدترین ورژن Keras منتشر شد.
Keras 3.0!
▶ Run Keras on top of JAX, TensorFlow, and PyTorch
▶ Train faster with XLA compilation
▶ Unlock training runs with any number of devices & hosts via the new Keras distribution API
https://keras.io/keras_3/
#پایتون #هوش_مصنوعی #الگوریتمها
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
Keras 3.0!
▶ Run Keras on top of JAX, TensorFlow, and PyTorch
▶ Train faster with XLA compilation
▶ Unlock training runs with any number of devices & hosts via the new Keras distribution API
https://keras.io/keras_3/
#پایتون #هوش_مصنوعی #الگوریتمها
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
اپلیکیشن تبدیل صدا به متن و متن به صدا هم آماده شد. اینم لینکش:
https://github.com/mallahyari/RealtimeSTT-TTS
#پایتون #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
https://github.com/mallahyari/RealtimeSTT-TTS
#پایتون #آموزش
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍9❤1
Forwarded from Ali's Notes (Ali Najafi)
TurkishBERTweet: Fast and Reliable Large Language Model for Social Media Analysis
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11❤1
Forwarded from DeepMind AI Expert (Farzad 🦅)
Media is too big
VIEW IN TELEGRAM
یک مولتی مدل MLT متا منتشر کرده اینجاست بازم میشه با مدلهای بنیادی کلی کار انجام داد.
قبلتر گوگل AudioPaLM رو معرفی کرده بود.
The first, all-in-one, multimodal translation model!
SeamlessM4T, a unified multilingual and multimodal machine translation system that supports ASR, text-to-text translation, speech-to-text translation, text-to-speech translation, and speech-to-speech translation.
🔸 GitHub
🔸 Project
پ.ن: در اپدیت جدید زبان فارسی هم اضافه شده است.
#مقاله #ایده_جذاب
پ.ن: به نظر رقیب جدی گوگل خواهد شد.
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
قبلتر گوگل AudioPaLM رو معرفی کرده بود.
The first, all-in-one, multimodal translation model!
SeamlessM4T, a unified multilingual and multimodal machine translation system that supports ASR, text-to-text translation, speech-to-text translation, text-to-speech translation, and speech-to-speech translation.
🔸 GitHub
🔸 Project
پ.ن: در اپدیت جدید زبان فارسی هم اضافه شده است.
#مقاله #ایده_جذاب
پ.ن: به نظر رقیب جدی گوگل خواهد شد.
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍5
DeepMind AI Expert
استارت اپ Pika معرفی شد هرچیزی که رو میخوایید کافیه بنویسید تا به فیلم تولید بشه. وقتی از ساختن بازیهای کامپیوتری با #هوش_مصنوعی میگفتم داریم یه گام نزدیکتر میشیم. ایدههاتون رو خلق کنید! https://pika.art #مقاله #ایده_جذاب 🔸 مطالب بیشتر 👇👇 ✅ @AI_DeepMind…
در اهمیت ۳بُعدی و دوبُعدی کردن تصاویر همینقدر بگم که چنین فیلم و... که ریپلای کردم به وجود اومده شما میخایی چکار کنید با هوش مصنوعی کامنت کنید
▪️ ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and Planning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ ConceptGraphs: Open-Vocabulary 3D Scene Graphs for Perception and Planning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍1🔥1
قبلتر مدل SAM معرفی کردم ولی اینجا با مدل RAM یک قدم جلوتر در #بینایی_کامپیوتر گذاشتن #مقاله ای که میاد تحلیل معنایی از تصاویر بصری رو ارائه میده و تگهای بیشتری که در تصاویر وجود داره مشخص میکنه این مدل ارتقا یافته مدل مشهور BLIP هستش
▪️ GitHub
▪️ Demo
▪️ Recognize Anything A Strong Image Tagging Model
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ GitHub
▪️ Demo
▪️ Recognize Anything A Strong Image Tagging Model
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍4🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
اینکه چطوری فیلمها رو میشه با #هوش_مصنوعی ساخت و چطوری میشه تصاویر دوبُعدی و سه بُعدی رو تولید کرد میشه از این #مقاله اوپن سورس شده که #ایده_جذابی رو داره، بدست اورد. با اسکن کردن یک محیط که انجام میده میشه دنبال موضوعات جالب گشت و خروجیهای بهتری و متفاوت تری رو بدست اورد و با این مقاله هم یه بازی رئال گونه از زندگی ساخت .و...
▪️ SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
▪️GitHub
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ SplaTAM: Splat, Track & Map 3D Gaussians for Dense RGB-D SLAM
▪️GitHub
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍6
یک قدم خارق العاده ای که شکل گرفته به وجود اومدن مدلهای زبانی ویژن هستش در مدل DreamSync اومدن مدلهای زیر رو باهم ارتباط دادند. اگه دنبال مدلهای ویژنی هستید بهترین شروع هستش
large language models (LLMs), vision-language models (VLMs), and text-to-image (T2I) models
▪️ DreamSync: Aligning Text-to-Image Generation with Image Understanding Feedback
▪️
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
large language models (LLMs), vision-language models (VLMs), and text-to-image (T2I) models
▪️ DreamSync: Aligning Text-to-Image Generation with Image Understanding Feedback
▪️
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
❤3👍3
DeepMind AI Expert
یک قدم خارق العاده ای که شکل گرفته به وجود اومدن مدلهای زبانی ویژن هستش در مدل DreamSync اومدن مدلهای زیر رو باهم ارتباط دادند. اگه دنبال مدلهای ویژنی هستید بهترین شروع هستش large language models (LLMs), vision-language models (VLMs), and text-to-image (T2I)…
حدود چند ماه پیش که فیسبوک (متا) مدل SAM رو معرفی کرد میگذره الان در #مقاله جدیدتری که منتشر کرده کلی دقت و کارایی مدل رو بالاتر بردند و در مقالات قبلتر شیوه توسعه این مدل رو از ابتدا پیگیری کنید و الان کجا هستیم.
image classification, object detection, instance segmentation, and semantic object detection
▪️ GitHub
▪️ EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
image classification, object detection, instance segmentation, and semantic object detection
▪️ GitHub
▪️ EfficientSAM: Leveraged Masked Image Pretraining for Efficient Segment Anything
#ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
🔥1🆒1
This media is not supported in your browser
VIEW IN TELEGRAM
گوگل مولتی مدلی رو ساخته که گلی کارها رو انجام میدخ مثه text, code, audio, image and video و ... که اقدامی ارزشمند برای یک رقابت و توسعه AGI هست.
▪️ Introducing Gemini: our largest and most capable AI model
#ایده_جذاب #مقاله
پ.ن: چرا صداشو تلگرام قطع میکنه نمیدونم داخل سیستم صداشو دارم موقع اپلود هم مراقبم ک بی صدا نشه ولی باز بی صدا اپلود شد
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Introducing Gemini: our largest and most capable AI model
#ایده_جذاب #مقاله
پ.ن: چرا صداشو تلگرام قطع میکنه نمیدونم داخل سیستم صداشو دارم موقع اپلود هم مراقبم ک بی صدا نشه ولی باز بی صدا اپلود شد
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍2😍1
پروژه AutoVisual Fusion Suite، یک تلاش چندگانه برای ادغام دو تکنیک مهم در حوزه هوش مصنوعی است: Video inpainting و Voice Conversion.
در بخش Video inpainting، از مدلهای پیشآموخته segmentation برای انتقال هدف(ها) از یک ویدیو به یک ویدیو دیگر استفاده میشود. در این بخش، دو مدل برجسته که در پلتفرم HuggingFace معرفی شدهاند، یعنی SAM و DETR Model with ResNet-50 backbone، بهعنوان بهترین گزینهها انتخاب شده و پیادهسازی شده است. البته نشان داده شده که SAM عملکرد بهتری ازDETR دارد. برای اپلای SAM به فریم های ویدیو از متریک Intersection over Union (IoU) برای شباهت ماسک فریم های بعدی با فریمی که کاربر در آن تارگت را انتخاب کرده اندازه گیری و انتخاب میشود.
برای استفاده میتونید کد را ران کنید یا ایمیج داکرایز شده برنامه را صرفا برای مدل DETR with ResNet-50 backbone از داکر هاب pull کنید و امتحان کنید.
در بخش Voice Conversion، از مدل so-vits-svc-fork برای تغییر شخصیت صدای سورس به صدای تارگت استفاده شده است. این مدل با سایر مدلهای vc مانند Retrieval-based-Voice-Conversion، AutoVC و Yourtts مقایسه شده است.
پروژه AutoVisual Fusion Suite، این دو بخش را در یک محیط یکپارچه به هم مرتبط کرده و یک راه حل جامع برای مسائل مربوط به تبدیل صدا و تصویر ارائه میدهد.
برای کسب اطلاعات بیشتر، به مخزن گیتهاب زیر مراجعه کنید:
https://github.com/Amirrezahmi/Video-Inpainting-and-Voice-Cloning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
در بخش Video inpainting، از مدلهای پیشآموخته segmentation برای انتقال هدف(ها) از یک ویدیو به یک ویدیو دیگر استفاده میشود. در این بخش، دو مدل برجسته که در پلتفرم HuggingFace معرفی شدهاند، یعنی SAM و DETR Model with ResNet-50 backbone، بهعنوان بهترین گزینهها انتخاب شده و پیادهسازی شده است. البته نشان داده شده که SAM عملکرد بهتری ازDETR دارد. برای اپلای SAM به فریم های ویدیو از متریک Intersection over Union (IoU) برای شباهت ماسک فریم های بعدی با فریمی که کاربر در آن تارگت را انتخاب کرده اندازه گیری و انتخاب میشود.
برای استفاده میتونید کد را ران کنید یا ایمیج داکرایز شده برنامه را صرفا برای مدل DETR with ResNet-50 backbone از داکر هاب pull کنید و امتحان کنید.
در بخش Voice Conversion، از مدل so-vits-svc-fork برای تغییر شخصیت صدای سورس به صدای تارگت استفاده شده است. این مدل با سایر مدلهای vc مانند Retrieval-based-Voice-Conversion، AutoVC و Yourtts مقایسه شده است.
پروژه AutoVisual Fusion Suite، این دو بخش را در یک محیط یکپارچه به هم مرتبط کرده و یک راه حل جامع برای مسائل مربوط به تبدیل صدا و تصویر ارائه میدهد.
برای کسب اطلاعات بیشتر، به مخزن گیتهاب زیر مراجعه کنید:
https://github.com/Amirrezahmi/Video-Inpainting-and-Voice-Cloning
#مقاله #ایده_جذاب
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍7
اگه میخواهید به درکی بهتر انتقال Transfer در #یادگیری_تقویتی برسید این یک منبع ارزشمند هستش.
▪️ Foundations for Transfer in Reinforcement Learning: A Taxonomy of Knowledge Modalities
#ایده_جذاب #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
▪️ Foundations for Transfer in Reinforcement Learning: A Taxonomy of Knowledge Modalities
#ایده_جذاب #مقاله
🔸 مطالب بیشتر 👇👇
✅ @AI_DeepMind
🔸 @AI_Person
👍2
DeepMind AI Expert
گوگل مولتی مدلی رو ساخته که گلی کارها رو انجام میدخ مثه text, code, audio, image and video و ... که اقدامی ارزشمند برای یک رقابت و توسعه AGI هست. ▪️ Introducing Gemini: our largest and most capable AI model #ایده_جذاب #مقاله پ.ن: چرا صداشو تلگرام قطع میکنه…
gemini_1_report.pdf
25.7 MB
👍4