This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬
در اکوسیستم گوگل، این کار حالا فوقالعاده ساده شده است. Google Vids بههمراه Gemini میتواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم بهطور خودکار.
در این فرآیند چه اتفاقی میافتد؟
✨ اسکریپت نوشته میشود
✨ صداگذاری انجام میشود
✨ موسیقی اضافه میشود
✨ ویدئو بر اساس سبک انتخابی شما ساخته میشود
کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام میدهد. این یعنی تبدیل ارائههای خشک به محتوای ویدئویی حرفهای — بدون دردسر تدوین.
🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
در اکوسیستم گوگل، این کار حالا فوقالعاده ساده شده است. Google Vids بههمراه Gemini میتواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم بهطور خودکار.
در این فرآیند چه اتفاقی میافتد؟
✨ اسکریپت نوشته میشود
✨ صداگذاری انجام میشود
✨ موسیقی اضافه میشود
✨ ویدئو بر اساس سبک انتخابی شما ساخته میشود
کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام میدهد. این یعنی تبدیل ارائههای خشک به محتوای ویدئویی حرفهای — بدون دردسر تدوین.
🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1
در ادامه ماراتن نانابانانا پرو 🍌✨
🔍 خیلیها نسخهی جدید Nano Banana Pro را فقط یک ارتقای کیفی میبینند—درحالیکه اصل ماجرا چیز دیگری است. کیفیت فوقالعادهاش (مثل خروجیهای 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا بهطرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.
---
🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه
چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کردهاند، و این یعنی یک دنیای جدید از کاربردها:
📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرامهای توضیحی
📌 ایجاد گرافهای تحلیلی
📌 ترکیب همهٔ اینها برای تبدیلشان به ویدئوهای ارائهای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace
نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.
---
🟡 چرا این برگ برنده دست گوگل است؟
زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را میتواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = دهها کاربرد واقعی و آماده برای میلیونها کاربر.
این همان نقطهای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدلها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».
---
نتیجه؟
نانابانانا پرو نهفقط بهتر شده—بلکه همهجا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصهسازی تصویری.
این نسخه چیزی شبیه دایرهالمعارف مولتیمدیا با موتور Gemini 3 است.
---
@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
🔍 خیلیها نسخهی جدید Nano Banana Pro را فقط یک ارتقای کیفی میبینند—درحالیکه اصل ماجرا چیز دیگری است. کیفیت فوقالعادهاش (مثل خروجیهای 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا بهطرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.
---
🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه
چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کردهاند، و این یعنی یک دنیای جدید از کاربردها:
📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرامهای توضیحی
📌 ایجاد گرافهای تحلیلی
📌 ترکیب همهٔ اینها برای تبدیلشان به ویدئوهای ارائهای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace
نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.
---
🟡 چرا این برگ برنده دست گوگل است؟
زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را میتواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = دهها کاربرد واقعی و آماده برای میلیونها کاربر.
این همان نقطهای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدلها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».
---
نتیجه؟
نانابانانا پرو نهفقط بهتر شده—بلکه همهجا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصهسازی تصویری.
این نسخه چیزی شبیه دایرهالمعارف مولتیمدیا با موتور Gemini 3 است.
---
@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
👍4❤1💯1
سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
GitHub
GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages
Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr
❤1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رندر بود یا ویدیو؟
این تیتر دیگر بیشتر از روی عادت نوشته میشود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.
⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر میکردند که رباتها حتی نمیتوانستند توپ فوتبال را درست بزنند؛ بیشتر شوتها از توپ رد میشد.
⏳ اما حالا چند ماه گذشته…
✨ نتیجه واقعاً حیرتانگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن رباتها به سطحی رسیده که دیدنش آدم را متوقف میکند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.
⚠️ و یک نکته مهمتر:
بهتر است هیچوقت در فاصله نزدیک با این رباتها درگیر نشوید؛ قدرت و سرعت آنها در این مرحله دیگر شوخیبردار نیست.
@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انساننما #اتوماسیون
این تیتر دیگر بیشتر از روی عادت نوشته میشود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.
⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر میکردند که رباتها حتی نمیتوانستند توپ فوتبال را درست بزنند؛ بیشتر شوتها از توپ رد میشد.
⏳ اما حالا چند ماه گذشته…
✨ نتیجه واقعاً حیرتانگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن رباتها به سطحی رسیده که دیدنش آدم را متوقف میکند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.
⚠️ و یک نکته مهمتر:
بهتر است هیچوقت در فاصله نزدیک با این رباتها درگیر نشوید؛ قدرت و سرعت آنها در این مرحله دیگر شوخیبردار نیست.
@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انساننما #اتوماسیون
🔥1
🤖 آیندهای که کار در آن «انتخابی» میشود
ایلان ماسک در نشست سرمایهگذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و رباتهای انساننما، جهان به مرحلهای میرسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دورهای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.
📉 اما نگاه اقتصاددانها محتاطتر است.
آنها تأیید میکنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش رباتها در صنایع پایین است،
• هزینههای جاری و سرمایهگذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.
⏳ آینده به سوی خودکارسازی پیش میرود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیتهای صنعتی و اجتماعی فاصله دارد.
@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی
ایلان ماسک در نشست سرمایهگذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و رباتهای انساننما، جهان به مرحلهای میرسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دورهای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.
📉 اما نگاه اقتصاددانها محتاطتر است.
آنها تأیید میکنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش رباتها در صنایع پایین است،
• هزینههای جاری و سرمایهگذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.
⏳ آینده به سوی خودکارسازی پیش میرود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیتهای صنعتی و اجتماعی فاصله دارد.
@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی
👍1
🎨✨ نانابانانا و ترفندهای تازه برای بازی با مختصات
یکی از جذابترین قابلیتهای نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:
🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset
نتیجه؟ منظرهای کارتپستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد میشوی (چروینیا) اما روی پیستهای سوئیس (زِرمات) سر میخوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه میدهد! 😅⛷️
🎯 ماجرا از این هم جذابتر میشود
وقتی وارد Google Maps میشوید، روی نقطهای از نقشه پین میگذارید، مختصات را کپی میکنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابانهای سنپترزبورگ — و همان را به نانابانانا میدهید.
🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمیکند؛ یک تصویر «عمومیشده» بر اساس انبوه دادههای اینترنت میسازد.
برای جزیره قبرس هم تست شده:
• ساحلها را اشتباه میکشد،
• حتی وسط کوهستان هم دریا نقاشی میکند!
در عوض حالوهوا، نور، حس مکان را فوقالعاده درمیآورد — فقط نه با دقت ژئومپینگ واقعی.
این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشهبردار ماهوارهای.
@rss_ai_ir
#هوش_مصنوعی ✨ #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین
یکی از جذابترین قابلیتهای نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:
🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset
نتیجه؟ منظرهای کارتپستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد میشوی (چروینیا) اما روی پیستهای سوئیس (زِرمات) سر میخوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه میدهد! 😅⛷️
🎯 ماجرا از این هم جذابتر میشود
وقتی وارد Google Maps میشوید، روی نقطهای از نقشه پین میگذارید، مختصات را کپی میکنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابانهای سنپترزبورگ — و همان را به نانابانانا میدهید.
🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمیکند؛ یک تصویر «عمومیشده» بر اساس انبوه دادههای اینترنت میسازد.
برای جزیره قبرس هم تست شده:
• ساحلها را اشتباه میکشد،
• حتی وسط کوهستان هم دریا نقاشی میکند!
در عوض حالوهوا، نور، حس مکان را فوقالعاده درمیآورد — فقط نه با دقت ژئومپینگ واقعی.
این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشهبردار ماهوارهای.
@rss_ai_ir
#هوش_مصنوعی ✨ #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین
❤2🔥1
🧬⚡️ راهنمای جدید انویدیا برای مقیاسپذیری مدلهای زیستی
شرکت NVIDIA یک گاید جامع منتشر کرده که نشان میدهد چگونه میتوان مدلهای بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستمهای پیچیده از صفر.
سه ایدهٔ کلیدی همه چیز را تغییر میدهند:
۱) بهکارگیری Transformer Engine ⚙️
این موتور، بلاکهای استاندارد ترنسفورمر را با نسخههای بهینهشده جایگزین میکند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضربهای ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.
۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازیسازی ترکیبی، مدل میتواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندیها از قبل آمادهاند و نیازی نیست مهندسی موازیسازی را دستی بسازید.
۳) صرفهجویی بزرگ در VRAM با sequence packing 💡
دادههای زیستی—مثل توالی پروتئینها—طولهای بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه میشود.
همچنین Sequence Packing توالیها را فشرده میکند، پدینگها حذف میشوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدلهای بزرگتر روی GPUهای کوچکتر
مزیت نهایی این روشها در BioNeMo Recipes این است که همچنان میتوان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریمورکهای سطح بالا رسید.
🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیستمحاسباتی
شرکت NVIDIA یک گاید جامع منتشر کرده که نشان میدهد چگونه میتوان مدلهای بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستمهای پیچیده از صفر.
سه ایدهٔ کلیدی همه چیز را تغییر میدهند:
۱) بهکارگیری Transformer Engine ⚙️
این موتور، بلاکهای استاندارد ترنسفورمر را با نسخههای بهینهشده جایگزین میکند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضربهای ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.
۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازیسازی ترکیبی، مدل میتواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندیها از قبل آمادهاند و نیازی نیست مهندسی موازیسازی را دستی بسازید.
۳) صرفهجویی بزرگ در VRAM با sequence packing 💡
دادههای زیستی—مثل توالی پروتئینها—طولهای بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه میشود.
همچنین Sequence Packing توالیها را فشرده میکند، پدینگها حذف میشوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدلهای بزرگتر روی GPUهای کوچکتر
مزیت نهایی این روشها در BioNeMo Recipes این است که همچنان میتوان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریمورکهای سطح بالا رسید.
🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیستمحاسباتی
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🇨🇳 رکورد جهانی تازه برای رباتهای پیادهرو
ربات تازهنفس ساخت چین توانست رکورد جهانی طولانیترین مسیر پیمودهشده بدون توقف را جابهجا کند:
بیش از ۱۰۶ کیلومتر پیادهروی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶♂️🤖
این رکورد جدید نشان میدهد صنعت رباتیک چین با سرعتی بیسابقه در حال نزدیکشدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکتهایی که روی رباتهای انساننما، تحویل خودکار، بازرسی صنعتی یا عملیاتهای طولانی کار میکنند، این پیشرفت یک نقطهعطف جدی محسوب میشود.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation
ربات تازهنفس ساخت چین توانست رکورد جهانی طولانیترین مسیر پیمودهشده بدون توقف را جابهجا کند:
بیش از ۱۰۶ کیلومتر پیادهروی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶♂️🤖
این رکورد جدید نشان میدهد صنعت رباتیک چین با سرعتی بیسابقه در حال نزدیکشدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکتهایی که روی رباتهای انساننما، تحویل خودکار، بازرسی صنعتی یا عملیاتهای طولانی کار میکنند، این پیشرفت یک نقطهعطف جدی محسوب میشود.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation
This media is not supported in your browser
VIEW IN TELEGRAM
🦞 استفاده از تنها یک تصویر مصنوعی برای هر کلاس 🦞
پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کردهاند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه میدهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دستهبند خطی را آموزش داد — و حتی فراتر از آن!
این تکنیک، ساختار گرادیانها را بازسازی میکند تا مدل بدون نیاز به مجموعهدادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ دادهسازی و سرعت بسیار بالاتر در آموزش مدلها.
📌 لینکها:
👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching
@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپلرنینگ #DataDistillation #AI 🧠✨
پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کردهاند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه میدهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دستهبند خطی را آموزش داد — و حتی فراتر از آن!
این تکنیک، ساختار گرادیانها را بازسازی میکند تا مدل بدون نیاز به مجموعهدادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ دادهسازی و سرعت بسیار بالاتر در آموزش مدلها.
📌 لینکها:
👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching
@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپلرنینگ #DataDistillation #AI 🧠✨
🔥1🙏1👌1
🔥 مقایسه Gemini 3.0 با رادیولوژیستها؛ نتایج RadLE منتشر شد
دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل میتواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»
برای پاسخ، سختترین معیار موجود انتخاب شد: RadLE v1.
📊 نتایج تست Gemini 3.0 Pro روی RadLE v1
دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنتهای رادیولوژی بهتر باشد
رزیدنتهای رادیولوژی: ۴۵٪
رادیولوژیستهای هیئتمدارکدار: ۸۳٪
مدل بهصورت پایدار استدلال مرحلهبهمرحله ارائه میکند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه
✨ برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سختترین بنچمارک رادیولوژی عبور کند.
@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI
دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل میتواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»
برای پاسخ، سختترین معیار موجود انتخاب شد: RadLE v1.
📊 نتایج تست Gemini 3.0 Pro روی RadLE v1
دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنتهای رادیولوژی بهتر باشد
رزیدنتهای رادیولوژی: ۴۵٪
رادیولوژیستهای هیئتمدارکدار: ۸۳٪
مدل بهصورت پایدار استدلال مرحلهبهمرحله ارائه میکند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه
✨ برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سختترین بنچمارک رادیولوژی عبور کند.
@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI
👏2❤1⚡1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ربات AlohaMini؛ انقلاب ششصد دلاری در رباتهای خانگی و Embodied-AI
دنیای رباتیک یک قدم دیگر به خانههای ما نزدیکتر شد. AlohaMini معرفی شده؛ رباتی دودستی، موبایل و کاملاً قابل چاپ با پرینتر سهبعدی — با هزینهای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.
این ربات مخصوص علاقهمندان، پژوهشگران و توسعهدهندگانی است که میخواهند بدون هزینههای سنگین، روی هوش تجسمیافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.
✨ ویژگیها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابهجایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتیمتر
◼️ کاملاً متنباز و سازگار با LeRobot برای شروع سریع برنامهنویسی
◼️ دو نسخه:
• Mini (کاملاً چاپ سهبعدی)
• Pro (ترکیب مواد مقاومتر)
🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، میتواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدلهای RL، Teleoperation و حتی یادگیری ادراکی بسازد.
📎 سورس کامل، فایلهای چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini
@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY
دنیای رباتیک یک قدم دیگر به خانههای ما نزدیکتر شد. AlohaMini معرفی شده؛ رباتی دودستی، موبایل و کاملاً قابل چاپ با پرینتر سهبعدی — با هزینهای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.
این ربات مخصوص علاقهمندان، پژوهشگران و توسعهدهندگانی است که میخواهند بدون هزینههای سنگین، روی هوش تجسمیافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.
✨ ویژگیها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابهجایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتیمتر
◼️ کاملاً متنباز و سازگار با LeRobot برای شروع سریع برنامهنویسی
◼️ دو نسخه:
• Mini (کاملاً چاپ سهبعدی)
• Pro (ترکیب مواد مقاومتر)
🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، میتواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدلهای RL، Teleoperation و حتی یادگیری ادراکی بسازد.
📎 سورس کامل، فایلهای چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini
@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY
❤1👍1🔥1👏1