This media is not supported in your browser
VIEW IN TELEGRAM
🍯 بازکردن هوشمندانهی UV برای مشهای سهبعدی 🍯
روش PartUV یک تکنیک جدید برای UV Unwrapping است که بهجای باز کردن کامل مش، آن را بر اساس «قطعات» تجزیه میکند. این مدل، ترکیبی از دانش یادگرفتهشده دربارهٔ بخشهای مختلف جسم و نشانههای هندسی است و در نهایت یک مجموعه کوچک، منظم و کاملاً همراستا با ساختار قطعهها تولید میکند.
✨ مناسب برای:
مدلسازی سهبعدی، گیم، انیمیشن، ریتاپو، تکسچرینگ حرفهای.
🎁 ریپوی پروژه هم منتشر شده.
🔗 لینکها
• Paper: arxiv.org/pdf/2511.16659
• Project: www.zhaoningwang.com/PartUV/
• Repo: github.com/EricWang12/PartUV
#سه_بعدی #UV #Mesh #AI3D
روش PartUV یک تکنیک جدید برای UV Unwrapping است که بهجای باز کردن کامل مش، آن را بر اساس «قطعات» تجزیه میکند. این مدل، ترکیبی از دانش یادگرفتهشده دربارهٔ بخشهای مختلف جسم و نشانههای هندسی است و در نهایت یک مجموعه کوچک، منظم و کاملاً همراستا با ساختار قطعهها تولید میکند.
✨ مناسب برای:
مدلسازی سهبعدی، گیم، انیمیشن، ریتاپو، تکسچرینگ حرفهای.
🎁 ریپوی پروژه هم منتشر شده.
🔗 لینکها
• Paper: arxiv.org/pdf/2511.16659
• Project: www.zhaoningwang.com/PartUV/
• Repo: github.com/EricWang12/PartUV
#سه_بعدی #UV #Mesh #AI3D
👍1
📌 مجموعه Figure گزارشی مفصل منتشر کرد از اینکه رباتهای Figure 02 چگونه به مدت ۱۱ ماه در کارخانه BMW کار کردند.
داستان اصلاً آزمایشگاهی نبود؛ این اولین جنگ واقعی صنعتی برای رباتها بود. تنها ۶ ماه بعد از معرفی مدل 02، آنها وارد خط تولید BMW شدند و تا ماه دهم به ظرفیت کاری کامل رسیدند.
🔧 شیفت کاری:
▪️ ۱۰ ساعت در روز
▪️ از دوشنبه تا جمعه
▪️ بیش از ۱۲۵۰ ساعت کار واقعی روی خط تولید
در مجموع، رباتها بیش از ۹۰ هزار قطعه را جابهجا کردند و در تولید ۳۰ هزار خودرو سری X3 نقش مستقیم داشتند. همچنین بیش از ۱.۲ میلیون قدم برداشتند و حدود ۳۲۰ کیلومتر در فضای کارخانه راه رفتند.
---
🎯 وظیفه اصلی رباتها
«لود کردن ورقهای فلزی» — یک کار کلاسیک صنعتی، اما بسیار دقیق.
ربات باید ورق فلزی را بردارد و با دقت ۵ میلیمتر داخل دستگاه جوش قرار دهد.
برای سنجش عملکرد، مهندسان KPIهای سختی تعیین کرده بودند:
🟢 ۸۴ ثانیه برای کاملکردن هر چرخه
🟢 بیش از ۹۹٪ نرخ موفقیت
🟢 صفر دخالت انسانی در هر شیفت
این اهداف باعث شد Figure الگوریتمهای جدید هماهنگی چشم–دست و گامبرداری تطبیقی را توسعه دهد.
---
🚧 چه چیزی خراب شد؟ تجربه واقعی یعنی پیدا کردن گلوگاهها.
با ورود Figure 03، نسل دوم رسماً بازنشسته شد. مهمترین نقطهضعف Figure 02 در عمل چه بود؟
❗️ پیشدستی (Forearm)
بهدلیل طراحی فشرده و نیاز به چابکی، این بخش:
— داغ میکرد
— تعمیرش سخت بود
— نقطهضعف کل سیستم محسوب میشد
در Figure 03 معماری این بخش کاملاً اصلاح شد:
🔵 برد توزیع برق حذف شد
🔵 سیمکشی دینامیک کنار گذاشته شد
🔵 کنترلرهای موتور مستقیماً به کامپیوتر مرکزی وصل شدند
اساساً تجربه سخت کارخانه BMW تبدیل شد به یک نسخهی کاملاً بهتر و مهندسیشده.
https://www.figure.ai/news/production-at-bmw
---
@rss_ai_ir
#هوش_مصنوعی #رباتیک #BMW #Figure #AI #Industry4_0
داستان اصلاً آزمایشگاهی نبود؛ این اولین جنگ واقعی صنعتی برای رباتها بود. تنها ۶ ماه بعد از معرفی مدل 02، آنها وارد خط تولید BMW شدند و تا ماه دهم به ظرفیت کاری کامل رسیدند.
🔧 شیفت کاری:
▪️ ۱۰ ساعت در روز
▪️ از دوشنبه تا جمعه
▪️ بیش از ۱۲۵۰ ساعت کار واقعی روی خط تولید
در مجموع، رباتها بیش از ۹۰ هزار قطعه را جابهجا کردند و در تولید ۳۰ هزار خودرو سری X3 نقش مستقیم داشتند. همچنین بیش از ۱.۲ میلیون قدم برداشتند و حدود ۳۲۰ کیلومتر در فضای کارخانه راه رفتند.
---
🎯 وظیفه اصلی رباتها
«لود کردن ورقهای فلزی» — یک کار کلاسیک صنعتی، اما بسیار دقیق.
ربات باید ورق فلزی را بردارد و با دقت ۵ میلیمتر داخل دستگاه جوش قرار دهد.
برای سنجش عملکرد، مهندسان KPIهای سختی تعیین کرده بودند:
🟢 ۸۴ ثانیه برای کاملکردن هر چرخه
🟢 بیش از ۹۹٪ نرخ موفقیت
🟢 صفر دخالت انسانی در هر شیفت
این اهداف باعث شد Figure الگوریتمهای جدید هماهنگی چشم–دست و گامبرداری تطبیقی را توسعه دهد.
---
🚧 چه چیزی خراب شد؟ تجربه واقعی یعنی پیدا کردن گلوگاهها.
با ورود Figure 03، نسل دوم رسماً بازنشسته شد. مهمترین نقطهضعف Figure 02 در عمل چه بود؟
❗️ پیشدستی (Forearm)
بهدلیل طراحی فشرده و نیاز به چابکی، این بخش:
— داغ میکرد
— تعمیرش سخت بود
— نقطهضعف کل سیستم محسوب میشد
در Figure 03 معماری این بخش کاملاً اصلاح شد:
🔵 برد توزیع برق حذف شد
🔵 سیمکشی دینامیک کنار گذاشته شد
🔵 کنترلرهای موتور مستقیماً به کامپیوتر مرکزی وصل شدند
اساساً تجربه سخت کارخانه BMW تبدیل شد به یک نسخهی کاملاً بهتر و مهندسیشده.
https://www.figure.ai/news/production-at-bmw
---
@rss_ai_ir
#هوش_مصنوعی #رباتیک #BMW #Figure #AI #Industry4_0
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 مدل Nano Banana Pro؛ یک دمو جذاب از قدرت نسل جدید مدلهای تصویری گوگل
⛔️در این نمونه، مدل با یک پرامپت ساده توانسته یک تصویر کاملاً سبکدار و دقیق بسازد:
🎨 پرامپت:
🔧 نکته:
✅حرکت و انیمیشن نهایی هم با Veo 3 ساخته شده.
@rss_ai_ir
#هوش_مصنوعی #نقشهکشی #NanoBananaPro #گوگل #تولید_تصویر #AI
⛔️در این نمونه، مدل با یک پرامپت ساده توانسته یک تصویر کاملاً سبکدار و دقیق بسازد:
🎨 پرامپت:
Generate a diagram of a two-layer neural network in the style of Stephen Biesty
🔧 نکته:
✅حرکت و انیمیشن نهایی هم با Veo 3 ساخته شده.
@rss_ai_ir
#هوش_مصنوعی #نقشهکشی #NanoBananaPro #گوگل #تولید_تصویر #AI
This media is not supported in your browser
VIEW IN TELEGRAM
⚡ ابزار مخصوص کسانی که از جدولسازی متنفرند
این سرویس فقط با یک پرامپت، خودش جدول را برایتان تکمیل میکند.
کافی است فایل را آپلود کنید یا لینک بدهید — بقیه کارها را هوش مصنوعی خودش انجام میدهد.
🔗 لینک
https://labs.ramp.com/sheets
@rss_ai_ir
#هوش_مصنوعی #جدول #بهرهوری #AITools #اتوماسیون
این سرویس فقط با یک پرامپت، خودش جدول را برایتان تکمیل میکند.
کافی است فایل را آپلود کنید یا لینک بدهید — بقیه کارها را هوش مصنوعی خودش انجام میدهد.
🔗 لینک
https://labs.ramp.com/sheets
@rss_ai_ir
#هوش_مصنوعی #جدول #بهرهوری #AITools #اتوماسیون
🧠 نشانههای واقعی یک جهش علمی با GPT-5
هوش مصنوعی فقط ابزار نیست—کمکم تبدیل میشود به عضو فعال تیم پژوهشی.
نتایج جدید OpenAI دقیقاً همین را نشان میدهد:
✨ همچنین GPT-5 دیگر فقط خلاصه نمیکند؛ خودش فرمول و قضیهٔ جدید میسازد
مدل توانایی استنتاج ریاضی و تولید روابط پیچیده را بهصورت مستقل پیدا کرده است.
🌀 در فیزیک، روی تقارنهای سیاهچالهها کار میکند—و درست هم کار میکند
تحلیل ساختارهای SL(2,R) در فضا-زمان خمیده، چیزی فراتر از اتوکامپلیت است.
این یعنی فهم انتزاع، نه حفظ متن.
📚 منابع علمی فراموششده را در چند دقیقه پیدا میکند
مقالههایی که پژوهشگر انسانی شاید هرگز نبیند، توسط مدل از عمق آرشیوها بیرون کشیده میشود.
🧬 در زیستشناسی هم سازوکارهای جدید پیشنهاد میدهد
و حیرتانگیزتر اینکه برخی از این پیشنهادها با نتایج آزمایشهایی که هنوز منتشر نشدهاند همخوانی دارد.
🧪 پیشنهاد آزمایش در سطح یک همنویسنده
دیگر نقش مدل فقط “کمککننده” نیست؛ به بخشی از فرایند علمی تبدیل شده است.
📌 این یعنی چه؟
• هزینهٔ کشف علمی نزدیک به صفر میشود
• گلوگاههای تخصصی کلاسیک از بین میروند
• تیمهای «انسان + هوش مصنوعی» از کل یک شاخه علمی سریعتر خواهند بود
• چرخهٔ کامل پژوهش—from idea to result—فشرده و خودکار میشود
اگر میپرسید شروع تکینگی فناورانه چه شکلی است…
احتمالاً بسیار شبیه همین چیزی است که اکنون میبینیم.
🔗 جزئیات کامل:
https://openai.com/index/accelerating-science-gpt-5/
@rss_ai_ir
#openai #chatgpt #هوش_مصنوعی #پژوهش #علم #GPT5
هوش مصنوعی فقط ابزار نیست—کمکم تبدیل میشود به عضو فعال تیم پژوهشی.
نتایج جدید OpenAI دقیقاً همین را نشان میدهد:
✨ همچنین GPT-5 دیگر فقط خلاصه نمیکند؛ خودش فرمول و قضیهٔ جدید میسازد
مدل توانایی استنتاج ریاضی و تولید روابط پیچیده را بهصورت مستقل پیدا کرده است.
🌀 در فیزیک، روی تقارنهای سیاهچالهها کار میکند—و درست هم کار میکند
تحلیل ساختارهای SL(2,R) در فضا-زمان خمیده، چیزی فراتر از اتوکامپلیت است.
این یعنی فهم انتزاع، نه حفظ متن.
📚 منابع علمی فراموششده را در چند دقیقه پیدا میکند
مقالههایی که پژوهشگر انسانی شاید هرگز نبیند، توسط مدل از عمق آرشیوها بیرون کشیده میشود.
🧬 در زیستشناسی هم سازوکارهای جدید پیشنهاد میدهد
و حیرتانگیزتر اینکه برخی از این پیشنهادها با نتایج آزمایشهایی که هنوز منتشر نشدهاند همخوانی دارد.
🧪 پیشنهاد آزمایش در سطح یک همنویسنده
دیگر نقش مدل فقط “کمککننده” نیست؛ به بخشی از فرایند علمی تبدیل شده است.
📌 این یعنی چه؟
• هزینهٔ کشف علمی نزدیک به صفر میشود
• گلوگاههای تخصصی کلاسیک از بین میروند
• تیمهای «انسان + هوش مصنوعی» از کل یک شاخه علمی سریعتر خواهند بود
• چرخهٔ کامل پژوهش—from idea to result—فشرده و خودکار میشود
اگر میپرسید شروع تکینگی فناورانه چه شکلی است…
احتمالاً بسیار شبیه همین چیزی است که اکنون میبینیم.
🔗 جزئیات کامل:
https://openai.com/index/accelerating-science-gpt-5/
@rss_ai_ir
#openai #chatgpt #هوش_مصنوعی #پژوهش #علم #GPT5
🔥2👍1👏1
🌉🤖 ابزار CodexMCP؛ پل هوشمند بین Claude Code و Codex برای کدنویسی تعاملی
ابزار CodexMCP مثل یک «لایه هماهنگکننده» بین Claude Code و Codex عمل میکند و کمک میکند چند ایجنت هوش مصنوعی همزمان روی یک پروژه کدنویسی کار کنند و خروجی منسجمتری بدهند.
🔹 پشتیبانی از دیالوگهای چندمرحلهای و انجام همزمان چند تسک برنامهنویسی
🔹 مدیریت حرفهای کانتکست و حفظ سشنها برای کارهای طولانی و تکرارشونده
🔹 استفاده از Claude Code برای تحلیل نیازمندی، معماری و طراحی قبل از نوشتن کد
🔹 امکان ردیابی لاگ، جزییات خروجی و هندلکردن خطاها در فرآیند اجرای تسکها
لینک GitHub:
https://github.com/GuDaStudio/codexmcp
@rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #کدنویسی_خودکار #MCP #Claude #Codex #python
ابزار CodexMCP مثل یک «لایه هماهنگکننده» بین Claude Code و Codex عمل میکند و کمک میکند چند ایجنت هوش مصنوعی همزمان روی یک پروژه کدنویسی کار کنند و خروجی منسجمتری بدهند.
🔹 پشتیبانی از دیالوگهای چندمرحلهای و انجام همزمان چند تسک برنامهنویسی
🔹 مدیریت حرفهای کانتکست و حفظ سشنها برای کارهای طولانی و تکرارشونده
🔹 استفاده از Claude Code برای تحلیل نیازمندی، معماری و طراحی قبل از نوشتن کد
🔹 امکان ردیابی لاگ، جزییات خروجی و هندلکردن خطاها در فرآیند اجرای تسکها
لینک GitHub:
https://github.com/GuDaStudio/codexmcp
@rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #کدنویسی_خودکار #MCP #Claude #Codex #python
👍1🔥1🥰1
🍕 Upsample Anything —
آپسمپلکننده یونیورسال بدون نیاز به آموزش 🍕
مدل Upsample Anything یک روش جدید و بدون نیاز به آموزش برای بزرگکردن هر نوع تصویر، ویدیو یا داده تصویری است.
این روش با یک بهینهسازی بسیار سبک در زمان اجرا کار میکند و نیاز به مدلهای سنگین یا دیتاستهای بزرگ ندارد.
🔍 برای کسانی که با سوپررزولوشن کار میکنند، این مقاله ارزش دیدن دارد.
📑 Paper:
https://lnkd.in/dsUfdtih
@rss_ai_ir
#Upsample #ImageAI #SuperResolution #ComputerVision #AI
آپسمپلکننده یونیورسال بدون نیاز به آموزش 🍕
مدل Upsample Anything یک روش جدید و بدون نیاز به آموزش برای بزرگکردن هر نوع تصویر، ویدیو یا داده تصویری است.
این روش با یک بهینهسازی بسیار سبک در زمان اجرا کار میکند و نیاز به مدلهای سنگین یا دیتاستهای بزرگ ندارد.
🔍 برای کسانی که با سوپررزولوشن کار میکنند، این مقاله ارزش دیدن دارد.
📑 Paper:
https://lnkd.in/dsUfdtih
@rss_ai_ir
#Upsample #ImageAI #SuperResolution #ComputerVision #AI
❤1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬
در اکوسیستم گوگل، این کار حالا فوقالعاده ساده شده است. Google Vids بههمراه Gemini میتواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم بهطور خودکار.
در این فرآیند چه اتفاقی میافتد؟
✨ اسکریپت نوشته میشود
✨ صداگذاری انجام میشود
✨ موسیقی اضافه میشود
✨ ویدئو بر اساس سبک انتخابی شما ساخته میشود
کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام میدهد. این یعنی تبدیل ارائههای خشک به محتوای ویدئویی حرفهای — بدون دردسر تدوین.
🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
در اکوسیستم گوگل، این کار حالا فوقالعاده ساده شده است. Google Vids بههمراه Gemini میتواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم بهطور خودکار.
در این فرآیند چه اتفاقی میافتد؟
✨ اسکریپت نوشته میشود
✨ صداگذاری انجام میشود
✨ موسیقی اضافه میشود
✨ ویدئو بر اساس سبک انتخابی شما ساخته میشود
کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام میدهد. این یعنی تبدیل ارائههای خشک به محتوای ویدئویی حرفهای — بدون دردسر تدوین.
🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections
@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1
در ادامه ماراتن نانابانانا پرو 🍌✨
🔍 خیلیها نسخهی جدید Nano Banana Pro را فقط یک ارتقای کیفی میبینند—درحالیکه اصل ماجرا چیز دیگری است. کیفیت فوقالعادهاش (مثل خروجیهای 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا بهطرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.
---
🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه
چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کردهاند، و این یعنی یک دنیای جدید از کاربردها:
📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرامهای توضیحی
📌 ایجاد گرافهای تحلیلی
📌 ترکیب همهٔ اینها برای تبدیلشان به ویدئوهای ارائهای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace
نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.
---
🟡 چرا این برگ برنده دست گوگل است؟
زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را میتواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = دهها کاربرد واقعی و آماده برای میلیونها کاربر.
این همان نقطهای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدلها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».
---
نتیجه؟
نانابانانا پرو نهفقط بهتر شده—بلکه همهجا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصهسازی تصویری.
این نسخه چیزی شبیه دایرهالمعارف مولتیمدیا با موتور Gemini 3 است.
---
@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
🔍 خیلیها نسخهی جدید Nano Banana Pro را فقط یک ارتقای کیفی میبینند—درحالیکه اصل ماجرا چیز دیگری است. کیفیت فوقالعادهاش (مثل خروجیهای 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا بهطرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.
---
🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه
چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کردهاند، و این یعنی یک دنیای جدید از کاربردها:
📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرامهای توضیحی
📌 ایجاد گرافهای تحلیلی
📌 ترکیب همهٔ اینها برای تبدیلشان به ویدئوهای ارائهای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace
نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.
---
🟡 چرا این برگ برنده دست گوگل است؟
زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را میتواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = دهها کاربرد واقعی و آماده برای میلیونها کاربر.
این همان نقطهای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدلها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».
---
نتیجه؟
نانابانانا پرو نهفقط بهتر شده—بلکه همهجا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصهسازی تصویری.
این نسخه چیزی شبیه دایرهالمعارف مولتیمدیا با موتور Gemini 3 است.
---
@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
👍4❤1💯1
سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
بیش از ۱۶۰۰ زبان (حتی زبانهای کممنبع و محلی) را پشتیبانی میکند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.
✨ ویژگیها:
✳️پشتیبانی از زبانهای بسیار متنوع، از رایج تا کاملاً نادر
✳️امکان اضافه کردن زبانهای جدید با دادهی آموزشی بسیار کم (few-shot / zero-shot)
✳️طراحیشده برای دسترسپذیری و شمول جوامع مختلف زبانی
✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیتهاب
لینک گیتهاب 🔗
https://github.com/facebookresearch/omnilingual-asr
@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
GitHub
GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages
Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr
❤1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رندر بود یا ویدیو؟
این تیتر دیگر بیشتر از روی عادت نوشته میشود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.
⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر میکردند که رباتها حتی نمیتوانستند توپ فوتبال را درست بزنند؛ بیشتر شوتها از توپ رد میشد.
⏳ اما حالا چند ماه گذشته…
✨ نتیجه واقعاً حیرتانگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن رباتها به سطحی رسیده که دیدنش آدم را متوقف میکند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.
⚠️ و یک نکته مهمتر:
بهتر است هیچوقت در فاصله نزدیک با این رباتها درگیر نشوید؛ قدرت و سرعت آنها در این مرحله دیگر شوخیبردار نیست.
@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انساننما #اتوماسیون
این تیتر دیگر بیشتر از روی عادت نوشته میشود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.
⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر میکردند که رباتها حتی نمیتوانستند توپ فوتبال را درست بزنند؛ بیشتر شوتها از توپ رد میشد.
⏳ اما حالا چند ماه گذشته…
✨ نتیجه واقعاً حیرتانگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن رباتها به سطحی رسیده که دیدنش آدم را متوقف میکند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.
⚠️ و یک نکته مهمتر:
بهتر است هیچوقت در فاصله نزدیک با این رباتها درگیر نشوید؛ قدرت و سرعت آنها در این مرحله دیگر شوخیبردار نیست.
@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انساننما #اتوماسیون
🔥1
🤖 آیندهای که کار در آن «انتخابی» میشود
ایلان ماسک در نشست سرمایهگذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و رباتهای انساننما، جهان به مرحلهای میرسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دورهای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.
📉 اما نگاه اقتصاددانها محتاطتر است.
آنها تأیید میکنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش رباتها در صنایع پایین است،
• هزینههای جاری و سرمایهگذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.
⏳ آینده به سوی خودکارسازی پیش میرود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیتهای صنعتی و اجتماعی فاصله دارد.
@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی
ایلان ماسک در نشست سرمایهگذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و رباتهای انساننما، جهان به مرحلهای میرسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دورهای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.
📉 اما نگاه اقتصاددانها محتاطتر است.
آنها تأیید میکنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش رباتها در صنایع پایین است،
• هزینههای جاری و سرمایهگذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.
⏳ آینده به سوی خودکارسازی پیش میرود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیتهای صنعتی و اجتماعی فاصله دارد.
@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی
👍1
🎨✨ نانابانانا و ترفندهای تازه برای بازی با مختصات
یکی از جذابترین قابلیتهای نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:
🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset
نتیجه؟ منظرهای کارتپستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد میشوی (چروینیا) اما روی پیستهای سوئیس (زِرمات) سر میخوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه میدهد! 😅⛷️
🎯 ماجرا از این هم جذابتر میشود
وقتی وارد Google Maps میشوید، روی نقطهای از نقشه پین میگذارید، مختصات را کپی میکنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابانهای سنپترزبورگ — و همان را به نانابانانا میدهید.
🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمیکند؛ یک تصویر «عمومیشده» بر اساس انبوه دادههای اینترنت میسازد.
برای جزیره قبرس هم تست شده:
• ساحلها را اشتباه میکشد،
• حتی وسط کوهستان هم دریا نقاشی میکند!
در عوض حالوهوا، نور، حس مکان را فوقالعاده درمیآورد — فقط نه با دقت ژئومپینگ واقعی.
این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشهبردار ماهوارهای.
@rss_ai_ir
#هوش_مصنوعی ✨ #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین
یکی از جذابترین قابلیتهای نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:
🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset
نتیجه؟ منظرهای کارتپستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد میشوی (چروینیا) اما روی پیستهای سوئیس (زِرمات) سر میخوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه میدهد! 😅⛷️
🎯 ماجرا از این هم جذابتر میشود
وقتی وارد Google Maps میشوید، روی نقطهای از نقشه پین میگذارید، مختصات را کپی میکنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابانهای سنپترزبورگ — و همان را به نانابانانا میدهید.
🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمیکند؛ یک تصویر «عمومیشده» بر اساس انبوه دادههای اینترنت میسازد.
برای جزیره قبرس هم تست شده:
• ساحلها را اشتباه میکشد،
• حتی وسط کوهستان هم دریا نقاشی میکند!
در عوض حالوهوا، نور، حس مکان را فوقالعاده درمیآورد — فقط نه با دقت ژئومپینگ واقعی.
این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشهبردار ماهوارهای.
@rss_ai_ir
#هوش_مصنوعی ✨ #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین
❤2🔥1
🧬⚡️ راهنمای جدید انویدیا برای مقیاسپذیری مدلهای زیستی
شرکت NVIDIA یک گاید جامع منتشر کرده که نشان میدهد چگونه میتوان مدلهای بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستمهای پیچیده از صفر.
سه ایدهٔ کلیدی همه چیز را تغییر میدهند:
۱) بهکارگیری Transformer Engine ⚙️
این موتور، بلاکهای استاندارد ترنسفورمر را با نسخههای بهینهشده جایگزین میکند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضربهای ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.
۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازیسازی ترکیبی، مدل میتواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندیها از قبل آمادهاند و نیازی نیست مهندسی موازیسازی را دستی بسازید.
۳) صرفهجویی بزرگ در VRAM با sequence packing 💡
دادههای زیستی—مثل توالی پروتئینها—طولهای بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه میشود.
همچنین Sequence Packing توالیها را فشرده میکند، پدینگها حذف میشوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدلهای بزرگتر روی GPUهای کوچکتر
مزیت نهایی این روشها در BioNeMo Recipes این است که همچنان میتوان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریمورکهای سطح بالا رسید.
🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیستمحاسباتی
شرکت NVIDIA یک گاید جامع منتشر کرده که نشان میدهد چگونه میتوان مدلهای بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستمهای پیچیده از صفر.
سه ایدهٔ کلیدی همه چیز را تغییر میدهند:
۱) بهکارگیری Transformer Engine ⚙️
این موتور، بلاکهای استاندارد ترنسفورمر را با نسخههای بهینهشده جایگزین میکند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضربهای ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.
۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازیسازی ترکیبی، مدل میتواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندیها از قبل آمادهاند و نیازی نیست مهندسی موازیسازی را دستی بسازید.
۳) صرفهجویی بزرگ در VRAM با sequence packing 💡
دادههای زیستی—مثل توالی پروتئینها—طولهای بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه میشود.
همچنین Sequence Packing توالیها را فشرده میکند، پدینگها حذف میشوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدلهای بزرگتر روی GPUهای کوچکتر
مزیت نهایی این روشها در BioNeMo Recipes این است که همچنان میتوان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریمورکهای سطح بالا رسید.
🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/
@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیستمحاسباتی