🚀 گوگل از EmbeddingGemma رونمایی کرد؛ یک مدل سبک و اوپنسورس برای ایجاد امبدینگهای متنی.
📌 ویژگی مهم: این مدل را میتوان مستقیم روی موبایل یا لپتاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.
🟢 چه چیزی داخلش هست؟
✳️308 میلیون پارامتر، اما از همه مدلهای زیر 500M در کیفیت بهتر عمل میکند (طبق MTEB)
✳️سرعت بسیار بالا: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
✳️پشتیبانی از بیش از 100 زبان
✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت
✳️پشتیبانی از کانتکست تا 2000 توکن
✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب
🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
@rss_ai_ir
#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP
📌 ویژگی مهم: این مدل را میتوان مستقیم روی موبایل یا لپتاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.
🟢 چه چیزی داخلش هست؟
✳️308 میلیون پارامتر، اما از همه مدلهای زیر 500M در کیفیت بهتر عمل میکند (طبق MTEB)
✳️سرعت بسیار بالا: کمتر از 15 میلیثانیه روی EdgeTPU (برای 256 توکن)
✳️پشتیبانی از بیش از 100 زبان
✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت
✳️پشتیبانی از کانتکست تا 2000 توکن
✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب
🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدلها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4
@rss_ai_ir
#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP
❤19🔥19👍18😁17🎉14🥰13👏13🙏1
🌟 یک مقاله مروری درباره دیتاستهای اوپن ML در Hugging Face منتشر شد.
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
👍20🎉17😁16🔥14❤12👏7🥰5
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
🔥19😁14🎉14❤13👍10👏10🥰6🙏2
🎮 Oasis 2.0
؛ دنیای بازی با هوش مصنوعی در لحظه تغییر میکند
@rss_ai_ir
🚀 شرکت Decart مدل Oasis 2.0 رو معرفی کرده؛ یک سیستم هوش مصنوعی که به بازیکنان اجازه میده دنیای بازی و سبک گرافیکی رو در لحظه تغییر بدن:
✨ اجرای همزمان در کیفیت 1080p و 30fps
✨ بدون نیاز به بارگذاری مجدد (on-the-fly)
🟢 نسخه آزمایشی آنلاین و مد برای ماینکرفت آماده استفاده است:
https://oasis2.decart.ai/demo
---
📌 جمعبندی:
این فناوری یک گام مهم در تلفیق هوش مصنوعی و دنیای بازیهاست؛ جایی که بازیکن میتواند نه فقط کاراکتر، بلکه کل جهان بازی را در لحظه بازطراحی کند.
#هوش_مصنوعی #بازی #Minecraft #Oasis2 #GameDev #AI
@rss_ai_ir
؛ دنیای بازی با هوش مصنوعی در لحظه تغییر میکند
@rss_ai_ir
🚀 شرکت Decart مدل Oasis 2.0 رو معرفی کرده؛ یک سیستم هوش مصنوعی که به بازیکنان اجازه میده دنیای بازی و سبک گرافیکی رو در لحظه تغییر بدن:
✨ اجرای همزمان در کیفیت 1080p و 30fps
✨ بدون نیاز به بارگذاری مجدد (on-the-fly)
🟢 نسخه آزمایشی آنلاین و مد برای ماینکرفت آماده استفاده است:
https://oasis2.decart.ai/demo
---
📌 جمعبندی:
این فناوری یک گام مهم در تلفیق هوش مصنوعی و دنیای بازیهاست؛ جایی که بازیکن میتواند نه فقط کاراکتر، بلکه کل جهان بازی را در لحظه بازطراحی کند.
#هوش_مصنوعی #بازی #Minecraft #Oasis2 #GameDev #AI
@rss_ai_ir
🎉35👏33🔥30❤28😁24👍21🥰21
🚀 تیم Qwen از بزرگترین مدل خود تاکنون رونمایی کرد: Qwen3-Max-Preview (Instruct) با بیش از ۱ تریلیون پارامتر!
📊 طبق بنچمارکها، این مدل عملکردی بهتر از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 دارد.
🔹 نتایج آزمایشهای داخلی و بازخوردهای اولیه کاربران نشان میدهد:
♻️مدل در دیالوگها قویتر شده
♻️در وظایف عامل (agent tasks) بهتر عمل میکند
♻️در پیروی از دستورالعملها دقیقتر است
♻️و از دانش گستردهتری برخوردار است
🔮 تیم Qwen قول داده به زودی یک سورپرایز دیگر هم معرفی کند.
📌 این مدل همین حالا در Qwen Chat و از طریق Alibaba Cloud API در دسترس است.
🟢 Qwen Chat: chat.qwen.ai
🟢 Alibaba Cloud API: لینک
@rss_ai_ir
#هوش_مصنوعی #Qwen3 #مدل_زبانی #AlibabaCloud #QwenChat
📊 طبق بنچمارکها، این مدل عملکردی بهتر از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 دارد.
🔹 نتایج آزمایشهای داخلی و بازخوردهای اولیه کاربران نشان میدهد:
♻️مدل در دیالوگها قویتر شده
♻️در وظایف عامل (agent tasks) بهتر عمل میکند
♻️در پیروی از دستورالعملها دقیقتر است
♻️و از دانش گستردهتری برخوردار است
🔮 تیم Qwen قول داده به زودی یک سورپرایز دیگر هم معرفی کند.
📌 این مدل همین حالا در Qwen Chat و از طریق Alibaba Cloud API در دسترس است.
🟢 Qwen Chat: chat.qwen.ai
🟢 Alibaba Cloud API: لینک
@rss_ai_ir
#هوش_مصنوعی #Qwen3 #مدل_زبانی #AlibabaCloud #QwenChat
🔥13❤12👏12😁12🥰10👍8🎉8🙏1
🚨 ما وارد «منطقه تکینگی هوش مصنوعی» شدیم
یک گزارش جدید نشان میدهد که حتی برترین متخصصان جهان و سوپرفورکسترها درباره سرعت پیشرفت AI به شدت اشتباه کردهاند.
📊 اشتباهات فاجعهبار
♻️مهارتهای ریاضی: در سال ۲۰۲۴ به ۸۷.۸٪ رسید (پیشبینی کارشناسان: ۲۱٪، سوپرفورکسترها: ۹٪)
♻️دانش عمومی: در سال ۲۰۲۴ به ۸۸.۷٪ رسید (کارشناسان: ۲۵٪، سوپرفورکسترها: ۷٪)
♻️مدال طلای المپیاد ریاضی: در ۲۰۲۵ محقق شد (پیشبینی: بعد از ۲۰۳۰ و حتی بعد از ۲۰۳۵)
♻️رشد توان پردازشی: ۵ برابر کمتر تخمین زده شده بود
❗️ اگر بهترین مغزهای دنیا ۵ تا ۱۰ برابر سرعت AI را دستکم گرفته باشند، این یعنی شاید هوش مصنوعی همسطح انسان به جای ۲۰۳۰، در ۲۰۲۶ برسد!
🔮 سؤال:
آیا ما آمادهایم که تنها یک سال دیگر، نه پنج سال دیگر، با AI همسطح انسان روبهرو شویم؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #AI #تکینگی #Singularity #آینده_فناوری
یک گزارش جدید نشان میدهد که حتی برترین متخصصان جهان و سوپرفورکسترها درباره سرعت پیشرفت AI به شدت اشتباه کردهاند.
📊 اشتباهات فاجعهبار
♻️مهارتهای ریاضی: در سال ۲۰۲۴ به ۸۷.۸٪ رسید (پیشبینی کارشناسان: ۲۱٪، سوپرفورکسترها: ۹٪)
♻️دانش عمومی: در سال ۲۰۲۴ به ۸۸.۷٪ رسید (کارشناسان: ۲۵٪، سوپرفورکسترها: ۷٪)
♻️مدال طلای المپیاد ریاضی: در ۲۰۲۵ محقق شد (پیشبینی: بعد از ۲۰۳۰ و حتی بعد از ۲۰۳۵)
♻️رشد توان پردازشی: ۵ برابر کمتر تخمین زده شده بود
❗️ اگر بهترین مغزهای دنیا ۵ تا ۱۰ برابر سرعت AI را دستکم گرفته باشند، این یعنی شاید هوش مصنوعی همسطح انسان به جای ۲۰۳۰، در ۲۰۲۶ برسد!
🔮 سؤال:
آیا ما آمادهایم که تنها یک سال دیگر، نه پنج سال دیگر، با AI همسطح انسان روبهرو شویم؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #AI #تکینگی #Singularity #آینده_فناوری
👍16🔥12😁11🥰9❤8🎉8👏4👎1
📚 دیگه ChatGPT فقط برای نوشتن متن نیست!
کافیه از قفسه کتابخونه یه عکس بگیری و ازش بخوای فلان عنوان رو پیدا کنه؛ مثل یه کتابدار حرفهای برات مکان دقیق کتاب رو میگه. ✅
اینجا با عکس قفسه "New Fiction"، کتاب Atmosphere رو در ردیف بالا، سمت راست پیدا کرده.
هوش مصنوعی داره کمکم وارد جزئیترین کارای روزمره هم میشه... ✨
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #کتاب #AI #فناوری
کافیه از قفسه کتابخونه یه عکس بگیری و ازش بخوای فلان عنوان رو پیدا کنه؛ مثل یه کتابدار حرفهای برات مکان دقیق کتاب رو میگه. ✅
اینجا با عکس قفسه "New Fiction"، کتاب Atmosphere رو در ردیف بالا، سمت راست پیدا کرده.
هوش مصنوعی داره کمکم وارد جزئیترین کارای روزمره هم میشه... ✨
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #کتاب #AI #فناوری
👍22🔥21🎉17😁13🥰11👏9❤7🤯1
🌟 InfoSeek:
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
👍44😁40🔥38❤37🎉31🥰24👏22
🚀 نصب سریعتر پکیجهای پایتون در پروژههای صنعتی!
🤖 اگر با پروژههای Docker + Python کار میکنید (مثلاً Flask یا Django)، خبر خوب اینه که میتونید بهجای pip از ابزار uv استفاده کنید:
✨ چرا uv؟
♻️تا ۱۰ برابر سریعتر از pip
♻️نصب سبکتر و قابل کش در داکر
♻️همهچیز یکجا: مدیریت وابستگی + نصب + اجرا
🔧 روش کار:
1️⃣ فایل pyproject.toml بسازید و وابستگیها (مثلاً flask, gunicorn) را داخلش لیست کنید.
2️⃣ در Dockerfile بهجای pip install از دستور uv sync استفاده کنید.
3️⃣ برای اجرا هم میتونید از uvx کمک بگیرید (مثل uvx gunicorn app:app).
📌 نتیجه:
♻️سرعت ⚡ بالا
♻️ایمیجهای کوچکتر
♻️مدیریت بهتر در CI/CD
🖥 مناسب برای: Flask, Django و هر پروژه Python که نیاز به سرعت و بهینهسازی دارد.
---
👉 تجربهتون از pip vs uv چی بوده؟ به نظرتون وقتشه کلاً مهاجرت کنیم؟
@rss_ai_ir
#Python #Docker #uv #Flask #Django #DevOps #Optimization
🤖 اگر با پروژههای Docker + Python کار میکنید (مثلاً Flask یا Django)، خبر خوب اینه که میتونید بهجای pip از ابزار uv استفاده کنید:
✨ چرا uv؟
♻️تا ۱۰ برابر سریعتر از pip
♻️نصب سبکتر و قابل کش در داکر
♻️همهچیز یکجا: مدیریت وابستگی + نصب + اجرا
🔧 روش کار:
1️⃣ فایل pyproject.toml بسازید و وابستگیها (مثلاً flask, gunicorn) را داخلش لیست کنید.
2️⃣ در Dockerfile بهجای pip install از دستور uv sync استفاده کنید.
3️⃣ برای اجرا هم میتونید از uvx کمک بگیرید (مثل uvx gunicorn app:app).
📌 نتیجه:
♻️سرعت ⚡ بالا
♻️ایمیجهای کوچکتر
♻️مدیریت بهتر در CI/CD
🖥 مناسب برای: Flask, Django و هر پروژه Python که نیاز به سرعت و بهینهسازی دارد.
---
👉 تجربهتون از pip vs uv چی بوده؟ به نظرتون وقتشه کلاً مهاجرت کنیم؟
@rss_ai_ir
#Python #Docker #uv #Flask #Django #DevOps #Optimization
🔥19❤14👍14😁13👏11🎉10🥰8
This media is not supported in your browser
VIEW IN TELEGRAM
🎭 Puppeteer:
ریگ و انیمیت خودکار مدلهای سهبعدی
✅بالاخره رسید! 🔥 پروژهی Puppeteer میتونه یک مدل سهبعدی ساده (مثلاً در فرمت obj) رو بگیره و بهصورت خودکار ریگ اولیه بسازه:
🦴 اضافهکردن اسکلت
🎨 ساخت نقشههای وزن برای اسکینینگ
⛔️البته ریگ کامل (blendshapeهای اصلاحی، constraintها، deformها، inverse kinematics و …) اینجا وجود نداره.
اما نکته جالبتر: 🕹️
👉 این سیستم میتونه یک ویدیو مرجع حرکت رو بگیره و انیمیشن همون حرکت رو روی اسکلت منتقل کنه!
🔍 ابزارهای پشت پرده:
♻️Video-Depth-Anything
برای تخمین عمق
♻️CoTracker3
برای ترکینگ نقاط
♻️MagicArticulate, MeshAnything, RigNet, Michelangelo, AnyMole, Lab4D
برای بخش ریگینگ
📌 با وجود محدودیتها (مثل بحث زاویه دوربین و دقت پایین انیمیشن)، این پروژه یک گام مهم محسوب میشه: اتوماتیکسازی ریگ و اسکینینگ
🔗 جزئیات: صفحه پروژه
💻 کد: GitHub
@rss_ai_ir
#3D #Animation #Rigging #AI #OpenSource
ریگ و انیمیت خودکار مدلهای سهبعدی
✅بالاخره رسید! 🔥 پروژهی Puppeteer میتونه یک مدل سهبعدی ساده (مثلاً در فرمت obj) رو بگیره و بهصورت خودکار ریگ اولیه بسازه:
🦴 اضافهکردن اسکلت
🎨 ساخت نقشههای وزن برای اسکینینگ
⛔️البته ریگ کامل (blendshapeهای اصلاحی، constraintها، deformها، inverse kinematics و …) اینجا وجود نداره.
اما نکته جالبتر: 🕹️
👉 این سیستم میتونه یک ویدیو مرجع حرکت رو بگیره و انیمیشن همون حرکت رو روی اسکلت منتقل کنه!
🔍 ابزارهای پشت پرده:
♻️Video-Depth-Anything
برای تخمین عمق
♻️CoTracker3
برای ترکینگ نقاط
♻️MagicArticulate, MeshAnything, RigNet, Michelangelo, AnyMole, Lab4D
برای بخش ریگینگ
📌 با وجود محدودیتها (مثل بحث زاویه دوربین و دقت پایین انیمیشن)، این پروژه یک گام مهم محسوب میشه: اتوماتیکسازی ریگ و اسکینینگ
🔗 جزئیات: صفحه پروژه
💻 کد: GitHub
@rss_ai_ir
#3D #Animation #Rigging #AI #OpenSource
❤19🔥19🎉19👍13😁10🥰9👏8
📌 چرا مدلهای زبانی دچار «هذیان» میشوند؟
⛔️شرکت OpenAI اخیراً پژوهشی منتشر کرده که دلایل اصلی هذیان (Hallucination) در مدلهای زبانی بزرگ (LLM) را توضیح میدهد.
هذیان یک باگ مرموز در هوش مصنوعی نیست، بلکه پیامد طبیعی و قابل پیشبینی فرایند آموزش مدل است.
🔹 از کجا شروع میشود؟
حتی روی دادههای کاملاً تمیز، اهداف آماری پرترین باعث میشوند مدل خطا تولید کند. بهویژه درباره حقایقی که در دادهها فقط یکبار دیده میشوند. پژوهشگران این را با مفهوم singleton rate معرفی کردند: اگر ۲۰٪ از حقایق تنها یکبار در دیتاست ظاهر شده باشند، مدل دستکم در ۲۰٪ موارد آن حقایق را اشتباه بازتولید خواهد کرد.
🔹 شواهد تجربی
در آزمایشها، DeepSeek-V3 سه تاریخ تولد اشتباه برای یکی از نویسندگان مقاله ارائه داد. در تست دیگری، مدلها حتی نتوانستند درست بشمارند چند بار حرف D در کلمه DEEPSEEK وجود دارد!
🔹 چرا RLHF و فاینتیونینگ مشکل را حل نمیکنند؟
زیرا اغلب بِنچمارکها و سیستمهای ارزیابی، «حدس زدن» را تشویق میکنند. پاسخ نادرست یک امتیاز دارد، اما «نمیدانم» صفر است. بنابراین مدلها برای کاهش جریمه، بهجای سکوت، ترجیح میدهند یک دروغ باورپذیر تولید کنند.
🔹 راهکارها از نگاه OpenAI
✳️تعریف آستانههای اطمینان در ارزیابی
✳️اجازه دادن به مدل برای گفتن «نمیدانم» بدون جریمه
✳️پایش singleton-rate در دادهها
✳️استفاده از RAG همراه با تأیید حقایق
✳️طراحی بِنچمارکهای جدید که شفافیت را تشویق کنند
📖 جزئیات بیشتر در مقالهی کامل OpenAI منتشر شده است.
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #OpenAI #LLM #AI
⛔️شرکت OpenAI اخیراً پژوهشی منتشر کرده که دلایل اصلی هذیان (Hallucination) در مدلهای زبانی بزرگ (LLM) را توضیح میدهد.
هذیان یک باگ مرموز در هوش مصنوعی نیست، بلکه پیامد طبیعی و قابل پیشبینی فرایند آموزش مدل است.
🔹 از کجا شروع میشود؟
حتی روی دادههای کاملاً تمیز، اهداف آماری پرترین باعث میشوند مدل خطا تولید کند. بهویژه درباره حقایقی که در دادهها فقط یکبار دیده میشوند. پژوهشگران این را با مفهوم singleton rate معرفی کردند: اگر ۲۰٪ از حقایق تنها یکبار در دیتاست ظاهر شده باشند، مدل دستکم در ۲۰٪ موارد آن حقایق را اشتباه بازتولید خواهد کرد.
🔹 شواهد تجربی
در آزمایشها، DeepSeek-V3 سه تاریخ تولد اشتباه برای یکی از نویسندگان مقاله ارائه داد. در تست دیگری، مدلها حتی نتوانستند درست بشمارند چند بار حرف D در کلمه DEEPSEEK وجود دارد!
🔹 چرا RLHF و فاینتیونینگ مشکل را حل نمیکنند؟
زیرا اغلب بِنچمارکها و سیستمهای ارزیابی، «حدس زدن» را تشویق میکنند. پاسخ نادرست یک امتیاز دارد، اما «نمیدانم» صفر است. بنابراین مدلها برای کاهش جریمه، بهجای سکوت، ترجیح میدهند یک دروغ باورپذیر تولید کنند.
🔹 راهکارها از نگاه OpenAI
✳️تعریف آستانههای اطمینان در ارزیابی
✳️اجازه دادن به مدل برای گفتن «نمیدانم» بدون جریمه
✳️پایش singleton-rate در دادهها
✳️استفاده از RAG همراه با تأیید حقایق
✳️طراحی بِنچمارکهای جدید که شفافیت را تشویق کنند
📖 جزئیات بیشتر در مقالهی کامل OpenAI منتشر شده است.
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #OpenAI #LLM #AI
👍16👏15🎉13❤11🔥11😁11🥰8
This media is not supported in your browser
VIEW IN TELEGRAM
✂️ ابزار متنباز برچسبگذاری تصاویر با هوش مصنوعی ✂️
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
😁28🎉15🔥14👍11❤9👏8🥰7
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 ویدئوهای Grok حالا با صدا منتشر میشوند!
🔹️ ایلان ماسک در توییتی اعلام کرد قابلیت جدید «گفتار در ویدیو» به ابزار Grok Imagine اضافه شده؛ ارتقایی مهم در تولید تصویر و ویدیو که طی هفتههای آینده عرضه خواهد شد.
🔹️ همچنین Grok Imagine طی ماههای اخیر بهعنوان نسخه مدرن Vine معرفی شد؛ ابزاری برای تولید ویدیوهای کوتاه (حدود ۶ ثانیه) که این بار همراه با صدا و بر پایه متن ساخته میشوند.
@rss_ai_ir
#هوش_مصنوعی #ایلان_ماسک #Grok #ویدیو #AI
🔹️ ایلان ماسک در توییتی اعلام کرد قابلیت جدید «گفتار در ویدیو» به ابزار Grok Imagine اضافه شده؛ ارتقایی مهم در تولید تصویر و ویدیو که طی هفتههای آینده عرضه خواهد شد.
🔹️ همچنین Grok Imagine طی ماههای اخیر بهعنوان نسخه مدرن Vine معرفی شد؛ ابزاری برای تولید ویدیوهای کوتاه (حدود ۶ ثانیه) که این بار همراه با صدا و بر پایه متن ساخته میشوند.
@rss_ai_ir
#هوش_مصنوعی #ایلان_ماسک #Grok #ویدیو #AI
❤21🔥19😁16🥰10👍8🎉8👏5