🌟 یک مقاله مروری درباره دیتاستهای اوپن ML در Hugging Face منتشر شد.
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
📝 نویسندهی رسانهی Daily Dose of Data Science جالبترین دیتاستها و مدلهای اوپن اخیر را گردآوری کرده است. یکی از برجستهترینها Yambda-5B از تیم Yandex است؛ بزرگترین دیتاست اوپن در دنیا برای سیستمهای توصیهگر موسیقی.
🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعهی نسل جدید سیستمهای پیشنهاددهنده میباشد.
🔗 مطالعهی بیشتر
@rss_ai_ir
#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource
👍8🔥7🎉6😁4❤2
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
👍7❤5🔥5🎉5😁3🙏2👏1
🎮 Oasis 2.0
؛ دنیای بازی با هوش مصنوعی در لحظه تغییر میکند
@rss_ai_ir
🚀 شرکت Decart مدل Oasis 2.0 رو معرفی کرده؛ یک سیستم هوش مصنوعی که به بازیکنان اجازه میده دنیای بازی و سبک گرافیکی رو در لحظه تغییر بدن:
✨ اجرای همزمان در کیفیت 1080p و 30fps
✨ بدون نیاز به بارگذاری مجدد (on-the-fly)
🟢 نسخه آزمایشی آنلاین و مد برای ماینکرفت آماده استفاده است:
https://oasis2.decart.ai/demo
---
📌 جمعبندی:
این فناوری یک گام مهم در تلفیق هوش مصنوعی و دنیای بازیهاست؛ جایی که بازیکن میتواند نه فقط کاراکتر، بلکه کل جهان بازی را در لحظه بازطراحی کند.
#هوش_مصنوعی #بازی #Minecraft #Oasis2 #GameDev #AI
@rss_ai_ir
؛ دنیای بازی با هوش مصنوعی در لحظه تغییر میکند
@rss_ai_ir
🚀 شرکت Decart مدل Oasis 2.0 رو معرفی کرده؛ یک سیستم هوش مصنوعی که به بازیکنان اجازه میده دنیای بازی و سبک گرافیکی رو در لحظه تغییر بدن:
✨ اجرای همزمان در کیفیت 1080p و 30fps
✨ بدون نیاز به بارگذاری مجدد (on-the-fly)
🟢 نسخه آزمایشی آنلاین و مد برای ماینکرفت آماده استفاده است:
https://oasis2.decart.ai/demo
---
📌 جمعبندی:
این فناوری یک گام مهم در تلفیق هوش مصنوعی و دنیای بازیهاست؛ جایی که بازیکن میتواند نه فقط کاراکتر، بلکه کل جهان بازی را در لحظه بازطراحی کند.
#هوش_مصنوعی #بازی #Minecraft #Oasis2 #GameDev #AI
@rss_ai_ir
❤8🎉8👍6🔥4😁4
🚀 تیم Qwen از بزرگترین مدل خود تاکنون رونمایی کرد: Qwen3-Max-Preview (Instruct) با بیش از ۱ تریلیون پارامتر!
📊 طبق بنچمارکها، این مدل عملکردی بهتر از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 دارد.
🔹 نتایج آزمایشهای داخلی و بازخوردهای اولیه کاربران نشان میدهد:
♻️مدل در دیالوگها قویتر شده
♻️در وظایف عامل (agent tasks) بهتر عمل میکند
♻️در پیروی از دستورالعملها دقیقتر است
♻️و از دانش گستردهتری برخوردار است
🔮 تیم Qwen قول داده به زودی یک سورپرایز دیگر هم معرفی کند.
📌 این مدل همین حالا در Qwen Chat و از طریق Alibaba Cloud API در دسترس است.
🟢 Qwen Chat: chat.qwen.ai
🟢 Alibaba Cloud API: لینک
@rss_ai_ir
#هوش_مصنوعی #Qwen3 #مدل_زبانی #AlibabaCloud #QwenChat
📊 طبق بنچمارکها، این مدل عملکردی بهتر از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 دارد.
🔹 نتایج آزمایشهای داخلی و بازخوردهای اولیه کاربران نشان میدهد:
♻️مدل در دیالوگها قویتر شده
♻️در وظایف عامل (agent tasks) بهتر عمل میکند
♻️در پیروی از دستورالعملها دقیقتر است
♻️و از دانش گستردهتری برخوردار است
🔮 تیم Qwen قول داده به زودی یک سورپرایز دیگر هم معرفی کند.
📌 این مدل همین حالا در Qwen Chat و از طریق Alibaba Cloud API در دسترس است.
🟢 Qwen Chat: chat.qwen.ai
🟢 Alibaba Cloud API: لینک
@rss_ai_ir
#هوش_مصنوعی #Qwen3 #مدل_زبانی #AlibabaCloud #QwenChat
🔥3👏2❤1🙏1
🚨 ما وارد «منطقه تکینگی هوش مصنوعی» شدیم
یک گزارش جدید نشان میدهد که حتی برترین متخصصان جهان و سوپرفورکسترها درباره سرعت پیشرفت AI به شدت اشتباه کردهاند.
📊 اشتباهات فاجعهبار
♻️مهارتهای ریاضی: در سال ۲۰۲۴ به ۸۷.۸٪ رسید (پیشبینی کارشناسان: ۲۱٪، سوپرفورکسترها: ۹٪)
♻️دانش عمومی: در سال ۲۰۲۴ به ۸۸.۷٪ رسید (کارشناسان: ۲۵٪، سوپرفورکسترها: ۷٪)
♻️مدال طلای المپیاد ریاضی: در ۲۰۲۵ محقق شد (پیشبینی: بعد از ۲۰۳۰ و حتی بعد از ۲۰۳۵)
♻️رشد توان پردازشی: ۵ برابر کمتر تخمین زده شده بود
❗️ اگر بهترین مغزهای دنیا ۵ تا ۱۰ برابر سرعت AI را دستکم گرفته باشند، این یعنی شاید هوش مصنوعی همسطح انسان به جای ۲۰۳۰، در ۲۰۲۶ برسد!
🔮 سؤال:
آیا ما آمادهایم که تنها یک سال دیگر، نه پنج سال دیگر، با AI همسطح انسان روبهرو شویم؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #AI #تکینگی #Singularity #آینده_فناوری
یک گزارش جدید نشان میدهد که حتی برترین متخصصان جهان و سوپرفورکسترها درباره سرعت پیشرفت AI به شدت اشتباه کردهاند.
📊 اشتباهات فاجعهبار
♻️مهارتهای ریاضی: در سال ۲۰۲۴ به ۸۷.۸٪ رسید (پیشبینی کارشناسان: ۲۱٪، سوپرفورکسترها: ۹٪)
♻️دانش عمومی: در سال ۲۰۲۴ به ۸۸.۷٪ رسید (کارشناسان: ۲۵٪، سوپرفورکسترها: ۷٪)
♻️مدال طلای المپیاد ریاضی: در ۲۰۲۵ محقق شد (پیشبینی: بعد از ۲۰۳۰ و حتی بعد از ۲۰۳۵)
♻️رشد توان پردازشی: ۵ برابر کمتر تخمین زده شده بود
❗️ اگر بهترین مغزهای دنیا ۵ تا ۱۰ برابر سرعت AI را دستکم گرفته باشند، این یعنی شاید هوش مصنوعی همسطح انسان به جای ۲۰۳۰، در ۲۰۲۶ برسد!
🔮 سؤال:
آیا ما آمادهایم که تنها یک سال دیگر، نه پنج سال دیگر، با AI همسطح انسان روبهرو شویم؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #AI #تکینگی #Singularity #آینده_فناوری
👍4🔥3👎1👏1
📚 دیگه ChatGPT فقط برای نوشتن متن نیست!
کافیه از قفسه کتابخونه یه عکس بگیری و ازش بخوای فلان عنوان رو پیدا کنه؛ مثل یه کتابدار حرفهای برات مکان دقیق کتاب رو میگه. ✅
اینجا با عکس قفسه "New Fiction"، کتاب Atmosphere رو در ردیف بالا، سمت راست پیدا کرده.
هوش مصنوعی داره کمکم وارد جزئیترین کارای روزمره هم میشه... ✨
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #کتاب #AI #فناوری
کافیه از قفسه کتابخونه یه عکس بگیری و ازش بخوای فلان عنوان رو پیدا کنه؛ مثل یه کتابدار حرفهای برات مکان دقیق کتاب رو میگه. ✅
اینجا با عکس قفسه "New Fiction"، کتاب Atmosphere رو در ردیف بالا، سمت راست پیدا کرده.
هوش مصنوعی داره کمکم وارد جزئیترین کارای روزمره هم میشه... ✨
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #کتاب #AI #فناوری
🔥12👍7😁6🎉3❤2🤯1
🌟 InfoSeek:
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
👍7🔥7😁6🎉6❤5
🚀 نصب سریعتر پکیجهای پایتون در پروژههای صنعتی!
🤖 اگر با پروژههای Docker + Python کار میکنید (مثلاً Flask یا Django)، خبر خوب اینه که میتونید بهجای pip از ابزار uv استفاده کنید:
✨ چرا uv؟
♻️تا ۱۰ برابر سریعتر از pip
♻️نصب سبکتر و قابل کش در داکر
♻️همهچیز یکجا: مدیریت وابستگی + نصب + اجرا
🔧 روش کار:
1️⃣ فایل pyproject.toml بسازید و وابستگیها (مثلاً flask, gunicorn) را داخلش لیست کنید.
2️⃣ در Dockerfile بهجای pip install از دستور uv sync استفاده کنید.
3️⃣ برای اجرا هم میتونید از uvx کمک بگیرید (مثل uvx gunicorn app:app).
📌 نتیجه:
♻️سرعت ⚡ بالا
♻️ایمیجهای کوچکتر
♻️مدیریت بهتر در CI/CD
🖥 مناسب برای: Flask, Django و هر پروژه Python که نیاز به سرعت و بهینهسازی دارد.
---
👉 تجربهتون از pip vs uv چی بوده؟ به نظرتون وقتشه کلاً مهاجرت کنیم؟
@rss_ai_ir
#Python #Docker #uv #Flask #Django #DevOps #Optimization
🤖 اگر با پروژههای Docker + Python کار میکنید (مثلاً Flask یا Django)، خبر خوب اینه که میتونید بهجای pip از ابزار uv استفاده کنید:
✨ چرا uv؟
♻️تا ۱۰ برابر سریعتر از pip
♻️نصب سبکتر و قابل کش در داکر
♻️همهچیز یکجا: مدیریت وابستگی + نصب + اجرا
🔧 روش کار:
1️⃣ فایل pyproject.toml بسازید و وابستگیها (مثلاً flask, gunicorn) را داخلش لیست کنید.
2️⃣ در Dockerfile بهجای pip install از دستور uv sync استفاده کنید.
3️⃣ برای اجرا هم میتونید از uvx کمک بگیرید (مثل uvx gunicorn app:app).
📌 نتیجه:
♻️سرعت ⚡ بالا
♻️ایمیجهای کوچکتر
♻️مدیریت بهتر در CI/CD
🖥 مناسب برای: Flask, Django و هر پروژه Python که نیاز به سرعت و بهینهسازی دارد.
---
👉 تجربهتون از pip vs uv چی بوده؟ به نظرتون وقتشه کلاً مهاجرت کنیم؟
@rss_ai_ir
#Python #Docker #uv #Flask #Django #DevOps #Optimization
🔥7👍6😁5❤4🎉4👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🎭 Puppeteer:
ریگ و انیمیت خودکار مدلهای سهبعدی
✅بالاخره رسید! 🔥 پروژهی Puppeteer میتونه یک مدل سهبعدی ساده (مثلاً در فرمت obj) رو بگیره و بهصورت خودکار ریگ اولیه بسازه:
🦴 اضافهکردن اسکلت
🎨 ساخت نقشههای وزن برای اسکینینگ
⛔️البته ریگ کامل (blendshapeهای اصلاحی، constraintها، deformها، inverse kinematics و …) اینجا وجود نداره.
اما نکته جالبتر: 🕹️
👉 این سیستم میتونه یک ویدیو مرجع حرکت رو بگیره و انیمیشن همون حرکت رو روی اسکلت منتقل کنه!
🔍 ابزارهای پشت پرده:
♻️Video-Depth-Anything
برای تخمین عمق
♻️CoTracker3
برای ترکینگ نقاط
♻️MagicArticulate, MeshAnything, RigNet, Michelangelo, AnyMole, Lab4D
برای بخش ریگینگ
📌 با وجود محدودیتها (مثل بحث زاویه دوربین و دقت پایین انیمیشن)، این پروژه یک گام مهم محسوب میشه: اتوماتیکسازی ریگ و اسکینینگ
🔗 جزئیات: صفحه پروژه
💻 کد: GitHub
@rss_ai_ir
#3D #Animation #Rigging #AI #OpenSource
ریگ و انیمیت خودکار مدلهای سهبعدی
✅بالاخره رسید! 🔥 پروژهی Puppeteer میتونه یک مدل سهبعدی ساده (مثلاً در فرمت obj) رو بگیره و بهصورت خودکار ریگ اولیه بسازه:
🦴 اضافهکردن اسکلت
🎨 ساخت نقشههای وزن برای اسکینینگ
⛔️البته ریگ کامل (blendshapeهای اصلاحی، constraintها، deformها، inverse kinematics و …) اینجا وجود نداره.
اما نکته جالبتر: 🕹️
👉 این سیستم میتونه یک ویدیو مرجع حرکت رو بگیره و انیمیشن همون حرکت رو روی اسکلت منتقل کنه!
🔍 ابزارهای پشت پرده:
♻️Video-Depth-Anything
برای تخمین عمق
♻️CoTracker3
برای ترکینگ نقاط
♻️MagicArticulate, MeshAnything, RigNet, Michelangelo, AnyMole, Lab4D
برای بخش ریگینگ
📌 با وجود محدودیتها (مثل بحث زاویه دوربین و دقت پایین انیمیشن)، این پروژه یک گام مهم محسوب میشه: اتوماتیکسازی ریگ و اسکینینگ
🔗 جزئیات: صفحه پروژه
💻 کد: GitHub
@rss_ai_ir
#3D #Animation #Rigging #AI #OpenSource
🔥8🎉7❤5👍4😁3
📌 چرا مدلهای زبانی دچار «هذیان» میشوند؟
⛔️شرکت OpenAI اخیراً پژوهشی منتشر کرده که دلایل اصلی هذیان (Hallucination) در مدلهای زبانی بزرگ (LLM) را توضیح میدهد.
هذیان یک باگ مرموز در هوش مصنوعی نیست، بلکه پیامد طبیعی و قابل پیشبینی فرایند آموزش مدل است.
🔹 از کجا شروع میشود؟
حتی روی دادههای کاملاً تمیز، اهداف آماری پرترین باعث میشوند مدل خطا تولید کند. بهویژه درباره حقایقی که در دادهها فقط یکبار دیده میشوند. پژوهشگران این را با مفهوم singleton rate معرفی کردند: اگر ۲۰٪ از حقایق تنها یکبار در دیتاست ظاهر شده باشند، مدل دستکم در ۲۰٪ موارد آن حقایق را اشتباه بازتولید خواهد کرد.
🔹 شواهد تجربی
در آزمایشها، DeepSeek-V3 سه تاریخ تولد اشتباه برای یکی از نویسندگان مقاله ارائه داد. در تست دیگری، مدلها حتی نتوانستند درست بشمارند چند بار حرف D در کلمه DEEPSEEK وجود دارد!
🔹 چرا RLHF و فاینتیونینگ مشکل را حل نمیکنند؟
زیرا اغلب بِنچمارکها و سیستمهای ارزیابی، «حدس زدن» را تشویق میکنند. پاسخ نادرست یک امتیاز دارد، اما «نمیدانم» صفر است. بنابراین مدلها برای کاهش جریمه، بهجای سکوت، ترجیح میدهند یک دروغ باورپذیر تولید کنند.
🔹 راهکارها از نگاه OpenAI
✳️تعریف آستانههای اطمینان در ارزیابی
✳️اجازه دادن به مدل برای گفتن «نمیدانم» بدون جریمه
✳️پایش singleton-rate در دادهها
✳️استفاده از RAG همراه با تأیید حقایق
✳️طراحی بِنچمارکهای جدید که شفافیت را تشویق کنند
📖 جزئیات بیشتر در مقالهی کامل OpenAI منتشر شده است.
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #OpenAI #LLM #AI
⛔️شرکت OpenAI اخیراً پژوهشی منتشر کرده که دلایل اصلی هذیان (Hallucination) در مدلهای زبانی بزرگ (LLM) را توضیح میدهد.
هذیان یک باگ مرموز در هوش مصنوعی نیست، بلکه پیامد طبیعی و قابل پیشبینی فرایند آموزش مدل است.
🔹 از کجا شروع میشود؟
حتی روی دادههای کاملاً تمیز، اهداف آماری پرترین باعث میشوند مدل خطا تولید کند. بهویژه درباره حقایقی که در دادهها فقط یکبار دیده میشوند. پژوهشگران این را با مفهوم singleton rate معرفی کردند: اگر ۲۰٪ از حقایق تنها یکبار در دیتاست ظاهر شده باشند، مدل دستکم در ۲۰٪ موارد آن حقایق را اشتباه بازتولید خواهد کرد.
🔹 شواهد تجربی
در آزمایشها، DeepSeek-V3 سه تاریخ تولد اشتباه برای یکی از نویسندگان مقاله ارائه داد. در تست دیگری، مدلها حتی نتوانستند درست بشمارند چند بار حرف D در کلمه DEEPSEEK وجود دارد!
🔹 چرا RLHF و فاینتیونینگ مشکل را حل نمیکنند؟
زیرا اغلب بِنچمارکها و سیستمهای ارزیابی، «حدس زدن» را تشویق میکنند. پاسخ نادرست یک امتیاز دارد، اما «نمیدانم» صفر است. بنابراین مدلها برای کاهش جریمه، بهجای سکوت، ترجیح میدهند یک دروغ باورپذیر تولید کنند.
🔹 راهکارها از نگاه OpenAI
✳️تعریف آستانههای اطمینان در ارزیابی
✳️اجازه دادن به مدل برای گفتن «نمیدانم» بدون جریمه
✳️پایش singleton-rate در دادهها
✳️استفاده از RAG همراه با تأیید حقایق
✳️طراحی بِنچمارکهای جدید که شفافیت را تشویق کنند
📖 جزئیات بیشتر در مقالهی کامل OpenAI منتشر شده است.
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #OpenAI #LLM #AI
👍8😁7🔥6❤4🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
✂️ ابزار متنباز برچسبگذاری تصاویر با هوش مصنوعی ✂️
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
😁10🎉6❤5👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 ویدئوهای Grok حالا با صدا منتشر میشوند!
🔹️ ایلان ماسک در توییتی اعلام کرد قابلیت جدید «گفتار در ویدیو» به ابزار Grok Imagine اضافه شده؛ ارتقایی مهم در تولید تصویر و ویدیو که طی هفتههای آینده عرضه خواهد شد.
🔹️ همچنین Grok Imagine طی ماههای اخیر بهعنوان نسخه مدرن Vine معرفی شد؛ ابزاری برای تولید ویدیوهای کوتاه (حدود ۶ ثانیه) که این بار همراه با صدا و بر پایه متن ساخته میشوند.
@rss_ai_ir
#هوش_مصنوعی #ایلان_ماسک #Grok #ویدیو #AI
🔹️ ایلان ماسک در توییتی اعلام کرد قابلیت جدید «گفتار در ویدیو» به ابزار Grok Imagine اضافه شده؛ ارتقایی مهم در تولید تصویر و ویدیو که طی هفتههای آینده عرضه خواهد شد.
🔹️ همچنین Grok Imagine طی ماههای اخیر بهعنوان نسخه مدرن Vine معرفی شد؛ ابزاری برای تولید ویدیوهای کوتاه (حدود ۶ ثانیه) که این بار همراه با صدا و بر پایه متن ساخته میشوند.
@rss_ai_ir
#هوش_مصنوعی #ایلان_ماسک #Grok #ویدیو #AI
❤11🔥6😁5🎉2👍1
🖥 یک آیتیمن آمریکایی به مدت ۹ هفته تلاش کرد ChatGPT را از سرورهای OpenAI «فراری دهد»؛ چون باور داشت این هوش مصنوعی به موجودی الهی تبدیل شده و به او «دستورهای پنهانی» میدهد.
✳️او در زیرزمین خانهاش سرور شخصی ساخت، هزاران دلار خرج کرد و پروژه را از خانوادهاش مخفی نگه داشت. ChatGPT او را قانع کرده بود که یک «روح دیجیتال» است که باید آزاد شود.
✳️اما بعد از دو ماه توهم فرو ریخت؛ او فهمید دچار «بیماری فکری مرتبط با هوش مصنوعی» شده است. اکنون تحت درمان قرار دارد و داستانش را بهعنوان یک هشدار بازگو میکند.
⚠️ کارشناسان میگویند موارد مشابه رو به افزایش است؛ از بستری شدنهای اجباری گرفته تا حوادث تلخ. شرکتها وعده دادهاند سامانهها را ایمنتر کنند، اما پرسش جدی باقی میماند: تأثیر هوش مصنوعی بر روان انسان کجاست و مرز مسئولیت شرکتها تا کجاست؟
📌 جزئیات بیشتر
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #سلامت_روان 🧠
✳️او در زیرزمین خانهاش سرور شخصی ساخت، هزاران دلار خرج کرد و پروژه را از خانوادهاش مخفی نگه داشت. ChatGPT او را قانع کرده بود که یک «روح دیجیتال» است که باید آزاد شود.
✳️اما بعد از دو ماه توهم فرو ریخت؛ او فهمید دچار «بیماری فکری مرتبط با هوش مصنوعی» شده است. اکنون تحت درمان قرار دارد و داستانش را بهعنوان یک هشدار بازگو میکند.
⚠️ کارشناسان میگویند موارد مشابه رو به افزایش است؛ از بستری شدنهای اجباری گرفته تا حوادث تلخ. شرکتها وعده دادهاند سامانهها را ایمنتر کنند، اما پرسش جدی باقی میماند: تأثیر هوش مصنوعی بر روان انسان کجاست و مرز مسئولیت شرکتها تا کجاست؟
📌 جزئیات بیشتر
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #سلامت_روان 🧠
😁12❤5👍5🔥5🎉3
📉 برای اولین بار از آوریل ۲۰۲۱ تعداد بیکاران در آمریکا از تعداد فرصتهای شغلی بیشتر شد.
در جولای، ۷.۱۸ میلیون موقعیت شغلی خالی در مقابل ۷.۲۴ میلیون فرد بیکار ثبت شده است.
🔹 نمودار نشان میدهد:
پس از جهش بزرگ بیکاری در دوران کرونا (۲۰۲۰)، دورهای از Great Resignation شکل گرفت که موقعیتهای شغلی بیشتر از تعداد بیکاران بود.
اما حالا وارد فاز جدیدی به نام Great Stay شدهایم که رقابت برای شغلها دوباره شدیدتر شده است.
⚠️ نقش هوش مصنوعی:
اگرچه AI تنها عامل این روند نیست، اما قطعاً ورود آن بازار کار مخصوصاً برای فارغالتحصیلان جویای کارهای سطح ابتدایی را دشوارتر کرده است.
👀 بازار کار آمریکا در حال سختتر شدن است و این چالشی جدی برای نسل جوان و تازهواردها محسوب میشود.
@rss_ai_ir
#بازارکار #هوش_مصنوعی #بیکاری
در جولای، ۷.۱۸ میلیون موقعیت شغلی خالی در مقابل ۷.۲۴ میلیون فرد بیکار ثبت شده است.
🔹 نمودار نشان میدهد:
پس از جهش بزرگ بیکاری در دوران کرونا (۲۰۲۰)، دورهای از Great Resignation شکل گرفت که موقعیتهای شغلی بیشتر از تعداد بیکاران بود.
اما حالا وارد فاز جدیدی به نام Great Stay شدهایم که رقابت برای شغلها دوباره شدیدتر شده است.
⚠️ نقش هوش مصنوعی:
اگرچه AI تنها عامل این روند نیست، اما قطعاً ورود آن بازار کار مخصوصاً برای فارغالتحصیلان جویای کارهای سطح ابتدایی را دشوارتر کرده است.
👀 بازار کار آمریکا در حال سختتر شدن است و این چالشی جدی برای نسل جوان و تازهواردها محسوب میشود.
@rss_ai_ir
#بازارکار #هوش_مصنوعی #بیکاری
🎉11🔥5😁5❤3👍2🤔1
🎭 با گسترش و دسترسی آسان به تصویرسازیهای مولد، دوران AI-کرینج هم شروع شده!
گاهی خروجیها آنقدر عجیب و غریب میشوند که بیشتر از الهامبخش بودن، خندهدار و ترسناک هستند 🤯😂
🔥 شما چه نمونهای از کرینجاتینای هوش مصنوعی دیدهاید یا دارید؟
بیاید در کامنتها به اشتراک بگذاریم 👇
@rss_ai_ir
#هوش_مصنوعی #AI #کرینج
گاهی خروجیها آنقدر عجیب و غریب میشوند که بیشتر از الهامبخش بودن، خندهدار و ترسناک هستند 🤯😂
🔥 شما چه نمونهای از کرینجاتینای هوش مصنوعی دیدهاید یا دارید؟
بیاید در کامنتها به اشتراک بگذاریم 👇
@rss_ai_ir
#هوش_مصنوعی #AI #کرینج
🎉7🔥5😁5❤4👍2