VIRSUN

🚀 گوگل از EmbeddingGemma رونمایی کرد؛ یک مدل سبک و اوپن‌سورس برای ایجاد امبدینگ‌های متنی.

📌 ویژگی مهم: این مدل را می‌توان مستقیم روی موبایل یا لپ‌تاپ اجرا کرد، بدون نیاز به اینترنت و با حفظ کامل حریم خصوصی.

🟢 چه چیزی داخلش هست؟

✳️308 میلیون پارامتر، اما از همه مدل‌های زیر 500M در کیفیت بهتر عمل می‌کند (طبق MTEB)

✳️سرعت بسیار بالا: کمتر از 15 میلی‌ثانیه روی EdgeTPU (برای 256 توکن)

✳️پشتیبانی از بیش از 100 زبان

✳️امکان کاهش ابعاد امبدینگ از 768 → 128 بدون افت کیفیت

✳️پشتیبانی از کانتکست تا 2000 توکن

✳️سازگار با Sentence-Transformers، LangChain، llama.cpp، transformers.js، Weaviate و دیگر ابزارهای محبوب

🟠 وبلاگ: https://developers.googleblog.com/en/introducing-embeddinggemma/
🟠 مدل‌ها: https://huggingface.co/collections/google/embeddinggemma-68b9ae3a72a82f0562a80dc4

@rss_ai_ir

#AI #Google #Gemma #EmbeddingGemma #ML #DeepLearning #LLM #NLP

❤19🔥19👍18😁17🎉14🥰13👏13🙏1

427 views11:47

VIRSUN

🌟 یک مقاله مروری درباره دیتاست‌های اوپن ML در Hugging Face منتشر شد.

📝 نویسنده‌ی رسانه‌ی Daily Dose of Data Science جالب‌ترین دیتاست‌ها و مدل‌های اوپن اخیر را گردآوری کرده است. یکی از برجسته‌ترین‌ها Yambda-5B از تیم Yandex است؛ بزرگ‌ترین دیتاست اوپن در دنیا برای سیستم‌های توصیه‌گر موسیقی.

🎵 دیتاست Yambda-5B شامل ۴.۷۹ میلیارد تعامل ناشناس (گوش دادن به آهنگ، لایک و دیسلایک) است. این دیتاست توجه پژوهشگران جهانی را جلب کرده و نویدبخش توسعه‌ی نسل جدید سیستم‌های پیشنهاددهنده می‌باشد.

🔗 مطالعه‌ی بیشتر

@rss_ai_ir

#AI #ML #Dataset #RecommendationSystem #Yandex #OpenSource

👍20🎉17😁16🔥14❤12👏7🥰5

429 views13:13

VIRSUN

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻

👉 فریم ورک WebEyeTrack یک فریم‌ورک نوآورانه است که مدل‌های سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام می‌کند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب می‌آورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر می‌گیرد.

🟢 کد منبع با لایسنس MIT منتشر شده است 💙

🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack

@rss_ai_ir

#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource

🔥19😁14🎉14❤13👍10👏10🥰6🙏2

437 views13:28

VIRSUN

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

0:25

This media is not supported in your browser

VIEW IN TELEGRAM

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

🎮 Oasis 2.0
؛ دنیای بازی با هوش مصنوعی در لحظه تغییر می‌کند
@rss_ai_ir

🚀 شرکت Decart مدل Oasis 2.0 رو معرفی کرده؛ یک سیستم هوش مصنوعی که به بازیکنان اجازه می‌ده دنیای بازی و سبک گرافیکی رو در لحظه تغییر بدن:

✨ اجرای همزمان در کیفیت 1080p و 30fps
✨ بدون نیاز به بارگذاری مجدد (on-the-fly)

🟢 نسخه آزمایشی آنلاین و مد برای ماینکرفت آماده استفاده است:
https://oasis2.decart.ai/demo

---
📌 جمع‌بندی:
این فناوری یک گام مهم در تلفیق هوش مصنوعی و دنیای بازی‌هاست؛ جایی که بازیکن می‌تواند نه فقط کاراکتر، بلکه کل جهان بازی را در لحظه بازطراحی کند.

#هوش_مصنوعی #بازی #Minecraft #Oasis2 #GameDev #AI
@rss_ai_ir

🎉35👏33🔥30❤28😁24👍21🥰21

1.24K views16:18

VIRSUN

🚀 تیم Qwen از بزرگ‌ترین مدل خود تاکنون رونمایی کرد: Qwen3-Max-Preview (Instruct) با بیش از ۱ تریلیون پارامتر!

📊 طبق بنچمارک‌ها، این مدل عملکردی بهتر از پرچمدار قبلی یعنی Qwen3-235B-A22B-2507 دارد.

🔹 نتایج آزمایش‌های داخلی و بازخوردهای اولیه کاربران نشان می‌دهد:

♻️مدل در دیالوگ‌ها قوی‌تر شده
♻️در وظایف عامل (agent tasks) بهتر عمل می‌کند
♻️در پیروی از دستورالعمل‌ها دقیق‌تر است
♻️و از دانش گسترده‌تری برخوردار است

🔮 تیم Qwen قول داده به زودی یک سورپرایز دیگر هم معرفی کند.

📌 این مدل همین حالا در Qwen Chat و از طریق Alibaba Cloud API در دسترس است.

🟢 Qwen Chat: chat.qwen.ai
🟢 Alibaba Cloud API: لینک

@rss_ai_ir

#هوش_مصنوعی #Qwen3 #مدل_زبانی #AlibabaCloud #QwenChat

🔥13❤12👏12😁12🥰10👍8🎉8🙏1

1.27K views17:01

VIRSUN

🚨 ما وارد «منطقه تکینگی هوش مصنوعی» شدیم

یک گزارش جدید نشان می‌دهد که حتی برترین متخصصان جهان و سوپرفورکسترها درباره سرعت پیشرفت AI به شدت اشتباه کرده‌اند.

📊 اشتباهات فاجعه‌بار

♻️مهارت‌های ریاضی: در سال ۲۰۲۴ به ۸۷.۸٪ رسید (پیش‌بینی کارشناسان: ۲۱٪، سوپرفورکسترها: ۹٪)

♻️دانش عمومی: در سال ۲۰۲۴ به ۸۸.۷٪ رسید (کارشناسان: ۲۵٪، سوپرفورکسترها: ۷٪)

♻️مدال طلای المپیاد ریاضی: در ۲۰۲۵ محقق شد (پیش‌بینی: بعد از ۲۰۳۰ و حتی بعد از ۲۰۳۵)

♻️رشد توان پردازشی: ۵ برابر کمتر تخمین زده شده بود

❗️ اگر بهترین مغزهای دنیا ۵ تا ۱۰ برابر سرعت AI را دست‌کم گرفته باشند، این یعنی شاید هوش مصنوعی هم‌سطح انسان به جای ۲۰۳۰، در ۲۰۲۶ برسد!

🔮 سؤال:
آیا ما آماده‌ایم که تنها یک سال دیگر، نه پنج سال دیگر، با AI هم‌سطح انسان روبه‌رو شویم؟ 🤔

@rss_ai_ir

#هوش_مصنوعی #AI #تکینگی #Singularity #آینده_فناوری

👍16🔥12😁11🥰9❤8🎉8👏4👎1

2.3K views04:19

VIRSUN

📚 دیگه ChatGPT فقط برای نوشتن متن نیست!

کافیه از قفسه کتابخونه یه عکس بگیری و ازش بخوای فلان عنوان رو پیدا کنه؛ مثل یه کتابدار حرفه‌ای برات مکان دقیق کتاب رو میگه. ✅

اینجا با عکس قفسه "New Fiction"، کتاب Atmosphere رو در ردیف بالا، سمت راست پیدا کرده.

هوش مصنوعی داره کم‌کم وارد جزئی‌ترین کارای روزمره هم میشه... ✨

@rss_ai_ir

#هوش_مصنوعی #ChatGPT #کتاب #AI #فناوری

👍22🔥21🎉17😁13🥰11👏9❤7🤯1

2.02K views04:31

VIRSUN

🌟 InfoSeek:
نسل جدید داده‌سازی برای تحقیقات عمیق با فرمالیزه‌سازی HCSP

مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژه‌ی تحقیقات عمیق (Deep Research).

🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئله‌ها تجزیه کند، چندمرحله‌ای استدلال نماید و در نهایت پاسخ‌ها را با منابع واقعی اعتبارسنجی کند.

🔹 فرمالیزه‌سازی به HCSP
این مسائل به‌صورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل می‌شوند:

❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یال‌ها روابط قابل‌بررسی از ویکی‌پدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشه‌ی درخت است که تنها با تقاطع محدودیت‌ها و زیرپرسش‌ها به‌دست می‌آید.

❌این رویکرد باعث می‌شود عمق و عرض استدلال به‌روشنی مشخص شده و هر گام میانی قابل بررسی و صحت‌سنجی باشد.

🔹 معماری عامل‌ها
دو عامل فرآیند را پیش می‌برند:

1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.

2. Browser – استخراج داده و لینک از صفحات.

چهار عمل اصلی چرخه را می‌سازند:

✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمق‌بخشی عمودی با دنبال‌کردن لینک‌ها
✅تولید متن سؤال تنها پس از تکمیل قیود

🔹 نتایج و خروجی‌ها

♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسب‌های استخراج.

♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و به‌مراتب بهتر از Qwen3-32B و Search-R1-32B.

♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.

🔹 مزایا

✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از داده‌های واقعی
✳️کاربردپذیری در معماری‌های مختلف

📌 لایسنس: Apache 2.0
📂 خروجی‌های منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزن‌های InfoSeeker-3B به‌زودی منتشر می‌شوند.)
💢HuggingFace
📛GitHub
🛑Arxiv

@rss_ai_ir

#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek

😁49👍47❤41🎉41🔥39🥰25👏24

2.13K views04:39

VIRSUN

🚀 نصب سریع‌تر پکیج‌های پایتون در پروژه‌های صنعتی!

🤖 اگر با پروژه‌های Docker + Python کار می‌کنید (مثلاً Flask یا Django)، خبر خوب اینه که می‌تونید به‌جای pip از ابزار uv استفاده کنید:

✨ چرا uv؟

♻️تا ۱۰ برابر سریع‌تر از pip
♻️نصب سبک‌تر و قابل کش در داکر
♻️همه‌چیز یکجا: مدیریت وابستگی + نصب + اجرا

🔧 روش کار:
1️⃣ فایل pyproject.toml بسازید و وابستگی‌ها (مثلاً flask, gunicorn) را داخلش لیست کنید.
2️⃣ در Dockerfile به‌جای pip install از دستور uv sync استفاده کنید.
3️⃣ برای اجرا هم می‌تونید از uvx کمک بگیرید (مثل uvx gunicorn app:app).

📌 نتیجه:

♻️سرعت ⚡ بالا
♻️ایمیج‌های کوچک‌تر
♻️مدیریت بهتر در CI/CD

🖥 مناسب برای: Flask, Django و هر پروژه Python که نیاز به سرعت و بهینه‌سازی دارد.

---

👉 تجربه‌تون از pip vs uv چی بوده؟ به نظرتون وقتشه کلاً مهاجرت کنیم؟

@rss_ai_ir

#Python #Docker #uv #Flask #Django #DevOps #Optimization

🔥30👍24🥰20❤18🎉17😁13👏11🤩9😍7❤‍🔥5💯5

2.16K views04:59

VIRSUN

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

🎭 Puppeteer:
ریگ و انیمیت خودکار مدل‌های سه‌بعدی

✅بالاخره رسید! 🔥 پروژه‌ی Puppeteer می‌تونه یک مدل سه‌بعدی ساده (مثلاً در فرمت obj) رو بگیره و به‌صورت خودکار ریگ اولیه بسازه:
🦴 اضافه‌کردن اسکلت
🎨 ساخت نقشه‌های وزن برای اسکینینگ

⛔️البته ریگ کامل (blendshapeهای اصلاحی، constraintها، deformها، inverse kinematics و …) اینجا وجود نداره.

اما نکته جالب‌تر: 🕹️
👉 این سیستم می‌تونه یک ویدیو مرجع حرکت رو بگیره و انیمیشن همون حرکت رو روی اسکلت منتقل کنه!

🔍 ابزارهای پشت پرده:

♻️Video-Depth-Anything
برای تخمین عمق

♻️CoTracker3
برای ترکینگ نقاط

♻️MagicArticulate, MeshAnything, RigNet, Michelangelo, AnyMole, Lab4D
برای بخش ریگینگ

📌 با وجود محدودیت‌ها (مثل بحث زاویه دوربین و دقت پایین انیمیشن)، این پروژه یک گام مهم محسوب میشه: اتوماتیک‌سازی ریگ و اسکینینگ

🔗 جزئیات: صفحه پروژه
💻 کد: GitHub

@rss_ai_ir

#3D #Animation #Rigging #AI #OpenSource

❤23🔥23👍20👏20🎉20😁14🥰13

2.12K views11:09

VIRSUN

📌 چرا مدل‌های زبانی دچار «هذیان» می‌شوند؟

⛔️شرکت OpenAI اخیراً پژوهشی منتشر کرده که دلایل اصلی هذیان (Hallucination) در مدل‌های زبانی بزرگ (LLM) را توضیح می‌دهد.

هذیان یک باگ مرموز در هوش مصنوعی نیست، بلکه پیامد طبیعی و قابل پیش‌بینی فرایند آموزش مدل است.

🔹 از کجا شروع می‌شود؟
حتی روی داده‌های کاملاً تمیز، اهداف آماری پرترین باعث می‌شوند مدل خطا تولید کند. به‌ویژه درباره حقایقی که در داده‌ها فقط یک‌بار دیده می‌شوند. پژوهشگران این را با مفهوم singleton rate معرفی کردند: اگر ۲۰٪ از حقایق تنها یک‌بار در دیتاست ظاهر شده باشند، مدل دست‌کم در ۲۰٪ موارد آن حقایق را اشتباه بازتولید خواهد کرد.

🔹 شواهد تجربی
در آزمایش‌ها، DeepSeek-V3 سه تاریخ تولد اشتباه برای یکی از نویسندگان مقاله ارائه داد. در تست دیگری، مدل‌ها حتی نتوانستند درست بشمارند چند بار حرف D در کلمه DEEPSEEK وجود دارد!

🔹 چرا RLHF و فاین‌تیونینگ مشکل را حل نمی‌کنند؟
زیرا اغلب بِنچمارک‌ها و سیستم‌های ارزیابی، «حدس زدن» را تشویق می‌کنند. پاسخ نادرست یک امتیاز دارد، اما «نمی‌دانم» صفر است. بنابراین مدل‌ها برای کاهش جریمه، به‌جای سکوت، ترجیح می‌دهند یک دروغ باورپذیر تولید کنند.

🔹 راهکارها از نگاه OpenAI

✳️تعریف آستانه‌های اطمینان در ارزیابی
✳️اجازه دادن به مدل برای گفتن «نمی‌دانم» بدون جریمه
✳️پایش singleton-rate در داده‌ها
✳️استفاده از RAG همراه با تأیید حقایق
✳️طراحی بِنچمارک‌های جدید که شفافیت را تشویق کنند

📖 جزئیات بیشتر در مقاله‌ی کامل OpenAI منتشر شده است.

@rss_ai_ir

#هوش_مصنوعی #یادگیری_عمیق #مدل_زبانی #OpenAI #LLM #AI

👍23👏23🔥22🎉17❤16😁16🥰14

2.17K views11:20

VIRSUN

0:07

This media is not supported in your browser

VIEW IN TELEGRAM

✂️ ابزار متن‌باز برچسب‌گذاری تصاویر با هوش مصنوعی ✂️

👉 ابزار VisioFirm محصول TOELT یک ابزار متن‌باز و هوش‌مصنوعی‌محور برای برچسب‌گذاری سریع تصاویر در پروژه‌های بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبه‌های چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir

#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm

😁30🔥22❤18👍18🎉16👏13🥰12

2.22K views15:19

VIRSUN

0:06

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 ویدئوهای Grok حالا با صدا منتشر می‌شوند!

🔹️ ایلان ماسک در توییتی اعلام کرد قابلیت جدید «گفتار در ویدیو» به ابزار Grok Imagine اضافه شده؛ ارتقایی مهم در تولید تصویر و ویدیو که طی هفته‌های آینده عرضه خواهد شد.
🔹️ همچنین Grok Imagine طی ماه‌های اخیر به‌عنوان نسخه مدرن Vine معرفی شد؛ ابزاری برای تولید ویدیوهای کوتاه (حدود ۶ ثانیه) که این بار همراه با صدا و بر پایه متن ساخته می‌شوند.

@rss_ai_ir

#هوش_مصنوعی #ایلان_ماسک #Grok #ویدیو #AI

🔥29❤27👍22🎉17😁16🥰14💯9😍6👏5🤩5❤‍🔥5

1.35K views03:08

About

Blog

Apps

Platform