🌟 InfoSeek:
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
نسل جدید دادهسازی برای تحقیقات عمیق با فرمالیزهسازی HCSP
مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژهی تحقیقات عمیق (Deep Research).
🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئلهها تجزیه کند، چندمرحلهای استدلال نماید و در نهایت پاسخها را با منابع واقعی اعتبارسنجی کند.
🔹 فرمالیزهسازی به HCSP
این مسائل بهصورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل میشوند:
❌هر نود یک زیرمسئله یا حقیقت اتمی است.
❌یالها روابط قابلبررسی از ویکیپدیا یا منابع باز هستند.
❌پاسخ نهایی، ریشهی درخت است که تنها با تقاطع محدودیتها و زیرپرسشها بهدست میآید.
❌این رویکرد باعث میشود عمق و عرض استدلال بهروشنی مشخص شده و هر گام میانی قابل بررسی و صحتسنجی باشد.
🔹 معماری عاملها
دو عامل فرآیند را پیش میبرند:
1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.
2. Browser – استخراج داده و لینک از صفحات.
چهار عمل اصلی چرخه را میسازند:
✅شروع از «anchor»
Parent Blurring
✅(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
✅عمقبخشی عمودی با دنبالکردن لینکها
✅تولید متن سؤال تنها پس از تکمیل قیود
🔹 نتایج و خروجیها
♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسبهای استخراج.
♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و بهمراتب بهتر از Qwen3-32B و Search-R1-32B.
♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.
🔹 مزایا
✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از دادههای واقعی
✳️کاربردپذیری در معماریهای مختلف
📌 لایسنس: Apache 2.0
📂 خروجیهای منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزنهای InfoSeeker-3B بهزودی منتشر میشوند.)
💢HuggingFace
📛GitHub
🛑Arxiv
@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
😁49👍47❤41🎉41🔥39🥰25👏24
This media is not supported in your browser
VIEW IN TELEGRAM
✂️ ابزار متنباز برچسبگذاری تصاویر با هوش مصنوعی ✂️
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
😁30🔥22❤18👍18🎉16👏13🥰12
This media is not supported in your browser
VIEW IN TELEGRAM
🖌️ ویرایش بلادرنگ با Drag 🖌️
👉 آزمایشگاه Visual AI از Inpaint4Drag رونمایی کرد؛ یک فریمورک نوآورانه که فرآیند ویرایش drag-based را به دو بخش warp دوطرفه در فضای پیکسل و inpainting تجزیه میکند. الهامگرفته از تغییر شکل الاستیک اجسام.
✨ نکته جالب اینجاست که میتوانید بهصورت بلادرنگ، اجسام را بکشید و تغییر شکل دهید، بدون از دست رفتن جزئیات.
📌 دمو و کد منتشر شده است (لایسنس هنوز مشخص نیست) 💙
🔗 Paper: https://arxiv.org/pdf/2509.04582
🔗 Project: https://visual-ai.github.io/inpaint4drag/
🔗 Repo: https://github.com/Visual-AI/Inpaint4Drag
🔗 Demo: https://colab.research.google.com/drive/1fzoyNzcJNZjM1_08FE9V2V20EQxGf4PH
@rss_ai_ir
#AI #ML #Inpaint4Drag #Editing #ComputerVision #Realtime
👉 آزمایشگاه Visual AI از Inpaint4Drag رونمایی کرد؛ یک فریمورک نوآورانه که فرآیند ویرایش drag-based را به دو بخش warp دوطرفه در فضای پیکسل و inpainting تجزیه میکند. الهامگرفته از تغییر شکل الاستیک اجسام.
✨ نکته جالب اینجاست که میتوانید بهصورت بلادرنگ، اجسام را بکشید و تغییر شکل دهید، بدون از دست رفتن جزئیات.
📌 دمو و کد منتشر شده است (لایسنس هنوز مشخص نیست) 💙
🔗 Paper: https://arxiv.org/pdf/2509.04582
🔗 Project: https://visual-ai.github.io/inpaint4drag/
🔗 Repo: https://github.com/Visual-AI/Inpaint4Drag
🔗 Demo: https://colab.research.google.com/drive/1fzoyNzcJNZjM1_08FE9V2V20EQxGf4PH
@rss_ai_ir
#AI #ML #Inpaint4Drag #Editing #ComputerVision #Realtime
👍27🔥25❤24😁20🎉18👏17🥰16
This media is not supported in your browser
VIEW IN TELEGRAM
👻 From Skin to Skeleton 👻
مقالهای تازه تلاش کرده مدل شناختهشدهی SMPL برای بدن انسان را با یک مدل تازه به نام BSM (Biomechanical Skeleton Model) یکپارچه کند. خروجی این تلاش، مدلی به نام SKEL است که مثل SMPL قابل انیمیتکردن است، اما با درجات آزادی کمتر و در عین حال سازگارتر با واقعیت بیومکانیکی بدن انسان.
🔹همچنین SKEL به محققان اجازه میدهد حرکات بدن را طبیعیتر، سبکتر و با دقت بیشتری شبیهسازی کنند.
🔹 این مدل، داده و کد برای تحقیقات در دسترس است.
🟢 Paper: arxiv.org/pdf/2509.06607
🟢 Project: https://skel.is.tue.mpg.de/
@rss_ai_ir
#AI #ML #ComputerVision #3DHumanModeling #SMPL #SKEL #Research
مقالهای تازه تلاش کرده مدل شناختهشدهی SMPL برای بدن انسان را با یک مدل تازه به نام BSM (Biomechanical Skeleton Model) یکپارچه کند. خروجی این تلاش، مدلی به نام SKEL است که مثل SMPL قابل انیمیتکردن است، اما با درجات آزادی کمتر و در عین حال سازگارتر با واقعیت بیومکانیکی بدن انسان.
🔹همچنین SKEL به محققان اجازه میدهد حرکات بدن را طبیعیتر، سبکتر و با دقت بیشتری شبیهسازی کنند.
🔹 این مدل، داده و کد برای تحقیقات در دسترس است.
🟢 Paper: arxiv.org/pdf/2509.06607
🟢 Project: https://skel.is.tue.mpg.de/
@rss_ai_ir
#AI #ML #ComputerVision #3DHumanModeling #SMPL #SKEL #Research
👏20❤15👍13😁13🎉13🔥12🥰10
This media is not supported in your browser
VIEW IN TELEGRAM
🌱 FoMo4Wheat؛ مدل پایهای مخصوص گندم 🌱
🔹 تیم PheniX Lab و همکاران، خانوادهای نوآورانه از مدلهای پایه را معرفی کردهاند که بهطور ویژه برای پردازش تصاویر گندم طراحی شدهاند. این مدلها برای وظایفی مانند طبقهبندی، آشکارسازی، شمارش و بخشبندی مناسباند.
✨ همهچیز بهصورت متنباز و تحت لایسنس MIT منتشر شده: دمو، دیتاست، مدل و کد.
📌 منابع:
👉 مقاله
👉 پروژه
👉 کد
👉 دمو آنلاین
این مدل میتونه نقطهی عطفی در هوش مصنوعی کشاورزی باشه، جایی که تحلیل دقیق و خودکار تصاویر گندم میتونه به بهبود عملکرد و بهرهوری کمک بزرگی بکنه. 🌾🤖
@rss_ai_ir
#AI #ML #Agriculture #ComputerVision #FoMo4Wheat #هوش_مصنوعی #کشاورزی
🔹 تیم PheniX Lab و همکاران، خانوادهای نوآورانه از مدلهای پایه را معرفی کردهاند که بهطور ویژه برای پردازش تصاویر گندم طراحی شدهاند. این مدلها برای وظایفی مانند طبقهبندی، آشکارسازی، شمارش و بخشبندی مناسباند.
✨ همهچیز بهصورت متنباز و تحت لایسنس MIT منتشر شده: دمو، دیتاست، مدل و کد.
📌 منابع:
👉 مقاله
👉 پروژه
👉 کد
👉 دمو آنلاین
این مدل میتونه نقطهی عطفی در هوش مصنوعی کشاورزی باشه، جایی که تحلیل دقیق و خودکار تصاویر گندم میتونه به بهبود عملکرد و بهرهوری کمک بزرگی بکنه. 🌾🤖
@rss_ai_ir
#AI #ML #Agriculture #ComputerVision #FoMo4Wheat #هوش_مصنوعی #کشاورزی
❤10🥰8🔥7👏7😁6👍5🎉3
🚀 تحقیقات جدید Google Research: جهش بزرگ در تولید خودکار کد علمی در سطح کارشناسان
ایده ساده و در عین حال قدرتمند است: ترکیب مدلهای زبانی بزرگ (LLM) + الگوریتم جستجوی درختی و تبدیل فرآیند نوشتن نرمافزار علمی به یک جستجوی هدایتشده.
🔧 روند کار:
مدل بارها کد را مینویسد، در محیط ایزوله (sandbox) اجرا میکند، کیفیت خروجی (مثلاً دقت پیشبینی یا کیفیت ادغام دادهها) بهصورت عددی ارزیابی میشود و درخت جستجو بهترین شاخهها را نگه میدارد و موارد ضعیف را حذف میکند.
🔑 نتایج کلیدی:
رسیدن به سطح کارشناسان و برتری نسبت به روشهای مرجع در حوزههای مختلف: زیستشناسی، اپیدمیولوژی، ژئوانالیز، علوم اعصاب، سریهای زمانی و روشهای عددی.
سرعت چشمگیر: کمتر از ۲ ساعت روی یک کارت T4 در مقابل ۳۶ ساعت روی ۱۶ کارت A100.
در زیستاطلاعاتی (Bioinformatics): ۴۰ روش جدید برای تحلیل دادههای تکسلولی ایجاد شد که از بهترین الگوریتمهای انسانی بهتر عمل کردند.
در اپیدمیولوژی: ۱۴ مدل جدید طراحی شد که رکورد پیشبینی بستریهای COVID-19 را شکستند.
📌 جمعبندی: به محض اینکه یک مسئله علمی بهصورت یک معیار ساده (متریک) فرمولبندی شود، ترکیب LLM + جستجوی درختی میتواند بهطور خودکار کد علمی تولید و بهبود دهد و به سطح بهترین متخصصان برسد.
🟢 ریپوی پروژه: GitHub
🟢 مقاله: arXiv
@rss_ai_ir
#AI #ML #GoogleResearch #ScientificComputing #LLM #AutoML #ResearchTools
ایده ساده و در عین حال قدرتمند است: ترکیب مدلهای زبانی بزرگ (LLM) + الگوریتم جستجوی درختی و تبدیل فرآیند نوشتن نرمافزار علمی به یک جستجوی هدایتشده.
🔧 روند کار:
مدل بارها کد را مینویسد، در محیط ایزوله (sandbox) اجرا میکند، کیفیت خروجی (مثلاً دقت پیشبینی یا کیفیت ادغام دادهها) بهصورت عددی ارزیابی میشود و درخت جستجو بهترین شاخهها را نگه میدارد و موارد ضعیف را حذف میکند.
🔑 نتایج کلیدی:
رسیدن به سطح کارشناسان و برتری نسبت به روشهای مرجع در حوزههای مختلف: زیستشناسی، اپیدمیولوژی، ژئوانالیز، علوم اعصاب، سریهای زمانی و روشهای عددی.
سرعت چشمگیر: کمتر از ۲ ساعت روی یک کارت T4 در مقابل ۳۶ ساعت روی ۱۶ کارت A100.
در زیستاطلاعاتی (Bioinformatics): ۴۰ روش جدید برای تحلیل دادههای تکسلولی ایجاد شد که از بهترین الگوریتمهای انسانی بهتر عمل کردند.
در اپیدمیولوژی: ۱۴ مدل جدید طراحی شد که رکورد پیشبینی بستریهای COVID-19 را شکستند.
📌 جمعبندی: به محض اینکه یک مسئله علمی بهصورت یک معیار ساده (متریک) فرمولبندی شود، ترکیب LLM + جستجوی درختی میتواند بهطور خودکار کد علمی تولید و بهبود دهد و به سطح بهترین متخصصان برسد.
🟢 ریپوی پروژه: GitHub
🟢 مقاله: arXiv
@rss_ai_ir
#AI #ML #GoogleResearch #ScientificComputing #LLM #AutoML #ResearchTools
👍11🎉7❤5🔥5😁5🥰4👏3
📸 یک پروژهی جالب در حوزه یادگیری ماشین
محققان روشی پیدا کردند که تنها با بررسی الگوی محو شدن (Blur) پسزمینه در عکسها، میتوانند تشخیص دهند آن عکس با کدام گوشی گرفته شده است.
🔍 نکتهی کلیدی: هر گوشی هوشمند، حتی وقتی از الگوریتمهای مشابه استفاده میکند، الگوی محوی مخصوص به خود را در تصاویر ثبت میکند.
📌 یافتهها:
فعلاً باید برای هر مدل گوشی یک مدل ML جداگانه آموزش داده شود.
اما در تئوری، همین حالا هم میتوان بررسی کرد که آیا دو عکس از یک دستگاه ثبت شدهاند یا خیر.
این موضوع میتواند در حوزههای امنیت سایبری، پزشکی قانونی دیجیتال و تحلیل متادیتای تصویر کاربرد داشته باشد.
📖 جزئیات بیشتر و دمو در سایت پروژه:
👉 https://blur-fields.github.io/
کد نیز بهزودی منتشر خواهد شد.
@rss_ai_ir
#هوش_مصنوعی #پردازش_تصویر #ML #Forensics #AI_industrial_news
محققان روشی پیدا کردند که تنها با بررسی الگوی محو شدن (Blur) پسزمینه در عکسها، میتوانند تشخیص دهند آن عکس با کدام گوشی گرفته شده است.
🔍 نکتهی کلیدی: هر گوشی هوشمند، حتی وقتی از الگوریتمهای مشابه استفاده میکند، الگوی محوی مخصوص به خود را در تصاویر ثبت میکند.
📌 یافتهها:
فعلاً باید برای هر مدل گوشی یک مدل ML جداگانه آموزش داده شود.
اما در تئوری، همین حالا هم میتوان بررسی کرد که آیا دو عکس از یک دستگاه ثبت شدهاند یا خیر.
این موضوع میتواند در حوزههای امنیت سایبری، پزشکی قانونی دیجیتال و تحلیل متادیتای تصویر کاربرد داشته باشد.
📖 جزئیات بیشتر و دمو در سایت پروژه:
👉 https://blur-fields.github.io/
کد نیز بهزودی منتشر خواهد شد.
@rss_ai_ir
#هوش_مصنوعی #پردازش_تصویر #ML #Forensics #AI_industrial_news
🔥3❤1👍1👏1🤔1🐳1
🦠 هوش مصنوعی توانست ویروسهای قاتل باکتری بسازد
⛔️دانشمندان استنفورد و مؤسسه Arc نشان دادند که مدلهای زایشی قادرند ژنوم کامل ویروسها را طراحی کنند – و جالب اینکه نسخههای سنتز شده واقعاً موفق به آلودهکردن باکتریها شدند.
✨ نکات کلیدی:
✅مدل Evo روی ۲ میلیون ژنوم فاژ آموزش دید.
✅به جای تقلید، ترکیبهای جدیدی از ژنها و توالیها پیشنهاد داد.
✅زنجیرههای سنتز شده روی E. coli تست شدند و نتیجه همان الگوی کلاسیک عفونت بود (ایجاد لکه روی محیط کشت).
⚡ اهمیت موضوع:
طراحی کل ژنوم یکی از سختترین چالشهای زیستشناسی است، چون کوچکترین خطا در پروموترها، نواحی کدکننده یا فریمهای خوانش، موجود را غیرقابل حیات میکند.
🔮 کاربردها و نگرانیها:
♻️میتواند توسعه فاژتراپی و وکتورهای ژندرمانی را سرعت دهد.
♻️اما مقیاسدهی به موجودات پیچیده بسیار دشوار است.
♻️یکی از نویسندگان هشدار داده: «این فناوری پتانسیل عظیمی دارد، ولی هرگونه آزمایش روی ویروسهای خطرناک مثل آبله یا سیاهزخم نگرانیهای جدی ایجاد میکند.»
🟢 جزییات بیشتر: MIT Tech Review
@rss_ai_ir
#هوش_مصنوعی #زیست_فناوری #بیوتک #AI #ML #فناوری
⛔️دانشمندان استنفورد و مؤسسه Arc نشان دادند که مدلهای زایشی قادرند ژنوم کامل ویروسها را طراحی کنند – و جالب اینکه نسخههای سنتز شده واقعاً موفق به آلودهکردن باکتریها شدند.
✨ نکات کلیدی:
✅مدل Evo روی ۲ میلیون ژنوم فاژ آموزش دید.
✅به جای تقلید، ترکیبهای جدیدی از ژنها و توالیها پیشنهاد داد.
✅زنجیرههای سنتز شده روی E. coli تست شدند و نتیجه همان الگوی کلاسیک عفونت بود (ایجاد لکه روی محیط کشت).
⚡ اهمیت موضوع:
طراحی کل ژنوم یکی از سختترین چالشهای زیستشناسی است، چون کوچکترین خطا در پروموترها، نواحی کدکننده یا فریمهای خوانش، موجود را غیرقابل حیات میکند.
🔮 کاربردها و نگرانیها:
♻️میتواند توسعه فاژتراپی و وکتورهای ژندرمانی را سرعت دهد.
♻️اما مقیاسدهی به موجودات پیچیده بسیار دشوار است.
♻️یکی از نویسندگان هشدار داده: «این فناوری پتانسیل عظیمی دارد، ولی هرگونه آزمایش روی ویروسهای خطرناک مثل آبله یا سیاهزخم نگرانیهای جدی ایجاد میکند.»
🟢 جزییات بیشتر: MIT Tech Review
@rss_ai_ir
#هوش_مصنوعی #زیست_فناوری #بیوتک #AI #ML #فناوری
👏14🥰13🔥10😁10🎉10❤4👍3
🧩 ردیابی سهبعدی نقاط با MVTracker
✅ابزار MVTracker ابزاری نوآورانه برای ردیابی نقاط سهبعدی با دادههای چند دوربینه است. این مدل قابلیت ادغام نماهای مختلف را در یک ابر نقاط سهبعدی واحد دارد و با استفاده از kNN correlation ارتباطات فضایی-زمانی را بهخوبی مدیریت میکند.
🚀 ویژگیهای کلیدی:
✳️اولین راهکار تخصصی برای ردیابی نقاط 3D از چند زاویه.
✳️استفاده از ترنسفورمرها برای بهبود تدریجی مسیرهای ردیابی.
✳️پشتیبانی از تنظیمات متنوع دوربینها بدون نیاز به بهینهسازی جداگانه برای هر سکانس.
✳️آماده برای استفاده سریع از طریق PyTorch Hub.
📌 سورسکد در گیتهاب:
github.com/ethz-vlg/mvtracker
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #python #3DTracking #PyTorch #ML
✅ابزار MVTracker ابزاری نوآورانه برای ردیابی نقاط سهبعدی با دادههای چند دوربینه است. این مدل قابلیت ادغام نماهای مختلف را در یک ابر نقاط سهبعدی واحد دارد و با استفاده از kNN correlation ارتباطات فضایی-زمانی را بهخوبی مدیریت میکند.
🚀 ویژگیهای کلیدی:
✳️اولین راهکار تخصصی برای ردیابی نقاط 3D از چند زاویه.
✳️استفاده از ترنسفورمرها برای بهبود تدریجی مسیرهای ردیابی.
✳️پشتیبانی از تنظیمات متنوع دوربینها بدون نیاز به بهینهسازی جداگانه برای هر سکانس.
✳️آماده برای استفاده سریع از طریق PyTorch Hub.
📌 سورسکد در گیتهاب:
github.com/ethz-vlg/mvtracker
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #python #3DTracking #PyTorch #ML
GitHub
GitHub - ethz-vlg/mvtracker: [ICCV 2025 Oral] MVTracker: Multi-view 3D Point Tracking
[ICCV 2025 Oral] MVTracker: Multi-view 3D Point Tracking - ethz-vlg/mvtracker
👏8❤6👍5🥰4🎉4🔥3😁2
🧬🤖 Paper2Agent:
جان بخشیدن به مقالات علمی
✅ابزار متنباز جدید از محققان استنفورد که مقالات علمی ایستا را به دستیارهای تعاملی هوش مصنوعی تبدیل میکند.
📌 چطور کار میکند؟
♻️ماژول Paper2MCP مقاله و کد آن (اگر وجود داشته باشد) را تحلیل کرده، متدهای کلیدی را استخراج و آنها را به ابزارهایی داخل MCP سرور تبدیل میکند.
♻️لایه Agent این سرور را به چتباتهایی مثل ChatGPT یا Claude Code متصل میکند.
🎯 در نتیجه هر مقاله علمی تبدیل میشود به یک دستیار اختصاصی که میتواند:
✳️توضیح ساده و قابلفهم از مفاهیم مقاله بدهد؛
✳️کدها را بدون نیاز به نصب دستی محیطها و ماژولها اجرا کند؛
✳️دادهها و پایپلاینهای چند مقاله مختلف را با هم ترکیب کند.
هر MCP سرور شامل است:
🔧 Tools —
توابع کاربردی (مثلاً پیشبینی تغییر بیان ژنها)
📂 Resources —
متن مقاله، کد و دیتاستها
💡 Prompts — سناریوهای گامبهگام
✨ با Paper2Agent، بازتولید روشهای علمی از یک فرآیند وقتگیر به یک تجربه تعاملی ساده در قالب چت تبدیل میشود.
🟠 Github
#هوش_مصنوعی #عامل_هوشمند #AI #ML #AIagent #دانشگاهی
@rss_ai_ir
جان بخشیدن به مقالات علمی
✅ابزار متنباز جدید از محققان استنفورد که مقالات علمی ایستا را به دستیارهای تعاملی هوش مصنوعی تبدیل میکند.
📌 چطور کار میکند؟
♻️ماژول Paper2MCP مقاله و کد آن (اگر وجود داشته باشد) را تحلیل کرده، متدهای کلیدی را استخراج و آنها را به ابزارهایی داخل MCP سرور تبدیل میکند.
♻️لایه Agent این سرور را به چتباتهایی مثل ChatGPT یا Claude Code متصل میکند.
🎯 در نتیجه هر مقاله علمی تبدیل میشود به یک دستیار اختصاصی که میتواند:
✳️توضیح ساده و قابلفهم از مفاهیم مقاله بدهد؛
✳️کدها را بدون نیاز به نصب دستی محیطها و ماژولها اجرا کند؛
✳️دادهها و پایپلاینهای چند مقاله مختلف را با هم ترکیب کند.
هر MCP سرور شامل است:
🔧 Tools —
توابع کاربردی (مثلاً پیشبینی تغییر بیان ژنها)
📂 Resources —
متن مقاله، کد و دیتاستها
💡 Prompts — سناریوهای گامبهگام
✨ با Paper2Agent، بازتولید روشهای علمی از یک فرآیند وقتگیر به یک تجربه تعاملی ساده در قالب چت تبدیل میشود.
🟠 Github
#هوش_مصنوعی #عامل_هوشمند #AI #ML #AIagent #دانشگاهی
@rss_ai_ir
👍40🥰39❤37🎉37🔥34👏34😁34
🦾 چین با سرعتی بیسابقه در حال رباتیزهکردن کارخانههای خود است
در سال ۲۰۲۴، چین حدود ۳۰۰ هزار ربات صنعتی جدید به کار گرفت — رقمی که از مجموع کل سایر کشورها نیز بیشتر است.
امروزه بیش از دو میلیون ربات در کارخانههای این کشور شبانهروز کار میکنند، بدون توقف.
📊 برای مقایسه:
🇺🇸 آمریکا در سال گذشته تنها ۳۴ هزار ربات اضافه کرد،
🇯🇵 ژاپن — ۴۴ هزار،
و در مجموع، چین اکنون ۵ برابر بیشتر از ایالات متحده ربات صنعتی دارد.
🚀 این جهش نتیجهی سیاستهای بلندمدت دولتی است — دقیقاً همان رویکردی که چین را در زمینهی خودروهای برقی و هوش مصنوعی به پیشتاز جهان تبدیل کرد:
وامهای ارزان، یارانههای هدفمند و برنامههای دقیق برای خودکارسازی.
🤖 امروز در بسیاری از خطوط تولید، رباتها عملیات جوشکاری، مونتاژ و جابجایی قطعات را انجام میدهند، در حالی که سیستمهای هوش مصنوعی در پسزمینه دادههای تجهیزات را تحلیل میکنند، فرسودگی را پیشبینی و توقفهای تولید را کاهش میدهند.
🏭 پیشتازی چین بهویژه در صنایع خودروسازی و الکترونیک مشهود است، جایی که هر ثانیه در خط تولید اهمیت دارد.
اکنون حدود ۶۰٪ از رباتهای نصبشده در داخل چین تولید میشوند، هرچند حسگرها، درایوها و تراشههای دقیق هنوز عمدتاً از آلمان و ژاپن وارد میشوند.
🦿 رباتهای انساننما هم به سرعت در حال رشدند — مدلهای پایهای که توسط استارتاپهای چینی تولید میشوند، اکنون حدود ۶ هزار دلار قیمت دارند.
🔧 چالش اصلی فعلی، کمبود متخصص در زمینهی تنظیم و نگهداری رباتهاست.
اما چین در اینجا هم برتری دارد: نیروی انسانی گستردهای از برقکاران و برنامهنویسان PLC، و اکنون میانگین حقوق مهندسان رباتیک در چین به ۶۰ هزار دلار در سال رسیده است.
💡 ترکیب حمایت دولتی، زنجیرههای تأمین هوشمند و تمرکز بر نرمافزار، چین را به مرکز جهانی تولید خودکار تبدیل کرده است.
در سالهای پیشرو، این یعنی کاهش هزینهی تولید و افزایش سرعت تحویل کالا نسبت به بسیاری از رقبا.
@rss_ai_ir
#AI #Robotics #Industry40 #China #Automation #ML #SmartFactory
در سال ۲۰۲۴، چین حدود ۳۰۰ هزار ربات صنعتی جدید به کار گرفت — رقمی که از مجموع کل سایر کشورها نیز بیشتر است.
امروزه بیش از دو میلیون ربات در کارخانههای این کشور شبانهروز کار میکنند، بدون توقف.
📊 برای مقایسه:
🇺🇸 آمریکا در سال گذشته تنها ۳۴ هزار ربات اضافه کرد،
🇯🇵 ژاپن — ۴۴ هزار،
و در مجموع، چین اکنون ۵ برابر بیشتر از ایالات متحده ربات صنعتی دارد.
🚀 این جهش نتیجهی سیاستهای بلندمدت دولتی است — دقیقاً همان رویکردی که چین را در زمینهی خودروهای برقی و هوش مصنوعی به پیشتاز جهان تبدیل کرد:
وامهای ارزان، یارانههای هدفمند و برنامههای دقیق برای خودکارسازی.
🤖 امروز در بسیاری از خطوط تولید، رباتها عملیات جوشکاری، مونتاژ و جابجایی قطعات را انجام میدهند، در حالی که سیستمهای هوش مصنوعی در پسزمینه دادههای تجهیزات را تحلیل میکنند، فرسودگی را پیشبینی و توقفهای تولید را کاهش میدهند.
🏭 پیشتازی چین بهویژه در صنایع خودروسازی و الکترونیک مشهود است، جایی که هر ثانیه در خط تولید اهمیت دارد.
اکنون حدود ۶۰٪ از رباتهای نصبشده در داخل چین تولید میشوند، هرچند حسگرها، درایوها و تراشههای دقیق هنوز عمدتاً از آلمان و ژاپن وارد میشوند.
🦿 رباتهای انساننما هم به سرعت در حال رشدند — مدلهای پایهای که توسط استارتاپهای چینی تولید میشوند، اکنون حدود ۶ هزار دلار قیمت دارند.
🔧 چالش اصلی فعلی، کمبود متخصص در زمینهی تنظیم و نگهداری رباتهاست.
اما چین در اینجا هم برتری دارد: نیروی انسانی گستردهای از برقکاران و برنامهنویسان PLC، و اکنون میانگین حقوق مهندسان رباتیک در چین به ۶۰ هزار دلار در سال رسیده است.
💡 ترکیب حمایت دولتی، زنجیرههای تأمین هوشمند و تمرکز بر نرمافزار، چین را به مرکز جهانی تولید خودکار تبدیل کرده است.
در سالهای پیشرو، این یعنی کاهش هزینهی تولید و افزایش سرعت تحویل کالا نسبت به بسیاری از رقبا.
@rss_ai_ir
#AI #Robotics #Industry40 #China #Automation #ML #SmartFactory
❤2
🦉 LightOnOCR-1B —
مدل جدید و فوقسریع OCR از LightOn
شرکت LightOn از مدل جدید LightOnOCR-1B رونمایی کرد — مدلی که از Qwen2-VL-72B-Instruct استخراج (distill) شده و روی دیتاستی شامل ۱۷.۶ میلیون صفحه / ۴۵.۵ میلیارد توکن آموزش دیده است.
🔥 ویژگیهای کلیدی:
♻️۱ میلیارد پارامتر
♻️پردازش ۵.۷ صفحه در ثانیه روی یک GPU نوع H100 (≈ حدود ۴۹۳٬۰۰۰ صفحه در روز)
♻️پشتیبانی از جدولها، فرمها، معادلات و چیدمانهای پیچیده
♻️۶.۵ برابر سریعتر از dots.ocr و ۱.۷ برابر سریعتر از DeepSeekOCR
♻️هزینه پردازش کمتر از $0.01 برای هر ۱۰۰۰ صفحه A4
📊 دقت (Olmo-Bench):
♻️دقیقتر از DeepSeekOCR
♻️همتراز با dots.ocr (در حالیکه ۳ برابر سبکتر است)
♻️+۱۶ امتیاز نسبت به Qwen3-VL-2B-Instruct
⚙️ ترکیب عالی از کیفیت، سرعت و هزینه پایین — مناسب برای پروژههای مقیاسبالا و سرویسهای ابری OCR.
🟢 مدل ۱B:
LightOnOCR-1B-1025
🟢 مدل 0.9B (32k):
LightOnOCR-0.9B-32k-1025
🟢 بلاگ رسمی:
huggingface.co/blog/lightonai/lightonocr
🟢 دموی آنلاین:
LightOnOCR-1B Demo
@rss_ai_ir
#OCR #هوش_مصنوعی #پردازش_تصویر #LightOn #Qwen #AI #ML #ComputerVision
مدل جدید و فوقسریع OCR از LightOn
شرکت LightOn از مدل جدید LightOnOCR-1B رونمایی کرد — مدلی که از Qwen2-VL-72B-Instruct استخراج (distill) شده و روی دیتاستی شامل ۱۷.۶ میلیون صفحه / ۴۵.۵ میلیارد توکن آموزش دیده است.
🔥 ویژگیهای کلیدی:
♻️۱ میلیارد پارامتر
♻️پردازش ۵.۷ صفحه در ثانیه روی یک GPU نوع H100 (≈ حدود ۴۹۳٬۰۰۰ صفحه در روز)
♻️پشتیبانی از جدولها، فرمها، معادلات و چیدمانهای پیچیده
♻️۶.۵ برابر سریعتر از dots.ocr و ۱.۷ برابر سریعتر از DeepSeekOCR
♻️هزینه پردازش کمتر از $0.01 برای هر ۱۰۰۰ صفحه A4
📊 دقت (Olmo-Bench):
♻️دقیقتر از DeepSeekOCR
♻️همتراز با dots.ocr (در حالیکه ۳ برابر سبکتر است)
♻️+۱۶ امتیاز نسبت به Qwen3-VL-2B-Instruct
⚙️ ترکیب عالی از کیفیت، سرعت و هزینه پایین — مناسب برای پروژههای مقیاسبالا و سرویسهای ابری OCR.
🟢 مدل ۱B:
LightOnOCR-1B-1025
🟢 مدل 0.9B (32k):
LightOnOCR-0.9B-32k-1025
🟢 بلاگ رسمی:
huggingface.co/blog/lightonai/lightonocr
🟢 دموی آنلاین:
LightOnOCR-1B Demo
@rss_ai_ir
#OCR #هوش_مصنوعی #پردازش_تصویر #LightOn #Qwen #AI #ML #ComputerVision
👍1
🔥 خلاصه کنفرانس PyTorchCon 2025 در سانفرانسیسکو
⛔️کنفرانس امسال PyTorch واقعاً پر از دستاوردهای مهم بود. در اینجا چهار مورد از جالبترین و کاربردیترین ابزارهایی که در این چند روز معرفی شدند را مرور میکنیم 👇
---
1️⃣ 🧠 Helion —
❌زبان جدید برنامهنویسی مخصوص PyTorch
✳️زبان جدیدی که روی پایه پایتون ساخته شده تا بتوانید هستههای پردازشی (kernels) را مستقیماً بنویسید.
همچنین Helion کد را بهصورت خودکار به Triton کامپایل میکند، یعنی بدون دردسر میتوانید کرنلهای GPU بهینه بنویسید.
🔗 Helion
---
2️⃣ ⚙️ torchcomms —
❌کتابخانه ارتباطی جدید برای یادگیری توزیعشده
✳️کتابخانهای مخصوص آموزش مدلها روی سختافزارهای عظیم (تا ۱۰۰هزار GPU 😮).
هدف اصلی: بهینهسازی ارتباط بین نودها و کاهش تاخیر در سیستمهای بزرگ.
🔗 torchcomms
---
3️⃣ 📱 ExecuTorch 1.0 —
❌ اجرای مدلها روی موبایل و گجتها
✳️راهحلی کامل برای اجرای مدلهای PyTorch روی موبایل، ساعتهای هوشمند و دستگاههای لبهای (Edge Devices).
هم از نظر سرعت، هم مصرف حافظه و انرژی، فوقالعاده بهینه شده.
🔗 ExecuTorch 1.0
---
4️⃣ 🤖 torchforge —
❌کتابخانهای برای یادگیری تقویتی (RL) و ساخت Agentها
✳️همچنین PyTorch با Torchforge مسیر تازهای در هوش مصنوعی عاملمحور باز کرده است.
ساختارش به گونهای طراحی شده که بخش الگوریتمی از زیرساخت جداست — تا تمرکز فقط روی منطق یادگیری باشد.
🔗 torchforge
---
📊 نتیجه:
همچنین PyTorch بهوضوح دارد از یک فریمورک آموزشی به اکوسیستم کامل AI برای تولید، استقرار و بهینهسازی مدلها تبدیل میشود.
دو روز فوقالعاده پربار برای جامعه هوش مصنوعی 🌍
@rss_ai_ir
#PyTorch #Helion #ExecuTorch #torchforge #AI #DeepLearning #ML #PyTorchCon
⛔️کنفرانس امسال PyTorch واقعاً پر از دستاوردهای مهم بود. در اینجا چهار مورد از جالبترین و کاربردیترین ابزارهایی که در این چند روز معرفی شدند را مرور میکنیم 👇
---
1️⃣ 🧠 Helion —
❌زبان جدید برنامهنویسی مخصوص PyTorch
✳️زبان جدیدی که روی پایه پایتون ساخته شده تا بتوانید هستههای پردازشی (kernels) را مستقیماً بنویسید.
همچنین Helion کد را بهصورت خودکار به Triton کامپایل میکند، یعنی بدون دردسر میتوانید کرنلهای GPU بهینه بنویسید.
🔗 Helion
---
2️⃣ ⚙️ torchcomms —
❌کتابخانه ارتباطی جدید برای یادگیری توزیعشده
✳️کتابخانهای مخصوص آموزش مدلها روی سختافزارهای عظیم (تا ۱۰۰هزار GPU 😮).
هدف اصلی: بهینهسازی ارتباط بین نودها و کاهش تاخیر در سیستمهای بزرگ.
🔗 torchcomms
---
3️⃣ 📱 ExecuTorch 1.0 —
❌ اجرای مدلها روی موبایل و گجتها
✳️راهحلی کامل برای اجرای مدلهای PyTorch روی موبایل، ساعتهای هوشمند و دستگاههای لبهای (Edge Devices).
هم از نظر سرعت، هم مصرف حافظه و انرژی، فوقالعاده بهینه شده.
🔗 ExecuTorch 1.0
---
4️⃣ 🤖 torchforge —
❌کتابخانهای برای یادگیری تقویتی (RL) و ساخت Agentها
✳️همچنین PyTorch با Torchforge مسیر تازهای در هوش مصنوعی عاملمحور باز کرده است.
ساختارش به گونهای طراحی شده که بخش الگوریتمی از زیرساخت جداست — تا تمرکز فقط روی منطق یادگیری باشد.
🔗 torchforge
---
📊 نتیجه:
همچنین PyTorch بهوضوح دارد از یک فریمورک آموزشی به اکوسیستم کامل AI برای تولید، استقرار و بهینهسازی مدلها تبدیل میشود.
دو روز فوقالعاده پربار برای جامعه هوش مصنوعی 🌍
@rss_ai_ir
#PyTorch #Helion #ExecuTorch #torchforge #AI #DeepLearning #ML #PyTorchCon
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌱 PlanarTrack:
مرجع بزرگ برای رهگیری صفحات (Planar Tracking) 🌱
👉 بنچمارک PlanarTrack یک دیتاست و بنچمارک بزرگ و باکیفیت برای رهگیری صفحات در ویدیوها است — شامل ۱,۱۵۰ توالی با بیش از ۷۳۳ هزار فریم، که دربرگیرندهی ۱۰۰۰ ویدیو کوتاهمدت و ۱۵۰ ویدیو بلندمدت است.
این مجموعه برای آموزش و ارزیابی الگوریتمهای رهگیری دقیق در سطوح مختلف طراحی شده و چالشی جدید برای مدلهای بینایی ماشین محسوب میشود. 💙
🔗 مرجعها:
📘 Review
📄 Paper (arXiv)
💻 Repo
🌐 Project
🧩 Dataset
#AI #ComputerVision #Tracking #PlanarTrack #Dataset #Benchmark #DeepLearning #ML #هوش_مصنوعی #بینایی_ماشین
مرجع بزرگ برای رهگیری صفحات (Planar Tracking) 🌱
👉 بنچمارک PlanarTrack یک دیتاست و بنچمارک بزرگ و باکیفیت برای رهگیری صفحات در ویدیوها است — شامل ۱,۱۵۰ توالی با بیش از ۷۳۳ هزار فریم، که دربرگیرندهی ۱۰۰۰ ویدیو کوتاهمدت و ۱۵۰ ویدیو بلندمدت است.
این مجموعه برای آموزش و ارزیابی الگوریتمهای رهگیری دقیق در سطوح مختلف طراحی شده و چالشی جدید برای مدلهای بینایی ماشین محسوب میشود. 💙
🔗 مرجعها:
📘 Review
📄 Paper (arXiv)
💻 Repo
🌐 Project
🧩 Dataset
#AI #ComputerVision #Tracking #PlanarTrack #Dataset #Benchmark #DeepLearning #ML #هوش_مصنوعی #بینایی_ماشین