VIRSUN
6.14K subscribers
1.02K photos
583 videos
5 files
652 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🌟 InfoSeek:
نسل جدید داده‌سازی برای تحقیقات عمیق با فرمالیزه‌سازی HCSP

مرکز BAAI از پروژه InfoSeek رونمایی کرد — یک متدولوژی باز برای سینتِز داده و حلقه آموزشی ویژه‌ی تحقیقات عمیق (Deep Research).

🔹 چالش اصلی
در این سطح، مسئله فقط استخراج یک واقعیت ساده نیست؛ مدل باید پرسش را به زیرمسئله‌ها تجزیه کند، چندمرحله‌ای استدلال نماید و در نهایت پاسخ‌ها را با منابع واقعی اعتبارسنجی کند.

🔹 فرمالیزه‌سازی به HCSP
این مسائل به‌صورت Hierarchical Constraint Satisfaction Problems (HCSP) مدل می‌شوند:

هر نود یک زیرمسئله یا حقیقت اتمی است.
یال‌ها روابط قابل‌بررسی از ویکی‌پدیا یا منابع باز هستند.
پاسخ نهایی، ریشه‌ی درخت است که تنها با تقاطع محدودیت‌ها و زیرپرسش‌ها به‌دست می‌آید.

این رویکرد باعث می‌شود عمق و عرض استدلال به‌روشنی مشخص شده و هر گام میانی قابل بررسی و صحت‌سنجی باشد.

🔹 معماری عامل‌ها
دو عامل فرآیند را پیش می‌برند:

1. Planner – انتخاب هدف و کنترل پیچیدگی کلّی.

2. Browser – استخراج داده و لینک از صفحات.



چهار عمل اصلی چرخه را می‌سازند:

شروع از «anchor»
Parent Blurring
(افزودن شرایط مستقل برای تعریف پاسخ یکتا)
عمق‌بخشی عمودی با دنبال‌کردن لینک‌ها
تولید متن سؤال تنها پس از تکمیل قیود


🔹 نتایج و خروجی‌ها

♻️دیتاست: ۵۰ هزار جفت پرسش–پاسخ و ۱۶.۵ هزار مسیر استدلال با برچسب‌های استخراج.

♻️روی بنچمارک BrowseComp-Plus با ۱۰۰K صفحه و BM25، مدل InfoSeeker-3B به دقت ۱۶.۵٪ رسید — بالاتر از Gemini 2.5 Flash, Sonnet 4, GPT-4.1 و به‌مراتب بهتر از Qwen3-32B و Search-R1-32B.

♻️جایگزینی دیتاست NQ+HQA با InfoSeek دقت را از ۳٪ به ۱۶.۵٪ افزایش داد.


🔹 مزایا

✳️عدم نیاز به Teacher Distillation
✳️خودبهبودی مداوم از داده‌های واقعی
✳️کاربردپذیری در معماری‌های مختلف


📌 لایسنس: Apache 2.0
📂 خروجی‌های منتشرشده: دیتاست، گزارش فنی، سازنده درخت داده و کد آموزش SFT. (کد RL و وزن‌های InfoSeeker-3B به‌زودی منتشر می‌شوند.)
💢HuggingFace
📛GitHub
🛑Arxiv

@rss_ai_ir

#هوش_مصنوعی #یادگیری_عمیق #داده #AI #ML #DeepResearch #InfoSeek
😁49👍4741🎉41🔥39🥰25👏24
This media is not supported in your browser
VIEW IN TELEGRAM
✂️ ابزار متن‌باز برچسب‌گذاری تصاویر با هوش مصنوعی ✂️

👉 ابزار VisioFirm محصول TOELT یک ابزار متن‌باز و هوش‌مصنوعی‌محور برای برچسب‌گذاری سریع تصاویر در پروژه‌های بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبه‌های چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir

#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
😁30🔥2218👍18🎉16👏13🥰12
This media is not supported in your browser
VIEW IN TELEGRAM
🖌️ ویرایش بلادرنگ با Drag 🖌️

👉 آزمایشگاه Visual AI از Inpaint4Drag رونمایی کرد؛ یک فریم‌ورک نوآورانه که فرآیند ویرایش drag-based را به دو بخش warp دوطرفه در فضای پیکسل و inpainting تجزیه می‌کند. الهام‌گرفته از تغییر شکل الاستیک اجسام.

نکته جالب اینجاست که می‌توانید به‌صورت بلادرنگ، اجسام را بکشید و تغییر شکل دهید، بدون از دست رفتن جزئیات.

📌 دمو و کد منتشر شده است (لایسنس هنوز مشخص نیست) 💙


🔗 Paper: https://arxiv.org/pdf/2509.04582
🔗 Project: https://visual-ai.github.io/inpaint4drag/
🔗 Repo: https://github.com/Visual-AI/Inpaint4Drag
🔗 Demo: https://colab.research.google.com/drive/1fzoyNzcJNZjM1_08FE9V2V20EQxGf4PH

@rss_ai_ir

#AI #ML #Inpaint4Drag #Editing #ComputerVision #Realtime
👍27🔥2524😁20🎉18👏17🥰16
This media is not supported in your browser
VIEW IN TELEGRAM
👻 From Skin to Skeleton 👻

مقاله‌ای تازه تلاش کرده مدل شناخته‌شده‌ی SMPL برای بدن انسان را با یک مدل تازه به نام BSM (Biomechanical Skeleton Model) یکپارچه کند. خروجی این تلاش، مدلی به نام SKEL است که مثل SMPL قابل انیمیت‌کردن است، اما با درجات آزادی کمتر و در عین حال سازگارتر با واقعیت بیومکانیکی بدن انسان.

🔹همچنین SKEL به محققان اجازه می‌دهد حرکات بدن را طبیعی‌تر، سبک‌تر و با دقت بیشتری شبیه‌سازی کنند.
🔹 این مدل، داده و کد برای تحقیقات در دسترس است.


🟢 Paper: arxiv.org/pdf/2509.06607
🟢 Project: https://skel.is.tue.mpg.de/

@rss_ai_ir

#AI #ML #ComputerVision #3DHumanModeling #SMPL #SKEL #Research
👏2015👍13😁13🎉13🔥12🥰10
This media is not supported in your browser
VIEW IN TELEGRAM
🌱 FoMo4Wheat؛ مدل پایه‌ای مخصوص گندم 🌱

🔹 تیم PheniX Lab و همکاران، خانواده‌ای نوآورانه از مدل‌های پایه را معرفی کرده‌اند که به‌طور ویژه برای پردازش تصاویر گندم طراحی شده‌اند. این مدل‌ها برای وظایفی مانند طبقه‌بندی، آشکارسازی، شمارش و بخش‌بندی مناسب‌اند.

همه‌چیز به‌صورت متن‌باز و تحت لایسنس MIT منتشر شده: دمو، دیتاست، مدل و کد.

📌 منابع:
👉 مقاله
👉 پروژه
👉 کد
👉 دمو آنلاین

این مدل می‌تونه نقطه‌ی عطفی در هوش مصنوعی کشاورزی باشه، جایی که تحلیل دقیق و خودکار تصاویر گندم می‌تونه به بهبود عملکرد و بهره‌وری کمک بزرگی بکنه. 🌾🤖

@rss_ai_ir

#AI #ML #Agriculture #ComputerVision #FoMo4Wheat #هوش_مصنوعی #کشاورزی
10🥰8🔥7👏7😁6👍5🎉3
🚀 تحقیقات جدید Google Research: جهش بزرگ در تولید خودکار کد علمی در سطح کارشناسان

ایده ساده و در عین حال قدرتمند است: ترکیب مدل‌های زبانی بزرگ (LLM) + الگوریتم جستجوی درختی و تبدیل فرآیند نوشتن نرم‌افزار علمی به یک جستجوی هدایت‌شده.

🔧 روند کار:
مدل بارها کد را می‌نویسد، در محیط ایزوله (sandbox) اجرا می‌کند، کیفیت خروجی (مثلاً دقت پیش‌بینی یا کیفیت ادغام داده‌ها) به‌صورت عددی ارزیابی می‌شود و درخت جستجو بهترین شاخه‌ها را نگه می‌دارد و موارد ضعیف را حذف می‌کند.

🔑 نتایج کلیدی:

رسیدن به سطح کارشناسان و برتری نسبت به روش‌های مرجع در حوزه‌های مختلف: زیست‌شناسی، اپیدمیولوژی، ژئوانالیز، علوم اعصاب، سری‌های زمانی و روش‌های عددی.

سرعت چشمگیر: کمتر از ۲ ساعت روی یک کارت T4 در مقابل ۳۶ ساعت روی ۱۶ کارت A100.

در زیست‌اطلاعاتی (Bioinformatics): ۴۰ روش جدید برای تحلیل داده‌های تک‌سلولی ایجاد شد که از بهترین الگوریتم‌های انسانی بهتر عمل کردند.

در اپیدمیولوژی: ۱۴ مدل جدید طراحی شد که رکورد پیش‌بینی بستری‌های COVID-19 را شکستند.


📌 جمع‌بندی: به محض اینکه یک مسئله علمی به‌صورت یک معیار ساده (متریک) فرمول‌بندی شود، ترکیب LLM + جستجوی درختی می‌تواند به‌طور خودکار کد علمی تولید و بهبود دهد و به سطح بهترین متخصصان برسد.

🟢 ریپوی پروژه: GitHub
🟢 مقاله: arXiv

@rss_ai_ir

#AI #ML #GoogleResearch #ScientificComputing #LLM #AutoML #ResearchTools
👍11🎉75🔥5😁5🥰4👏3
📸 یک پروژه‌ی جالب در حوزه یادگیری ماشین

محققان روشی پیدا کردند که تنها با بررسی الگوی محو شدن (Blur) پس‌زمینه در عکس‌ها، می‌توانند تشخیص دهند آن عکس با کدام گوشی گرفته شده است.

🔍 نکته‌ی کلیدی: هر گوشی هوشمند، حتی وقتی از الگوریتم‌های مشابه استفاده می‌کند، الگوی محوی مخصوص به خود را در تصاویر ثبت می‌کند.

📌 یافته‌ها:

فعلاً باید برای هر مدل گوشی یک مدل ML جداگانه آموزش داده شود.

اما در تئوری، همین حالا هم می‌توان بررسی کرد که آیا دو عکس از یک دستگاه ثبت شده‌اند یا خیر.

این موضوع می‌تواند در حوزه‌های امنیت سایبری، پزشکی قانونی دیجیتال و تحلیل متادیتای تصویر کاربرد داشته باشد.


📖 جزئیات بیشتر و دمو در سایت پروژه:
👉 https://blur-fields.github.io/

کد نیز به‌زودی منتشر خواهد شد.

@rss_ai_ir
#هوش_مصنوعی #پردازش_تصویر #ML #Forensics #AI_industrial_news
🔥31👍1👏1🤔1🐳1
🦠 هوش مصنوعی توانست ویروس‌های قاتل باکتری بسازد

⛔️دانشمندان استنفورد و مؤسسه Arc نشان دادند که مدل‌های زایشی قادرند ژنوم کامل ویروس‌ها را طراحی کنند – و جالب اینکه نسخه‌های سنتز شده واقعاً موفق به آلوده‌کردن باکتری‌ها شدند.

نکات کلیدی:

مدل Evo روی ۲ میلیون ژنوم فاژ آموزش دید.

به جای تقلید، ترکیب‌های جدیدی از ژن‌ها و توالی‌ها پیشنهاد داد.

زنجیره‌های سنتز شده روی E. coli تست شدند و نتیجه همان الگوی کلاسیک عفونت بود (ایجاد لکه روی محیط کشت).


اهمیت موضوع:
طراحی کل ژنوم یکی از سخت‌ترین چالش‌های زیست‌شناسی است، چون کوچک‌ترین خطا در پروموترها، نواحی کدکننده یا فریم‌های خوانش، موجود را غیرقابل حیات می‌کند.

🔮 کاربردها و نگرانی‌ها:

♻️می‌تواند توسعه فاژتراپی و وکتورهای ژن‌درمانی را سرعت دهد.
♻️اما مقیاس‌دهی به موجودات پیچیده بسیار دشوار است.
♻️یکی از نویسندگان هشدار داده: «این فناوری پتانسیل عظیمی دارد، ولی هرگونه آزمایش روی ویروس‌های خطرناک مثل آبله یا سیاه‌زخم نگرانی‌های جدی ایجاد می‌کند.»


🟢 جزییات بیشتر: MIT Tech Review

@rss_ai_ir
#هوش_مصنوعی #زیست_فناوری #بیوتک #AI #ML #فناوری
👏14🥰13🔥10😁10🎉104👍3
🧩 ردیابی سه‌بعدی نقاط با MVTracker

ابزار MVTracker ابزاری نوآورانه برای ردیابی نقاط سه‌بعدی با داده‌های چند دوربینه است. این مدل قابلیت ادغام نماهای مختلف را در یک ابر نقاط سه‌بعدی واحد دارد و با استفاده از kNN correlation ارتباطات فضایی-زمانی را به‌خوبی مدیریت می‌کند.

🚀 ویژگی‌های کلیدی:

✳️اولین راهکار تخصصی برای ردیابی نقاط 3D از چند زاویه.
✳️استفاده از ترنسفورمرها برای بهبود تدریجی مسیرهای ردیابی.
✳️پشتیبانی از تنظیمات متنوع دوربین‌ها بدون نیاز به بهینه‌سازی جداگانه برای هر سکانس.
✳️آماده برای استفاده سریع از طریق PyTorch Hub.


📌 سورس‌کد در گیت‌هاب:
github.com/ethz-vlg/mvtracker

@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #python #3DTracking #PyTorch #ML
👏86👍5🥰4🎉4🔥3😁2
🧬🤖 Paper2Agent:
جان بخشیدن به مقالات علمی

ابزار متن‌باز جدید از محققان استنفورد که مقالات علمی ایستا را به دستیارهای تعاملی هوش مصنوعی تبدیل می‌کند.

📌 چطور کار می‌کند؟

♻️ماژول Paper2MCP مقاله و کد آن (اگر وجود داشته باشد) را تحلیل کرده، متدهای کلیدی را استخراج و آن‌ها را به ابزارهایی داخل MCP سرور تبدیل می‌کند.

♻️لایه Agent این سرور را به چت‌بات‌هایی مثل ChatGPT یا Claude Code متصل می‌کند.


🎯 در نتیجه هر مقاله علمی تبدیل می‌شود به یک دستیار اختصاصی که می‌تواند:

✳️توضیح ساده و قابل‌فهم از مفاهیم مقاله بدهد؛
✳️کدها را بدون نیاز به نصب دستی محیط‌ها و ماژول‌ها اجرا کند؛
✳️داده‌ها و پایپلاین‌های چند مقاله مختلف را با هم ترکیب کند.


هر MCP سرور شامل است:

🔧 Tools —
توابع کاربردی (مثلاً پیش‌بینی تغییر بیان ژن‌ها)

📂 Resources —
متن مقاله، کد و دیتاست‌ها

💡 Prompts — سناریوهای گام‌به‌گام


با Paper2Agent، بازتولید روش‌های علمی از یک فرآیند وقت‌گیر به یک تجربه تعاملی ساده در قالب چت تبدیل می‌شود.

🟠 Github

#هوش_مصنوعی #عامل_هوشمند #AI #ML #AIagent #دانشگاهی


@rss_ai_ir
👍40🥰3937🎉37🔥34👏34😁34
🦾 چین با سرعتی بی‌سابقه در حال رباتیزه‌کردن کارخانه‌های خود است

در سال ۲۰۲۴، چین حدود ۳۰۰ هزار ربات صنعتی جدید به کار گرفت — رقمی که از مجموع کل سایر کشورها نیز بیشتر است.
امروزه بیش از دو میلیون ربات در کارخانه‌های این کشور شبانه‌روز کار می‌کنند، بدون توقف.

📊 برای مقایسه:
🇺🇸 آمریکا در سال گذشته تنها ۳۴ هزار ربات اضافه کرد،
🇯🇵 ژاپن — ۴۴ هزار،
و در مجموع، چین اکنون ۵ برابر بیشتر از ایالات متحده ربات صنعتی دارد.

🚀 این جهش نتیجه‌ی سیاست‌های بلندمدت دولتی است — دقیقاً همان رویکردی که چین را در زمینه‌ی خودروهای برقی و هوش مصنوعی به پیشتاز جهان تبدیل کرد:
وام‌های ارزان، یارانه‌های هدفمند و برنامه‌های دقیق برای خودکارسازی.

🤖 امروز در بسیاری از خطوط تولید، ربات‌ها عملیات جوشکاری، مونتاژ و جابجایی قطعات را انجام می‌دهند، در حالی که سیستم‌های هوش مصنوعی در پس‌زمینه داده‌های تجهیزات را تحلیل می‌کنند، فرسودگی را پیش‌بینی و توقف‌های تولید را کاهش می‌دهند.

🏭 پیشتازی چین به‌ویژه در صنایع خودروسازی و الکترونیک مشهود است، جایی که هر ثانیه در خط تولید اهمیت دارد.

اکنون حدود ۶۰٪ از ربات‌های نصب‌شده در داخل چین تولید می‌شوند، هرچند حسگرها، درایوها و تراشه‌های دقیق هنوز عمدتاً از آلمان و ژاپن وارد می‌شوند.

🦿 ربات‌های انسان‌نما هم به سرعت در حال رشدند — مدل‌های پایه‌ای که توسط استارتاپ‌های چینی تولید می‌شوند، اکنون حدود ۶ هزار دلار قیمت دارند.

🔧 چالش اصلی فعلی، کمبود متخصص در زمینه‌ی تنظیم و نگهداری ربات‌هاست.
اما چین در اینجا هم برتری دارد: نیروی انسانی گسترده‌ای از برق‌کاران و برنامه‌نویسان PLC، و اکنون میانگین حقوق مهندسان رباتیک در چین به ۶۰ هزار دلار در سال رسیده است.

💡 ترکیب حمایت دولتی، زنجیره‌های تأمین هوشمند و تمرکز بر نرم‌افزار، چین را به مرکز جهانی تولید خودکار تبدیل کرده است.
در سال‌های پیش‌رو، این یعنی کاهش هزینه‌ی تولید و افزایش سرعت تحویل کالا نسبت به بسیاری از رقبا.

@rss_ai_ir

#AI #Robotics #Industry40 #China #Automation #ML #SmartFactory
2
🦉 LightOnOCR-1B —
مدل جدید و فوق‌سریع OCR از LightOn

شرکت LightOn از مدل جدید LightOnOCR-1B رونمایی کرد — مدلی که از Qwen2-VL-72B-Instruct استخراج (distill) شده و روی دیتاستی شامل ۱۷.۶ میلیون صفحه / ۴۵.۵ میلیارد توکن آموزش دیده است.

🔥 ویژگی‌های کلیدی:

♻️۱ میلیارد پارامتر
♻️پردازش ۵.۷ صفحه در ثانیه روی یک GPU نوع H100 (≈ حدود ۴۹۳٬۰۰۰ صفحه در روز)
♻️پشتیبانی از جدول‌ها، فرم‌ها، معادلات و چیدمان‌های پیچیده
♻️۶.۵ برابر سریع‌تر از dots.ocr و ۱.۷ برابر سریع‌تر از DeepSeekOCR
♻️هزینه پردازش کمتر از $0.01 برای هر ۱۰۰۰ صفحه A4


📊 دقت (Olmo-Bench):

♻️دقیق‌تر از DeepSeekOCR
♻️هم‌تراز با dots.ocr (در حالی‌که ۳ برابر سبک‌تر است)
♻️+۱۶ امتیاز نسبت به Qwen3-VL-2B-Instruct


⚙️ ترکیب عالی از کیفیت، سرعت و هزینه پایین — مناسب برای پروژه‌های مقیاس‌بالا و سرویس‌های ابری OCR.

🟢 مدل ۱B:
LightOnOCR-1B-1025
🟢 مدل 0.9B (32k):
LightOnOCR-0.9B-32k-1025
🟢 بلاگ رسمی:
huggingface.co/blog/lightonai/lightonocr
🟢 دموی آنلاین:
LightOnOCR-1B Demo

@rss_ai_ir
#OCR #هوش_مصنوعی #پردازش_تصویر #LightOn #Qwen #AI #ML #ComputerVision
👍1
🔥 خلاصه کنفرانس PyTorchCon 2025 در سان‌فرانسیسکو

⛔️کنفرانس امسال PyTorch واقعاً پر از دستاوردهای مهم بود. در اینجا چهار مورد از جالب‌ترین و کاربردی‌ترین ابزارهایی که در این چند روز معرفی شدند را مرور می‌کنیم 👇
---

1️⃣ 🧠 Helion —
زبان جدید برنامه‌نویسی مخصوص PyTorch
✳️زبان جدیدی که روی پایه پایتون ساخته شده تا بتوانید هسته‌های پردازشی (kernels) را مستقیماً بنویسید.
همچنین Helion کد را به‌صورت خودکار به Triton کامپایل می‌کند، یعنی بدون دردسر می‌توانید کرنل‌های GPU بهینه بنویسید.

🔗 Helion

---

2️⃣ ⚙️ torchcomms —
کتابخانه ارتباطی جدید برای یادگیری توزیع‌شده
✳️کتابخانه‌ای مخصوص آموزش مدل‌ها روی سخت‌افزارهای عظیم (تا ۱۰۰هزار GPU 😮).
هدف اصلی: بهینه‌سازی ارتباط بین نودها و کاهش تاخیر در سیستم‌های بزرگ.
🔗 torchcomms

---

3️⃣ 📱 ExecuTorch 1.0 —
اجرای مدل‌ها روی موبایل و گجت‌ها

✳️راه‌حلی کامل برای اجرای مدل‌های PyTorch روی موبایل، ساعت‌های هوشمند و دستگاه‌های لبه‌ای (Edge Devices).
هم از نظر سرعت، هم مصرف حافظه و انرژی، فوق‌العاده بهینه شده.
🔗 ExecuTorch 1.0

---

4️⃣ 🤖 torchforge —
کتابخانه‌ای برای یادگیری تقویتی (RL) و ساخت Agentها
✳️همچنین PyTorch با Torchforge مسیر تازه‌ای در هوش مصنوعی عامل‌محور باز کرده است.
ساختارش به گونه‌ای طراحی شده که بخش الگوریتمی از زیرساخت جداست — تا تمرکز فقط روی منطق یادگیری باشد.
🔗 torchforge

---

📊 نتیجه:
همچنین PyTorch به‌وضوح دارد از یک فریم‌ورک آموزشی به اکوسیستم کامل AI برای تولید، استقرار و بهینه‌سازی مدل‌ها تبدیل می‌شود.
دو روز فوق‌العاده پربار برای جامعه هوش مصنوعی 🌍

@rss_ai_ir
#PyTorch #Helion #ExecuTorch #torchforge #AI #DeepLearning #ML #PyTorchCon
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌱 PlanarTrack:
مرجع بزرگ برای رهگیری صفحات (Planar Tracking) 🌱

👉 بنچمارک PlanarTrack یک دیتاست و بنچمارک بزرگ و باکیفیت برای رهگیری صفحات در ویدیوها است — شامل ۱,۱۵۰ توالی با بیش از ۷۳۳ هزار فریم، که دربرگیرنده‌ی ۱۰۰۰ ویدیو کوتاه‌مدت و ۱۵۰ ویدیو بلندمدت است.

این مجموعه برای آموزش و ارزیابی الگوریتم‌های رهگیری دقیق در سطوح مختلف طراحی شده و چالشی جدید برای مدل‌های بینایی ماشین محسوب می‌شود. 💙

🔗 مرجع‌ها:
📘 Review
📄 Paper (arXiv)
💻 Repo
🌐 Project
🧩 Dataset

#AI #ComputerVision #Tracking #PlanarTrack #Dataset #Benchmark #DeepLearning #ML #هوش_مصنوعی #بینایی_ماشین