🏛️ معماری ConvNeXt: نگاهی عمیق به CNN مدرنی که قواعد بازی را تغییر داد 🚀
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
* نرمالسازی: به جای
---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
3x3
به 7x7
افزایش یافت. این کار به مدل اجازه میدهد تا بخش بسیار بزرگتری از تصویر را ببیند (میدان دید وسیعتر) و الگوهای پیچیدهتری را درک کند. 🖼️۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
ReLU
با GELU
که نرمتر و مدرنتر است، جایگزین شد. ⚡* نرمالسازی: به جای
BatchNorm
، از LayerNorm
استفاده شد که پایداری بیشتری در طول آموزش دارد و از ترنسفورمرها به ارث برده شده است. 📊---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
👍3🎉3🔥2👏1😁1
🚀 معرفی 4DNeX: نسل تازهی مدلسازی 4 بعدی (تصویر → صحنهی پویا)
🔹 پژوهشگران Zeng Tao, Jiawei Ren, Long Zhuo, Tianqi Liu, Zhaoxi Chen یک چارچوب نوین به نام 4DNeX ارائه دادهاند؛ روشی feed-forward برای تولید نمایشهای سهبعدی پویا (۴D) تنها از یک تصویر.
✨ ویژگیهای کلیدی:
* استفاده از مدل دیفیوشن ویدئویی از پیشآموزشدیده.
* معرفی دیتاست جدید 4DNeX-10M.
* نمایش یکپارچهی ویدئو در ۶ بُعد (RGB + XYZ).
* استراتژیهای ساده مانند width-wise fusion و XYZ normalization.
⚡️ کارایی چشمگیر:
* تولید صحنهی 4D تنها در ۱۵ دقیقه (درحالیکه روشهایی مثل Free4D حدود ۶۰ دقیقه زمان میگیرند).
* دستیابی به ۹۷.۲٪ سازگاری و ۵۸.۳٪ پویایی در وظایف image-to-4D.
🌍 اهمیت:
این روش یک گام بزرگ در مدلسازی مولد ۴D است؛ راهکاری مقیاسپذیر و دسترسپذیر برای شبیهسازی تکامل پویای صحنهها، که میتواند به عنوان پایهای برای جهانهای مجازی و مدلهای شبیهسازی هوشمند عمل کند.
📖 جزئیات بیشتر: [arXiv](https://arxiv.org/abs/2508.13154) | [HuggingFace](https://huggingface.co/papers/2508.13154)
@rss_ai_ir
#هوش_مصنوعی #4D #دیفیوشن #GenerativeAI #ComputerVision #arXiv
🔹 پژوهشگران Zeng Tao, Jiawei Ren, Long Zhuo, Tianqi Liu, Zhaoxi Chen یک چارچوب نوین به نام 4DNeX ارائه دادهاند؛ روشی feed-forward برای تولید نمایشهای سهبعدی پویا (۴D) تنها از یک تصویر.
✨ ویژگیهای کلیدی:
* استفاده از مدل دیفیوشن ویدئویی از پیشآموزشدیده.
* معرفی دیتاست جدید 4DNeX-10M.
* نمایش یکپارچهی ویدئو در ۶ بُعد (RGB + XYZ).
* استراتژیهای ساده مانند width-wise fusion و XYZ normalization.
⚡️ کارایی چشمگیر:
* تولید صحنهی 4D تنها در ۱۵ دقیقه (درحالیکه روشهایی مثل Free4D حدود ۶۰ دقیقه زمان میگیرند).
* دستیابی به ۹۷.۲٪ سازگاری و ۵۸.۳٪ پویایی در وظایف image-to-4D.
🌍 اهمیت:
این روش یک گام بزرگ در مدلسازی مولد ۴D است؛ راهکاری مقیاسپذیر و دسترسپذیر برای شبیهسازی تکامل پویای صحنهها، که میتواند به عنوان پایهای برای جهانهای مجازی و مدلهای شبیهسازی هوشمند عمل کند.
📖 جزئیات بیشتر: [arXiv](https://arxiv.org/abs/2508.13154) | [HuggingFace](https://huggingface.co/papers/2508.13154)
@rss_ai_ir
#هوش_مصنوعی #4D #دیفیوشن #GenerativeAI #ComputerVision #arXiv
👍16❤10🎉10🔥9👏9😁7🥰4👌1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 بینایی ماشین در خدمت صنعت
هوش مصنوعی و بینایی ماشین در خطوط تولید دیگر یک انتخاب لوکس نیست، بلکه یک ضرورت است. نمونهی تازه از DeepX نشان میدهد چگونه میتوان با مدلهای پردازش تصویر، بهرهوری و ایمنی را چند برابر کرد:
🔹 ردیابی لحظهای اشیا: شناسایی و دنبالکردن بطریها و محصولات روی خط تولید.
🔹 تشخیص عیوب: کشف ایراداتی که از چشم انسان پنهان میماند (مانند بطریهای معیوب ۲۳ و ۲۸).
🔹 اسکن موجودی انبار: شناسایی خودکار جایگاههای خالی و پایش لحظهای انبار.
🔹 ردیابی کارکنان: تحلیل حرکات کارکنان برای افزایش ایمنی و جلوگیری از ورود به مناطق خطرناک.
⚡️ این فناوریها نهتنها باعث کاهش خطا و افزایش سرعت میشوند، بلکه امنیت کارگران و کیفیت محصول را هم تضمین میکنند.
@rss_ai_ir
#AI_industrial #ComputerVision #SmartFactory #Industry40
هوش مصنوعی و بینایی ماشین در خطوط تولید دیگر یک انتخاب لوکس نیست، بلکه یک ضرورت است. نمونهی تازه از DeepX نشان میدهد چگونه میتوان با مدلهای پردازش تصویر، بهرهوری و ایمنی را چند برابر کرد:
🔹 ردیابی لحظهای اشیا: شناسایی و دنبالکردن بطریها و محصولات روی خط تولید.
🔹 تشخیص عیوب: کشف ایراداتی که از چشم انسان پنهان میماند (مانند بطریهای معیوب ۲۳ و ۲۸).
🔹 اسکن موجودی انبار: شناسایی خودکار جایگاههای خالی و پایش لحظهای انبار.
🔹 ردیابی کارکنان: تحلیل حرکات کارکنان برای افزایش ایمنی و جلوگیری از ورود به مناطق خطرناک.
⚡️ این فناوریها نهتنها باعث کاهش خطا و افزایش سرعت میشوند، بلکه امنیت کارگران و کیفیت محصول را هم تضمین میکنند.
@rss_ai_ir
#AI_industrial #ComputerVision #SmartFactory #Industry40
👍7🎉7❤5🔥5🥰4👏4😁3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
⚽ نتایج SoccerNet 2025! ⚽
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
🔹 رقابتهای SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالشها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستمهای هوشمند ورزشی بازتر میکنند.
📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo
#AI #ComputerVision #SoccerNet #FootballTech
❤16🎉11👍10🔥7😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سهبعدی چندنما (Multi-View 3D Tracking) 🌈
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔹 پروژه MVTracker بهعنوان اولین سیستم دادهمحور برای ردیابی نقاط سهبعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم میکند.
📊 دسترسیها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)
#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین
@rss_ai_ir
🔥9🎉9👍5❤1😁1🙏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 WebEyeTrack:
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
رهگیری چشم در وب، به صورت بلادرنگ 👁️💻
👉 فریم ورک WebEyeTrack یک فریمورک نوآورانه است که مدلهای سبک و پیشرفته تخمین نگاه (Gaze Estimation) را مستقیماً در مرورگر ادغام میکند. این ابزار رهگیری نگاه با هوش مصنوعی را به وب میآورد و به طور صریح وضعیت سر (Head Pose) را هم در نظر میگیرد.
🟢 کد منبع با لایسنس MIT منتشر شده است 💙
🔗 مقاله: https://arxiv.org/pdf/2508.19544
🔗 پروژه: redforestai.github.io/WebEyeTrack
🔗 ریپو: github.com/RedForestAi/WebEyeTrack
@rss_ai_ir
#AI #ML #GazeEstimation #WebAI #ComputerVision #WebEyeTrack #opensource
🔥19😁14🎉14❤13👍10👏10🥰6🙏2
This media is not supported in your browser
VIEW IN TELEGRAM
✂️ ابزار متنباز برچسبگذاری تصاویر با هوش مصنوعی ✂️
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
👉 ابزار VisioFirm محصول TOELT یک ابزار متنباز و هوشمصنوعیمحور برای برچسبگذاری سریع تصاویر در پروژههای بینایی ماشین است.
🔹 پشتیبانی از تشخیص اشیاء، جعبههای چرخیده (Oriented BBs) و سگمنتیشن.
🔹 کد منبع با مجوز Apache 2.0 منتشر شده 💙
🔗 Paper: https://arxiv.org/pdf/2509.04180
🔗 Repo:
https://github.com/OschAI/VisioFirm
@rss_ai_ir
#AI #ML #ComputerVision #Annotation #OpenSource #VisioFirm
😁30🔥22❤18👍18🎉16👏13🥰12
This media is not supported in your browser
VIEW IN TELEGRAM
🖌️ ویرایش بلادرنگ با Drag 🖌️
👉 آزمایشگاه Visual AI از Inpaint4Drag رونمایی کرد؛ یک فریمورک نوآورانه که فرآیند ویرایش drag-based را به دو بخش warp دوطرفه در فضای پیکسل و inpainting تجزیه میکند. الهامگرفته از تغییر شکل الاستیک اجسام.
✨ نکته جالب اینجاست که میتوانید بهصورت بلادرنگ، اجسام را بکشید و تغییر شکل دهید، بدون از دست رفتن جزئیات.
📌 دمو و کد منتشر شده است (لایسنس هنوز مشخص نیست) 💙
🔗 Paper: https://arxiv.org/pdf/2509.04582
🔗 Project: https://visual-ai.github.io/inpaint4drag/
🔗 Repo: https://github.com/Visual-AI/Inpaint4Drag
🔗 Demo: https://colab.research.google.com/drive/1fzoyNzcJNZjM1_08FE9V2V20EQxGf4PH
@rss_ai_ir
#AI #ML #Inpaint4Drag #Editing #ComputerVision #Realtime
👉 آزمایشگاه Visual AI از Inpaint4Drag رونمایی کرد؛ یک فریمورک نوآورانه که فرآیند ویرایش drag-based را به دو بخش warp دوطرفه در فضای پیکسل و inpainting تجزیه میکند. الهامگرفته از تغییر شکل الاستیک اجسام.
✨ نکته جالب اینجاست که میتوانید بهصورت بلادرنگ، اجسام را بکشید و تغییر شکل دهید، بدون از دست رفتن جزئیات.
📌 دمو و کد منتشر شده است (لایسنس هنوز مشخص نیست) 💙
🔗 Paper: https://arxiv.org/pdf/2509.04582
🔗 Project: https://visual-ai.github.io/inpaint4drag/
🔗 Repo: https://github.com/Visual-AI/Inpaint4Drag
🔗 Demo: https://colab.research.google.com/drive/1fzoyNzcJNZjM1_08FE9V2V20EQxGf4PH
@rss_ai_ir
#AI #ML #Inpaint4Drag #Editing #ComputerVision #Realtime
👍27🔥25❤24😁20🎉18👏17🥰16
This media is not supported in your browser
VIEW IN TELEGRAM
🧐 جستجوی افراد در ویدیو و عکس با چند کلمه توصیفی!
👨🏻💻 یک مهندس یادگیری عمیق سیستمی طراحی کرده که تنها با یک توضیح ساده مثل «یک مرد با پیراهن سفید و دوچرخه» میتواند افراد را در تصاویر و ویدیوها پیدا کند، بدون نیاز به شناسه (ID) از پیش تعریفشده.
✏️ هدف اصلی پروژه: ارائه راهکاری کاربردی برای حوزههای امنیت و خردهفروشی؛ جاهایی که چنین قابلیتی ارزش عملی بالایی ایجاد میکند.
---
❓ روش کار:
☑️ مدل SigLIP روی یک دیتاست جدید ReID که شامل ویژگیهای توصیفی دقیق بود فاینتیون شده است (توضیحات دیتاست با کمک Gemini تولید شده).
☑️ دیتاست با فرمت FiftyOne آماده شده تا برای هر فرد در زوایا و نماهای مختلف یک ID یکتا تعریف شود (کاربردی برای ReID).
✔️ کل مسیر، از ساخت داده تا فاینتیون و دیپلوی روی HuggingFace به همراه Gradio Demo در یک ریپوی کامل منتشر شده است.
---
┌ 🥵 SigLIP Person Finder
├ 🖥 Demo
├ 🖥 Dataset
└ 🐱 GitHub Repo
@rss_ai_ir
---
🌐 #هوش_مصنوعی #یادگیری_عمیق #DeepLearning #ReID #ComputerVision #AI
👨🏻💻 یک مهندس یادگیری عمیق سیستمی طراحی کرده که تنها با یک توضیح ساده مثل «یک مرد با پیراهن سفید و دوچرخه» میتواند افراد را در تصاویر و ویدیوها پیدا کند، بدون نیاز به شناسه (ID) از پیش تعریفشده.
✏️ هدف اصلی پروژه: ارائه راهکاری کاربردی برای حوزههای امنیت و خردهفروشی؛ جاهایی که چنین قابلیتی ارزش عملی بالایی ایجاد میکند.
---
❓ روش کار:
☑️ مدل SigLIP روی یک دیتاست جدید ReID که شامل ویژگیهای توصیفی دقیق بود فاینتیون شده است (توضیحات دیتاست با کمک Gemini تولید شده).
☑️ دیتاست با فرمت FiftyOne آماده شده تا برای هر فرد در زوایا و نماهای مختلف یک ID یکتا تعریف شود (کاربردی برای ReID).
✔️ کل مسیر، از ساخت داده تا فاینتیون و دیپلوی روی HuggingFace به همراه Gradio Demo در یک ریپوی کامل منتشر شده است.
---
┌ 🥵 SigLIP Person Finder
├ 🖥 Demo
├ 🖥 Dataset
└ 🐱 GitHub Repo
@rss_ai_ir
---
🌐 #هوش_مصنوعی #یادگیری_عمیق #DeepLearning #ReID #ComputerVision #AI
👍24🔥21🥰20👏19😁18🎉18❤13
This media is not supported in your browser
VIEW IN TELEGRAM
🩸 مدل پایه برای گلبولهای قرمز خون 🩸
🔬 محققان دانشگاه Cagliari مدل RedDino را معرفی کردند؛ یک مدل self-supervised برای تحلیل مورفولوژی گلبولهای قرمز (RBC).
📊 این مدل روی ۱.۲۵ میلیون تصویر گلبول قرمز آموزش دیده و توانسته در تشخیص شکل به رکورد جدید SOTA برسد.
💡 انتشار عمومی:
📄 مقاله
💻 کد
🤗 مدلها
⚙️ لایسنس: Apache 2.0
---
🌐 #هوش_مصنوعی #پزشکی #زیستپزشکی #ComputerVision #DeepLearning #RedDino
@rss_ai_ir
🔬 محققان دانشگاه Cagliari مدل RedDino را معرفی کردند؛ یک مدل self-supervised برای تحلیل مورفولوژی گلبولهای قرمز (RBC).
📊 این مدل روی ۱.۲۵ میلیون تصویر گلبول قرمز آموزش دیده و توانسته در تشخیص شکل به رکورد جدید SOTA برسد.
💡 انتشار عمومی:
📄 مقاله
💻 کد
🤗 مدلها
⚙️ لایسنس: Apache 2.0
---
🌐 #هوش_مصنوعی #پزشکی #زیستپزشکی #ComputerVision #DeepLearning #RedDino
@rss_ai_ir
🔥30🎉26❤21👏21🥰20😁19👍14😍8❤🔥8🤩7💯3