VIRSUN
15.3K subscribers
448 photos
257 videos
2 files
266 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
🎨 پرامپت آماده: اسباب‌بازی وینیل (Vinyl Toy)

🧸 اگر می‌خواهید فیگورهای سه‌بعدی کیوت و بامزه بسازید، این پرامپت مخصوص شماست.
با این دستور می‌توانید هر شخصیت دلخواه خودتان را به یک عروسک وینیل کارتونی تبدیل کنید.

📌 نمونه خروجی‌ها 👇
(همانند عکس‌های بالا: دزد دریایی، نینجا، کاراکتر فانتزی...)


---

📝 Prompt (برای کپی در ابزار تصویرسازی):

Chibi-style 3D vinyl toy of [subject], rendered in [color1] and [color2] tones,
front-facing on a white background. Minimalist composition with soft shadows,
oversized head and tiny body proportions, clean OC renderer output in Cinema 4D.

کافیست به‌جای [subject] نام شخصیت (مثل pirate یا ninja)
و به‌جای [color1] و [color2] رنگ‌های دلخواه خودتان (مثل blue و gold) را وارد کنید.

👾 نتیجه: یک عروسک سه‌بعدی با استایل چیبی (سر بزرگ، بدن کوچک) روی پس‌زمینه سفید و با نورپردازی نرم.


---

#Prompt #VinylToy #3D #AIart

@rss_ai_ir
🎉13🔥11😁11👍86
This media is not supported in your browser
VIEW IN TELEGRAM
نتایج SoccerNet 2025!

🔹 رقابت‌های SoccerNet 2025 Challenges یک بنچمارک باز برای پیشبرد تحقیقات در حوزه بینایی کامپیوتری و تحلیل ویدیوهای فوتبال است.
این چالش‌ها روی درک رخدادها، شناسایی بازیکنان و تحلیل بازی تمرکز دارند و نتایج آن راه را برای سیستم‌های هوشمند ورزشی بازتر می‌کنند.

📌 منابع:
👉 Paper (arXiv)
👉 Project Page
👉 GitHub Repo

#AI #ComputerVision #SoccerNet #FootballTech
16🎉11👍10🔥7😁4
📑 منظور از RFP در پروژه‌های صنعتی هوش مصنوعی

وقتی سازمانی تصمیم می‌گیرد یک پروژه هوش مصنوعی را اجرا کند، اولین گام انتشار RFP (Request For Proposal یا «درخواست پیشنهاد») است.

🔹 در این سند مشخص می‌شود:
1️⃣ هدف و مسئله‌ای که باید حل شود 🎯
2️⃣ نیازها و الزامات فنی ⚙️
3️⃣ زمان‌بندی و بودجه تقریبی 💰
4️⃣ معیارهای انتخاب بهترین پیشنهاد 📊

🔹 تیم‌ها و شرکت‌های متخصص پس از مطالعه RFP، پروپوزال‌های خود را ارائه می‌دهند. در نهایت سازمان می‌تواند بین گزینه‌های مختلف، بهترین راه‌حل را انتخاب کند.

اهمیت RFP در صنعت این است که از همان ابتدا شفافیت ایجاد می‌کند و مانع اتلاف زمان و هزینه می‌شود.


⛔️⛔️⛔️در چند روز آینده RFP یکی از صنایع معدنی را قرار خواهیم داد تا بتوانید در صورتیکه شرکت دارید اقدام نمایید.
---

#هوش_مصنوعی #صنعت #RFP #پروژه #مدیریت_فنی

@rss_ai_ir
👍16🔥11😁9🎉95
This media is not supported in your browser
VIEW IN TELEGRAM
📌 انواع روش‌های عمق‌سنجی در بینایی ماشین و صنعت


🔹 ۱. روش‌های سنتی (Geometric Methods):

استریو ویژن (Stereo Vision):
مقایسه دو تصویر از زوایای مختلف برای محاسبه عمق.
استراکچر از موشن (Structure from Motion – SfM):
بازسازی سه‌بعدی با استفاده از تصاویر متوالی یک دوربین متحرک.
Shape from Shading / Defocus:
استفاده از سایه یا میزان فوکوس برای تخمین عمق.
Photometric Stereo:
نورپردازی از چند جهت و تحلیل تغییرات روشنایی.


🔹 ۲. سنسوری (Sensor-based):

LiDAR (Light Detection and Ranging):
پرتاب لیزر و اندازه‌گیری زمان بازگشت.
Time-of-Flight (ToF) Cameras:
سنجش عمق با زمان رفت و برگشت نور.
Structured Light:
تاباندن الگوهای نوری روی صحنه و اندازه‌گیری تغییر شکل آن‌ها (مثل Kinect قدیمی).
Radar & mmWave:
به‌ویژه در خودروهای خودران و محیط‌های صنعتی پر گردوغبار.


🔹 ۳. مبتنی بر یادگیری عمیق (Deep Learning–based):

Monocular Depth Estimation:
آموزش شبکه‌های CNN/Transformer برای تخمین عمق از یک تصویر.
Stereo Matching with Deep Nets:
جایگزینی الگوریتم‌های هندسی با شبکه‌های عصبی.
Depth Completion:
ترکیب داده‌های ناقص LiDAR با تصویر RGB.
Neural Radiance Fields (NeRF):
بازسازی سه‌بعدی از تصاویر چندگانه با استفاده از شبکه‌های عصبی ضمنی.
Gaussian Splatting 3DGS (۲۰۲۳–۲۰۲۵):
روشی جدیدتر نسبت به NeRF، سریع‌تر و کارآمدتر برای بازسازی صحنه‌ها.


🔹 ۴. ترکیبی و چندوجهی (Hybrid / Multimodal):

Fusion Approaches:
ترکیب LiDAR + RGB + IMU برای دقت بالاتر (مثلاً در خودروها).

Event Cameras + Depth:
استفاده از دوربین‌های رویدادی برای تخمین عمق در صحنه‌های بسیار سریع.

AI-driven SLAM (Simultaneous Localization and Mapping):
همزمانی نقشه‌برداری و عمق‌سنجی با یادگیری عمیق.


کاربردها در صنعت:
👷 کنترل کیفیت قطعات صنعتی،
🚘 خودروهای خودران،
🤖 رباتیک و بازوهای هوشمند،
🏭 پایش خطوط تولید،
🩺 پزشکی (جراحی رباتیک، تصویربرداری سه‌بعدی).


🔖 هشتگ‌ها:
#هوش_مصنوعی #بینایی_ماشین #عمق_سنجی #DeepLearning #LiDAR #NeRF

@rss_ai_ir
🔥1511😁9👍8🎉6
🔰 فاصله کاری یا Working Distance در لنزهای صنعتی

🔻به فاصله میان لنز تا جسم اصطلاحاً فاصله کاری یا Working Distance می‌گویند.
🔻در لنزهای صنعتی یک پارامتر مهم به نام حداقل فاصله کاری (Minimum Working Distance) وجود دارد که نشان می‌دهد لنز تا چه حد می‌تواند به جسم نزدیک شود. بنابراین هنگام انتخاب لنز باید دقت کنیم که فاصله کاری موردنیاز ما بیشتر از حداقل فاصله کاری لنز باشد.

🔻گاهی به دلیل محدودیت فضا یا نیاز پروژه، تمایل داریم فاصله کاری را کاهش دهیم. اما کاهش این فاصله چالش‌هایی به همراه دارد:

1️⃣ پیچیدگی طراحی لنز افزایش می‌یابد.
2️⃣ قیمت لنز به دلیل طراحی خاص و استفاده از عدسی‌های بیشتر بالا می‌رود.
3️⃣ کارایی سیستم (مثل نورگیری و عمق میدان) کاهش پیدا می‌کند.

بنابراین انتخاب درست فاصله کاری، یک تعادل میان فضای فیزیکی، هزینه و کیفیت تصویر ایجاد می‌کند.

#تجهیزات_صنعتی #لنز_صنعتی #دوربین_صنعتی #اتوماسیون_صنعتی #پروژه_صنعتی


🆔 @rss_ai_ir
🔥15🎉138👍6😁6
This media is not supported in your browser
VIEW IN TELEGRAM
🌹 مدل ROSE: حذف اشیا و اثرات محیطی 🌹

یکی از چالش‌های بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام می‌دهد.

🔸 قابلیت‌ها:

♻️حذف شیء ناخواسته همراه با سایه‌ها و بازتاب‌ها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی


🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست

این پیشرفت می‌تونه ابزار قدرتمندی برای طراحان گرافیک، فیلم‌سازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀

#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI

@rss_ai_ir
👍1513🔥11😁7🎉6
This media is not supported in your browser
VIEW IN TELEGRAM
🐕 ربات‌سگ‌ها در حال پیشروی سریع!

دیگه فقط ابزار آزمایشگاهی نیستن؛ ربات‌سگ‌ها دارن وارد صنعت، امنیت، لجستیک و حتی زندگی روزمره می‌شن. 🚀
از گشت‌زنی در کارخانه‌ها تا عملیات امداد و حتی همراهی در محیط‌های خانگی.

🔸 پیشرفت در هوش مصنوعی و بینایی ماشین باعث شده این ربات‌ها هوشمندتر، چابک‌تر و مستقل‌تر بشن.

🔸 شرکت‌های بزرگی مثل Boston Dynamics و Unitree حالا با نسل‌های جدید، توانایی حمل بار، شناسایی خطر و تعامل طبیعی با انسان رو به نمایش گذاشتن.

آیا این روند به معنای حضور گسترده‌ی «سگ‌های رباتیک» در زندگی روزمره ماست؟ 🐾

#رباتیک #هوش_مصنوعی #اتوماسیون #صنعت

@rss_ai_ir
👍15😁12🎉98🔥7
🧠 هوش مصنوعی در خدمت تشخیص سریع خطرات مغزی نوزادان

🔹 یاندکس با همکاری پزشکان دانشگاه پزشکی کودکان سن‌پترزبورگ و دانشجویان شاد، سامانه‌ای مبتنی بر هوش مصنوعی توسعه داده که تصاویر MRI مغز نوزادان را تنها در چند ثانیه تحلیل می‌کند.

🔹 این مدل می‌تواند خطر بروز فلج مغزی (Cerebral Palsy) را شناسایی کند؛ کاری که تا پیش از این تا ۳ روز طول می‌کشید. اکنون با کمک هوش مصنوعی، این زمان به ۳ ثانیه کاهش یافته است – یعنی ۵۰ برابر سریع‌تر!

⚙️ جزئیات فنی:

♻️الگوریتم بر پایه‌ی U-Net با بَکبون ResNeXt-50 طراحی شده و از DiceLoss برای بهبود دقت استفاده می‌کند.
♻️تصاویر MRI ابتدا با BIBSNet پیش‌برچسب‌گذاری شدند و سپس پزشکان صحت آن را تکمیل کردند.
♻️کل فرایند در Yandex Cloud اجرا شده و نیازی به GPU در کلینیک‌ها ندارد.


📊 دقت مدل با شاخص IoU = 0.703 ارزیابی شد که آن را به یک ابزار مطمئن در تصمیم‌گیری بالینی تبدیل می‌کند.

🔗 کد این پروژه پس از تست‌های بالینی به صورت اوپن‌سورس منتشر خواهد شد تا پژوهشگران و پزشکان در سراسر جهان بتوانند از آن استفاده کنند.

#هوش_مصنوعی #پزشکی #MRI #تشخیص_زودهنگام

@rss_ai_ir
🔥12😁1110👍9🎉9
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!

این ظرفیت بالا می‌تواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمک‌رسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی

اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین ربات‌هایی در صنایع و شهرها خواهیم بود؟

#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉1110👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.

🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایش‌های چندمرحله‌ای (multi-turn edits) به‌صورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini

آیا این ابزار می‌تواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨

#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍129😁3👏1🙏1
🧠 مدل ThinkDial: کنترل باز و دقیق بر میزان استدلال در LLMها

پژوهشگران با معرفی ThinkDial اولین چارچوب بازمتن (Open-Recipe) برای کنترل سطح استدلال در مدل‌های زبانی بزرگ (LLMها) را ارائه کرده‌اند. این چارچوب همان چیزی است که پیش‌تر در سیستم‌های اختصاصی مثل GPT-OSS دیده بودیم، اما حالا به شکل باز در دسترس پژوهشگران قرار گرفته است.

🔑 ایده اصلی
به جای اینکه مدل همیشه با حداکثر توان استدلال کند (که هزینه محاسباتی بالایی دارد)، ThinkDial به شما اجازه می‌دهد بین حالت‌های مختلف عملیات جابه‌جا شوید:
✳️حالت Medium: کاهش ۵۰٪ تعداد توکن‌ها، با کمتر از ۱۰٪ افت کارایی
✳️حالت Low: کاهش ۷۵٪ توکن‌ها، با کمتر از ۱۵٪ افت کارایی
✳️این یعنی شما می‌توانید سطح استدلال را بر اساس نیاز پروژه (مثلاً چت سبک، تحلیل سریع یا پژوهش دقیق) تنظیم کنید.

نوآوری‌ها

1. Budget-Mode Supervised Fine-tuning → تنظیم دقیق مدل برای سطوح مختلف مصرف محاسباتی.


2. Budget-Aware Reinforcement Learning → یادگیری تقویتی دو‌مرحله‌ای برای هماهنگی دقت و هزینه.


3. Leak Penalty → مکانیزمی که مانع از آن می‌شود مدل استدلال را به بخش نهایی پاسخ منتقل کند (یعنی واقعاً تعداد توکن‌های استدلال کاهش یابد).



📊 مزیت‌ها برای صنعت

♻️کاهش هزینه اجرای مدل‌ها در دیتاسنترها.
♻️امکان استقرار مدل روی دستگاه‌های با منابع محدود.
♻️انعطاف‌پذیری بالا برای کاربردهای مختلف: از دستیارهای گفت‌وگویی سبک گرفته تا تحلیل‌های پیچیده مالی یا علمی.


📄 مقاله: arXiv
🖥️ مدل‌ها و کد: HuggingFace

#هوش_مصنوعی #LLM #بهینه‌سازی #استدلال_ماشین #ThinkDial
@rss_ai_ir
👍1🔥1👏1
🧩 بیش از ۲۰۰ اسکریپت آماده برای n8n – رایگان و کاربردی

اگر با اتوماسیون سر و کار دارید، این ریپو گیت‌هاب پر از فلوهای آماده برای فروش، مارکتینگ، حسابداری، کدنویسی و بهره‌وری شخصی به کارتان می‌آید.

🔎 مفهوم n8n چیست؟

✳️ابزار اتوماسیون اوپن‌سورس بدون کدنویسی
✳️سازنده‌ی بصری (بلوک‌ها را وصل کن = فرایند بساز)
✳️صدها اینتگریشن: ایمیل، CRM، شیت‌ها، پیام‌رسان‌ها، وب‌هوک‌ها
✳️امکان افزودن منطق جاوااسکریپت
✳️اجرا بر اساس زمان‌بندی یا رویداد؛ روی کلاود یا سرور خودتان


🛠️ روش استفاده

1. فایل workflow.json را دانلود و در n8n ایمپورت کنید

2. کلیدهای API و کرِدنشیال‌ها را داخل نودها قرار دهید

3. مراحل را تست و اجرای Cron/Webhook را فعال کنید



📂 ریپو مجموعه فلوها: (Github)
📦 آپدیت—بسته نصبی با ۳۰۰+ راهکار آماده: https://github.com/kossakovsky/n8n-installer

#اتوماسیون #n8n #بدون_کدنویسی #DevOps #بهره‌وری #هوش_مصنوعی
@rss_ai_ir
👍1🔥1👏1
🎙 مجموعه OpenAI و معرفی GPT-Realtime؛ پیشرفته‌ترین مدل گفتار به گفتار

مدل جدید gpt-realtime حالا استاندارد تازه‌ای برای دستیارهای صوتی و بات‌های تماس تعریف می‌کند.

💰 قیمت‌ها:

🎧 ورودی صوتی: ۳۲ دلار به ازای هر ۱ میلیون توکن

🗂 ورودی کش‌شده: ۰.۴ دلار به ازای هر ۱ میلیون توکن

🔊 خروجی صوتی: ۶۴ دلار به ازای هر ۱ میلیون توکن


📊 نتایج بنچمارک‌ها:

MultiChallenge (Audio) – دقت در دنبال‌کردن دستورهای صوتی:
gpt-realtime: %۳۰.۵
gpt-4o-realtime-preview-2025-06-03: %۲۶.۵
gpt-4o-realtime-preview-2024-12-17: %۲۰.۶

ComplexFuncBench (Audio) – دقت در اجرای دستورهای پیچیده:
gpt-realtime: %۶۶.۵
gpt-4o-realtime-preview-2025-06-03: %۵۸.۹
gpt-4o-realtime-preview-2024-12-17: %۴۹.۷


🔑 چرا مهم است؟

درک بهتر و دقیق‌تر دستورهای صوتی 🎯

کاهش خطا در فهم گفتار 🗣

آماده برای استفاده واقعی در دستیارهای صوتی و مراکز تماس 📞


این مدل با داده‌های باکیفیت و پاداش‌دهی تخصصی آموزش دیده و کیفیت صدای خروجی آن بسیار طبیعی است.

#هوش_مصنوعی #OpenAI #گفتار_به_گفتار #VoiceAI #GPTRealtime
@rss_ai_ir
👍1🔥1👏1
🚀 مدل جدید xAI: Grok Code Fast 1

مدل تازه‌ای از تیم ایلان ماسک معرفی شد که مخصوص برنامه‌نویسی روزمره طراحی شده است. تمرکز این مدل بر agentic-coding است: یعنی حلقه‌های استدلال + فراخوانی ابزارها (grep، ترمینال، ویرایش فایل). این مدل روی یک کورپوس عظیم از کد و PRهای واقعی آموزش و فاین‌تیون شده است.

🙌 همین حالا به صورت رایگان روی پلتفرم‌های محبوب در دسترس است:
GitHub Copilot، Cursor، Cline، Kilo Code، Roo Code، opencode و Windsurf

📏 مشخصات کلیدی:

کانتکست: ۲۵۶k توکن

محدودیت‌ها: تا ۲ میلیون توکن در دقیقه و ۴۸۰ درخواست در دقیقه

معماری سبک و بهینه‌شده برای سرعت

نتایج عالی در زبان‌های TypeScript، Python، Java، Rust، C++، Go


💰 قیمت‌گذاری (xAI API):

ورودی: ۰.۲۰ دلار / ۱M توکن

خروجی: ۱.۵۰ دلار / ۱M توکن

کش‌شده: ۰.۰۲ دلار / ۱M توکن
👉 یعنی ۶ برابر ارزان‌تر از GPT-5


🔮 تیم Grok قول داده به‌روزرسانی‌های منظم ارائه کند. نسخه در دست آموزش شامل ورودی مولتی‌مدال، فراخوانی همزمان چند ابزار و کانتکست توسعه‌یافته خواهد بود.

🟠 جزییات: https://x.ai/news/grok-code-fast-1
🟠 راهنمای Prompt Engineering: https://docs.x.ai/docs/guides/grok-code-prompt-engineering

#xAI #Grok #هوش_مصنوعی #کدنویسی
@rss_ai_ir
2👍1👏1