VIRSUN
15K subscribers
457 photos
260 videos
2 files
273 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🌹 مدل ROSE: حذف اشیا و اثرات محیطی 🌹

یکی از چالش‌های بزرگ در پردازش تصویر، حذف شیء ناخواسته به همراه اثرات محیطی آن است (مثل سایه، بازتاب، نور، شفافیت و آینه).
مدل جدید ROSE (Remove Objects & Effects) دقیقاً همین کار را انجام می‌دهد.

🔸 قابلیت‌ها:

♻️حذف شیء ناخواسته همراه با سایه‌ها و بازتاب‌ها
♻️اصلاح نور و شفافیت محیط
♻️پشتیبانی از آینه و سطوح انعکاسی


🔸 منابع در دسترس:
📄 مرور مقاله
📑 Paper
🌐 پروژه
🤖 مدل در HuggingFace
🖥 دمو
📊 دیتاست

این پیشرفت می‌تونه ابزار قدرتمندی برای طراحان گرافیک، فیلم‌سازان و کاربردهای صنعتی بینایی ماشین باشه. 🚀

#بینایی_ماشین #هوش_مصنوعی #پردازش_تصویر #ROSE #AI

@rss_ai_ir
👍1513🔥11😁7🎉6
This media is not supported in your browser
VIEW IN TELEGRAM
🐕 ربات‌سگ‌ها در حال پیشروی سریع!

دیگه فقط ابزار آزمایشگاهی نیستن؛ ربات‌سگ‌ها دارن وارد صنعت، امنیت، لجستیک و حتی زندگی روزمره می‌شن. 🚀
از گشت‌زنی در کارخانه‌ها تا عملیات امداد و حتی همراهی در محیط‌های خانگی.

🔸 پیشرفت در هوش مصنوعی و بینایی ماشین باعث شده این ربات‌ها هوشمندتر، چابک‌تر و مستقل‌تر بشن.

🔸 شرکت‌های بزرگی مثل Boston Dynamics و Unitree حالا با نسل‌های جدید، توانایی حمل بار، شناسایی خطر و تعامل طبیعی با انسان رو به نمایش گذاشتن.

آیا این روند به معنای حضور گسترده‌ی «سگ‌های رباتیک» در زندگی روزمره ماست؟ 🐾

#رباتیک #هوش_مصنوعی #اتوماسیون #صنعت

@rss_ai_ir
👍15😁12🎉98🔥7
🧠 هوش مصنوعی در خدمت تشخیص سریع خطرات مغزی نوزادان

🔹 یاندکس با همکاری پزشکان دانشگاه پزشکی کودکان سن‌پترزبورگ و دانشجویان شاد، سامانه‌ای مبتنی بر هوش مصنوعی توسعه داده که تصاویر MRI مغز نوزادان را تنها در چند ثانیه تحلیل می‌کند.

🔹 این مدل می‌تواند خطر بروز فلج مغزی (Cerebral Palsy) را شناسایی کند؛ کاری که تا پیش از این تا ۳ روز طول می‌کشید. اکنون با کمک هوش مصنوعی، این زمان به ۳ ثانیه کاهش یافته است – یعنی ۵۰ برابر سریع‌تر!

⚙️ جزئیات فنی:

♻️الگوریتم بر پایه‌ی U-Net با بَکبون ResNeXt-50 طراحی شده و از DiceLoss برای بهبود دقت استفاده می‌کند.
♻️تصاویر MRI ابتدا با BIBSNet پیش‌برچسب‌گذاری شدند و سپس پزشکان صحت آن را تکمیل کردند.
♻️کل فرایند در Yandex Cloud اجرا شده و نیازی به GPU در کلینیک‌ها ندارد.


📊 دقت مدل با شاخص IoU = 0.703 ارزیابی شد که آن را به یک ابزار مطمئن در تصمیم‌گیری بالینی تبدیل می‌کند.

🔗 کد این پروژه پس از تست‌های بالینی به صورت اوپن‌سورس منتشر خواهد شد تا پژوهشگران و پزشکان در سراسر جهان بتوانند از آن استفاده کنند.

#هوش_مصنوعی #پزشکی #MRI #تشخیص_زودهنگام

@rss_ai_ir
🔥12😁1110👍9🎉9
This media is not supported in your browser
VIEW IN TELEGRAM
🔻 ربات Unitree A2 توانایی حمل بار تا ۲۵۰ کیلوگرم را دارد!

این ظرفیت بالا می‌تواند انقلابی در کاربردهای صنعتی و خدماتی ایجاد کند:
🔹 حمل بار در معادن و خطوط تولید
🔹 پشتیبانی لجستیکی در انبارها و بنادر
🔹 کمک‌رسانی در عملیات امداد و نجات
🔹 کاربردهای نظامی و امنیتی

اما پرسش اصلی اینجاست: چه زمانی شاهد استفاده گسترده و واقعی از چنین ربات‌هایی در صنایع و شهرها خواهیم بود؟

#رباتیک #اتوماسیون #صنعت۴ #AI_industrial_news
@rss_ai_ir
🎉1110👍10🔥9😁8
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 نانو-بانانا، هوش مصنوعی ویرایش تصویر که رتبه ۱ را کسب کرده بود، حالا با نام Gemini 2.5 Flash Image توسط گوگل عرضه شد.

🔹 دارای قابلیت استدلال چندوجهی و استفاده از دانش دنیای واقعی
🔹 پشتیبانی از ویرایش‌های چندمرحله‌ای (multi-turn edits) به‌صورت پایدار
🔹 امکان ترکیب تصاویر و ایجاد خروجی منسجم
🔹 در دسترس برای کاربران رایگان و پولی Gemini

آیا این ابزار می‌تواند آینده ویرایش تصویر در صنعت خلاقیت و تبلیغات را متحول کند؟ 🎨

#هوش_مصنوعی #ویرایش_تصویر #Gemini #AI_industrial_news
@rss_ai_ir
🔥15🎉13👍129😁3👏1🙏1
🧠 مدل ThinkDial: کنترل باز و دقیق بر میزان استدلال در LLMها

پژوهشگران با معرفی ThinkDial اولین چارچوب بازمتن (Open-Recipe) برای کنترل سطح استدلال در مدل‌های زبانی بزرگ (LLMها) را ارائه کرده‌اند. این چارچوب همان چیزی است که پیش‌تر در سیستم‌های اختصاصی مثل GPT-OSS دیده بودیم، اما حالا به شکل باز در دسترس پژوهشگران قرار گرفته است.

🔑 ایده اصلی
به جای اینکه مدل همیشه با حداکثر توان استدلال کند (که هزینه محاسباتی بالایی دارد)، ThinkDial به شما اجازه می‌دهد بین حالت‌های مختلف عملیات جابه‌جا شوید:
✳️حالت Medium: کاهش ۵۰٪ تعداد توکن‌ها، با کمتر از ۱۰٪ افت کارایی
✳️حالت Low: کاهش ۷۵٪ توکن‌ها، با کمتر از ۱۵٪ افت کارایی
✳️این یعنی شما می‌توانید سطح استدلال را بر اساس نیاز پروژه (مثلاً چت سبک، تحلیل سریع یا پژوهش دقیق) تنظیم کنید.

نوآوری‌ها

1. Budget-Mode Supervised Fine-tuning → تنظیم دقیق مدل برای سطوح مختلف مصرف محاسباتی.


2. Budget-Aware Reinforcement Learning → یادگیری تقویتی دو‌مرحله‌ای برای هماهنگی دقت و هزینه.


3. Leak Penalty → مکانیزمی که مانع از آن می‌شود مدل استدلال را به بخش نهایی پاسخ منتقل کند (یعنی واقعاً تعداد توکن‌های استدلال کاهش یابد).



📊 مزیت‌ها برای صنعت

♻️کاهش هزینه اجرای مدل‌ها در دیتاسنترها.
♻️امکان استقرار مدل روی دستگاه‌های با منابع محدود.
♻️انعطاف‌پذیری بالا برای کاربردهای مختلف: از دستیارهای گفت‌وگویی سبک گرفته تا تحلیل‌های پیچیده مالی یا علمی.


📄 مقاله: arXiv
🖥️ مدل‌ها و کد: HuggingFace

#هوش_مصنوعی #LLM #بهینه‌سازی #استدلال_ماشین #ThinkDial
@rss_ai_ir
👍1🔥1👏1
🧩 بیش از ۲۰۰ اسکریپت آماده برای n8n – رایگان و کاربردی

اگر با اتوماسیون سر و کار دارید، این ریپو گیت‌هاب پر از فلوهای آماده برای فروش، مارکتینگ، حسابداری، کدنویسی و بهره‌وری شخصی به کارتان می‌آید.

🔎 مفهوم n8n چیست؟

✳️ابزار اتوماسیون اوپن‌سورس بدون کدنویسی
✳️سازنده‌ی بصری (بلوک‌ها را وصل کن = فرایند بساز)
✳️صدها اینتگریشن: ایمیل، CRM، شیت‌ها، پیام‌رسان‌ها، وب‌هوک‌ها
✳️امکان افزودن منطق جاوااسکریپت
✳️اجرا بر اساس زمان‌بندی یا رویداد؛ روی کلاود یا سرور خودتان


🛠️ روش استفاده

1. فایل workflow.json را دانلود و در n8n ایمپورت کنید

2. کلیدهای API و کرِدنشیال‌ها را داخل نودها قرار دهید

3. مراحل را تست و اجرای Cron/Webhook را فعال کنید



📂 ریپو مجموعه فلوها: (Github)
📦 آپدیت—بسته نصبی با ۳۰۰+ راهکار آماده: https://github.com/kossakovsky/n8n-installer

#اتوماسیون #n8n #بدون_کدنویسی #DevOps #بهره‌وری #هوش_مصنوعی
@rss_ai_ir
👍1🔥1👏1
🎙 مجموعه OpenAI و معرفی GPT-Realtime؛ پیشرفته‌ترین مدل گفتار به گفتار

مدل جدید gpt-realtime حالا استاندارد تازه‌ای برای دستیارهای صوتی و بات‌های تماس تعریف می‌کند.

💰 قیمت‌ها:

🎧 ورودی صوتی: ۳۲ دلار به ازای هر ۱ میلیون توکن

🗂 ورودی کش‌شده: ۰.۴ دلار به ازای هر ۱ میلیون توکن

🔊 خروجی صوتی: ۶۴ دلار به ازای هر ۱ میلیون توکن


📊 نتایج بنچمارک‌ها:

MultiChallenge (Audio) – دقت در دنبال‌کردن دستورهای صوتی:
gpt-realtime: %۳۰.۵
gpt-4o-realtime-preview-2025-06-03: %۲۶.۵
gpt-4o-realtime-preview-2024-12-17: %۲۰.۶

ComplexFuncBench (Audio) – دقت در اجرای دستورهای پیچیده:
gpt-realtime: %۶۶.۵
gpt-4o-realtime-preview-2025-06-03: %۵۸.۹
gpt-4o-realtime-preview-2024-12-17: %۴۹.۷


🔑 چرا مهم است؟

درک بهتر و دقیق‌تر دستورهای صوتی 🎯

کاهش خطا در فهم گفتار 🗣

آماده برای استفاده واقعی در دستیارهای صوتی و مراکز تماس 📞


این مدل با داده‌های باکیفیت و پاداش‌دهی تخصصی آموزش دیده و کیفیت صدای خروجی آن بسیار طبیعی است.

#هوش_مصنوعی #OpenAI #گفتار_به_گفتار #VoiceAI #GPTRealtime
@rss_ai_ir
👍1🔥1👏1
🚀 مدل جدید xAI: Grok Code Fast 1

مدل تازه‌ای از تیم ایلان ماسک معرفی شد که مخصوص برنامه‌نویسی روزمره طراحی شده است. تمرکز این مدل بر agentic-coding است: یعنی حلقه‌های استدلال + فراخوانی ابزارها (grep، ترمینال، ویرایش فایل). این مدل روی یک کورپوس عظیم از کد و PRهای واقعی آموزش و فاین‌تیون شده است.

🙌 همین حالا به صورت رایگان روی پلتفرم‌های محبوب در دسترس است:
GitHub Copilot، Cursor، Cline، Kilo Code، Roo Code، opencode و Windsurf

📏 مشخصات کلیدی:

کانتکست: ۲۵۶k توکن

محدودیت‌ها: تا ۲ میلیون توکن در دقیقه و ۴۸۰ درخواست در دقیقه

معماری سبک و بهینه‌شده برای سرعت

نتایج عالی در زبان‌های TypeScript، Python، Java، Rust، C++، Go


💰 قیمت‌گذاری (xAI API):

ورودی: ۰.۲۰ دلار / ۱M توکن

خروجی: ۱.۵۰ دلار / ۱M توکن

کش‌شده: ۰.۰۲ دلار / ۱M توکن
👉 یعنی ۶ برابر ارزان‌تر از GPT-5


🔮 تیم Grok قول داده به‌روزرسانی‌های منظم ارائه کند. نسخه در دست آموزش شامل ورودی مولتی‌مدال، فراخوانی همزمان چند ابزار و کانتکست توسعه‌یافته خواهد بود.

🟠 جزییات: https://x.ai/news/grok-code-fast-1
🟠 راهنمای Prompt Engineering: https://docs.x.ai/docs/guides/grok-code-prompt-engineering

#xAI #Grok #هوش_مصنوعی #کدنویسی
@rss_ai_ir
2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👌 برای داشتن یک دفاع خوب در زمان ارائه پروپوزال صنعتی هوش مصنوعی باید علاوه بر توضیح ایده و کاربرد، روی نحوه ارائه هم کار کنید. یکی از مواردی که امروز بسیار مهم شده و می‌تواند دفاع شما را حرفه‌ای و به‌روز نشان دهد، استفاده از نرم‌افزارهای ارائه پیشرفته و تعاملی است.


---

🔹 نکات کلیدی برای دفاع موفق:

1. شروع قوی: در چند دقیقه اول باید مشکل صنعتی را شفاف و تاثیرگذار بیان کنید (با عدد، آمار یا مثال واقعی).


2. نمایش کاربرد هوش مصنوعی: نشان دهید AI دقیقاً کجا وارد خط تولید یا فرآیند می‌شود (مثلاً کاهش خطای انسانی، پیش‌بینی خرابی تجهیزات، بهینه‌سازی کیفیت).

3. زبان ساده برای مدیران: مدیران صنعتی همیشه فنی نیستند؛ بخش‌های پیچیده را ساده‌سازی کنید.

4. مفهوم ROI و ارزش اقتصادی: بگویید پروژه چطور هزینه را کاهش یا سود را افزایش می‌دهد.

5. نمایش عملی یا دموی کوتاه: حتی یک شبیه‌سازی ساده درک مخاطب را چند برابر می‌کند.

---

🔹 یکی از موارد جدید برای ارائه بهتر:
امروزه می‌توانید از ابزارهایی مثل:

♻️استفاده Pitch.com یا Beautiful.ai برای طراحی اسلایدهای هوشمند و مینیمال

♻️استفاده Canva AI Presentations برای ساخت اسلاید با ورودی متنی و اتوماسیون طراحی

♻️استفاده Tome AI برای ساخت ارائه تعاملی همراه با نمودار و دموهای ویدیویی

♻️استفاده Notion AI + Loom برای ترکیب متن، دیاگرام و ویدئو
---

🔑 نتیجه:
امروز فقط داشتن اسلاید کافی نیست؛ باید ارائه شما شبیه یک داستان تصویری باشد. اگر از نرم‌افزارهای جدید ارائه استفاده کنید، پیام شما برای مدیران صنعتی بسیار تاثیرگذارتر خواهد بود.

@rss_ai_ir
👍2🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
😂 ترکیب خنده‌دار و خفن: Nano Banana + Runway Act 2

📌 سناریو خیلی ساده‌ست:
1️⃣ یه عکس از خودتون بردارید.
2️⃣ بندازیدش توی نانابانانا و هر جور دوست دارید با انوتیشن و ادیت روش «شوخی» کنید 😅 (بزرگ کردن عینک، تغییر استایل، اضافه کردن پس‌زمینه عجیب و …).
3️⃣ خروجی رو بدید به Runway Act 2 برای تبدیل به ویدیو.

🔥 نتیجه: یه ویدیو خفن و فان از خودتون که هیچکس باورش نمی‌شه با دو تا ابزار ساخته شده.

📊@rss_ai_ir
🔥98👍6😁5
⚠️ تغییرات جدید در سیاست‌های Anthropic برای آموزش Claude

♻️شرکت Anthropic اعلام کرد که از این پس، کاربران خودشان انتخاب می‌کنند که آیا چت‌ها و جلسات کدنویسی‌شان برای آموزش مدل Claude استفاده شود یا نه.

📌 نکات مهم:

♻️در صورت موافقت، داده‌ها می‌توانند تا ۵ سال ذخیره شوند (به‌جای ۳۰ روز).

♻️باید تصمیم‌گیری تا ۲۸ سپتامبر ۲۰۲۵ انجام شود. پذیرش تنظیمات بلافاصله فعال می‌شود.

♻️این قابلیت برای تمام پلن‌های Free، Pro و Max در دسترس است.


اگر نمی‌خواهید داده‌ها استفاده شوند:

هنگام نمایش pop-up کافیست تومبلر را روی Off بگذارید.

اگر اشتباهاً پذیرفتید، مسیر Settings → Privacy → Privacy Settings → Help improve Claude را باز کنید و گزینه را خاموش کنید.


ℹ️ توجه:

✳️می‌توانید هر زمان تصمیم‌تان را تغییر دهید، اما تنظیمات جدید فقط روی داده‌های آینده اعمال می‌شود. داده‌های قبلی حذف نمی‌شوند.

✳️این تغییرات فقط مربوط به کاربران عادی (Consumer Plans) است و شامل Claude for Work، Gov، Education و API (Bedrock, Vertex AI) نمی‌شود.

✳️در اپلیکیشن، یک pop-up با دکمه بزرگ Accept ظاهر می‌شود که تومبلر آن به‌طور پیش‌فرض روشن است.


⛔️همچنین Anthropic تاکید کرده که داده‌های حساس را فیلتر یا ماسک می‌کند و اطلاعات کاربران را نمی‌فروشد.

🔗 جزئیات بیشتر: anthropic.com/news/updates-to-our-consumer-terms

#Claude #هوش_مصنوعی #حریم_خصوصی

@rss_ai_ir
😁85👍5🎉4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئو‌سازی همزمان با Krea.ai

استارتاپ Krea ثبت‌نام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.

مشخصات:

♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی می‌تواند شامل پرامپت متنی، تصویر، اسکرین‌شات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً به‌صورت همزمان ساخته می‌شود


🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر می‌خواهد ایجاد کند.

🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video

📌 به نظر می‌رسد این قابلیت بتواند انقلابی در طراحی، بازی‌سازی و تولید محتوا به وجود بیاورد.

#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI

@rss_ai_ir
7👍6🎉6🔥4😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🌈 ردیابی سه‌بعدی چندنما (Multi-View 3D Tracking) 🌈

🔹 پروژه MVTracker به‌عنوان اولین سیستم داده‌محور برای ردیابی نقاط سه‌بعدی دلخواه در چندین دوربین معرفی شد. این روش امکان ردیابی دقیق اشیاء و نقاط را از زوایای مختلف فراهم می‌کند.

📊 دسترسی‌ها:
👉 مقاله (arXiv)
👉 پروژه
👉 مخزن کد (Repo)

#AI #ComputerVision #3DTracking #هوش_مصنوعی #بینایی_ماشین

@rss_ai_ir
🔥9🎉9👍51😁1🙏1👌1
🌊 مدوزای سایبورگ؛ ربات زنده اعماق دریا 🪼

ایده‌ی استفاده از حیوانات به‌عنوان ربات چیز تازه‌ای نیست (مثلاً سوسک‌های کنترل‌شده)، اما این بار نوبت مدوزاست! پژوهشگران در آزمایشگاه Dabiri Lab موفق شدند حرکت این موجودات دریایی را با تحریک نورون‌های ساده‌ی آن‌ها کنترل کنند و آن‌ها را به ربات‌های زیردریایی زنده تبدیل نمایند.

🔹 ویژگی‌ها و مزایا:

🧠 مدوزا سیستم عصبی مرکزی یا گیرنده درد ندارد؛ بنابراین از نظر اخلاقی آسیب نمی‌بیند.

⚡️ هزینه‌ی اکتشاف به شدت کاهش می‌یابد؛ می‌توان به‌جای میلیون‌ها دلار صرف تجهیزات، از این موجودات طبیعی بهره برد.

📊 هدف اصلی: جمع‌آوری داده‌های محیطی (دما، فشار، شوری و غیره) در اعماق اقیانوس.


🔹 چالش‌ها:

♻️مدوزاها می‌توانند حمل بارهای علمی نسبتاً سنگین را انجام دهند.
♻️اما در حال حاضر بیشتر حرکتشان عمودی است؛ چون مرکز جرم تغییر می‌کند و کنترل جانبی هنوز نیاز به پیشرفت دارد.
♻️این پروژه می‌تواند آینده‌ی اکتشاف اقیانوس‌ها را متحول کند؛ دسترسی به اعماق را برای گروه‌های تحقیقاتی کوچک و کم‌بودجه هم ممکن می‌سازد.
و البته… دیدن تصاویر این مدوزاهای سایبورگ در حال شنا واقعاً چشم‌نواز است

📎 جزئیات بیشتر: LA Times

#هوش_مصنوعی #روباتیک #مدوزا #اکتشاف_دریایی #بیوهیبرید

@rss_ai_ir
😁7🎉7👍63🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🏓 ربات پینگ‌پنگ‌باز برکلی 🤖

مهندسان دانشگاه UC Berkeley یک ربات انسان‌نما معرفی کردند که توانست در بازی تنیس‌روی‌میز ۱۰۶ ضربه‌ی متوالی را بدون خطا برگرداند! 🔥

این ربات کاملاً خودمختار عمل می‌کند (بدون کنترل از راه دور):

🔹 پیش‌بینی هوشمند: مسیر توپ را محاسبه می‌کند و بهترین نقطه، زمان و سرعت ضربه را تعیین می‌کند.
🔹 کنترل یادگیری تقویتی (RL): برنامه‌ی حرکتی را به حرکت‌های هماهنگ دست‌ها و پاها تبدیل می‌کند و تعادل ربات را هنگام ضربه حفظ می‌کند.
🔹 یادگیری از ویدئوهای واقعی: حرکات طبیعی و شبیه انسان‌اند، نه خشک و رباتیک.
🔹 سرعت بالا: حلقه‌ی کنترلی در کمتر از یک ثانیه بسته می‌شود، به همین دلیل ربات می‌تواند رالی‌های طولانی و بدون خطا اجرا کند.


این پیشرفت می‌تواند آینده‌ی ورزش‌های رباتیک و آموزش هوشمند را متحول کند. 🎯
@rss_ai_ir

#رباتیک #هوش_مصنوعی #ورزش #Berkeley #PingPong
👍8🎉6🔥4😁43