VIRSUN – Telegram

VIRSUN

15.1K subscribers

204 photos

155 videos

1 file

154 links

📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

Download Telegram

About

Blog

Apps

Platform

15.1K subscribers

⚙️ چالش بزرگ طراحی سیستم سورتینگ صنعتی با هوش مصنوعی @rss_ai_ir --- ✅در یک سیستم بینایی ماشین صنعتی که با سرعت بالا مواد معدنی را تفکیک می‌کند، ترکیبی از چالش‌های نرم‌افزاری، سخت‌افزاری، نوری و کنترلی وجود دارد. اگر بخواهی چنین سیستمی بسازی، باید بتوانی…

✅ پاسخ‌های پیشنهادی به سوالات:
1️⃣ مدل پیشنهادی: YOLOv5 یا YOLO-Nano برای سرعت بالا و دقت مناسب در محیط‌های صنعتی مناسب است.
2️⃣ روش آموزش: استفاده از داده‌های متنوع و Augmentation شدید + Fine-Tuning روی داده‌های واقعی خط تولید.
3️⃣ یادگیری آنلاین: بله، استفاده از روش‌های Online Learning یا Active Learning برای به‌روزرسانی مدل در حین اجرا توصیه می‌شود.
4️⃣ دقت قابل قبول: برای صنایع معدنی معمولاً دقت ۹۰٪ به بالا مطلوب است، اما برای جداسازی مواد گران‌بها بالاتر از ۹۵٪ نیاز است.
5️⃣ ماژول پردازشی پیشنهادی:
• NVIDIA Jetson AGX Orin
• Google Coral Dev Board
• Xilinx Zynq MPSoC (برای latency بسیار پایین)
6️⃣ دوربین مناسب:
• دوربین صنعتی با shutter global و حداقل 120fps
• برندهایی مثل Basler یا IDS با لنز مقاوم در برابر گردوغبار و لرزش
7️⃣ نورپردازی مؤثر:
• ترکیبی از Backlight برای شناسایی لبه‌ها و Dome Light برای بافت سطحی
8️⃣ مکانیسم جداسازی سریع:
• جت هوا (Air Ejector) به دلیل پاسخ سریع (زیر 10ms) و بدون قطعات متحرک
9️⃣ کنترل بلادرنگ:
• بله، استفاده از Real-Time PLC یا بردهایی مثل NI CompactRIO برای اجرای دقیق فرمان‌ها ضروری است
🔟 مقابله با شرایط محیطی:
• استفاده از UPS صنعتی، سنسور حرارتی برای پایش دما، و جعبه‌های ضدغبار (IP67) برای حفاظت از سخت‌افزار
📌 این پاسخ‌ها نقطه شروع خوبی هستند. برای اجرای واقعی، باید بسته به شرایط خط تولید، طراحی سفارشی‌سازی شود.✅

👍1🔥1👏1🙏1

256 views19:38

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 ربات‌های یونیتری (Unitree) باز هم جنجالی شدند!

🚨 با اینکه این ربات‌ها در دسته‌ی ربات‌های پیشرفته برای جابه‌جایی در زمین‌های ناهموار قرار دارند، اما گاهی کوچک‌ترین نقص در الگوریتم‌های کنترل یا بینایی ماشین می‌تواند رفتار غیرقابل‌پیش‌بینی ایجاد کند.

⚙️ سوال مهم اینجاست:
آیا باید کنترل هوشمند این ربات‌ها تقویت شود؟ یا شاید نیاز به قوانین سخت‌گیرانه‌تری برای استفاده عمومی آن‌هاست؟

📡 نظر شما چیه؟
آیا به ربات‌هایی که خودشون تصمیم می‌گیرن اعتماد دارید؟

🧠 تحلیل‌ها و پست‌های داغ بیشتر در کانال:
@rss_ai_ir

#رباتیک #Unitree #هوش_مصنوعی #ربات_هوشمند #بینایی_ماشین #کنترل_پیشرفته #AI_Robotics

👍1🔥1😱1🤪1

208 viewsedited 04:16

🎯 هوشمندسازی نباید مُد باشد؛ باید مسئله‌محور باشد!

🚫 این روزها بسیاری از سازمان‌ها، کارخانه‌ها و حتی استارتاپ‌ها، بدون تحلیل دقیق نیاز، به‌سرعت به سراغ سیستم‌های هوش مصنوعی می‌روند. اما آیا هر مشکلی نیاز به AI دارد؟ آیا فقط چون رقبا از «هوش مصنوعی» استفاده می‌کنند، ما هم باید استفاده کنیم؟ پاسخ: قطعاً نه!

---

💡 چرا هوشمندسازی فقط وقتی مفید است که مسئله‌محور باشد؟

1️⃣ مسئله دقیقاً چیست؟
اگر مسأله روشن نیست، هوش مصنوعی نمی‌تواند معجزه کند. AI باید برای حل یک مشکل واقعی و ملموس استفاده شود، نه فقط برای افزایش کلاس پروژه!

2️⃣ آیا داده داریم؟
مدل‌های هوشمند بدون داده، مثل ماشین بدون بنزین هستند. هر جا داده‌ی با کیفیت و قابل اعتماد نیست، نباید به سمت یادگیری ماشین رفت.

3️⃣ راه حل ساده‌تر وجود دارد؟
اگر یک الگوریتم ساده‌ی منطقی (Rule-based) کار را بهتر، سریع‌تر و ارزان‌تر انجام می‌دهد، دلیلی ندارد از مدلی پیچیده با ده‌ها میلیون پارامتر استفاده کنیم.

4️⃣ آیا هزینه/زمان توجیه دارد؟
مدل‌های هوش مصنوعی نیاز به نگهداری، آپدیت، پایش، و گاهی آموزش مجدد دارند. اگر یک سیستم پایدار و کم‌هزینه کافی‌ست، ورود به AI ممکن است اشتباه استراتژیک باشد.

---

📌 نتیجه‌گیری:
هوشمندسازی یعنی حل مسئله با ابزار درست.
نه تقلید کورکورانه، نه رقابت ناآگاهانه.

🚀 مهندس حرفه‌ای، قبل از انتخاب ابزار، اول سؤال می‌پرسد!

📡 برای تحلیل‌های فنی و حرفه‌ای بیشتر:
@rss_ai_ir

#هوش_مصنوعی #اتوماسیون #AI #یادگیری_ماشین #مسئله_محور #تحلیل_سیستم #مهندسی_فنی #مد_نباشیم #هوشمند_فکر_کنیم

👍3👏1🙏1

208 viewsedited 04:28

🇨🇳 چین باز هم شگفتی آفرید؛ یک LLM متن‌باز دیگر وارد میدان شد!

📢 مدل زبانی GLM 4.5 رسماً معرفی شد و در بسیاری از بنچمارک‌ها، پا‌به‌پای غول‌های غربی مثل Claude 4 Opus و Gemini 2.5 Pro رقابت می‌کند!

📊 مقایسه با مدل‌های مطرح دنیا:

🔹 AIME24:
GLM4.5 = 91.0 🔥
⬆️ بالاتر از Claude 4 Opus

🔹 MATH500:
GLM4.5 = 98.2 📐
⬆️ جلوتر از GPT-4.1!

🔹 GPQA:
GLM4.5 = 79.1
⬇️ کمی پایین‌تر از Gemini 2.5

🔹 SWE-bench (کدنویسی):
GLM4.5 = 64.2
⬇️ پایین‌تر از Sonnet 4

🔹 Terminal-Bench (تعامل CLI):
GLM4.5 = 37.5
⬇️ پایین‌تر از Opus 4

---

💥 این دستاورد یک زنگ خطر جدی برای آمریکا در رقابت مدل‌های متن‌باز است.
چین با GLM4.5، نشان می‌دهد که دیگر تنها دنبال تقلید نیست، بلکه آماده پیشتازی است.

📌 اگر هوادار آینده هوش مصنوعی هستی، باید جدی‌تر از همیشه چشم به شرق بدوزی!

#مدل_زبان_بزرگ #هوش_مصنوعی #LLM #GLM4_5 #چین #متن_باز #رقابت_فناورانه
@rss_ai_ir

🔥3😱1🙏1

185 viewsedited 13:45

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 ربات خون‌گیر با دقت ۹۴٪ در بیمارستان‌های چین فعال شد!

در یکی از مراکز درمانی چین، برای اولین بار رباتی وارد فاز اجرایی شده که با استفاده از بینایی ماشین و الگوریتم‌های یادگیری عمیق، عملیات خون‌گیری وریدی را به‌صورت کاملاً خودکار انجام می‌دهد.

📈 دقت اعلام‌شده: ۹۴٪

🎯 مزایا:

♻️کاهش خطای انسانی
♻️مناسب برای بیماران اضطرابی یا کودکان
♻️قابلیت استفاده در شب و شرایط خاص

❗ اما سوالی مهم باقی می‌ماند: آن ۶٪ باقی‌مانده چطور؟
در حوزه سلامت، حتی درصدهای کوچک می‌توانند بحرانی باشند.

🧠 ورود ربات‌ها به حوزه پزشکی، باید با دقت، نظارت مستمر و اخلاق حرفه‌ای همراه باشد تا جایگزینی مطمئن برای پرستاران و پزشکان باشند.

#هوش_مصنوعی #ربات_پزشکی #ربات_خونگیری #AI_in_Healthcare
@rss_ai_ir

👏2😁2👌1

186 viewsedited 13:51

🧠 زمین بازی نهایی برای آزمودن ایجنت‌های هوش مصنوعی – همین حالا روی GitHub

اگر واقعاً می‌خواهی استاد AI Agent بشی، فقط مقاله نخون — کدها رو اجرا کن!
یک مخزن گیت‌هاب فوق‌العاده که همه‌چیز برای یادگیری عملی و ساخت ایجنت‌های پیشرفته رو فراهم کرده:

🔹 فهرست دسته‌بندی‌شده ایجنت‌ها بر اساس نوع:
‌– ساده، RAG، چندحالته، خودگردان و...

🔹 کاربردها:
‌– تحلیل سرمایه‌گذاری، تحقیق، مدیریت سفر، راه‌اندازی محصول و...

🔹 امکانات ویژه:
‌– حلقه‌های خودمختار (Autonomous Loops)
‌– ایجنت‌های چندعاملی (Multi-Agent)
‌– اتوماسیون مرورگر و GitHub
‌– ایجنت‌هایی با قابلیت تغییر و بهبود خودکار
‌– مدل‌سازی مالی و برنامه‌ریزی full-stack

📁 ایجنت‌ها Plug & Play هستن — فقط کلون کن، اجرا بگیر و مهندسی معکوس رو شروع کن.

🔗 لینک گیت‌هاب: Awesome LLM Agents

🎯 اگه واقعاً قصد داری ایجنت بسازی، اینجا دقیقاً آزمایشگاه توئه!

#هوش_مصنوعی #عامل_هوشمند #AI_Agent #کدنویسی #یادگیری_عمیق
@rss_ai_ir

❤3👍2🔥2

169 viewsedited 13:55

⚖️ — وکیل هوشمند تو Law ChatGPT!

♻️وقتی پای قرارداد و متن‌های حقوقی وسطه، دیگه لازم نیست همه بندها رو با ذره‌بین بخونی یا کلی پول خرج وکیل کنی.

♻️همچنین Law ChatGPT می‌تونه دقیق، سریع و خودکار اسناد حقوقی‌ات رو بررسی کنه:

🔍 قابلیت‌ها:

🔹 شناسایی بندهای پرریسک و مبهم
🔹 توضیح ساده‌ی اصطلاحات پیچیده‌ی حقوقی
🔹 پشتیبانی از فایل‌های PDF، قراردادها، توافق‌نامه‌ها و اسناد رسمی

📎 فقط کافیه فایل رو بدی بهش — اون برات خلاصه می‌کنه، هشدار می‌ده و همه‌چیزو برات قابل‌فهم می‌کنه.

🧠 دیگه لازم نیست فقط برای اینکه کسی بهت بگه “امضا نکن”، هزینه‌ سنگین پرداخت کنی!

👨‍⚖️ همین الان تستش کن:
LawChatGPT

#هوش_مصنوعی #وکیل_هوشمند #بررسی_قرارداد #AI_Law #LegalTech
@rss_ai_ir

👏3👍1🔥1

163 viewsedited 13:58

🧠 پشته‌ی توسعه‌دهندگان RAG (بازیابی + تولید) به زبان ساده!

♻️این تصویر، نمای کاملی از ابزارها و لایه‌های مورد استفاده برای ساخت سیستم‌های RAG رو نشون می‌ده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.

📌 خلاصه مهم‌ترین اجزا:
🔹 مدل‌های زبانی (LLMs):
متن‌باز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon

🔹 فریم‌ورک‌ها برای پیاده‌سازی RAG:
LangChain، LlamaIndex، Haystack، Txtai

🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus

🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker

🔹 مدل‌های برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere

🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب می‌شن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.

📣 اگر می‌خوای مدل‌های Retrieval-Augmented Generation حرفه‌ای بسازی، این پشته‌ی ابزارها دقیقاً چیزیه که باید بلد باشی!

📍 آموزش‌ها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack

👏2❤1🔥1

183 views14:09

🧠 مدل جدید برای تشخیص چهره جعلی (Anti-Spoofing)

در مقاله‌ی InstructFLIP محققان به بررسی یک مدل Vision-Language Unified پرداخته‌اند که با کمک دستورالعمل‌های زبانی می‌تواند تصاویر چهره را تحلیل کرده و حملات جعلی (Spoofing) را تشخیص دهد!

📌 نکات کلیدی:
🔹 مدل چندوظیفه‌ای با ادغام تصویر و زبان
🔹 قابل استفاده برای حملات چاپی، ویدیویی و ماسک سه‌بعدی
🔹 بدون نیاز به داده‌های زیاد برای هر نوع حمله

📎 لینک‌ها:
🔧 کد پروژه در گیت‌هاب
📄 مقاله در arXiv
📂 دیتاست Replay-Attack

👁‍🗨 آینده تشخیص چهره، هوشمندتر از همیشه...

@rss_ai_ir

👍2❤1🔥1👏1

168 views14:43

🤖 ربات‌ها در خرده‌فروشی چین: اولین فروشگاه ۶S رباتیک افتتاح شد!

در شهر شنژن چین، اولین فروشگاه کاملاً تخصصی ربات‌ها به سبک 6S راه‌اندازی شده؛ مفهومی نوآورانه که شامل فروش، اجاره، تعمیر، خدمات پس از فروش، مشاوره و تجربه عملی با ربات‌هاست!

📦 در این فروشگاه چه می‌بینید؟
▪️ ربات‌های صنعتی، پزشکی، آموزشی و خانگی
▪️ قطعات برای مونتاژ و ارتقاء
▪️ محصولات شرکت‌های برتر چینی با تمرکز بر قیمت مناسب و فراگیری

🎯 هدف: تبدیل ربات‌ها به ابزاری روزمره همانند گوشی یا وسایل خانگی.

🔧 بازدیدکنندگان می‌توانند با ربات‌ها تعامل واقعی داشته باشند، مشاوره بگیرند و جدیدترین فناوری‌ها را تجربه کنند.

📍 آینده خرده‌فروشی، هوشمندتر از همیشه...

#هوش_مصنوعی #رباتیک #خرده_فروشی_هوشمند #تکنولوژی
@rss_ai_ir

👍2🔥2👏1

176 views14:44

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 مایکروسافت یک بار دیگر قدرت داده‌های مصنوعی را در بینایی کامپیوتر به رخ کشید!

♻️مدل‌های بینایی کامپیوتر انسان‌محور امروزی نیازمند میلیاردها پارامتر، دیتاست‌های عظیم و هزینه‌های بالای استنتاج هستند. اما آیا می‌توان بدون صرف میلیون‌ها دلار به همان دقت رسید؟

🔍 پاسخ مثبت است:
پژوهشگران مایکروسافت نشان داده‌اند که مدل‌ها می‌توانند فقط با داده‌های مصنوعی با کیفیت بالا آموزش ببینند و دقیقاً همان نتایج را ارائه دهند!

🔧 پروژه DAViD: چارچوبی متن‌باز برای تولید انسان‌های دیجیتال با هندسه و بافت چهره دقیق.

🧠 کاربردهای کلیدی: • پیش‌بینی عمق (Depth Prediction)
• برآورد زاویه‌ی سطح (Normal Estimation)
• سگمنت‌سازی پس‌زمینه و انسان‌ها در عکس/ویدیو

🌟 چرا مهم است؟ • داده مصنوعی = لیبل‌گذاری پیکسلی بی‌نقص
• تنوع بی‌پایان از زاویه، نور، صحنه، ژست
• مقیاس‌پذیری عالی برای آموزش از صفر یا فاین‌تیون کردن

📦 مایکروسافت همه چیز را متن‌باز کرده:
✅ ۳۰۰٬۰۰۰ نمونه
✅ مدل‌های از پیش‌آموزش‌دیده
✅ کد کامل فریم‌ورک

🔗 لینک‌ها:
🔸 وب‌سایت پروژه
📄 مقاله آکادمیک
💻 کد در گیت‌هاب

🚀 اگر در حوزه بینایی کامپیوتر انسان‌محور فعالیت می‌کنید، این پروژه یک نقطه شروع قدرتمند است — حتی بدون داده واقعی.

@rss_ai_ir
#بینایی_کامپیوتر #مایکروسافت #داده_مصنوعی #CV #هوش_مصنوعی #متن_باز

🔥4❤1👍1👏1

187 viewsedited 14:57

❓ در یک سامانه رباتیک بازوی صنعتی، کدام‌یک از گزینه‌های زیر مهم‌ترین عامل در کنترل دقیق موقعیت انتهای بازو (End-Effector) است؟

Anonymous Quiz

تعداد مفاصل و طول هر بخش از بازو

نوع سنسور مجاورت استفاده‌شده در محیط

دقت دوربین مورد استفاده در سیستم بینایی

الگوریتم معکوس سینماتیک (Inverse Kinematics) برای محاسبه زاویه مفاصل

👍1🔥1🙏1

19 voters161 views03:56

This media is not supported in your browser

VIEW IN TELEGRAM

😎 وقتی با این همه علم هوش مصنوعی از سر کار برمی‌گردی، حس می‌کنی یه ابرقهرمان دیجیتالی هستی!

🕺 هوش مصنوعی روی شونه‌ت
🎧 پرامپت‌ها توی ذهنت
💻 و کلی پروژه توی لپ‌تاپت!

📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes

😁2👍1🕊1

166 views03:56

💠 نسل جدید دارایی‌های سه‌بعدی با ویژگی‌های فیزیکی واقعی PhysX‑3D:

✅داده بساز، رفتار فیزیکی شبیه‌سازی کن، مدل سه‌بعدی واقعی بساز.
---

🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکت‌های سه‌بعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکت‌پذیری و...) را نیز تولید می‌کند.

📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:

📌 توزیع اجزای مدل‌ها (شکل a):
اکثر آبجکت‌ها بین 1 تا 20 جزء دارند، که نشان‌دهنده طراحی ساده و کاربردی است.

📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازه‌ای بین 50 تا 200 سانتی‌متر دارند؛ بسیار مناسب برای کاربردهای واقع‌گرایانه مثل متاورس، AR/VR یا ربات‌ها.

📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتی‌اند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.

📌 خواص فیزیکی مواد (شکل c - میانی و راست):

* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³

📌 توزیع موضوعی داده‌ها (شکل d):
ابر کلمات نشان می‌دهد بیشترین آبجکت‌ها شامل:
Furniture, Table, Chair, Lamp, Lighting, Cabinet هستند.

📌 PhysXNet-XL (شکل e)
نسخه بزرگ‌تر دیتاست با تولید رویه‌ای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.

---

🎯 این آمار نشون می‌ده که:

* دیتاست بسیار گسترده و تنوع‌پذیر طراحی شده.
* ویژگی‌های فیزیکی کاملاً قابل کنترل و واقعی‌اند.
* کاربرد در رباتیک، بازی‌سازی، شبیه‌سازهای صنعتی و آموزش مدل‌های فیزیک‌محور بسیار بالاست.

🖥

Github: https://github.com/ziangcao0312/PhysX-3D

📕

Paper: https://arxiv.org/pdf/2507.12465v1.pdf

🔗 Dataset: https://paperswithcode.com/dataset/shapenet

📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir

#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سه‌بعدی #AI_3D

Please open Telegram to view this post

VIEW IN TELEGRAM

❤2👍2🙏1

150 viewsedited 04:05

This media is not supported in your browser

VIEW IN TELEGRAM

🧠⌚ سنسور‌ال‌ام (SensorLM)؛ ساعتی که شما را مثل کتاب می‌خواند!

گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعت‌های هوشمند فیت‌بیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدم‌ها و دمای بدن را به زبان طبیعی تبدیل کند.

📌 به‌جای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید می‌کند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیاده‌روی ۱۵ دقیقه‌ای شما را به تعادل برگرداند.»

📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسب‌گذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین داده‌ی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)

🚀 توانایی‌های این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواست‌هایی مانند «چه زمانی استرسم بالا بود؟» با بازه‌های زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه

📌 مدل SensorLM، داده‌های سنسوری دقیقه‌ای را به زبان انسانی تبدیل می‌کند؛ حرکتی مهم برای از بین بردن شکاف میان داده‌ی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI

❤2👍1🔥1

155 views06:02

This media is not supported in your browser

VIEW IN TELEGRAM

🎥✨ مدل Aleph از Runway؛ فتوشاپی برای ویدیو، اما با جادوی هوش مصنوعی!

پلتفرم Runway به‌تازگی از مدل Aleph رونمایی کرده؛ مدلی که می‌توان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیه‌ای!

🧪 این مدل به کاربران اجازه می‌دهد تا:

🎭 چهره‌ها، اجسام و صحنه‌ها را با دستورات متنی یا بصری تغییر دهند

🖌 بافت و استایل دلخواه را به کلیپ‌ها اضافه کنند

🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین

🧠 از پایه برای ویرایش و بازسازی واقع‌گرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول می‌کند.

📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph

🧩 نتیجه؟ همان‌طور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.

🎬 منتظر ویدیوهای خلاقانه‌تر، کوتاه‌تر و باحال‌تر از همیشه باشید!

📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI

👍2🔥1🤯1

159 viewsedited 06:06

This media is not supported in your browser

VIEW IN TELEGRAM

📚 حالت Study Mode به ChatGPT اضافه شد!

✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازه‌ای شده.

🧠 در این حالت:
♻️به‌جای دادن پاسخ نهایی، مدل سوال‌های راهنما می‌پرسه
♻️آموزش رو مرحله‌به‌مرحله جلو می‌بره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چت‌ها رو در نظر می‌گیره
♻️کوییز می‌گیره، نکات رو ارزیابی می‌کنه و یادگیری فعال رو تقویت می‌کنه

🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار می‌کنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخه‌های آینده)
♻️و به‌مرور پیشرفت‌تون رو دنبال می‌کنه

🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!

📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری

👍3❤1🔥1👏1

183 viewsedited 09:01

This media is not supported in your browser

VIEW IN TELEGRAM

🛥 استفاده‌ی هوشمندانه از عامل ChatGPT برای کنترل دوربین مداربسته!

✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل می‌کند — دنبال یک قایق فیروزه‌ای رنگ می‌گردد و سعی می‌کند نام نوشته‌شده روی آن را بخواند.

📸 چه کارهایی انجام می‌دهد؟

♻️خودش دوربین را زوم می‌کند
♻️زاویه را به سمت چپ یا راست تغییر می‌دهد
♻️زاویه دید مناسب را انتخاب می‌کند
♻️و در طول کار، به‌صورت زنده گزارش عملکردش را می‌دهد:
«زوم می‌کنم... کمی به چپ حرکت می‌دم... دوربین را می‌چرخونم تا زاویه بهتری بگیرم...»

⚡️ نتیجه؟
این عامل به‌خوبی از عهده‌ی کاری برمی‌آید که تا همین چند وقت پیش فقط از انسان‌ها برمی‌آمد.

🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent

👍3❤2🔥1👏1

253 viewsedited 09:07

📸 رتبه‌بندی جدید مدل‌های تولید تصویر با هوش مصنوعی منتشر شد
@rss_ai_ir

🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.

📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدل‌های مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیده‌اند.

📅 این مدل‌ها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شده‌اند و رقابت میان آن‌ها شدیدتر از همیشه است.

⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا می‌شود و با این حال دقت بالایی دارد.

❓آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
❓آیا گوگل می‌تواند در به‌روزرسانی بعدی صدر را پس بگیرد؟

📲 دیدگاه شما درباره این رقابت چیست؟

#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir

👍1🔥1👏1

140 viewsedited 17:45