VIRSUN
15.8K subscribers
333 photos
200 videos
2 files
204 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
💊 پژوهشگران MIT با استفاده از هوش مصنوعی مولد توانستند ترکیبات جدیدی بسازند که قادرند با باکتری‌های مقاوم به دارو مقابله کنند.

🔬 به‌جای جستجو در پایگاه‌های شناخته‌شده، آن‌ها بیش از ۳۶ میلیون مولکول فرضی تولید کردند و با شبکه‌های عصبی گرافی (تحلیل اتم‌ها و پیوندها به‌عنوان گراف) بررسی نمودند.

دستاوردها:
• سنتز و آزمایش ۲۴ مولکول منتخب
• شناسایی ۷ مولکول فعال علیه باکتری‌ها
• کشف ۲ ترکیب بسیار قوی که توانستند موش‌های آلوده را درمان کنند

🧪 دو ترکیب شاخص:

✳️ترکیب DN1 درمان‌کننده عفونت پوستی MRSA

✳️ترکیب NG1 موثر بر سوزاک مقاوم به دارو


💡 تفاوت کلیدی این است که AI پژوهشگران را به «فضای شیمیایی جدید» رسانده؛ جایی که مقاومت باکتری‌ها هنوز شکل نگرفته است.

پژوهشگران معتقدند این می‌تواند آغاز «عصر طلایی دوم آنتی‌بیوتیک‌ها» باشد.

@rss_ai_ir 🧬
🔥12😁1211🎉7👍6🥰5👏5
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 نسخه جدید Perch 2.0 توسط DeepMind معرفی شد؛ مدلی فشرده برای شنیدن صدای طبیعت و کمک به نجات گونه‌های در خطر انقراض.

برخلاف مدل‌های غول‌پیکر، این شبکه کوچک و بهینه، بدون میلیاردها پارامتر یا آموزش‌های پیچیده، توانسته همه بنچمارک‌ها را پشت سر بگذارد و همین حالا در تحقیقات میدانی استفاده می‌شود.

🌱 اهمیت موضوع
صداهای طبیعت منبع مهمی برای درک تنوع زیستی هستند:
♻️تشخیص گونه‌های موجود در جنگل
♻️برآورد جمعیت
♻️بررسی تولیدمثل
♻️ردیابی اثرات انسانی بر زیستگاه‌ها


اما تحلیل یک ساعت ضبط در مناطق استوایی (با ده‌ها صدای همزمان) کار بسیار دشواری است.

🐦 توانایی‌های Perch 2.0
این مدل یک universal embedder برای صداهای جانوری است:

ورودی: ۵ ثانیه صدا

خروجی: یک بردار قابل استفاده برای
▫️ جستجوی صداهای مشابه
▫️ خوشه‌بندی و دسته‌بندی
▫️ آموزش سریع کلاسفایر برای گونه‌های جدید (few-shot)


اجرا بدون نیاز به GPU و بدون fine-tuning.

🛠 معماری
پایه: EfficientNet-B3 با ۱۲M پارامتر
سه هد:
1. کلاس‌بندی ~۱۵هزار گونه
2. پروتوتایپ (تولید logits معنایی برای distillation)
3. پیش‌بینی منبع ضبط



آموزش در دو مرحله:
▫️ یادگیری پروتوتایپ به صورت مستقل
▫️ استفاده از logits آن به‌عنوان soft labels برای هد اصلی (self-distillation)


📊 نتایج

♻️همچنین SOTA در دیتاست‌های BirdSet و BEANS
♻️انتقال‌پذیری عالی به داده‌های دریایی (نهنگ‌ها، دلفین‌ها) حتی با نبود داده کافی در آموزش
♻️تنها با embeddings ثابت، بدون fine-tuning


🔑 نتیجه اصلی
همچنین Perch 2.0 ثابت کرد که:
🟢 داده‌ی باکیفیت
🟢 معماری ساده
🟢 تعریف دقیق وظیفه
می‌تواند مهم‌تر از افزایش بی‌پایان پارامترها باشد.


🌍 تأثیرات

♻️برای زیست‌شناسان: تحلیل سریع جنگل‌های آمازون یا صخره‌های مرجانی بدون ساخت مدل جدید
♻️برای مهندسان ML: الگویی برای ساخت شبکه‌های کوچک و دقیق



📌 منابع:
🔗 Github
🔗 DeepMind Blog
🔗 Paper

@rss_ai_ir 🤖 | هوش مصنوعی
👍16😁129🔥9👏7🎉3🥰2
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 افسر پلیس هولوگرامی در پارک‌های سئول

در پارک‌های سئول یک افسر پلیس سه‌بعدی هولوگرامی تمام‌قد نصب شده که هر شب از ساعت ۱۹ تا ۲۲ فعال می‌شود و به بازدیدکنندگان یادآوری می‌کند محیط تحت نظارت است.

📉 نتایج شگفت‌انگیز: پس از نصب این سیستم، آمار جرایم در محدوده پارک ۲۰ تا ۲۲ درصد کاهش یافته است.

🔹 چرا مؤثر است؟

حضور ظاهری پلیس باعث بازدارندگی روانی قوی می‌شود.

بدون نیاز به نیروی انسانی، به‌صورت خودکار و کم‌هزینه عمل می‌کند.


🌍 این تجربه نشان می‌دهد که فناوری هولوگرام می‌تواند آینده امنیت شهری را متحول کند. شاید در آینده به‌جای پلیس فیزیکی، هولوگرام‌های امنیتی در سطح شهر دیده شوند.

🎥 ویدیو کامل: https://youtu.be/NSETX6x8GSU

@rss_ai_ir
🔥12👍11👏9🎉8😁76🥰5
11🎉11🔥10😁10👍7🥰3👏3
🪄 اومنی آواتار — جان بخشیدن به عکس‌ها

توسعه‌دهندگان چینی یک جایگزین رایگان برای HeyGen و Hedra معرفی کردند: کافیست یک عکس و فایل صوتی آپلود کنید و در چند ثانیه ویدیویی بگیرید که فرد داخل عکس مثل انسان واقعی حرف می‌زند و حرکت می‌کند.

🔹 ویژگی‌ها:

♻️تولید ویدیو در چند ثانیه
♻️حرکات طبیعی صورت و لب‌خوانی هماهنگ با صدا
♻️متن‌باز و قابل استفاده رایگان


📌 دریافت از گیت‌هاب:
https://github.com/Omni-Avatar/OmniAvatar

@rss_ai_ir
😁1613👍12🎉12👏10🔥8🥰5❤‍🔥1
🔎 دانش تقطیر (Knowledge Distillation) کجا به کار می‌آید؟

ایده این روش ساده است:
یک مدل بزرگ و قوی (Teacher) آموزش دیده، دانش خودش را به یک مدل کوچک‌تر (Student) منتقل می‌کند.

📍 موارد استفاده:
1️⃣ اجرای مدل روی سخت‌افزارهای محدود (موبایل، IoT، رباتیک).
2️⃣ کاهش هزینه و زمان پردازش در کلاد یا سرورها.
3️⃣ فشرده‌سازی چند مدل قوی در یک مدل سبک.
4️⃣ انتقال دانش وقتی داده‌های اختصاصی کم است.
5️⃣ ساخت نسخه‌های سریع‌تر از مدل‌های عظیم (مثل DistilBERT از BERT).

💡 هر جا نیاز به مدل سبک‌تر و سریع‌تر با دقت نزدیک به مدل بزرگ باشد، دانش تقطیر بهترین گزینه است.

✍🏼 @rss_ai_ir
🎉10🥰8😁76👏5👍4🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
چرا استفاده از HiggsfieldAI مهم است؟
زیرا تقریباً هر روز یک ابزار تازه معرفی می‌کند!

🆕 تازه‌ترین ابزار: Draw-to-Video
دیگر نیازی به نوشتن پرامپت ندارید؛ فقط روی تصویر مشخص کنید چه اتفاقی باید در صحنه رخ دهد، و مدل بقیه کار را انجام می‌دهد.


🎥 آینده تولید ویدیو از اینجا می‌گذرد.

🛫 @rss_ai_ir
🔥4👏1😱1
🔬 تجربه‌ای علمی از پروژه‌های صنعتی هوش مصنوعی:

1️⃣ زمان‌بر بودن فرایند توسعه
پروژه‌های صنعتی در حوزه هوش مصنوعی به دلیل مراحل مختلف شامل جمع‌آوری داده، پاک‌سازی، طراحی مدل، تست میدانی و پیاده‌سازی، معمولاً چندین برابر پروژه‌های تحقیقاتی آکادمیک زمان‌بر هستند.

2️⃣ دسترسی محدود به داده‌ها
بسیاری از صنایع سنتی فاقد زیرساخت ثبت و ذخیره‌سازی منسجم داده هستند. حتی در صنایع مدرن، داده‌های حیاتی به دلایل امنیتی، محرمانگی یا ملاحظات رقابتی به‌سادگی در اختیار پژوهشگران قرار داده نمی‌شود.

3️⃣ کیفیت و ناسازگاری داده‌ها
در صورتی هم که داده موجود باشد، اغلب با مشکلاتی چون عدم برچسب‌گذاری، وجود نویز، مقیاس‌های مختلف سنجش و خلأهای زمانی روبه‌رو است که نیاز به پردازش و نرمال‌سازی پیشرفته دارد.

4️⃣ چالش فرهنگی و سازمانی
فضای کاری صنایع با دانشگاه تفاوت بنیادین دارد. در صنعت، رویکرد عملگرایانه، سرعت و هزینه در اولویت است، در حالی‌که در آکادمیک تمرکز بر نوآوری، صحت علمی و انتشار نتایج است. این تضاد فرهنگی می‌تواند مانع همکاری مؤثر شود، مگر اینکه پژوهشگر با زبان و نیازهای صنعت همسو شود.

5️⃣ نیاز به هم‌راستایی راهبردی
برای موفقیت، پژوهشگر باید علاوه بر مهارت‌های فنی، به مدیریت پروژه، مهارت‌های ارتباطی و درک مدل‌های اقتصادی صنعت مسلط باشد. تنها در این صورت است که خروجی پژوهش می‌تواند به محصول صنعتی قابل اتکا تبدیل شود.

⚡️ نتیجه: پروژه‌های صنعتی در هوش مصنوعی تنها یک مسئله مهندسی نیستند، بلکه ترکیبی از چالش‌های فنی، سازمانی، داده‌ای و فرهنگی هستند. موفقیت در آن‌ها نیازمند صبر، انعطاف‌پذیری و توانایی ترجمه زبان آکادمیک به زبان صنعت است.

@rss_ai_ir
👏4👍1🔥1
⚔️ جنگ‌های آینده در دنیای دیجیتال: نبرد هوش مصنوعی علیه هوش مصنوعی! ⚔️

شاید وقتی اسم "جنگ" را می‌شنوید، به فکر سرباز و تانک بیفتید. اما امروز، یک جنگ تمام‌عیار، خاموش و با سرعتی باورنکردنی در دنیای سایبری در جریان است: نبرد AI علیه AI! 🤯

این یعنی چه؟ یعنی هم قهرمان‌ها (متخصصان امنیت) و هم تبهکاران (هکرها) از هوش مصنوعی به عنوان سلاح اصلی خود استفاده می‌کنند. بیایید دو جبهه این نبرد را بشناسیم:

---

🛡️ جبهه اول: هوش مصنوعی به عنوان "مدافع" (The Good Guys)


متخصصان امنیت سایبری از AI برای ساختن یک قلعه دیجیتال غیرقابل نفوذ استفاده می‌کنند:

1️⃣ چشم همیشه بیدار: AI می‌تواند حجم عظیمی از داده‌های شبکه را در لحظه تحلیل کند و کوچک‌ترین فعالیت مشکوک (مثل ورود یک کارمند در ساعت ۳ صبح) را فوراً شناسایی کند. 🕵️‍♂️

2️⃣ واکنش در کسری از ثانیه: اگر یک حمله شروع شود، AI می‌تواند به صورت خودکار IP مهاجم را مسدود یا دستگاه آلوده را از شبکه ایزوله کند. سرعتی که هیچ انسانی به آن نمی‌رسد! ⚡️

3️⃣ پیش‌بینی حملات: با تحلیل حملات قبلی در جهان، AI یاد می‌گیرد که حملات بعدی از کجا و چگونه خواهند بود و قبل از وقوع، هشدار می‌دهد. 🔮

---

🧨 جبهه دوم: هوش مصنوعی به عنوان "مهاجم" (The Bad Guys)

در طرف دیگر، هکرها هم از AI برای ساخت سلاح‌های هوشمندتر و خطرناک‌تر استفاده می‌کنند:

1️⃣ بدافزارهای تطبیق‌پذیر: تصور کنید یک ویروس وارد شبکه شما شود که می‌تواند "یاد بگیرد"! این بدافزار آنتی‌ویروس شما را شناسایی کرده و رفتار خود را برای پنهان ماندن تغییر می‌دهد. 🦎

2️⃣ ایمیل‌های فیشینگ فوق‌پیشرفته: با استفاده از AI، هکرها ایمیل‌هایی می‌سازند که دقیقاً شبیه ایمیل رئیس یا همکار شماست! تشخیص جعلی بودن آن‌ها تقریبا غیرممکن است. 📧🤖

3️⃣ ارتش ربات‌های حمله‌کننده: AI می‌تواند یک ارتش از ربات‌ها را مدیریت کند که ۲۴ ساعته و ۷ روز هفته به دنبال یک نقطه ضعف در سیستم شما می‌گردند و از شکست‌هایشان درس می‌گیرند. 🤖🔥

---

⚡️ نتیجه: مسابقه تسلیحاتی الگوریتمیک! ⚡️

"جنگ AI علیه AI" یعنی یک چرخه بی‌پایان از حمله و دفاع با سرعت نور:
* یک AI مهاجم روش جدیدی برای نفوذ پیدا می‌کند.
* یک AI مدافع آن روش را یاد می‌گیرد و سد دفاعی خود را قوی‌تر می‌کند.
* یک AI مهاجم دوباره خود را آپدیت می‌کند تا از سد جدید عبور کند... و این داستان ادامه دارد.

آینده امنیت ما به این بستگی دارد که هوش مصنوعیِ "خوب" همیشه یک قدم از هوش مصنوعیِ "بد" جلوتر باشد. 🚀

#هوش_مصنوعی #امنیت_سایبری #جنگ_سایبری #تکنولوژی #فناوری #هک #امنیت #AI #CyberSecurity #AIvsAI #Deepfake #Malware #Phishing

@rss_ai_ir
🔥7😁6👍5🎉54👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔮 متا مدلی به نام TRIBE معرفی کرده که می‌تواند واکنش مغز انسان به محتوا را پیش‌بینی کند.

🖥 این مدل بر اساس داده‌های داوطلبانی آموزش دیده که ۸۰ ساعت برنامه تلویزیونی تماشا کردند و سپس توانست فعالیت مغزی را در ۱۰۰۰ ناحیه مختلف پیش‌بینی کند.

📊 نتایج نشان داد TRIBE حدود ۳۰٪ دقیق‌تر از مدل‌های تک‌حسی (فقط متن، صدا یا تصویر) عمل می‌کند، چون ویدئو، صوت و متن را هم‌زمان تحلیل می‌کند.

🌍 چرا مهم است؟
♻️کمک به درک بهتر نحوه پردازش اطلاعات در مغز.
♻️کاربرد در علوم اعصاب، آموزش و بازاریابی.
♻️گامی به سوی پیوند هوش مصنوعی با شناخت مغز انسان.

@rss_ai_ir | #هوش_مصنوعی #Meta #Neuroscience #BrainTech
😁10🔥6👍53🎉3👏1
🧠 انتخاب ابزار مناسب: شبکه عصبی سنتی (NN) یا شبکه کانولوشنی (CNN)؟ 🤔

در دنیای هوش مصنوعی، انتخاب معماری درست برای شبکه عصبی، کلید موفقیت پروژه شماست. دو تا از معروف‌ترین سربازهای این میدان، شبکه‌های عصبی سنتی (که بهشون MLP هم میگن) و شبکه‌های عصبی کانولوشنی (CNN) هستند.

اما سوال اصلی اینجاست: کِی و چرا باید از هرکدوم استفاده کنیم؟ بیایید یک بار برای همیشه این موضوع را روشن کنیم! 👇

---

📊 ۱. شبکه‌های عصبی سنتی (NN / MLP): تحلیلگر داده‌های ساختاریافته

این شبکه‌ها مثل یک تحلیلگر خبره هستند که با جداول داده (مثل فایل اکسل) کار می‌کنند. هر ورودی برای آن‌ها یک ویژگی مستقل است.

🔑 چه موقع از NN استفاده کنیم؟
وقتی داده‌های شما ساختاریافته (Structured) و جدولی (Tabular) هستند و موقعیت مکانی داده‌ها نسبت به هم اهمیتی ندارد.

مثال‌های عالی:
♻️ پیش‌بینی قیمت مسکن: ورودی‌ها: متراژ، تعداد اتاق، سال ساخت، محله. (ترتیب این ستون‌ها مهم نیست). 🏠
♻️ تشخیص ریزش مشتری (Churn): ورودی‌ها: سن مشتری، نوع اشتراک، میانگین خرید ماهانه. 📈
♻️ اعتبارسنجی بانکی: ورودی‌ها: درآمد، سابقه وام، میزان بدهی. 💳

💡 قانون سرانگشتی: اگر داده‌های شما در یک فایل CSV یا جدول اکسل به خوبی جا می‌شوند، به احتمال زیاد NN گزینه مناسبی برای شماست.

---

🖼️ ۲. شبکه‌های عصبی کانولوشنی (CNN): استاد تشخیص الگوهای فضایی

قدرت اصلی CNN در درک روابط فضایی (Spatial Relationships) بین داده‌هاست. این شبکه‌ها دنیا را مثل ما می‌بینند: به جای دیدن پیکسل‌های جدا، الگوها، لبه‌ها، بافت‌ها و اشکال را تشخیص می‌دهند.

🔑 چه موقع از CNN استفاده کنیم؟
وقتی داده‌های شما ساختاری شبیه به شبکه (Grid-like) دارند و همسایگی و موقعیت داده‌ها بسیار مهم است.

مثال‌های عالی:
♻️ پردازش تصویر: تشخیص چهره، دسته‌بندی عکس‌ها (سگ یا گربه؟)، پیدا کردن اشیاء در تصویر. 📸
♻️ تحلیل ویدئو: تشخیص حرکت یا فعالیت در ویدئو. 📹
♻️ تصویربرداری پزشکی: تشخیص تومور در اسکن‌های MRI یا CT-Scan. 🩺
♻️ تحلیل صدا: با تبدیل صدا به تصویر (اسپکتروگرام)، می‌توان الگوهای صوتی را با CNN تحلیل کرد. 🔊

💡 قانون سرانگشتی: اگر با داده‌هایی مثل عکس، ویدئو یا هر نوع داده‌ای که در آن "پیکسل‌های همسایه" با هم مرتبط هستند کار می‌کنید، CNN پادشاه بی‌رقیب است.

---

خلاصه نهایی:

♻️ داده‌های جدولی و بدون وابستگی مکانی؟ 👈 NN سنتی
♻️ داده‌های تصویری، ویدیویی یا با ساختار شبکه‌ای؟ 👈 CNN

انتخاب درست ابزار، نیمی از مسیر موفقیت است! 🚀

#هوش_مصنوعی #یادگیری_عمیق #شبکه_عصبی #پردازش_تصویر #علم_داده #ماشین_لرنینگ #آموزش_هوش_مصنوعی #CNN #NeuralNetworks #DeepLearning #DataScience
👍9🔥65🎉5😁3👏1
😎 حقیقت جالبی که خیلی از توسعه‌دهنده‌ها درک کرده‌اند اینه که کاربران عادی اهمیتی به «پرامپت‌سازی حرفه‌ای» نمی‌دهند.

📊 در تمام اپلیکیشن‌هایی که روی LLM ساخته شده‌اند، آنالیتیک‌ها نشان می‌دهد کاربر یک جمله ساده می‌نویسد و انتظار خروجی کامل دارد. به همین دلیل، توسعه‌دهندگان داخل خودِ اپ حجم زیادی از دستورالعمل‌ها و ساختارها را به‌صورت پیش‌فرض جاسازی می‌کنند تا همان درخواست ساده‌ی کاربر به یک پرامپت پیچیده و کاربردی تبدیل شود.

🧠 از طرف دیگر، مدل‌های «تفکری» (Thinking Models) اساساً نیازمند پرامپت‌های کلاسیک نیستند. این مدل‌ها خودشان جای خالی درخواستی کاربر را پر می‌کنند و بافت منطقی یا داده‌ای لازم را اضافه می‌کنند. تعداد کمی از افراد بلدند این نسل از مدل‌ها را درست پرامپت کنند، ولی واقعیت اینه که برای عموم کاربرها هم نیازی نیست.

بله، مواقعی هست که یک پرامپت خیلی خاص و دقیق لازم می‌شود (مثلاً در یک تسک پژوهشی یا تخصصی)، اما این‌ها استثنا هستند. اگر تا حالا در چنین وضعیتی نبودید، اصلاً مهم نیست – می‌توانید بی‌خیال ماجرای «پرامپت پارسلتانگ» شوید.

نتیجه: تنبل بودن در پرامپت‌نویسی نه تنها اشکال نداره، بلکه مسیر درست استفاده از LLM همین است. احترام به کسانی که راحت می‌نویسند و انتظار دارند AI خودش فکر کند! 🙌

@rss_ai_ir | #LLM #AI #Prompting
👍10🔥6🎉65👏1😁1
🤖 شرکت Figure AI مدل جدیدی به نام Helix معرفی کرده که یک تحول اساسی در رباتیک انسان‌نماست: کنترل کامل ۳۵ درجه آزادی نیم‌تنه بالا (سر، دست‌ها، بازوها، انگشتان و تنه) تنها با یک شبکه عصبی، آن هم با واکنش به دستورات گفتاری طبیعی.

🔹 ویژگی‌های کلیدی Helix

یادگیری تعمیم‌پذیر (Grab-anything): دستور «چای‌ساز را بردار» حتی برای چای‌سازی که ربات هرگز ندیده، اجرا می‌شود.
کار گروهی: یک مجموعه وزن روی دو ربات مختلف کار می‌کند؛ یکی بسته‌ی شیر را می‌دهد، دیگری در یخچال می‌گذارد — بدون برنامه‌ریزی نقش‌ها.
کنترل هم‌زمان ۳۵ محور حرکتی با فرکانس ۲۰۰ هرتز: هماهنگی چشم، بدن و انگشتان برای گرفتن دقیق اشیاء.
کاملاً روی دستگاه: همه‌ی محاسبات روی دو GPU کم‌مصرف داخلی انجام می‌شود، بدون نیاز به پردازش ابری.

🧠 معماری «سیستم ۱ و سیستم ۲»

1. سیستم ۲ (فکر کندتر): یک VLM متن‌باز ۷ میلیارد پارامتری با ۷-۹ هرتز → درک صحنه و تولید دستور کلی.
2. سیستم ۱ (واکنش سریع): یک ترنسفورمر ۸۰ میلیون پارامتری با ۲۰۰ هرتز → اجرای دقیق حرکات و اصلاح لحظه‌ای مسیر.

📊 داده‌های آموزشی

* تنها ۵۰۰ ساعت ضبط تله‌اپراتوری (<۵٪ دیتاست‌های رایج).
* بدون فاین‌تیون جداگانه: همان وزن‌ها هم برای گرفتن لیوان، هم بازکردن کشو و همکاری دو ربات کافی‌اند.
* برچسب‌گذاری خودکار: VLM ویدیوها را تحلیل کرده و متن آموزشی تولید می‌کند.

🏠 چرا مهم است؟
خانه چالش‌برانگیزترین محیط برای ربات‌هاست: تنوع بی‌پایان اشیاء، ظروف شکننده، لباس‌های مچاله. تا دیروز هر مهارت جدید نیازمند هزاران دموی انسانی یا کدنویسی پیچیده بود. حالا با Helix، تنها یک جمله‌ی صوتی کافیست.

🚀 گام بعدی
تیم Figure AI این نتایج را فقط «نوک کوه یخ» می‌داند و در حال جذب نیرو برای ۱۰۰۰ برابر مقیاس‌پذیری Helix است. آینده‌ای که میلیون‌ها ربات انسان‌نما وارد خانه‌ها شوند، یک قدم دیگر نزدیک‌تر شد.

مدل Helix = GPT برای دست‌های رباتیک.
فقط با یک مدل، با زبان طبیعی، بدون کدنویسی اضافه. دفعه‌ی بعد که کنترل تلویزیون زیر مبل افتاد، فقط کافیست به ربات بگویید: «لطفاً بردار».

📌 @rss_ai_ir | #Robotics #AI #FigureAI
6👍5🔥5😁4🎉2
Media is too big
VIEW IN TELEGRAM
عدم تعادل ربات در برخی از شرایط و زمان های جالب


🎥 آینده تولید ربات از اینجا می‌گذرد.

🛫 @rss_ai_ir
👍149🔥8🎉8😁7🥰3👏2🤣1
🤖 تغییرات اخیر در سیستم پرامپت کلود 4.0 نشان می‌دهد که Anthropic چطور با زبان طبیعی رفتار ربات را برنامه‌ریزی می‌کند.

🔹 مهم‌ترین نکات:

♻️حذف «هاتفیکس»‌های قدیمی که حالا مستقیم در فرایند آموزش مدل اعمال می‌شوند.
♻️تأکید بیشتر روی استفاده از قابلیت جستجو.
♻️گسترش سناریوهای استفاده از Artifacts.
♻️بهینه‌سازی کانتکست مخصوصاً در کدنویسی.
♻️اضافه شدن محافظت‌های امنیت سایبری جدید.


📊 پرامپت سیستمی کلود حدود ۲۳ هزار توکن دارد که تقریباً ۱۱٪ از کل پنجره‌ی کانتکست را می‌گیرد. این موضوع نشون می‌ده که چرخه‌ی توسعه کلود کاربرمحوره: اول رفتارهای مشاهده‌شده با تغییر پرامپت اصلاح می‌شوند و بعد در مرحله‌ی آموزش مدل، دائمی می‌گردند.

به زبان ساده: Anthropic اول با «دستورالعمل‌ها» واکنش سریع نشان می‌دهد و بعد آن تغییرات را در DNA مدل وارد می‌کند.

@rss_ai_ir | #Claude #Anthropic #AI
🔥138👍8🥰8🎉8😁7👏3
🤖 معماری Local–Global Siamese در یادگیری عمیق

در بسیاری از مسائل بینایی ماشین، صرفاً دید کلی یا فقط توجه به جزئیات کافی نیست. برای مثال در تشخیص عیوب صنعتی یا تصاویر پزشکی، هم باید ساختار کلی جسم دیده شود و هم نقص‌های ظریف و کوچک. اینجا معماری Local–Global Siamese Network وارد عمل می‌شود.

🔹 Global Branch (شاخه کلی):
کل تصویر به عنوان ورودی پردازش می‌شود تا ویژگی‌های بزرگ‌مقیاس مانند شکل، ساختار، الگوهای تکرارشونده و بافت کلی استخراج شوند.

🔹 Local Branch (شاخه محلی):
نواحی مهم یا قطعات کوچک تصویر (Patch) جدا شده و با دقت بالا بررسی می‌شوند تا تغییرات ریز، ترک‌ها یا جزئیات نامحسوس از دست نروند.

🔹 Siamese Mechanism (مقایسه هم‌زاد):
هر دو نمای محلی و کلی با وزن‌های مشترک (Shared Weights) پردازش می‌شوند و در نهایت در یک فضای ویژگی مشترک ترکیب یا مقایسه می‌گردند. این روش امکان اندازه‌گیری شباهت یا تفاوت را با دقت بالا فراهم می‌کند.

📊 کاربردهای کلیدی:

🏭 صنعتی: تشخیص عیوب سطحی در کاتدهای مسی، ترک‌های ریز، یا تغییرات ناهمگون در محصولات.

🧬 پزشکی: شناسایی ضایعات کوچک در کنار بافت کلی (مانند تصاویر MRI یا CT).

🔐 امنیت و بیومتریک: مقایسه چهره یا اثرانگشت در شرایطی که تفاوت‌ها بسیار جزئی هستند.

🌍 تحلیل تصاویر ماهواره‌ای: ترکیب دید کلی از مناظر و تمرکز روی جزئیات کوچک مثل جاده‌ها یا ساختمان‌ها.


مزیت اصلی این معماری این است که مدل هم نگاه پرنده‌ای (Macro) دارد و هم نگاه میکروسکوپی (Micro)، و به همین دلیل در بسیاری از پروژه‌های واقعی نسبت به CNN ساده یا Siamese معمولی عملکرد بهتری نشان می‌دهد.

#DeepLearning #Siamese #LocalGlobal #ComputerVision #AI #IndustrialAI #MedicalAI

✍️ ¦ @rss_ai_ir
10🔥6🥰6🎉6😁5👍3👏2
📌 معیارهای ارزیابی امکان‌پذیری اجرای یک پروژه صنعتی در حوزه هوش مصنوعی

قبل از ورود به هر پروژه صنعتی باید بررسی شود که آیا اجرای آن واقع‌بینانه و مقرون‌به‌صرفه است یا خیر. برخی از مهم‌ترین ملاک‌ها عبارتند از:

🔹 1. دسترسی به داده

♻️آیا داده‌های کافی، باکیفیت و متنوع در دسترس هستند؟
♻️آیا امکان برچسب‌گذاری دقیق وجود دارد یا باید زمان و هزینه زیادی صرف Annotation شود؟


🔹 2. زیرساخت سخت‌افزاری و نرم‌افزاری

♻️آیا صنعت موردنظر زیرساخت لازم (دوربین‌ها، سنسورها، سرورها، GPU و شبکه پایدار) را دارد؟
♻️آیا تیم فنی توانایی استقرار و نگهداری از سیستم را خواهد داشت؟


🔹 3. ارزش افزوده اقتصادی

♻️آیا نتیجه پروژه منجر به صرفه‌جویی مالی، افزایش بهره‌وری یا کاهش ریسک می‌شود؟
♻️نسبت هزینه به فایده (Cost–Benefit) منطقی است؟


🔹 4. همکاری و فرهنگ سازمانی

♻️آیا کارکنان صنعت با پروژه همکاری می‌کنند یا مقاومت دارند؟
♻️آیا فرهنگ سازمانی پذیرای تغییرات دیجیتال است؟


🔹 5. پیچیدگی فنی و ریسک‌ها

♻️آیا پروژه بیش از حد پیچیده است یا می‌توان با نسخه کوچک‌تر (Proof of Concept) شروع کرد؟
♻️ریسک شکست و هزینه‌های پنهان آن قابل قبول هستند؟


🔹 6. زمان و منابع انسانی

♻️آیا تیم توسعه‌دهنده تجربه مشابه دارد؟
♻️آیا زمان‌بندی پروژه با محدودیت‌های صنعت هماهنگ است؟


جمع‌بندی:
اگر داده کافی + زیرساخت مناسب + ارزش اقتصادی + همراهی سازمانی وجود داشته باشد، پروژه صنعتی قابل انجام است. در غیر این صورت بهتر است ابتدا پروژه به‌صورت پایلوت کوچک آغاز شود تا ریسک و هزینه کاهش یابد.

⚙️ #AI #IndustrialAI #ProjectManagement #Feasibility

✍️ ¦ @rss_ai_ir
👍18😁11🔥10🎉10👏76🥰6