This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ علیبابا با MoDA برگشت به صحنه!
یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپنسورس منتشر شده.
🔑 نکته جالب اینجاست که بعد از مدتها انتظار برای کد پروژههایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.
📌 پروژه: MoDA
📂 کد: GitHub
👀 در صفحهی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شدهاند، و در بخش acknowledgements هم لیستی از منابع و پروژههای مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet
⚡ نتیجه: یک فرصت عالی برای علاقهمندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!
#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir
یک معماری چندوجهی مبتنی بر Diffusion برای ساخت آواتارهای متحرک و talking head generation معرفی شده که کاملاً اپنسورس منتشر شده.
🔑 نکته جالب اینجاست که بعد از مدتها انتظار برای کد پروژههایی مثل EMO، بالاخره یک کد باز و آماده تست در اختیار داریم.
📌 پروژه: MoDA
📂 کد: GitHub
👀 در صفحهی پروژه دموهایی از مقالات قدیمی و جدید ترکیب شدهاند، و در بخش acknowledgements هم لیستی از منابع و پروژههای مرتبط مثل:
LivePortrait, EchoMimic, JoyVasa, Ditto, Open Facevid2vid, InsightFace, X-Pose, DiffPoseTalk, Hallo, wav2vec 2.0, Q-Align, Syncnet
⚡ نتیجه: یک فرصت عالی برای علاقهمندان به lip-sync و آواتارهای متحرک. کد را تست کنید، چون معلوم نیست همیشه در دسترس بماند!
#LipSync #MoDA #Alibaba #Diffusion
@rss_ai_ir
👍6🔥5🥰5👏5🎉5😁4❤3
❓ در الگوریتم تبدیل فوریه دو بعدی (2D Fourier Transform)، چرا اطلاعات مربوط به فرکانسهای پایین معمولاً در مرکز طیف قرار میگیرند و چه کاربردی در فیلترینگ تصاویر دارند؟
Anonymous Quiz
10%
چون نویز تصویر همیشه در فرکانسهای پایین ظاهر میشود و باید حذف شود.
50%
تغییرات کلی و روشنایی تصویر در فرکانسهای پایین ذخیره و برای بازسازی ساختار اصلی تصویر ضروریاند.
30%
چون تغییرات مرزی و جزئیات ریز تصویر تنها در فرکانسهای پایین قابل مشاهدهاند.
10%
چون فیلترهای لبه معمولاً روی فرکانسهای پایین اعمال میشوند.
👍8🎉6🔥5👏5🥰4😁3❤2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 در نسخه Kling 2.1 قابلیت تازهای اضافه شده: FirstFrame / LastFrame.
این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که دهها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.
📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.
#Kling #AI #FirstFrame #LastFrame
@rss_ai_ir
این ویژگی فعلاً فقط برای کاربرانی فعال شده که قبلاً از مدل تعریف کرده بودند. جذابیش اینه که حتی بدون پرامپت هم میشه استفاده کرد — مثل کار Nano Banana که دهها واریانت کاراکتر ساخته و خروجی خیلی تمیزی داده.
📌 حالا کافیه اولین یا آخرین فریم رو در Kling بارگذاری کنید تا موتور هوش مصنوعی با همون حالت شروع یا پایان بسازه و نتیجه چیزی شبیه Elastic Reality روی استروئیدهای هوش مصنوعی بشه.
#Kling #AI #FirstFrame #LastFrame
@rss_ai_ir
👏9🔥8👍6🥰5❤3🎉3😁2
🔎 آیا این متن را یک انسان نوشته یا هوش مصنوعی؟ آشنایی با ابزارهای تشخیص محتوای هوش مصنوعی 🤖
با پیشرفت خیرهکننده مدلهای زبانی مثل ChatGPT و Gemini، تشخیص تفاوت بین متن نوشتهشده توسط انسان و هوش مصنوعی روزبهروز سختتر میشود. در همین راستا، ابزارها و وبسایتهایی با عنوان تشخیصدهنده هوش مصنوعی (AI Detector) ظهور کردهاند که ادعا میکنند میتوانند این تفاوت را تشخیص دهند.
✅ معرفی چند ابزار معروف 🌐
چندین سایت در این زمینه فعال هستند که در ادامه به چند مورد معروف اشاره میشود:
✳️ یکی از اولین و مشهورترین ابزارها GPTZero است که توسط یک دانشجو ساخته شد.
✳️ ابزار Originality.ai یک گزینه دقیق و پولی است که بهطور تخصصی برای ناشران محتوا طراحی شده و همزمان سرقت ادبی (Plagiarism) را نیز بررسی میکند.
✳️ سرویس Copyleaks AI Content Detector ابزاری است که تشخیص محتوای هوش مصنوعی را با یک جستجوگر قوی سرقت ادبی ترکیب کرده است.
✳️ یک جایگزین رایگان و محبوب با رابط کاربری ساده، ZeroGPT است.
✳️ ابزار AI Detector از شرکت Writer.com نیز یکی دیگر از گزینههای موجود در این حوزه است.
---
🚨 هشدار بسیار مهم: این ابزارها کامل نیستند! 🚨
این بخش، مهمترین قسمت ماجراست. اعتماد صددرصدی به این ابزارها میتواند بسیار خطرناک و ناعادلانه باشد. چرا؟
۱. خطای مثبت کاذب (False Positive) 😥
این بزرگترین مشکل است. این ابزارها ممکن است یک متن کاملاً انسانی را به اشتباه به عنوان محصول هوش مصنوعی شناسایی کنند. این خطا میتواند به دلیل سبک نوشتاری ساده، استفاده از جملات استاندارد یا حتی موضوعات فنی باشد. متهم کردن یک دانشجو یا نویسنده فقط بر اساس نتیجه این ابزارها، کاری کاملاً اشتباه است.
۲. خطای منفی کاذب (False Negative) 🤫
این ابزارها به راحتی فریب میخورند. اگر یک متن تولیدشده توسط هوش مصنوعی توسط یک انسان کمی ویرایش شود (اصطلاحاً "Humanized" شود)، شانس اینکه ابزار آن را به عنوان متن انسانی تشخیص دهد، بسیار بالا میرود.
۳. امتیاز احتمالی، نه حکم قطعی 📊
خروجی این ابزارها یک درصد احتمال است، نه یک پاسخ قطعی "بله" یا "خیر". نمره "90% احتمالاً توسط AI نوشته شده" به معنای اثبات قطعی نیست، بلکه یک تخمین آماری بر اساس الگوهایی است که ابزار آموزش دیده تا شناسایی کند.
۴. بازی موش و گربه بیپایان 😼🐭
مدلهای هوش مصنوعی دائماً در حال پیشرفت هستند و نوشتارشان به سبک انسان نزدیکتر میشود. در مقابل، ابزارهای تشخیصدهنده نیز سعی میکنند خود را بهروز کنند. این یک رقابت تمامنشدنی است و هیچ ابزاری نمیتواند ادعای دقت همیشگی داشته باشد.
---
⛔️ پس چه کار کنیم؟ راهنمای استفاده هوشمندانه 💡
✳️ به عنوان یک سرنخ، نه مدرک قطعی: از خروجی این ابزارها فقط به عنوان یک سیگنال اولیه یا یک سرنخ استفاده کنید، نه به عنوان مدرک نهایی برای قضاوت.
✳️ قضاوت انسانی در اولویت است: هیچ چیز جایگزین تحلیل و قضاوت یک انسان باتجربه نمیشود. سبک نگارش، عمق تحلیل و تفکر انتقادی در متن، نشانههایی هستند که یک انسان بهتر از ماشین تشخیص میدهد.
✳️ برای نویسندگان: به جای نگرانی از این ابزارها، روی خلق محتوای باکیفیت، معتبر و دارای دیدگاه شخصی تمرکز کنید. از هوش مصنوعی به عنوان دستیار برای ایدهپردازی یا پیشنویس استفاده کنید، اما همیشه اثر انگشت خودتان را روی کار نهایی بگذارید.
نتیجهگیری: ابزارهای تشخیص محتوای هوش مصنوعی فناوری جالبی هستند، اما باید با احتیاط و تفکر انتقادی فراوان از آنها استفاده کرد. آنها در وضعیت فعلی، بیشتر از آنکه مفید باشند، میتوانند باعث سوءتفاهم و قضاوتهای ناعادلانه شوند.
#هوش_مصنوعی #محتوا #سئو #تشخیص_محتوا #نویسندگی #فناوری #تولیدمحتوا #هوش_مصنوعی_مولد
@rss_ai_ir
با پیشرفت خیرهکننده مدلهای زبانی مثل ChatGPT و Gemini، تشخیص تفاوت بین متن نوشتهشده توسط انسان و هوش مصنوعی روزبهروز سختتر میشود. در همین راستا، ابزارها و وبسایتهایی با عنوان تشخیصدهنده هوش مصنوعی (AI Detector) ظهور کردهاند که ادعا میکنند میتوانند این تفاوت را تشخیص دهند.
✅ معرفی چند ابزار معروف 🌐
چندین سایت در این زمینه فعال هستند که در ادامه به چند مورد معروف اشاره میشود:
✳️ یکی از اولین و مشهورترین ابزارها GPTZero است که توسط یک دانشجو ساخته شد.
✳️ ابزار Originality.ai یک گزینه دقیق و پولی است که بهطور تخصصی برای ناشران محتوا طراحی شده و همزمان سرقت ادبی (Plagiarism) را نیز بررسی میکند.
✳️ سرویس Copyleaks AI Content Detector ابزاری است که تشخیص محتوای هوش مصنوعی را با یک جستجوگر قوی سرقت ادبی ترکیب کرده است.
✳️ یک جایگزین رایگان و محبوب با رابط کاربری ساده، ZeroGPT است.
✳️ ابزار AI Detector از شرکت Writer.com نیز یکی دیگر از گزینههای موجود در این حوزه است.
---
🚨 هشدار بسیار مهم: این ابزارها کامل نیستند! 🚨
این بخش، مهمترین قسمت ماجراست. اعتماد صددرصدی به این ابزارها میتواند بسیار خطرناک و ناعادلانه باشد. چرا؟
۱. خطای مثبت کاذب (False Positive) 😥
این بزرگترین مشکل است. این ابزارها ممکن است یک متن کاملاً انسانی را به اشتباه به عنوان محصول هوش مصنوعی شناسایی کنند. این خطا میتواند به دلیل سبک نوشتاری ساده، استفاده از جملات استاندارد یا حتی موضوعات فنی باشد. متهم کردن یک دانشجو یا نویسنده فقط بر اساس نتیجه این ابزارها، کاری کاملاً اشتباه است.
۲. خطای منفی کاذب (False Negative) 🤫
این ابزارها به راحتی فریب میخورند. اگر یک متن تولیدشده توسط هوش مصنوعی توسط یک انسان کمی ویرایش شود (اصطلاحاً "Humanized" شود)، شانس اینکه ابزار آن را به عنوان متن انسانی تشخیص دهد، بسیار بالا میرود.
۳. امتیاز احتمالی، نه حکم قطعی 📊
خروجی این ابزارها یک درصد احتمال است، نه یک پاسخ قطعی "بله" یا "خیر". نمره "90% احتمالاً توسط AI نوشته شده" به معنای اثبات قطعی نیست، بلکه یک تخمین آماری بر اساس الگوهایی است که ابزار آموزش دیده تا شناسایی کند.
۴. بازی موش و گربه بیپایان 😼🐭
مدلهای هوش مصنوعی دائماً در حال پیشرفت هستند و نوشتارشان به سبک انسان نزدیکتر میشود. در مقابل، ابزارهای تشخیصدهنده نیز سعی میکنند خود را بهروز کنند. این یک رقابت تمامنشدنی است و هیچ ابزاری نمیتواند ادعای دقت همیشگی داشته باشد.
---
⛔️ پس چه کار کنیم؟ راهنمای استفاده هوشمندانه 💡
✳️ به عنوان یک سرنخ، نه مدرک قطعی: از خروجی این ابزارها فقط به عنوان یک سیگنال اولیه یا یک سرنخ استفاده کنید، نه به عنوان مدرک نهایی برای قضاوت.
✳️ قضاوت انسانی در اولویت است: هیچ چیز جایگزین تحلیل و قضاوت یک انسان باتجربه نمیشود. سبک نگارش، عمق تحلیل و تفکر انتقادی در متن، نشانههایی هستند که یک انسان بهتر از ماشین تشخیص میدهد.
✳️ برای نویسندگان: به جای نگرانی از این ابزارها، روی خلق محتوای باکیفیت، معتبر و دارای دیدگاه شخصی تمرکز کنید. از هوش مصنوعی به عنوان دستیار برای ایدهپردازی یا پیشنویس استفاده کنید، اما همیشه اثر انگشت خودتان را روی کار نهایی بگذارید.
نتیجهگیری: ابزارهای تشخیص محتوای هوش مصنوعی فناوری جالبی هستند، اما باید با احتیاط و تفکر انتقادی فراوان از آنها استفاده کرد. آنها در وضعیت فعلی، بیشتر از آنکه مفید باشند، میتوانند باعث سوءتفاهم و قضاوتهای ناعادلانه شوند.
#هوش_مصنوعی #محتوا #سئو #تشخیص_محتوا #نویسندگی #فناوری #تولیدمحتوا #هوش_مصنوعی_مولد
@rss_ai_ir
👍1👏1🙏1
مدلهای اپنسورس جدید GPT-OSS از OpenAI منتشر شدند 🧠⚙️
برای نخستینبار بعد از GPT-2، اوپنایآی وزنهای دو مدل بزرگ را در دسترس عموم قرار داده:
مدل های gpt-oss-20B و gpt-oss-120B. این مدلها بر پایهی Mixture-of-Experts (MoE) ساخته شدهاند، با طول کانتکست تا ۱۲۸k و قابلیت تنظیم سطح استدلال (low / medium / high). همچنین فرمت جدیدی به نام harmony برای پیامها معرفی شده است.
---
🔹 معماری و مشخصات فنی
❇️ مدل ۱۲۰B شامل ۱۲۸ کارشناس است که تنها ۴ کارشناس روی هر توکن فعال میشوند.
❇️ مدل ۲۰B شامل ۳۲ کارشناس است.
❇️ حجم چکپوینتها: حدود ۶۰.۸ GiB (۱۲۰B) و ۱۲.۸ GiB (۲۰B).
❇️ با فشردهسازی MXFP4، مدل ۱۲۰B روی GPU با ۸۰ گیگابایت حافظه جا میشود و مدل ۲۰B روی کارتهای ۱۶ گیگابایتی قابل اجراست.
❇️ طول کانتکست: تا \~۱۲۸k توکن.
---
🔹 ویژگیهای کلیدی
❇️ فرمت harmony با سه کانال خروجی:
❇️قابلیت analysis (تفکر و بخشی از tool calls)
❇️ commentary (فراخوانی ابزارها)
❇️final (نتیجه نهایی)
❇️ حالتهای استدلال (Reasoning modes): low / medium / high در پرامپت سیستم مشخص میشوند و بین سرعت، دقت و هزینه تعادل ایجاد میکنند.
❇️ توکنایزر جدید o200k\_harmony با دقت بهتر روی کاراکترهای غیرانگلیسی و اموجیها.
---
🔹 مثال برای تنظیم سطح استدلال
---
🔹 اهمیت در عمل
✅ ساخت دستیارهای محلی و آفلاین با دادههای حساس روی سختافزار در دسترس.
✅استانداردسازی پرامپت با harmony و سازگاری راحتتر با vLLM، Ollama و سایر رانتایمها.
✅ امکان انتخاب سطح استدلال برای کنترل بهتر روی سرعت ↔️ دقت ↔️ هزینه.
---
🔹 نکات تکمیلی
❌ زنجیرههای استدلال (CoT) بدون فیلتر نباید مستقیم به کاربر نمایش داده شوند.
❌ دیتاست آموزشی بیشتر انگلیسی است، برای کاربردهای فارسی یا روسی نیاز به فاینتیون یا تطبیق وجود دارد.
---
✅ جمعبندی: GPT-OSS جهش انقلابی نیست، بلکه نتیجهی مهندسی دقیق و استانداردسازی است که آستانهی ورود به دنیای مدلهای اپنسورس و قابلکنترل را پایینتر میآورد.
📌 مطالعه بیشتر: [Jay Alammar – Visual GPT-OSS](https://newsletter.languagemodels.co/p/the-illustrated-gpt-oss)
#هوش_مصنوعی #مدل_زبان #اپن_سورس #GPT_OSS
@rss_ai_ir
برای نخستینبار بعد از GPT-2، اوپنایآی وزنهای دو مدل بزرگ را در دسترس عموم قرار داده:
مدل های gpt-oss-20B و gpt-oss-120B. این مدلها بر پایهی Mixture-of-Experts (MoE) ساخته شدهاند، با طول کانتکست تا ۱۲۸k و قابلیت تنظیم سطح استدلال (low / medium / high). همچنین فرمت جدیدی به نام harmony برای پیامها معرفی شده است.
---
🔹 معماری و مشخصات فنی
❇️ مدل ۱۲۰B شامل ۱۲۸ کارشناس است که تنها ۴ کارشناس روی هر توکن فعال میشوند.
❇️ مدل ۲۰B شامل ۳۲ کارشناس است.
❇️ حجم چکپوینتها: حدود ۶۰.۸ GiB (۱۲۰B) و ۱۲.۸ GiB (۲۰B).
❇️ با فشردهسازی MXFP4، مدل ۱۲۰B روی GPU با ۸۰ گیگابایت حافظه جا میشود و مدل ۲۰B روی کارتهای ۱۶ گیگابایتی قابل اجراست.
❇️ طول کانتکست: تا \~۱۲۸k توکن.
---
🔹 ویژگیهای کلیدی
❇️ فرمت harmony با سه کانال خروجی:
❇️قابلیت analysis (تفکر و بخشی از tool calls)
❇️ commentary (فراخوانی ابزارها)
❇️final (نتیجه نهایی)
❇️ حالتهای استدلال (Reasoning modes): low / medium / high در پرامپت سیستم مشخص میشوند و بین سرعت، دقت و هزینه تعادل ایجاد میکنند.
❇️ توکنایزر جدید o200k\_harmony با دقت بهتر روی کاراکترهای غیرانگلیسی و اموجیها.
---
🔹 مثال برای تنظیم سطح استدلال
<|start|>system<|message|>
You are a helpful AI.
Reasoning: medium
Tools: web_search, python
<|end|>
---
🔹 اهمیت در عمل
✅ ساخت دستیارهای محلی و آفلاین با دادههای حساس روی سختافزار در دسترس.
✅استانداردسازی پرامپت با harmony و سازگاری راحتتر با vLLM، Ollama و سایر رانتایمها.
✅ امکان انتخاب سطح استدلال برای کنترل بهتر روی سرعت ↔️ دقت ↔️ هزینه.
---
🔹 نکات تکمیلی
❌ زنجیرههای استدلال (CoT) بدون فیلتر نباید مستقیم به کاربر نمایش داده شوند.
❌ دیتاست آموزشی بیشتر انگلیسی است، برای کاربردهای فارسی یا روسی نیاز به فاینتیون یا تطبیق وجود دارد.
---
✅ جمعبندی: GPT-OSS جهش انقلابی نیست، بلکه نتیجهی مهندسی دقیق و استانداردسازی است که آستانهی ورود به دنیای مدلهای اپنسورس و قابلکنترل را پایینتر میآورد.
📌 مطالعه بیشتر: [Jay Alammar – Visual GPT-OSS](https://newsletter.languagemodels.co/p/the-illustrated-gpt-oss)
#هوش_مصنوعی #مدل_زبان #اپن_سورس #GPT_OSS
@rss_ai_ir
👍1🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🔧 رباتها بدون ابزار عملیاتی مثل بازوی مکانیکی، بیشتر شبیه دکور لوکس هستن تا ماشین صنعتی!
خیلی وقتها در پروژههای رباتیک کلی تکنولوژی پیشرفته بهکار میره، ولی سؤال اساسی اینه: کاربرد واقعی کجاست؟
🔹 بدون ماژولهای عملیاتی مثل بازوی مکانیکی، گیرههای هوشمند یا سیستمهای لجستیکی، ربات فقط یک نمایش پرزرقوبرق باقی میمونه.
🔹 با اضافه کردن این بخشهاست که ربات واقعاً وارد دنیای صنعت میشه: از مونتاژ و بستهبندی گرفته تا جابهجایی در خطوط تولید و انبارداری هوشمند.
پس دفعه بعد که رباتی دیدید، یادتون باشه:
اگر توی دلش بازوی مکانیکی نباشه، شاید فقط برای عکس گرفتن ساخته شده باشه 😅
#رباتیک #هوش_مصنوعی #اتوماسیون #صنعت
@rss_ai_ir
خیلی وقتها در پروژههای رباتیک کلی تکنولوژی پیشرفته بهکار میره، ولی سؤال اساسی اینه: کاربرد واقعی کجاست؟
🔹 بدون ماژولهای عملیاتی مثل بازوی مکانیکی، گیرههای هوشمند یا سیستمهای لجستیکی، ربات فقط یک نمایش پرزرقوبرق باقی میمونه.
🔹 با اضافه کردن این بخشهاست که ربات واقعاً وارد دنیای صنعت میشه: از مونتاژ و بستهبندی گرفته تا جابهجایی در خطوط تولید و انبارداری هوشمند.
پس دفعه بعد که رباتی دیدید، یادتون باشه:
اگر توی دلش بازوی مکانیکی نباشه، شاید فقط برای عکس گرفتن ساخته شده باشه 😅
#رباتیک #هوش_مصنوعی #اتوماسیون #صنعت
@rss_ai_ir
👍2🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🥇 خبر داغ از مسابقات جهانی رباتهای انساننما
❇️ربات Unitree موفق شد در رشتهی دو ۴۰۰ متر مدال طلا بگیره و رکوردی تازه ثبت کنه: ۱ دقیقه و ۲۸ ثانیه 🏃♂️🤖
♨️این زمان تقریباً دو برابر رکورد جهانی انسانی (۴۳.۰۳ ثانیه) است، اما برای یک ربات انساننما جهشی بزرگ محسوب میشه.
✳️این موفقیت نشون میده که رباتها دارن با سرعتی شگفتانگیز به دنیای ورزش و تحرک انسانی نزدیک میشن.
#رباتیک #هوش_مصنوعی #ورزش #RobotGames
@rss_ai_ir
❇️ربات Unitree موفق شد در رشتهی دو ۴۰۰ متر مدال طلا بگیره و رکوردی تازه ثبت کنه: ۱ دقیقه و ۲۸ ثانیه 🏃♂️🤖
♨️این زمان تقریباً دو برابر رکورد جهانی انسانی (۴۳.۰۳ ثانیه) است، اما برای یک ربات انساننما جهشی بزرگ محسوب میشه.
✳️این موفقیت نشون میده که رباتها دارن با سرعتی شگفتانگیز به دنیای ورزش و تحرک انسانی نزدیک میشن.
#رباتیک #هوش_مصنوعی #ورزش #RobotGames
@rss_ai_ir
👏19😁18🔥17👍14🥰14❤12🎉8
This media is not supported in your browser
VIEW IN TELEGRAM
👠 مدل OmniTry: پروسهی جدید پرو کردن مجازی برای هر آیتم پوشیدنی 👠
سیستم OmniTry یک فریمورک یکپارچه معرفی کرده که قابلیتهای Virtual Try-On (VTON) را از لباس فراتر میبرد و شامل هر نوع وسیلهی پوشیدنی میشود: از جواهرات و اکسسوریها گرفته تا آیتمهای دیگر — آن هم بدون نیاز به ماسکگذاری دستی. ✨
🔹 ویژگیها:
♻️پشتیبانی از همهی پوشیدنیها (لباس، جواهرات، اکسسوری)
♻️بدون نیاز به ماسک (Mask-Free)
♻️انتشار وزنها، بنچمارک و دموی HuggingFace
📌 منابع:
👉 Paper
👉 Project
👉 Repo
🤗 Demo
#هوش_مصنوعی #VTON #پردازش_تصویر #OmniTry #VirtualTryOn
@rss_ai_ir
سیستم OmniTry یک فریمورک یکپارچه معرفی کرده که قابلیتهای Virtual Try-On (VTON) را از لباس فراتر میبرد و شامل هر نوع وسیلهی پوشیدنی میشود: از جواهرات و اکسسوریها گرفته تا آیتمهای دیگر — آن هم بدون نیاز به ماسکگذاری دستی. ✨
🔹 ویژگیها:
♻️پشتیبانی از همهی پوشیدنیها (لباس، جواهرات، اکسسوری)
♻️بدون نیاز به ماسک (Mask-Free)
♻️انتشار وزنها، بنچمارک و دموی HuggingFace
📌 منابع:
👉 Paper
👉 Project
👉 Repo
🤗 Demo
#هوش_مصنوعی #VTON #پردازش_تصویر #OmniTry #VirtualTryOn
@rss_ai_ir
🥰21👍20❤18💯17😍16❤🔥16🔥15🤩15🎉13👏2
💬 به نقل از The Verge: «اوپنایآی در آیندهی نزدیک قصد دارد تریلیونها دلار روی ساخت دیتاسنترها سرمایهگذاری کند!»
⚡ رقابت برای دستیابی به AGI / ASI وارد سطح تازهای شده — دیگر صحبت از میلیاردها نیست، بلکه پای تریلیونها در میانه است.
🤖 هوش مصنوعی به اولویت شماره یک جهان فناوری تبدیل شده و بسیاری این پروژه را با پروژه منهتن در تاریخ معاصر مقایسه میکنند.
#هوش_مصنوعی #OpenAI #AGI #دیتاسنتر
@rss_ai_ir
⚡ رقابت برای دستیابی به AGI / ASI وارد سطح تازهای شده — دیگر صحبت از میلیاردها نیست، بلکه پای تریلیونها در میانه است.
🤖 هوش مصنوعی به اولویت شماره یک جهان فناوری تبدیل شده و بسیاری این پروژه را با پروژه منهتن در تاریخ معاصر مقایسه میکنند.
#هوش_مصنوعی #OpenAI #AGI #دیتاسنتر
@rss_ai_ir
🥰27❤24👍19❤🔥18💯18🎉14🤩13😍13🔥11👏6😁4
❓ در روش Histogram Equalization هدف اصلی چیست و چگونه باعث بهبود کیفیت تصویر میشود؟
Anonymous Quiz
47%
کاهش نویز با توزیع یکنواخت پیکسلها در فضای فرکانس.
0%
افزایش وضوح لبهها با اعمال مشتقگیری روی تصویر.
53%
بهبود کنتراست تصویر از طریق بازتوزیع شدت روشنایی پیکسلها در کل دامنه دینامیکی
0%
کاهش ابعاد تصویر برای پردازش سریعتر.
😁27👍26🎉24🔥19🥰19👏19❤16
🔹 در نیمهی نخست سال ۲۰۲۵ دو شرکت OpenAI و Anthropic رشد خیرهکنندهای را تجربه کردند و بهنوعی وارد مرحلهی «ابررشد» شدند.
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
💰 درآمد سالانه (ARR):
* اوپنایآی از ۶ میلیارد دلار به ۱۲ میلیارد دلار در عرض ۶ ماه رسید.
* آنتروپیک از ۱ میلیارد دلار به ۵ میلیارد دلار در ۷ ماه رشد کرد.
📊 مقایسه درآمدها:
* اوپنایآی در بخش اشتراکها (مصرفکننده و سازمانی) پیشتاز است.
* آنتروپیک در بخش API کمی جلوتر است: ۳.۱ میلیارد دلار در برابر ۲.۹ میلیارد دلار.
* نیمی از درآمد API آنتروپیک تنها از Cursor و GitHub Copilot به دست میآید.
👩💻 شاخصهای استفاده:
* چتجیپیتی روزانه بیش از ۳ میلیارد پیام پردازش میکند (رشد ۴ برابری نسبت به سال گذشته).
* کلودکُد به ۴۰۰ میلیون دلار ARR رسیده و تنها در چند هفته دو برابر شده است.
* بسیاری از دستیارها به طور پیشفرض از Claude 4 Sonnet استفاده میکنند.
⚖️ با این حال اگر جیپیتی-۵ دوباره برتری مطلق پیدا کند، احتمال دارد Cursor و Copilot به سمت اوپنایآی متمایل شوند و این میتواند موازنهی بازار را یکشبه تغییر دهد.
🌐 @rss_ai_ir
#هوش_مصنوعی #OpenAI #Anthropic #ChatGPT #Claude #Cursor #Copilot #GPT5 #بازار
🎉26🔥18👏18🥰17❤15👍15😁14
🚀 معرفی 4DNeX: نسل تازهی مدلسازی 4 بعدی (تصویر → صحنهی پویا)
🔹 پژوهشگران Zeng Tao, Jiawei Ren, Long Zhuo, Tianqi Liu, Zhaoxi Chen یک چارچوب نوین به نام 4DNeX ارائه دادهاند؛ روشی feed-forward برای تولید نمایشهای سهبعدی پویا (۴D) تنها از یک تصویر.
✨ ویژگیهای کلیدی:
* استفاده از مدل دیفیوشن ویدئویی از پیشآموزشدیده.
* معرفی دیتاست جدید 4DNeX-10M.
* نمایش یکپارچهی ویدئو در ۶ بُعد (RGB + XYZ).
* استراتژیهای ساده مانند width-wise fusion و XYZ normalization.
⚡️ کارایی چشمگیر:
* تولید صحنهی 4D تنها در ۱۵ دقیقه (درحالیکه روشهایی مثل Free4D حدود ۶۰ دقیقه زمان میگیرند).
* دستیابی به ۹۷.۲٪ سازگاری و ۵۸.۳٪ پویایی در وظایف image-to-4D.
🌍 اهمیت:
این روش یک گام بزرگ در مدلسازی مولد ۴D است؛ راهکاری مقیاسپذیر و دسترسپذیر برای شبیهسازی تکامل پویای صحنهها، که میتواند به عنوان پایهای برای جهانهای مجازی و مدلهای شبیهسازی هوشمند عمل کند.
📖 جزئیات بیشتر: [arXiv](https://arxiv.org/abs/2508.13154) | [HuggingFace](https://huggingface.co/papers/2508.13154)
@rss_ai_ir
#هوش_مصنوعی #4D #دیفیوشن #GenerativeAI #ComputerVision #arXiv
🔹 پژوهشگران Zeng Tao, Jiawei Ren, Long Zhuo, Tianqi Liu, Zhaoxi Chen یک چارچوب نوین به نام 4DNeX ارائه دادهاند؛ روشی feed-forward برای تولید نمایشهای سهبعدی پویا (۴D) تنها از یک تصویر.
✨ ویژگیهای کلیدی:
* استفاده از مدل دیفیوشن ویدئویی از پیشآموزشدیده.
* معرفی دیتاست جدید 4DNeX-10M.
* نمایش یکپارچهی ویدئو در ۶ بُعد (RGB + XYZ).
* استراتژیهای ساده مانند width-wise fusion و XYZ normalization.
⚡️ کارایی چشمگیر:
* تولید صحنهی 4D تنها در ۱۵ دقیقه (درحالیکه روشهایی مثل Free4D حدود ۶۰ دقیقه زمان میگیرند).
* دستیابی به ۹۷.۲٪ سازگاری و ۵۸.۳٪ پویایی در وظایف image-to-4D.
🌍 اهمیت:
این روش یک گام بزرگ در مدلسازی مولد ۴D است؛ راهکاری مقیاسپذیر و دسترسپذیر برای شبیهسازی تکامل پویای صحنهها، که میتواند به عنوان پایهای برای جهانهای مجازی و مدلهای شبیهسازی هوشمند عمل کند.
📖 جزئیات بیشتر: [arXiv](https://arxiv.org/abs/2508.13154) | [HuggingFace](https://huggingface.co/papers/2508.13154)
@rss_ai_ir
#هوش_مصنوعی #4D #دیفیوشن #GenerativeAI #ComputerVision #arXiv
👍11❤7🎉5🔥4🥰3😁3👏2👌1
🪄 معرفی MagicTryOn؛ نسل تازهی ویدئو-پروبار مجازی 👗🎥
🔹 پروژهی MagicTryOn با بهرهگیری از Diffusion Transformer، امکان تغییر پوشاک روی ویدئو را فراهم میکند، بدون آنکه جزئیات لباس از بین برود.
✨ اجزای کلیدی:
✅مبتنی بر VideoX-Fun / Wan2.1-I2V-14B برای تولید ویدئو.
✅توصیف دقیق لباسها با کمک Qwen2.5-VL-7B-Instruct.
✅استفاده از ابزارهای مکمل مانند openpose و densepose برای هماهنگی بدن و لباس.
⚡️ دستاورد:
اگر به دنبال فاینتیون کردن WAN 2.1 برای پروبار مجازی بودید، این پروژه همان چیزی است که نیاز دارید.
📌 کد و جزئیات: GitHub
📖 پروژه: MagicTryOn
@rss_ai_ir
#هوش_مصنوعی #VirtualTryOn #Image2Video #Diffusion #Transformers #AIfashion
🔹 پروژهی MagicTryOn با بهرهگیری از Diffusion Transformer، امکان تغییر پوشاک روی ویدئو را فراهم میکند، بدون آنکه جزئیات لباس از بین برود.
✨ اجزای کلیدی:
✅مبتنی بر VideoX-Fun / Wan2.1-I2V-14B برای تولید ویدئو.
✅توصیف دقیق لباسها با کمک Qwen2.5-VL-7B-Instruct.
✅استفاده از ابزارهای مکمل مانند openpose و densepose برای هماهنگی بدن و لباس.
⚡️ دستاورد:
اگر به دنبال فاینتیون کردن WAN 2.1 برای پروبار مجازی بودید، این پروژه همان چیزی است که نیاز دارید.
📌 کد و جزئیات: GitHub
📖 پروژه: MagicTryOn
@rss_ai_ir
#هوش_مصنوعی #VirtualTryOn #Image2Video #Diffusion #Transformers #AIfashion
🥰83👍80🎉78🔥74❤70😁52👏42❤🔥19💯17🤩15😍12
This media is not supported in your browser
VIEW IN TELEGRAM
☀️مدل Surya: مدلهای بنیادین هوش مصنوعی برای هلیوفیزیک و پیشبینی اثرات خورشید بر زمین و فضا
ناسا و IBM مدل Surya Heliophysics Foundational Model را بهصورت اپنسورس منتشر کردند؛ مدلی عظیممقیاس که با دادههای ۹ سال رصد ماهواره Solar Dynamics Observatory (SDO) آموزش دیده است.
---
🟢 چرا مهم است؟
طوفانهای خورشیدی میتوانند زندگی ما را تحتتأثیر قرار دهند:
🛰 از کار انداختن ماهوارهها
✈️ اختلال در ناوبری هواپیماها
⚡️ ایجاد نوسان و قطعی برق
👨🚀 افزایش تهدیدهای پرتو برای فضانوردان
---
🟠 ویژگیهای کلیدی Surya
✳️ آموزشدیده روی دادههای ۱۴ ساله خورشید
✳️ توانایی پیشبینی فورانهای خورشیدی ۲ ساعت قبل از وقوع
✳️ مشخصکردن دقیق محل انفجار روی سطح خورشید
✳️ کمک به آمادگی صنایع هواپیمایی، انرژی و مخابرات در برابر اختلالها
---
🚀 ناسا و IBM دههها روی مدلهای اقلیم و پیشبینی آبوهوا روی زمین کار کردند؛ حالا وارد مرحلهی جدیدی از «پیشبینی آبوهوای فضایی» شدهاند.
🔗 [HuggingFace](https://huggingface.co/nasa-ibm-ai4science)
🔗 [مدلها](https://huggingface.co/nasa-ibm-ai4science/models)
🔗 [دادهها](https://huggingface.co/nasa-ibm-ai4science/datasets)
@rss_ai_ir
#هوش_مصنوعی #ناسا #IBM #هلیوفیزیک #آب_و_هوای_فضایی #AI4Science 🌌
ناسا و IBM مدل Surya Heliophysics Foundational Model را بهصورت اپنسورس منتشر کردند؛ مدلی عظیممقیاس که با دادههای ۹ سال رصد ماهواره Solar Dynamics Observatory (SDO) آموزش دیده است.
---
🟢 چرا مهم است؟
طوفانهای خورشیدی میتوانند زندگی ما را تحتتأثیر قرار دهند:
🛰 از کار انداختن ماهوارهها
✈️ اختلال در ناوبری هواپیماها
⚡️ ایجاد نوسان و قطعی برق
👨🚀 افزایش تهدیدهای پرتو برای فضانوردان
---
🟠 ویژگیهای کلیدی Surya
✳️ آموزشدیده روی دادههای ۱۴ ساله خورشید
✳️ توانایی پیشبینی فورانهای خورشیدی ۲ ساعت قبل از وقوع
✳️ مشخصکردن دقیق محل انفجار روی سطح خورشید
✳️ کمک به آمادگی صنایع هواپیمایی، انرژی و مخابرات در برابر اختلالها
---
🚀 ناسا و IBM دههها روی مدلهای اقلیم و پیشبینی آبوهوا روی زمین کار کردند؛ حالا وارد مرحلهی جدیدی از «پیشبینی آبوهوای فضایی» شدهاند.
🔗 [HuggingFace](https://huggingface.co/nasa-ibm-ai4science)
🔗 [مدلها](https://huggingface.co/nasa-ibm-ai4science/models)
🔗 [دادهها](https://huggingface.co/nasa-ibm-ai4science/datasets)
@rss_ai_ir
#هوش_مصنوعی #ناسا #IBM #هلیوفیزیک #آب_و_هوای_فضایی #AI4Science 🌌
❤15👍11🎉11👏10🥰7😁7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🔹 صنعت ۵.۰ چیست؟
صنعت ۵.۰ نسل جدید تحول صنعتی است که پس از صنعت ۴.۰ مطرح شده است.
در حالیکه صنعت ۴.۰ تمرکز خود را بر اتوماسیون، اینترنت اشیا، دادههای بزرگ و هوش مصنوعی قرار داده بود، در صنعت ۵.۰ محور اصلی همکاری انسان و ماشین است.
---
⚙️ ویژگیهای کلیدی صنعت ۵.۰:
1. 🤝 همافزایی انسان و ربات – رباتها و هوش مصنوعی کارهای تکراری و سنگین را انجام میدهند و انسانها بر خلاقیت و نوآوری تمرکز میکنند.
2. 🌍 پایداری و سبز بودن – توجه ویژه به انرژیهای تجدیدپذیر، کاهش ضایعات و تولید پایدار.
3. 👨🏭 شخصیسازی تولید – ساخت محصولات مطابق با نیاز و سلیقه هر فرد.
4. 🛡 تمرکز بر رفاه انسانی – بهبود کیفیت زندگی و شرایط کاری کارکنان در کنار بهرهوری.
5. 📡 فناوریهای کلیدی – ترکیب هوش مصنوعی، رباتیک پیشرفته، اینترنت صنعتی اشیا، واقعیت افزوده/مجازی و تحلیل دادههای پیشرفته.
---
🚀 تفاوت اصلی صنعت ۴.۰ و ۵.۰:
✳️ صنعت ۴.۰: تمرکز بر اتوماسیون کامل و دیجیتالیسازی کارخانهها.
✳️ صنعت ۵.۰: تمرکز بر ترکیب توان ماشینها با خلاقیت و هوش انسانی.
---
✨ به زبان ساده:
صنعت ۴.۰ بهدنبال کارخانههای هوشمند بود، اما صنعت ۵.۰ بهدنبال کارخانههای انسانمحور و پایدار است.
@rss_ai_ir
#صنعت۵_۰ #کارخانه_هوشمند #هوش_مصنوعی #رباتیک
صنعت ۵.۰ نسل جدید تحول صنعتی است که پس از صنعت ۴.۰ مطرح شده است.
در حالیکه صنعت ۴.۰ تمرکز خود را بر اتوماسیون، اینترنت اشیا، دادههای بزرگ و هوش مصنوعی قرار داده بود، در صنعت ۵.۰ محور اصلی همکاری انسان و ماشین است.
---
⚙️ ویژگیهای کلیدی صنعت ۵.۰:
1. 🤝 همافزایی انسان و ربات – رباتها و هوش مصنوعی کارهای تکراری و سنگین را انجام میدهند و انسانها بر خلاقیت و نوآوری تمرکز میکنند.
2. 🌍 پایداری و سبز بودن – توجه ویژه به انرژیهای تجدیدپذیر، کاهش ضایعات و تولید پایدار.
3. 👨🏭 شخصیسازی تولید – ساخت محصولات مطابق با نیاز و سلیقه هر فرد.
4. 🛡 تمرکز بر رفاه انسانی – بهبود کیفیت زندگی و شرایط کاری کارکنان در کنار بهرهوری.
5. 📡 فناوریهای کلیدی – ترکیب هوش مصنوعی، رباتیک پیشرفته، اینترنت صنعتی اشیا، واقعیت افزوده/مجازی و تحلیل دادههای پیشرفته.
---
🚀 تفاوت اصلی صنعت ۴.۰ و ۵.۰:
✳️ صنعت ۴.۰: تمرکز بر اتوماسیون کامل و دیجیتالیسازی کارخانهها.
✳️ صنعت ۵.۰: تمرکز بر ترکیب توان ماشینها با خلاقیت و هوش انسانی.
---
✨ به زبان ساده:
صنعت ۴.۰ بهدنبال کارخانههای هوشمند بود، اما صنعت ۵.۰ بهدنبال کارخانههای انسانمحور و پایدار است.
@rss_ai_ir
#صنعت۵_۰ #کارخانه_هوشمند #هوش_مصنوعی #رباتیک
🥰15❤13😁11👍8🔥6👏6🎉4
Media is too big
VIEW IN TELEGRAM
🤖 در مسابقات جهانی رباتهای انساننما، تیم Unitree در رقابت ۱۰۰ متر با مانع موفق شد هر سه مدال را از آن خود کند! 🥇🥈🥉
🔥 این موفقیت نشاندهندهی سرعت بالای پیشرفت رباتهای نسل جدید در تحرک و چابکی است.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Unitree #روبات #AI
🔥 این موفقیت نشاندهندهی سرعت بالای پیشرفت رباتهای نسل جدید در تحرک و چابکی است.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Unitree #روبات #AI
😁13👍9🎉8❤7👏7🔥6🥰5
📈 حباب یا تحول واقعی؟
🔹 سم آلتمن، مدیرعامل OpenAI، بهتازگی گفت ممکنه هوش مصنوعی هم درگیر یک حباب سرمایهگذاری شده باشه — درست مثل داتکامهای دهه ۹۰ میلادی. اون زمان بورس نزدک در کمتر از دو سال تقریباً ۸۰٪ سقوط کرد و خیلی از شرکتها هیچوقت به سوددهی نرسیدن.
🧩 به گفته آلتمن:
«حباب وقتی شکل میگیره که آدمهای باهوش بیشازحد مجذوب یک ایده خوب میشن. آیا الان در فاز هیجانزدگی بیشازحد نسبت به AI هستیم؟ بهنظرم بله. اما آیا AI همچنان بزرگترین اتفاق تاریخ معاصر به حساب میاد؟ بهنظرم باز هم بله.»
📊 طبق گزارش تورستن اسلوک (اقتصاددان مشهور والاستریت)، اگر واقعا حبابی باشه، همین حالا هم از حباب اینترنتی بزرگتره. نسبت قیمت به سود مورد انتظار (Forward P/E) برای ۱۰ شرکت برتر AI امروز خیلی بالاتره از اوج داتکامها. (نمودار بالا)
🤔 حالا سؤال: اگر واقعا در دل یک حبابیم، کدوم استارتاپها میتونن بعد از ترکیدن حباب هم زنده بمونن؟
@rss_ai_ir
#هوش_مصنوعی #اقتصاد #استارتاپ #سرمایهگذاری #بازارهای_مالی
🔹 سم آلتمن، مدیرعامل OpenAI، بهتازگی گفت ممکنه هوش مصنوعی هم درگیر یک حباب سرمایهگذاری شده باشه — درست مثل داتکامهای دهه ۹۰ میلادی. اون زمان بورس نزدک در کمتر از دو سال تقریباً ۸۰٪ سقوط کرد و خیلی از شرکتها هیچوقت به سوددهی نرسیدن.
🧩 به گفته آلتمن:
«حباب وقتی شکل میگیره که آدمهای باهوش بیشازحد مجذوب یک ایده خوب میشن. آیا الان در فاز هیجانزدگی بیشازحد نسبت به AI هستیم؟ بهنظرم بله. اما آیا AI همچنان بزرگترین اتفاق تاریخ معاصر به حساب میاد؟ بهنظرم باز هم بله.»
📊 طبق گزارش تورستن اسلوک (اقتصاددان مشهور والاستریت)، اگر واقعا حبابی باشه، همین حالا هم از حباب اینترنتی بزرگتره. نسبت قیمت به سود مورد انتظار (Forward P/E) برای ۱۰ شرکت برتر AI امروز خیلی بالاتره از اوج داتکامها. (نمودار بالا)
🤔 حالا سؤال: اگر واقعا در دل یک حبابیم، کدوم استارتاپها میتونن بعد از ترکیدن حباب هم زنده بمونن؟
@rss_ai_ir
#هوش_مصنوعی #اقتصاد #استارتاپ #سرمایهگذاری #بازارهای_مالی
🔥9👍7👏7❤6🥰5🎉5😁2
🧠✨ یک نکته مهم در شبکههای عصبی گرافی (GNN)
در GNNها، یکی از چالشهای اساسی پدیدهی over-smoothing است. یعنی وقتی تعداد لایهها زیاد میشود، بردارهای ویژگی نودها به مرور شبیه هم میشوند و گراف اطلاعات تمایزی خود را از دست میدهد.
🔹 چرا این اتفاق میافتد؟
چون در هر لایه، گرهها ویژگیهای همسایههایشان را جمع میکنند. اگر این کار چندین بار تکرار شود، همه گرهها به سمت یک نمایش یکنواخت همگرا میشوند.
🔹 راهکارها:
1. استفاده از residual connections یا skip connections برای حفظ اطلاعات اولیه.
2. بهکارگیری attention mechanisms (مثل GAT) تا وزن همسایهها یکسان نباشد.
3. محدود کردن عمق شبکه و استفاده از shallow GNN همراه با تکنیکهای regularization.
4. استفاده از روشهای جدید مثل GraphSAGE یا Jumping Knowledge Networks.
📌 پس اگر دیدید مدلتان با افزایش لایهها به جای بهبود، دچار افت عملکرد میشود، احتمالاً با over-smoothing طرف هستید.
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #GraphNeuralNetwork #یادگیری_عمیق
در GNNها، یکی از چالشهای اساسی پدیدهی over-smoothing است. یعنی وقتی تعداد لایهها زیاد میشود، بردارهای ویژگی نودها به مرور شبیه هم میشوند و گراف اطلاعات تمایزی خود را از دست میدهد.
🔹 چرا این اتفاق میافتد؟
چون در هر لایه، گرهها ویژگیهای همسایههایشان را جمع میکنند. اگر این کار چندین بار تکرار شود، همه گرهها به سمت یک نمایش یکنواخت همگرا میشوند.
🔹 راهکارها:
1. استفاده از residual connections یا skip connections برای حفظ اطلاعات اولیه.
2. بهکارگیری attention mechanisms (مثل GAT) تا وزن همسایهها یکسان نباشد.
3. محدود کردن عمق شبکه و استفاده از shallow GNN همراه با تکنیکهای regularization.
4. استفاده از روشهای جدید مثل GraphSAGE یا Jumping Knowledge Networks.
📌 پس اگر دیدید مدلتان با افزایش لایهها به جای بهبود، دچار افت عملکرد میشود، احتمالاً با over-smoothing طرف هستید.
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #GraphNeuralNetwork #یادگیری_عمیق
🥰7😁7🎉7❤5👍5👏5🔥3