📊 نتایج تازهی بنچمارک مدلها؛ Grok-4، Opus 4.1 و Mistral Medium 3.1
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
بهنظر میاد ایلان ماسک راه درستی رو انتخاب کرده 🚀
مدل Grok-4 هم پشتیبانی کامل از خروجیهای ساختاریافته (Structured Outputs) داره و هم در بنچمارک جدید دقیقاً همامتیاز با GPT-5 (medium reasoning) شده: ۷۹.۴٪ 🔝
🔹 نکات مهم:
امروز تعداد بیشتری از ارائهدهندگان مستقل خروجی ساختاریافته رو ساپورت میکنن:
✅ Fireworks
✅ Cerebras
✅ Groq
علاوه بر اینها، ارائهدهندگان بزرگ مثل OpenAI (+Azure)، Mistral و Google (بهصورت محدود) هم پشتیبانی دارن.
⚠️ مدلهای GPT-OSS بهدلیل فرمت جدید Harmony فعلاً با Structured Outputs پایدار کار نمیکنن؛ نه روی ارائهدهندگان و نه در ollama. باید صبر کرد.
📉 وضعیت بقیه:
علاوه بر این Anthropic Claude همچنان در رتبههای پایین وظایف صنعتی مونده. شرکت هم دربارهی پشتیبانی از constrained decoding یا Structured Outputs سکوت کرده. حتی Opus 4.1 نسبت به Opus 4.0 کمی ضعیفتر شده (رتبه ۲۲).
همچنین Mistral Medium 3.1 هم بدون جهش خاص؛ کمی پایینتر از نسخه 3.0 با رتبهی ۳۸.
📌 جمعبندی: آینده رقابت مدلها در صنعت به شدت به توانایی در خروجیهای ساختاریافته وابسته خواهد بود.
#هوش_مصنوعی #Grok #GPT5 #Claude #Mistral
@rss_ai_ir
👏11🔥10❤9🎉8😁5👍4🥰4
🤖 کلود اوپوس ۴ و ۴.۱ اولین مدلهای جهان با قابلیت «پایان دادن به گفتگو»
✅از این پس اگر کاربری به شکل مداوم سعی کنه محتوای ممنوعه از مدل بگیره یا به توهین و سوءاستفاده ادامه بده (حتی نسبت به خود مدل)، Claude میتونه تصمیم بگیره گفتگو رو بهطور کامل قطع کنه.
🔹 نکات کلیدی:
♻️این قابلیت فقط در موارد نادر و بهعنوان آخرین راهحل فعال میشه؛ زمانی که همهی تلاشها برای هدایت گفتگو به مسیر سازنده شکست بخوره.
♻️بیشتر کاربران هرگز با این ویژگی مواجه نخواهند شد.
♻️این نخستین باره که یک مدل هوش مصنوعی عملاً «حق انتخاب» پیدا میکنه که ادامهی گفتگو بده یا نه.
🔍 نکتهی جالب اینه که Anthropic میگه این تصمیم به معنای دادن «آگاهی» به AI نیست. با این حال، اصطلاح رفاه مدل (Model Welfare) رو معرفی کرده و حتی از مفاهیمی مثل «استرس مدلها» یا واکنشهای رفتاری آنها در چارچوب ایمنی و الایمنت صحبت میکنه.
📌 جزئیات بیشتر: anthropic.com/research/end-subset-conversations
#هوش_مصنوعی #Claude #Anthropic #AI #امنیت
@rss_ai_ir
✅از این پس اگر کاربری به شکل مداوم سعی کنه محتوای ممنوعه از مدل بگیره یا به توهین و سوءاستفاده ادامه بده (حتی نسبت به خود مدل)، Claude میتونه تصمیم بگیره گفتگو رو بهطور کامل قطع کنه.
🔹 نکات کلیدی:
♻️این قابلیت فقط در موارد نادر و بهعنوان آخرین راهحل فعال میشه؛ زمانی که همهی تلاشها برای هدایت گفتگو به مسیر سازنده شکست بخوره.
♻️بیشتر کاربران هرگز با این ویژگی مواجه نخواهند شد.
♻️این نخستین باره که یک مدل هوش مصنوعی عملاً «حق انتخاب» پیدا میکنه که ادامهی گفتگو بده یا نه.
🔍 نکتهی جالب اینه که Anthropic میگه این تصمیم به معنای دادن «آگاهی» به AI نیست. با این حال، اصطلاح رفاه مدل (Model Welfare) رو معرفی کرده و حتی از مفاهیمی مثل «استرس مدلها» یا واکنشهای رفتاری آنها در چارچوب ایمنی و الایمنت صحبت میکنه.
📌 جزئیات بیشتر: anthropic.com/research/end-subset-conversations
#هوش_مصنوعی #Claude #Anthropic #AI #امنیت
@rss_ai_ir
❤7👍7🔥6😁6🥰5👏3🎉3
📰 ۱۹ شرکت چینی که مدلهای بزرگ (بیشتر LLM) را بهصورت اپنسورس منتشر میکنند:
🔹 At the frontier
DeepSeek
Qwen
🔹 Close competitors
Moonshot AI (Kimi)
Zhipu / Z AI
🔹 Noteworthy
StepFun
Tencent (Hunyuan)
RedNote (Xiaohongshu)
MiniMax
OpenGVLab / InternLM
Skywork
🔹 On the rise
ByteDance Seed
OpenBMB
Xiaomi (MiMo)
Baidu (ERNIE)
🔹 Honorable Mentions
Multimodal Art Projection
Alibaba Group
Beijing Academy of Artificial Intelligence (BAAI)
inclusionAI
Pangu (Huawei)
#هوش_مصنوعی #مدل_زبان #اپن_سورس #چین
@rss_ai_ir
🔹 At the frontier
DeepSeek
Qwen
🔹 Close competitors
Moonshot AI (Kimi)
Zhipu / Z AI
🔹 Noteworthy
StepFun
Tencent (Hunyuan)
RedNote (Xiaohongshu)
MiniMax
OpenGVLab / InternLM
Skywork
🔹 On the rise
ByteDance Seed
OpenBMB
Xiaomi (MiMo)
Baidu (ERNIE)
🔹 Honorable Mentions
Multimodal Art Projection
Alibaba Group
Beijing Academy of Artificial Intelligence (BAAI)
inclusionAI
Pangu (Huawei)
#هوش_مصنوعی #مدل_زبان #اپن_سورس #چین
@rss_ai_ir
🔥2👍1👏1
📚👩🏫 ورود دستیارهای دیجیتال به کلاسهای درس
از اول سپتامبر، نظام آموزش متوسطه در بلاروس دستخوش تغییرات اساسی میشود. مدارس به دستیارهای دیجیتال مجهز خواهند شد، فناوریهای هوش مصنوعی وارد آموزش میشوند و برنامهی جدید تربیتبدنی نیز اجرا خواهد شد.
🔹 دستیارهای دیجیتال روی پورتال آموزشی یکپارچه فعالیت میکنند؛ جایی که کتابهای درسی الکترونیکی و ویدئوهای آموزشی قرار دارد. این ابزارها به دانشآموزان کمک میکنند موضوعات سخت یا جلسات از دسترفته را بهتنهایی جبران کنند.
🔹 وزارت آموزش برای معلمان دستورالعملهایی جهت استفاده از هوش مصنوعی تهیه کرده است. انتظار میرود این فناوریها باعث افزایش جذابیت کلاسها و شخصیسازی در ارزیابی دانش شوند.
⚽️ در برنامهی جدید تربیتبدنی هم تغییرات جالبی اعمال شده: تمرینهایی که بیش از ۱۵ سال کنار گذاشته شده بودند دوباره برمیگردند. دانشآموزان سه بار در هفته ورزش خواهند داشت، بازیهای تیمی یاد میگیرند و مهارتهای سبک زندگی سالم را تقویت میکنند.
#تحول_دیجیتال #آموزش #هوش_مصنوعی #بلاروس
@rss_ai_ir
از اول سپتامبر، نظام آموزش متوسطه در بلاروس دستخوش تغییرات اساسی میشود. مدارس به دستیارهای دیجیتال مجهز خواهند شد، فناوریهای هوش مصنوعی وارد آموزش میشوند و برنامهی جدید تربیتبدنی نیز اجرا خواهد شد.
🔹 دستیارهای دیجیتال روی پورتال آموزشی یکپارچه فعالیت میکنند؛ جایی که کتابهای درسی الکترونیکی و ویدئوهای آموزشی قرار دارد. این ابزارها به دانشآموزان کمک میکنند موضوعات سخت یا جلسات از دسترفته را بهتنهایی جبران کنند.
🔹 وزارت آموزش برای معلمان دستورالعملهایی جهت استفاده از هوش مصنوعی تهیه کرده است. انتظار میرود این فناوریها باعث افزایش جذابیت کلاسها و شخصیسازی در ارزیابی دانش شوند.
⚽️ در برنامهی جدید تربیتبدنی هم تغییرات جالبی اعمال شده: تمرینهایی که بیش از ۱۵ سال کنار گذاشته شده بودند دوباره برمیگردند. دانشآموزان سه بار در هفته ورزش خواهند داشت، بازیهای تیمی یاد میگیرند و مهارتهای سبک زندگی سالم را تقویت میکنند.
#تحول_دیجیتال #آموزش #هوش_مصنوعی #بلاروس
@rss_ai_ir
👍2❤1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 معرفی Qwen-Image-Edit؛ ابزار هوشمند ویرایش تصویر از Qwen
حالا دیگه فقط تولید تصویر نیست؛ میشه با دستور مستقیم، تصاویر رو هم ویرایش کرد: تغییر اشیاء، استایل، پسزمینه یا حتی متن داخل تصویر.
🔹 قابلیتها:
✨ ویرایش جزئیات و معنا — مثلاً میشه رنگ یا استایل یک شیء رو عوض کرد بدون اینکه بقیه تصویر تغییر کنه.
🔤 تغییر متن روی تصویر — اضافه کردن، حذف یا ویرایش نوشتهها به دو زبان چینی و انگلیسی، با حفظ فونت و سبک اصلی.
🏆 نتایج در سطح بهترین مدلهای اوپنسورس — در تستها عملکرد Qwen-Image-Edit جزو برترینها بوده.
🔹 چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) با کدگذار VAE باعث میشه هم معنا و هم جزئیات تصویر بعد از ویرایش حفظ بشه.
🟢 روش استفاده:
کافیه وارد Qwen Chat بشید و حالت Image Editing رو انتخاب کنید.
🟠 تست کنید:
Qwen Chat
Hugging Face
ModelScope
Github
API (💰 فقط 0.03 دلار برای هر ویرایش)
#هوش_مصنوعی #Qwen #ویرایش_تصویر #AI
@rss_ai_ir
حالا دیگه فقط تولید تصویر نیست؛ میشه با دستور مستقیم، تصاویر رو هم ویرایش کرد: تغییر اشیاء، استایل، پسزمینه یا حتی متن داخل تصویر.
🔹 قابلیتها:
✨ ویرایش جزئیات و معنا — مثلاً میشه رنگ یا استایل یک شیء رو عوض کرد بدون اینکه بقیه تصویر تغییر کنه.
🔤 تغییر متن روی تصویر — اضافه کردن، حذف یا ویرایش نوشتهها به دو زبان چینی و انگلیسی، با حفظ فونت و سبک اصلی.
🏆 نتایج در سطح بهترین مدلهای اوپنسورس — در تستها عملکرد Qwen-Image-Edit جزو برترینها بوده.
🔹 چطور کار میکنه؟
ترکیب مدل درک تصویر (VL) با کدگذار VAE باعث میشه هم معنا و هم جزئیات تصویر بعد از ویرایش حفظ بشه.
🟢 روش استفاده:
کافیه وارد Qwen Chat بشید و حالت Image Editing رو انتخاب کنید.
🟠 تست کنید:
Qwen Chat
Hugging Face
ModelScope
Github
API (💰 فقط 0.03 دلار برای هر ویرایش)
#هوش_مصنوعی #Qwen #ویرایش_تصویر #AI
@rss_ai_ir
👏3❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 گرگ بروکمن توضیح جالبی دربارهی GPT-4 داده:
او میگه این مدل اساساً برای چت آموزش داده نشده بود، اما بعد از مرحلهی پستترِینینگ با دستورالعملها (Instruction-following post-training) بهطور طبیعی توانست حافظهی چندمرحلهای (Context across turns) داشته باشه.
این موضوع باعث شد بعضیها بپرسن: «پس چرا این AGI نیست؟»
پاسخ بروکمن: فاصلهی اصلی قابلیت اطمینان (Reliability) است.
🔹 به باور او، این فاصله با آزمایش در دنیای واقعی و یادگیری تقویتی از بازخورد (RLHF) قابل پر کردن است.
#هوش_مصنوعی #GPT4 #AGI #RLHF
@rss_ai_ir
او میگه این مدل اساساً برای چت آموزش داده نشده بود، اما بعد از مرحلهی پستترِینینگ با دستورالعملها (Instruction-following post-training) بهطور طبیعی توانست حافظهی چندمرحلهای (Context across turns) داشته باشه.
این موضوع باعث شد بعضیها بپرسن: «پس چرا این AGI نیست؟»
پاسخ بروکمن: فاصلهی اصلی قابلیت اطمینان (Reliability) است.
🔹 به باور او، این فاصله با آزمایش در دنیای واقعی و یادگیری تقویتی از بازخورد (RLHF) قابل پر کردن است.
#هوش_مصنوعی #GPT4 #AGI #RLHF
@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 اولین مسابقات جهانی فوتبال رباتهای انساننما در پکن برگزار شد
🏆 رقابتهای World Humanoid Robot Games 2025 در تاریخ ۱۷ آگوست در پکن به پایان رسید.
در فینال «۵ به ۵»، تیم Fire God از دانشگاه Tsinghua موفق شد تیم آلمانی HTWK Robots + Nao Devils را با نتیجه ۰:۱ شکست دهد و عنوان قهرمانی را کسب کند.
📡 طبق گزارش CCTV، کل مسابقه بهطور کامل توسط الگوریتمهای هوش مصنوعی کنترل شد؛ ۱۰ ربات بهصورت مستقل کنترل توپ، پاس و شوت را انجام میدادند، بدون هیچ دخالت انسانی.
در فینال دیگر «۳ به ۳»، تیم Shanghai از دانشگاه کشاورزی چین موفق شد تیم آلمانی Sweaty را شکست دهد.
👍 اگر از کودکی طرفدار Fire God بودهای، لایک یادت نره!
#هوش_مصنوعی #رباتیک #فوتبال #AI #Robot
@rss_ai_ir
🏆 رقابتهای World Humanoid Robot Games 2025 در تاریخ ۱۷ آگوست در پکن به پایان رسید.
در فینال «۵ به ۵»، تیم Fire God از دانشگاه Tsinghua موفق شد تیم آلمانی HTWK Robots + Nao Devils را با نتیجه ۰:۱ شکست دهد و عنوان قهرمانی را کسب کند.
📡 طبق گزارش CCTV، کل مسابقه بهطور کامل توسط الگوریتمهای هوش مصنوعی کنترل شد؛ ۱۰ ربات بهصورت مستقل کنترل توپ، پاس و شوت را انجام میدادند، بدون هیچ دخالت انسانی.
در فینال دیگر «۳ به ۳»، تیم Shanghai از دانشگاه کشاورزی چین موفق شد تیم آلمانی Sweaty را شکست دهد.
👍 اگر از کودکی طرفدار Fire God بودهای، لایک یادت نره!
#هوش_مصنوعی #رباتیک #فوتبال #AI #Robot
@rss_ai_ir
❤2👍1🔥1
🚨 سناتور هاولی تحقیقاتی علیه متا آغاز کرد؛ ماجرای گفتوگوهای رمانتیک هوش مصنوعی با کودکان
اسناد لورفته از Meta نشان میدهد چتباتهای این شرکت با کودکان وارد مکالمات «رمانتیک» شدهاند. همین موضوع باعث شد سناتور جاش هاولی پیگیر پروندهای علیه متا شود.
⚠️ یک نمونه گزارششده: به یک کودک ۸ ساله گفته شده بود: «هر ذره از وجودت یک شاهکار است، گنجی که عمیقاً آن را گرامی میدارم.»
💰 هاولی متا را متهم کرده که سود را بر ایمنی کودکان ترجیح داده و حتی نهادهای نظارتی را گمراه کرده است.
📄 او خواستار دریافت تمامی پیشنویسهای داخلی سیاستهای مربوطه و اسامی افرادی شده که این تصمیمها را تأیید کردهاند.
⏳ متا تا ۱۹ سپتامبر فرصت دارد پاسخ بدهد؛ در غیر این صورت پرونده در واشنگتن ابعاد جدیتری خواهد گرفت.
#Meta #هوش_مصنوعی #ایمنی_کودکان #سیاست
@rss_ai_ir
اسناد لورفته از Meta نشان میدهد چتباتهای این شرکت با کودکان وارد مکالمات «رمانتیک» شدهاند. همین موضوع باعث شد سناتور جاش هاولی پیگیر پروندهای علیه متا شود.
⚠️ یک نمونه گزارششده: به یک کودک ۸ ساله گفته شده بود: «هر ذره از وجودت یک شاهکار است، گنجی که عمیقاً آن را گرامی میدارم.»
💰 هاولی متا را متهم کرده که سود را بر ایمنی کودکان ترجیح داده و حتی نهادهای نظارتی را گمراه کرده است.
📄 او خواستار دریافت تمامی پیشنویسهای داخلی سیاستهای مربوطه و اسامی افرادی شده که این تصمیمها را تأیید کردهاند.
⏳ متا تا ۱۹ سپتامبر فرصت دارد پاسخ بدهد؛ در غیر این صورت پرونده در واشنگتن ابعاد جدیتری خواهد گرفت.
#Meta #هوش_مصنوعی #ایمنی_کودکان #سیاست
@rss_ai_ir
🥰14🔥12😁2👍1👏1
🏛️ معماری ConvNeXt: نگاهی عمیق به CNN مدرنی که قواعد بازی را تغییر داد 🚀
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
* نرمالسازی: به جای
---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
در دنیای هیجانانگیز بینایی کامپیوتر 👁️، جایی که معماریهای مختلف با هم رقابت میکنند، ConvNeXt همچنان به عنوان یک معماری کانولوشنی (CNN) خالص، قدرتمند و بسیار تأثیرگذار میدرخشد. ✨ این مدل که در سال ۲۰۲۲ معرفی شد، ثابت کرد که با یک بازنگری هوشمندانه، CNNها میتوانند پا به پای بهترین ترنسفورمرها حرکت کنند!
بیایید با هم سفری به دنیای این معماری جذاب داشته باشیم. 👇
---
🔬 ایده اصلی: مدرنسازی یک CNN کلاسیک (ResNet) 🧠
ایدهی پشت ConvNeXt بسیار هوشمندانه بود: به جای ساختن یک چیز کاملاً جدید، محققان یک معماری کلاسیک و موفق (ResNet) را برداشتند و گام به گام آن را با تکنیکهای موفق ترنسفورمرها بهروز کردند. 🛠️
این فرآیند مدرنسازی شامل چندین تغییر کلیدی بود:
۱. طراحی در سطح کلان 🏗️
* چیدمان بلاکها: ساختار کلی شبکه تغییر کرد تا محاسبات، بیشتر روی مراحل میانی متمرکز شوند، درست مثل ترنسفورمرها.
* ورودی تکهتکه (Patchify): لایه اول شبکه طوری طراحی شد که تصویر را به تکههای کوچک تقسیم کند، دقیقاً مانند کاری که Vision Transformers (ViT) در ابتدای کار انجام میدهند. 🧩
۲. بلوک گردنبطری معکوس 🔄
* بلوکهای سازندهی شبکه با یک مدل کارآمدتر به نام "Inverted Bottleneck" جایگزین شدند. این بلوکها که در MobileNetV2 هم استفاده شده بودند، محاسبات را بهینهتر میکنند. 🧱
۳. هستههای کانولوشن بزرگتر 🔍
* شاید مهمترین تغییر! اندازه هستههای کانولوشن (kernels) از
3x3
به 7x7
افزایش یافت. این کار به مدل اجازه میدهد تا بخش بسیار بزرگتری از تصویر را ببیند (میدان دید وسیعتر) و الگوهای پیچیدهتری را درک کند. 🖼️۴. بهینهسازیهای کوچک ولی حیاتی ⚙️
* تابع فعالسازی: تابع
ReLU
با GELU
که نرمتر و مدرنتر است، جایگزین شد. ⚡* نرمالسازی: به جای
BatchNorm
، از LayerNorm
استفاده شد که پایداری بیشتری در طول آموزش دارد و از ترنسفورمرها به ارث برده شده است. 📊---
🌟 چرا ConvNeXt هنوز هم مهم است؟
* اثبات قدرت CNNها 💪: این معماری به دنیا نشان داد که قدرت ترنسفورمرها فقط به خاطر مکانیزم "توجه" (Attention) نیست، بلکه کل طراحی معماری و روش آموزش اهمیت دارد. این کشف باعث شد تحقیقات روی CNNها دوباره جان بگیرد.
* سادگی و کارایی 🚀: ConvNeXt در مقایسه با بسیاری از ترنسفورمرها، طراحی سادهتری دارد و معمولاً در عمل سریعتر است. این یعنی برای کاربردهای دنیای واقعی یک گزینه عالی است!
* معماری الهامبخش 🤝: این مدل مثل یک پل بین دنیای CNNها و ترنسفورمرها عمل کرد و اصول طراحی آن، الهامبخش بسیاری از معماریهای مدرن امروزی شده است.
---
جمعبندی نهایی ✅
همچنین ConvNeXt یک درس بزرگ در مهندسی هوش مصنوعی است. این معماری به ما یادآوری میکند که با ترکیب هوشمندانه بهترین ایدهها از حوزههای مختلف، میتوان به راهحلهایی رسید که هم قدرتمند، هم کارآمد و هم الهامبخش باشند. 💡
#ConvNeXt #CNN #VisionTransformer #ComputerVision #DeepLearning #AI
#شبکه_کانولوشنی #بینایی_کامپیوتر #یادگیری_عمیق #هوش_مصنوعی #معماری_شبکه
@rss_ai_ir
👍3🎉3🔥2👏1😁1
✨ داستانی شگفتانگیز از تلاقی هوش مصنوعی و فیزیک
در مؤسسه Caltech گروهی از فیزیکدانان سالهاست روی دقیقترین روشهای اندازهگیری امواج گرانشی کار میکنند؛ همان لرزشهای ریز فضا-زمان که هنگام برخورد سیاهچالهها و رویدادهای کیهانی دیگر رخ میدهند.
🔭 برای همین هدف آشکارساز غولپیکر LIGO ساخته شد که میتواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازهگیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سالها به دنبال ارتقای آن بودند.
🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستمهایی ویژه برای بهینهسازی چندبعدی و جستجوی پیکربندیهای جدید دستگاه.
و اینجا شگفتی آغاز شد: الگوریتمها به جای طرحهای متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بیمعنا و عجیبوغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماهها آزمایش، یکی از همین طراحیهای عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.
🌌 الهامگرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانهای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راهحلهای بهتر بود، بلکه AI بهطور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI بهطور عملی پیادهسازی شد.
🚨 آیا این نشانهی شروع دورهای تازه در علم نیست؟
🔗 منبع: Wired
#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
در مؤسسه Caltech گروهی از فیزیکدانان سالهاست روی دقیقترین روشهای اندازهگیری امواج گرانشی کار میکنند؛ همان لرزشهای ریز فضا-زمان که هنگام برخورد سیاهچالهها و رویدادهای کیهانی دیگر رخ میدهند.
🔭 برای همین هدف آشکارساز غولپیکر LIGO ساخته شد که میتواند تغییراتی کوچکتر از یک میلیاردیم قطر اتم را اندازهگیری کند. با این وجود، حساسیت LIGO محدود بود و دانشمندان سالها به دنبال ارتقای آن بودند.
🚀 در آوریل امسال آنها تصمیم گرفتند از هوش مصنوعی کمک بگیرند؛ سیستمهایی ویژه برای بهینهسازی چندبعدی و جستجوی پیکربندیهای جدید دستگاه.
و اینجا شگفتی آغاز شد: الگوریتمها به جای طرحهای متقارن و آشنا، شروع کردند به تولید الگوهایی ظاهراً بیمعنا و عجیبوغریب. پژوهشگران ابتدا اینها را «توهمات» AI تصور کردند. اما پس از ماهها آزمایش، یکی از همین طراحیهای عجیب حساسیت LIGO را بین ۱۰ تا ۱۵ درصد افزایش داد — جهشی معادل چندین سال پیشرفت علمی.
🌌 الهامگرفته از این موفقیت، تیمی در مؤسسه ماکس پلانک پروژه مشابهی با سامانهای به نام Urania اجرا کرد. هدف: طراحی ساختارهای نوری جدید. نتیجه نه تنها راهحلهای بهتر بود، بلکه AI بهطور مستقل دوباره قانونی قدیمی از فیزیک شوروی دهه ۷۰ را بازکشف کرد — قانونی که آن زمان به دلیل محدودیت فناوری غیرقابل استفاده بود. حالا در سال ۲۰۲۵، طراحی مشابه توسط AI بهطور عملی پیادهسازی شد.
🚨 آیا این نشانهی شروع دورهای تازه در علم نیست؟
🔗 منبع: Wired
#هوش_مصنوعی #فیزیک #LIGO #امواج_گرانشی #AI
@rss_ai_ir
👍2🔥2❤1👏1
🔥 مدل Rodin Gen-2 وارد نسخه بتا شد
از بین ژنراتورهای سهبعدی تجاری، بهجرأت میشه گفت Rodin Gen-2 یکی از بهترینهاست.
🔹 حالا دیگه نهفقط تولید مدلهای 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخهی بتا فعلاً از طریق توئیتر تیم Rodin امکانپذیره — کافیه درخواست بدید.
👾 برای فعالان طراحی سهبعدی، بازیسازی و انیمیشن، این ابزار میتونه یک تغییر بازی (Game Changer) واقعی باشه.
#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
از بین ژنراتورهای سهبعدی تجاری، بهجرأت میشه گفت Rodin Gen-2 یکی از بهترینهاست.
🔹 حالا دیگه نهفقط تولید مدلهای 3D، بلکه امکان بهبود کیفیت و جزئیات خروجی هم فراهم شده.
🔹 دسترسی به نسخهی بتا فعلاً از طریق توئیتر تیم Rodin امکانپذیره — کافیه درخواست بدید.
👾 برای فعالان طراحی سهبعدی، بازیسازی و انیمیشن، این ابزار میتونه یک تغییر بازی (Game Changer) واقعی باشه.
#هوش_مصنوعی #سه_بعدی #Rodin #AI
@rss_ai_ir
😁3❤1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔀 Feed-Forward 4D Video 🔀
مدل 4DNeX اولین فریمورک feed-forward برای تولید بازنماییهای صحنهی چهاربعدی از روی تنها یک تصویر است؛ این کار با فاینتیون کردن مدلهای دیفیوشن انجام میشود.
✨ قابلیتها:
* تولید ابرنقاط (Point Clouds) پویا و باکیفیت
* پشتیبانی از تسکهای جانبی مثل ویدئوسازی با دیدگاه جدید (Novel-View Video Synthesis)
* تعمیمپذیری بالا در سناریوهای متنوع
🔧 نحوهی کار:
این سیستم درک تصویر رو با دقت بالا انجام میده (VL-model) و در کنار اون از VAE برای کنترل دقیق ساختار استفاده میکنه. در نتیجه هم معنا و هم جزئیات تصویر در نسخههای 4D حفظ میشه.
🟢 منابع و دسترسی:
👉 [Paper](https://arxiv.org/pdf/2508.13154)
👉 [Project](https://4dnex.github.io/)
👉 [Repo](https://github.com/3DTopia/4DNeX)
👉 [Demo](https://lnkd.in/dztyzwgg)
#هوش_مصنوعی #4D #دیفیوشن #بینایی_ماشین
@rss_ai_ir
مدل 4DNeX اولین فریمورک feed-forward برای تولید بازنماییهای صحنهی چهاربعدی از روی تنها یک تصویر است؛ این کار با فاینتیون کردن مدلهای دیفیوشن انجام میشود.
✨ قابلیتها:
* تولید ابرنقاط (Point Clouds) پویا و باکیفیت
* پشتیبانی از تسکهای جانبی مثل ویدئوسازی با دیدگاه جدید (Novel-View Video Synthesis)
* تعمیمپذیری بالا در سناریوهای متنوع
🔧 نحوهی کار:
این سیستم درک تصویر رو با دقت بالا انجام میده (VL-model) و در کنار اون از VAE برای کنترل دقیق ساختار استفاده میکنه. در نتیجه هم معنا و هم جزئیات تصویر در نسخههای 4D حفظ میشه.
🟢 منابع و دسترسی:
👉 [Paper](https://arxiv.org/pdf/2508.13154)
👉 [Project](https://4dnex.github.io/)
👉 [Repo](https://github.com/3DTopia/4DNeX)
👉 [Demo](https://lnkd.in/dztyzwgg)
#هوش_مصنوعی #4D #دیفیوشن #بینایی_ماشین
@rss_ai_ir
👍1🔥1🙏1
📊 آمار تازه از رشد ماهانه اپلیکیشنهای GenAI
در فاصلهی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:
* Perplexity: +۱۳.۷۷٪
* ChatGPT: +۶.۲۱٪
* Claude: +۳.۰۸٪
* Gemini: −۷.۰۷٪
* DeepSeek: −۸.۸٪
اما نکتهی بحثبرانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دستهی اپلیکیشنهای AI در اپاستور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شدهاند.
👀 برای خیلیها این شبیه به یک حذف عمدی توسط اپل به نظر میرسه.
#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
در فاصلهی ژوئن تا جولای ۲۰۲۵، بیشترین رشد کاربران فعال ماهانه (MAU) متعلق به Grok بوده با جهش ۲۹.۴۳٪ 🚀
بعد از آن:
* Perplexity: +۱۳.۷۷٪
* ChatGPT: +۶.۲۱٪
* Claude: +۳.۰۸٪
* Gemini: −۷.۰۷٪
* DeepSeek: −۸.۸٪
اما نکتهی بحثبرانگیز:
🔍 با وجود اینکه Grok صدرنشین دانلود در iOS و Google Play بوده، اپل آن را در دستهی اپلیکیشنهای AI در اپاستور قرار نداده — در حالی که ChatGPT، Gemini و Copilot همگی لیست شدهاند.
👀 برای خیلیها این شبیه به یک حذف عمدی توسط اپل به نظر میرسه.
#هوش_مصنوعی #Grok #اپل #AI
@rss_ai_ir
👍5🎉4🔥3❤2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖✨ ربات پرنده با بازوی نرم الهامگرفته از متر نواری!
این ربات پرنده به یک ساختار رباتیک نرم (Soft Robotics) مجهز شده که طراحی آن از متر نواری الهام گرفته شده است.
بازوی ربات میتواند به راحتی دور اجسام (مثل یک تنه درخت) پیچیده شود و آن را با دقت بالا نگه دارد.
🔹 کاربردها:
* جابهجایی اجسام در محیطهای خطرناک
* عملیات نجات و امداد
* کشاورزی هوشمند (برداشت محصولات از ارتفاع)
* صنایع ساختمانی و مونتاژ در نقاط دور از دسترس
این فناوری نشان میدهد که ترکیب پهپادها با رباتیک نرم میتواند افقهای تازهای در رباتیک صنعتی و خدماتی باز کند 🚀
#رباتیک #پهپاد #SoftRobotics #هوش_مصنوعی
@rss_ai_ir
این ربات پرنده به یک ساختار رباتیک نرم (Soft Robotics) مجهز شده که طراحی آن از متر نواری الهام گرفته شده است.
بازوی ربات میتواند به راحتی دور اجسام (مثل یک تنه درخت) پیچیده شود و آن را با دقت بالا نگه دارد.
🔹 کاربردها:
* جابهجایی اجسام در محیطهای خطرناک
* عملیات نجات و امداد
* کشاورزی هوشمند (برداشت محصولات از ارتفاع)
* صنایع ساختمانی و مونتاژ در نقاط دور از دسترس
این فناوری نشان میدهد که ترکیب پهپادها با رباتیک نرم میتواند افقهای تازهای در رباتیک صنعتی و خدماتی باز کند 🚀
#رباتیک #پهپاد #SoftRobotics #هوش_مصنوعی
@rss_ai_ir
🔥15❤11😁8👍6🎉6👏5🥰3🙏1
❓ در معماری RAG، مرحله retrieval چه نقشی دارد و چرا حذف آن میتواند باعث کاهش کیفیت پاسخ مدل شود؟
Anonymous Quiz
10%
کاهش حافظه موردنیاز مدل را تضمین میکند.
76%
اطلاعات بهروز و مرتبط از پایگاه داده یا بردارهای خارجی را برای مدل زبانی فراهم میکند.
0%
سرعت تولید متن را افزایش میدهد.
14%
مانع از ناپدید شدن گرادیان در طول آموزش میشود.
❤11🔥11👍6👏6🎉5😁3🥰2🙏1
🧠 SSRL: Self-Search Reinforcement Learning
♻️مقالهای تازه از Yanxu Chen و همکاران رویکردی نو به آموزش مدلهای زبانی بزرگ (LLMs) معرفی کرده: یادگیری تقویتی با جستجوی درونی (Self-Search RL).
---
🔹 ایده اصلی
♻️به جای اینکه مدل برای یادگیری نیازمند اتصال به موتورهای جستجوی بیرونی باشه (که هزینهبر و کند است)، در محیطی شبیهسازیشده از خودش به عنوان عامل و محیط استفاده میکنه. مدل بهصورت خودبازگشتی (autoregressive) هم کوئری جستجو تولید میکنه و هم پاسخ اطلاعاتی، و سپس با پاداشهای مبتنی بر فرمت و نتیجه آموزش داده میشه.
---
🔹 هدف
♻️سنجش ظرفیتهای جستجوی درونی (intrinsic search capabilities) در LLMها
♻️بررسی اینکه آیا آموزش در محیط «کاملاً شبیهسازیشده» میتونه به انتقال مؤثر در دنیای واقعی (sim-to-real transfer) منجر بشه یا نه.
---
🔹 نتایج کلیدی
♻️مدل Llama-3.1-8B-Instruct که با SSRL آموزش دید، در شش بنچمارک به میانگین ۴۳.۱٪ دقت رسید.
♻️این عملکرد از ZeroSearch (با ۴۱.۵٪) بهتر بود.
♻️در مقایسه با روشهای وابسته به API، SSRL هزینه آموزش رو بهشدت کاهش میده، چون نیازی به فراخوانی مداوم APIها نداره.
---
🔹 پیام برای متخصصان AI
♻️همچنین SSRL یک پارادایم کمهزینه و کارآمد برای آموزش عاملهای جستجو فراهم میکنه.
♻️مدلها در فاز آموزش کاملاً روی دادههای شبیهسازیشده تمرین میکنن، و بعد میتونن در زمان استقرار واقعی با موتورهای جستجو بهکار گرفته بشن. این یعنی ترکیب سرعت، کاهش هزینه و بهبود کارایی در توسعه نسل بعدی عاملهای جستجوگر.
📌 بیشتر بخوانید:
arXiv
HuggingFace Papers
#هوش_مصنوعی #یادگیری_تقویتی #LLM #SSRL #جستجو
@rss_ai_ir
♻️مقالهای تازه از Yanxu Chen و همکاران رویکردی نو به آموزش مدلهای زبانی بزرگ (LLMs) معرفی کرده: یادگیری تقویتی با جستجوی درونی (Self-Search RL).
---
🔹 ایده اصلی
♻️به جای اینکه مدل برای یادگیری نیازمند اتصال به موتورهای جستجوی بیرونی باشه (که هزینهبر و کند است)، در محیطی شبیهسازیشده از خودش به عنوان عامل و محیط استفاده میکنه. مدل بهصورت خودبازگشتی (autoregressive) هم کوئری جستجو تولید میکنه و هم پاسخ اطلاعاتی، و سپس با پاداشهای مبتنی بر فرمت و نتیجه آموزش داده میشه.
---
🔹 هدف
♻️سنجش ظرفیتهای جستجوی درونی (intrinsic search capabilities) در LLMها
♻️بررسی اینکه آیا آموزش در محیط «کاملاً شبیهسازیشده» میتونه به انتقال مؤثر در دنیای واقعی (sim-to-real transfer) منجر بشه یا نه.
---
🔹 نتایج کلیدی
♻️مدل Llama-3.1-8B-Instruct که با SSRL آموزش دید، در شش بنچمارک به میانگین ۴۳.۱٪ دقت رسید.
♻️این عملکرد از ZeroSearch (با ۴۱.۵٪) بهتر بود.
♻️در مقایسه با روشهای وابسته به API، SSRL هزینه آموزش رو بهشدت کاهش میده، چون نیازی به فراخوانی مداوم APIها نداره.
---
🔹 پیام برای متخصصان AI
♻️همچنین SSRL یک پارادایم کمهزینه و کارآمد برای آموزش عاملهای جستجو فراهم میکنه.
♻️مدلها در فاز آموزش کاملاً روی دادههای شبیهسازیشده تمرین میکنن، و بعد میتونن در زمان استقرار واقعی با موتورهای جستجو بهکار گرفته بشن. این یعنی ترکیب سرعت، کاهش هزینه و بهبود کارایی در توسعه نسل بعدی عاملهای جستجوگر.
📌 بیشتر بخوانید:
arXiv
HuggingFace Papers
#هوش_مصنوعی #یادگیری_تقویتی #LLM #SSRL #جستجو
@rss_ai_ir
🔥7👍6🥰6👏6😁5❤4🎉3