🌟 یک خبر تاریخی در دنیای AGI!
برای اولینبار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.
آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را بهصورت ترکیبی و هماهنگ کنار هم قرار میدهد تا توانایی reasoning آنها چند برابر شود.
۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.
⚠️ اما نکته مهم:
این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمهخصوصی (semi-private) احتمالاً امتیاز پایینتر خواهد شد.
با این حال، این پیشرفت شگفتانگیز است؛ چون:
♻️بهتنهایی Gemini 3 حدود ۴۵٪ میگیرد
♻️وGPT-5.1 فقط حدود ۲۰٪
♻️و تا چند ماه پیش بهترین مدلها ۱ تا ۲٪ بودند!
♻️اینکه ARC-AGI-2 عملاً غیرقابلحل بهنظر میرسید
اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.
لینکها:
🔗 بلاگپست
🔗 کد
#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
برای اولینبار یک سیستم هوش مصنوعی توانست روی ARC-AGI-2 عملکردی فراتر از انسان ثبت کند.
آزمایشگاه Poetiq روشی جدید طراحی کرده که در آن چند مدل LLM را بهصورت ترکیبی و هماهنگ کنار هم قرار میدهد تا توانایی reasoning آنها چند برابر شود.
۲۰ نوامبر، تیم اعلام کرد که ترکیب Gemini 3 + GPT-5.1 توانسته روی ARC-AGI-2 public eval رکوردی ثبت کند که از سطح انسانی بالاتر است.
⚠️ اما نکته مهم:
این نتیجه روی نسخه عمومی تست ثبت شده.
روی نسخه نیمهخصوصی (semi-private) احتمالاً امتیاز پایینتر خواهد شد.
با این حال، این پیشرفت شگفتانگیز است؛ چون:
♻️بهتنهایی Gemini 3 حدود ۴۵٪ میگیرد
♻️وGPT-5.1 فقط حدود ۲۰٪
♻️و تا چند ماه پیش بهترین مدلها ۱ تا ۲٪ بودند!
♻️اینکه ARC-AGI-2 عملاً غیرقابلحل بهنظر میرسید
اما حالا یک ترکیب هوشمندانه از چند مدل توانسته از مرز انسانی عبور کند.
لینکها:
🔗 بلاگپست
🔗 کد
#هوش_مصنوعی #AGI #ARC_AGI #Gemini3 #GPT5 #Poetiq #AI_research
👍3
⚡️ ارزیابی Anthropic از اثر کمکیارهای هوش مصنوعی بر بهرهوری واقعی
اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش میدهد — نه در تستهای آزمایشگاهی، بلکه در وظایف واقعی کاربران.
🔍 نتایج کلیدی
رشد بهرهوری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.
روش اندازهگیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصصها ↔️ زمان انجام همان کار در چت.
میانگین صرفهجویی زمانی: ۸۰٪ در هر کار.
بیشترین سود برای نقشهای با دستمزد بالا:
👨💻 توسعهدهندگان
⚖️ وکلا
👔 مدیران
کارهای پیچیدهی ۲ساعته بیشترین کاهش زمان را تجربه کردند.
مشاغل کمدرآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.
اعتبارسنجی با دادههای واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعهدهندگان انسانی.
⚠️ محدودیتها
فقط زمان داخل چت اندازهگیری شده.
اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.
بنابراین بهرهوری واقعی احتمالاً کمتر از عدد اعلامشده است.
📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains
#هوش_مصنوعی #Claude #Anthropic #بهرهوری #AI #اتوماسیون
اینکه Anthropic با تحلیل ۱۰۰ هزار دیالوگ واقعی با Claude تلاش کرده تخمین بزند که هوش مصنوعی در عمل چقدر زمان کار را کاهش میدهد — نه در تستهای آزمایشگاهی، بلکه در وظایف واقعی کاربران.
🔍 نتایج کلیدی
رشد بهرهوری بالقوه ۱.۸٪ سالانه — تقریباً دو برابر نرخ رشد اخیر آمریکا.
روش اندازهگیری: مقایسهٔ زمانِ معمول اجرای یک وظیفه توسط متخصصها ↔️ زمان انجام همان کار در چت.
میانگین صرفهجویی زمانی: ۸۰٪ در هر کار.
بیشترین سود برای نقشهای با دستمزد بالا:
👨💻 توسعهدهندگان
⚖️ وکلا
👔 مدیران
کارهای پیچیدهی ۲ساعته بیشترین کاهش زمان را تجربه کردند.
مشاغل کمدرآمد (لجستیک، خدمات، رستورانی) کمترین سود را دارند.
اعتبارسنجی با دادههای واقعی JIRA:
📌 همبستگی زمان تخمینی 0.44 — تقریباً برابر با همبستگی 0.50 توسعهدهندگان انسانی.
⚠️ محدودیتها
فقط زمان داخل چت اندازهگیری شده.
اثرات واقعی مثل بررسی خروجی، اصلاحات و انتقال به pipeline کاری — محاسبه نشده.
بنابراین بهرهوری واقعی احتمالاً کمتر از عدد اعلامشده است.
📎 لینک تحقیق:
https://www.anthropic.com/research/estimating-productivity-gains
#هوش_مصنوعی #Claude #Anthropic #بهرهوری #AI #اتوماسیون
👍1
⚡️ Qwen3-VL:
انتشار گزارش فنی نسل جدید مدلهای چندموداله ویژن–لنگویج
✅گزارش فنی (Tech Report) مدلهای Qwen3-VL منتشر شد؛ خانوادهای از VLMهایی که تصویر و متن را همزمان پردازش میکنند و در یک ماه گذشته رکوردشکنی کردهاند.
🔍 نکات کلیدی
سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.
مدل Qwen3-VL-8B بهتنهایی ۲ میلیون دانلود را رد کرده.
❌این خانواده ادامهدهندهی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.
📘 محتویات گزارش فنی
در این Tech Report توضیح داده شده:
معماری کامل vision–language در نسل Qwen3-VL
فرآیند آموزش:
• Pretraining
روی دادههای عظیم چندموداله
• و Post-training شامل alignment و RL
♻️منابع داده و روشهای دقیق فیلتر کردن دیتاست
♻️مقایسه با VLMهای رقیب روی دهها بنچمارک
♻️پیشرفتها در دقت، فهم بصری، OCR و ریاضیات تصویری
🔗 لینکها
PDF گزارش:
https://arxiv.org/pdf/2511.21631
ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ
#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
انتشار گزارش فنی نسل جدید مدلهای چندموداله ویژن–لنگویج
✅گزارش فنی (Tech Report) مدلهای Qwen3-VL منتشر شد؛ خانوادهای از VLMهایی که تصویر و متن را همزمان پردازش میکنند و در یک ماه گذشته رکوردشکنی کردهاند.
🔍 نکات کلیدی
سه مدل Qwen3-VL مجموعاً بیش از ۱ میلیون دانلود در یک ماه.
مدل Qwen3-VL-8B بهتنهایی ۲ میلیون دانلود را رد کرده.
❌این خانواده ادامهدهندهی مسیر موفق Qwen2.5-VL با بیش از ۲۸۰۰ استناد است.
📘 محتویات گزارش فنی
در این Tech Report توضیح داده شده:
معماری کامل vision–language در نسل Qwen3-VL
فرآیند آموزش:
• Pretraining
روی دادههای عظیم چندموداله
• و Post-training شامل alignment و RL
♻️منابع داده و روشهای دقیق فیلتر کردن دیتاست
♻️مقایسه با VLMهای رقیب روی دهها بنچمارک
♻️پیشرفتها در دقت، فهم بصری، OCR و ریاضیات تصویری
🔗 لینکها
PDF گزارش:
https://arxiv.org/pdf/2511.21631
ویدئوی معرفی رسمی:
https://www.youtube.com/watch?v=clwFmuJX_wQ
#Qwen #Qwen3 #QwenVL #Qwen3VL #LLM #AIModel
❤2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🇨🇳 چین و نسل جدید «مراقب درسخواندن» با هوش مصنوعی
در چین، والدین یک استفاده عجیبوغریب اما روبهگسترش از هوش مصنوعی پیدا کردهاند: ناظر لحظهای درسخواندن بچهها.
آنها اپ Doubao (محصول ByteDance) را باز میکنند، دوربین را به سمت کودک میگیرند و فقط یک دستور میدهند:
«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»
از همان لحظه، دستیار هوشمند کنترل را بهدست میگیرد و پشتسرهم اخطار میدهد:
🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»
یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلمهای علمیتخیلی میدیدیم.
📌 هشتگها
#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
در چین، والدین یک استفاده عجیبوغریب اما روبهگسترش از هوش مصنوعی پیدا کردهاند: ناظر لحظهای درسخواندن بچهها.
آنها اپ Doubao (محصول ByteDance) را باز میکنند، دوربین را به سمت کودک میگیرند و فقط یک دستور میدهند:
«دوباو، مراقبش باش. اگر حواسش پرت شد یا قوز کرد، تذکر بده.»
از همان لحظه، دستیار هوشمند کنترل را بهدست میگیرد و پشتسرهم اخطار میدهد:
🔸 «با خودکارت ور نرو.»
🔸 «روی تکلیف تمرکز کن.»
🔸 «صاف بنشین.»
🔸 «چرت نزن.»
🔸 «روی دستت تکیه نده.»
🔸 «خودکار را نجو.»
یک ناظر دیجیتالی کلاس درس؛ چیزی که تا چند سال پیش فقط در فیلمهای علمیتخیلی میدیدیم.
📌 هشتگها
#AI #China #Doubao #ByteDance #EducationTech #StudyMonitor #EdTech #AIinEducation
😁4🤣2❤1🤡1
🎨 راهنمای رسمیِ پرامپتنویسی FLUX.2
این مدل تازهنفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجیها دقیقتر و قابلکنترلتر میشوند:
🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپتهای JSON پشتیبانی میکند. یعنی میتوانید ترکیببندی، اشیا، رنگها، سبک و جزئیات صحنه را شفاف و خطبهخط مشخص کنید.
🔹 پشتیبانی از HEX برای رنگها
اگر رنگ دقیق میخواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت میکنید.
🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمیشود.
باید فقط بگویید چه میخواهید، نه چه نمیخواهید.
🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را میفهمد. همین باعث میشود خروجیها از نظر فرهنگی طبیعیتر باشند.
🔹 پشتیبانی از تنظیمات دوربین
برای کار فتورئال میتوانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.
https://docs.bfl.ai/guides/prompting_guide_flux2
#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
این مدل تازهنفس چندتا قاعدهٔ مهم دارد که اگر رعایت شوند، خروجیها دقیقتر و قابلکنترلتر میشوند:
🔹 پرامپت ساختاریافته با JSON
اینکه FLUX.2 از پرامپتهای JSON پشتیبانی میکند. یعنی میتوانید ترکیببندی، اشیا، رنگها، سبک و جزئیات صحنه را شفاف و خطبهخط مشخص کنید.
🔹 پشتیبانی از HEX برای رنگها
اگر رنگ دقیق میخواهید، مستقیم کد HEX بدهید.
مثلاً "#E91E63" دقیقاً همان رنگی است که دریافت میکنید.
🔹 بدون پرامپت منفی
این مدل «اجتناب»، «نباشد»، «نذار»، «بدون» و… را متوجه نمیشود.
باید فقط بگویید چه میخواهید، نه چه نمیخواهید.
🔹 پرامپت چندزبانه
پرامپت فارسی، انگلیسی یا هر زبان دیگری را میفهمد. همین باعث میشود خروجیها از نظر فرهنگی طبیعیتر باشند.
🔹 پشتیبانی از تنظیمات دوربین
برای کار فتورئال میتوانید مدل دوربین، لنز، فاصلهٔ کانونی و تنظیمات تصویربرداری را دقیق مشخص کنید.
https://docs.bfl.ai/guides/prompting_guide_flux2
#Flux2 #راهنمای_پرامپت #AI #تولید_تصویر
👍4🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 اسپلتهای مصنوعی؛ یک تکنیک خلاقانه برای شبیهسازی سهبعدی
یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:
1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیهسازی و رندر میشود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه میشود.
3️⃣ این ویدئو وارد Postshot میشود تا از آن یک Gaussian Splat سهبعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلاتشده که میتوانید در هر موتور یا ابزار سازگار با splats بهصورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.
⚡️ نتیجه چشمگیر است:
نهتنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سهبعدی سبک، تعاملی و قابلاستفاده در پروژههای گرافیکی و ریلتایم.
🔗 Embergen:
jangafx.com/software/embergen
🔗 Postshot:
jawset.com
@cgevent
یک روش جالب برای ساخت synthetic splats این روزها بین کاربران محبوب شده:
1️⃣ ابتدا انفجار یا افکت موردنظر داخل Embergen شبیهسازی و رندر میشود.
2️⃣ سپس از یک فریم ثابت، یک ویدئوی ۳۶۰ درجه (turntable) تهیه میشود.
3️⃣ این ویدئو وارد Postshot میشود تا از آن یک Gaussian Splat سهبعدی ساخته شود.
4️⃣ نتیجه؟
یک صحنه اسپلاتشده که میتوانید در هر موتور یا ابزار سازگار با splats بهصورت زنده و تعاملی بچرخانید—کاملاً خارج از محیط Embergen.
⚡️ نتیجه چشمگیر است:
نهتنها زیبا، بلکه یک ایده جذاب برای ساخت دیتاهای سهبعدی سبک، تعاملی و قابلاستفاده در پروژههای گرافیکی و ریلتایم.
🔗 Embergen:
jangafx.com/software/embergen
🔗 Postshot:
jawset.com
@cgevent
👍2🔥1👏1
🔥 نسل جدید «دانشمند هوش مصنوعی» از اندرو اَن (Andrew Ng) منتشر شد — همان استاد افسانهای استنفورد و همبنیانگذار Coursera.
این ابزار، یک AI محقق و داور سطح PhD است که میتواند کیفیت پژوهشهای شما را چند برابر کند.
🎓 چه کار میکند؟
• پایاننامه یا مقاله را در چند ثانیه مثل یک استاد سختگیر بررسی میکند
اشتباهات، ضعفها، منابع ناقص، استدلالهای سست و حتی ایرادات ساختاری را پیدا میکند.
• فکتها، ارجاعات و استانداردهای دانشگاهی را چک میکند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .
• مثل یک استاد واقعی رفتار میکند
نه تعریف بیخود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش میکشد.
• باعث میشود سریعتر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماهها منتظر داوری مجلات باشید.
🔗 لینک ابزار
https://paperreview.ai/
اگر کار پژوهشی دارید، پایاننامه مینویسید، یا دانشجوهای شما مقاله مینویسند — این ابزار واقعاً یک انقلاب است.
@rss_ai_ir
این ابزار، یک AI محقق و داور سطح PhD است که میتواند کیفیت پژوهشهای شما را چند برابر کند.
🎓 چه کار میکند؟
• پایاننامه یا مقاله را در چند ثانیه مثل یک استاد سختگیر بررسی میکند
اشتباهات، ضعفها، منابع ناقص، استدلالهای سست و حتی ایرادات ساختاری را پیدا میکند.
• فکتها، ارجاعات و استانداردهای دانشگاهی را چک میکند
طبق فرمت دانشگاه شما، APA, IEEE, MLA و … .
• مثل یک استاد واقعی رفتار میکند
نه تعریف بیخود، نه پاسخ سطحی — دقیقاً مثل یک پروفسور وسواسی که تا آخرین جمله را به چالش میکشد.
• باعث میشود سریعتر بنویسید، بهتر منتشر کنید و کمتر گرفتار اصلاحیه شوید
دیگر لازم نیست ماهها منتظر داوری مجلات باشید.
🔗 لینک ابزار
https://paperreview.ai/
اگر کار پژوهشی دارید، پایاننامه مینویسید، یا دانشجوهای شما مقاله مینویسند — این ابزار واقعاً یک انقلاب است.
@rss_ai_ir
👍2🔥2❤1
✔️ INTELLECT-3
مدلی تازه و قدرتمند از Prime Intellect که بهعنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحلهی SFT و RL مقیاسبالا آموزش دیده است.
🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.
🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیرههای طولانیِ اقدامات و وظایف مبتنی بر عاملها (Agents) طراحی شده، نه صرفاً تولید متن.
---
⭐️ ویژگیهای کلیدی
بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدلهایی با این اندازه
✅آموزش روی 512×H200 برای حدود ۲ ماه
استفاده از استک اختصاصی Prime Intellect شامل:
✳️PRIME-RL
✳️Verifiers
✳️Environments Hub
✳️زیرساخت sandbox برای اجرای امن
✳️کاملاً اوپنسورس: از مدل تا ابزارها و محیطها
---
📎 لینکهای مهم
🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf
🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3
🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl
🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers
🔸 Environments Hub
https://hub.primeintellect.ai
---
🏷 هشتگها
#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
مدلی تازه و قدرتمند از Prime Intellect که بهعنوان یک Mixture-of-Experts با اندازه ۱۰۶B معرفی شده است؛ مدلی که بر پایه GLM-4.5 Air ساخته شده و با دو مرحلهی SFT و RL مقیاسبالا آموزش دیده است.
🔥 نکته مهم این نسخه:
این اولین مدل در این ابعاد است که در آن یادگیری تقویتی غیرهمزمان (Asynchronous RL) نه یک آزمایش، بلکه ستون اصلی فرآیند آموزش است.
نتیجه؟
مدلی که در ریزنینگ، ریاضی و کدنویسی عملکردی فراتر از انتظار دارد.
🎯 تمرکز INTELLECT-3:
این مدل برای حل زنجیرههای طولانیِ اقدامات و وظایف مبتنی بر عاملها (Agents) طراحی شده، نه صرفاً تولید متن.
---
⭐️ ویژگیهای کلیدی
بهترین عملکرد در ریاضی، کدنویسی و استدلال در بین مدلهایی با این اندازه
✅آموزش روی 512×H200 برای حدود ۲ ماه
استفاده از استک اختصاصی Prime Intellect شامل:
✳️PRIME-RL
✳️Verifiers
✳️Environments Hub
✳️زیرساخت sandbox برای اجرای امن
✳️کاملاً اوپنسورس: از مدل تا ابزارها و محیطها
---
📎 لینکهای مهم
🔸 Technical Report
https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf
🔸 مدل در HuggingFace
https://huggingface.co/PrimeIntellect/INTELLECT-3
🔸 PRIME-RL Framework
https://github.com/PrimeIntellect-ai/prime-rl
🔸 Verifiers
https://github.com/PrimeIntellect-ai/verifiers
🔸 Environments Hub
https://hub.primeintellect.ai
---
🏷 هشتگها
#هوش_مصنوعی #یادگیری_عمیق #intellect3 #primeintellect #RL #موء #glm45 #مدل_بازمتن
🔥3❤2
🔥 مدل جدید Z-Image منتشر شد — نسل تازهی مدلهای سریع و سبک T2I
تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدلهای سنگینتر ارائه میدهد.
✨ ویژگیهای کلیدی Z-Image:
🚀 سرعت خارقالعاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی میسازد
⚡ کمتر از یک ثانیه تأخیر روی کارتهای H800
🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست
🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر
این مدل برای کسانی که سرعت، دقت و اجرای لوکال همزمان میخواهند— یک گزینهی جدی است.
🔗 دمو
https://modelscope.cn/aigc/imageGeneration
🔗 وِیتها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo
@rss_ai_ir
#AI #GenAI #Tongyi #TextToImage #Prompting #ML
تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدلهای سنگینتر ارائه میدهد.
✨ ویژگیهای کلیدی Z-Image:
🚀 سرعت خارقالعاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی میسازد
⚡ کمتر از یک ثانیه تأخیر روی کارتهای H800
🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست
🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر
این مدل برای کسانی که سرعت، دقت و اجرای لوکال همزمان میخواهند— یک گزینهی جدی است.
🔗 دمو
https://modelscope.cn/aigc/imageGeneration
🔗 وِیتها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo
@rss_ai_ir
#AI #GenAI #Tongyi #TextToImage #Prompting #ML
❤5🔥2👏1
🔥 بهترین راهنمای فاینتیونینگ که امسال در arXiv میبینید!
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering ✨
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
❤1👍1🔥1🥰1
🚀 دیپسیک بازگشت؛ این بار با یک انقلاب در ریاضیات
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
🔥3👏2❤1