VIRSUN
6.08K subscribers
1.06K photos
626 videos
5 files
687 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات‌های انسان‌نمای چینی شرکت Unitree با سرعتی شگفت‌انگیز در حال پیشرفت هستند!

این نسل جدید از ربات‌ها اکنون قادرند حرکات پیچیده و دشوار را با دقت و تعادل بالا انجام دهند — از پرش و چرخش گرفته تا حرکات ترکیبی مشابه تمرینات ورزشی انسان.

📈 سرعت پیشرفت این سیستم‌ها در یادگیری و کنترل حرکتی نشان می‌دهد که چین در مسیر تبدیل شدن به یکی از رهبران جهانی در حوزه‌ی رباتیک هوشمند قرار دارد.

🎯 در آینده‌ای نه‌چندان دور، این ربات‌ها می‌توانند در صنایع، امداد و نجات، و حتی کارهای روزمره کنار انسان‌ها فعالیت کنند.

@rss_ai_ir
#هوش_مصنوعی #رباتیک #Unitree #ربات_انسان_نما #AI #China
This media is not supported in your browser
VIEW IN TELEGRAM
🫙 AnyUp:
افزایش جهانی ویژگی‌ها در بینایی ماشین 🫙

پژوهشگران روش جدیدی با نام AnyUp ارائه کرده‌اند که می‌تواند برای افزایش وضوح ویژگی‌ها (Feature Up-Sampling) در هر مدل بینایی ماشین و در هر رزولوشنی استفاده شود — بدون نیاز به آموزش مجدد شبکه‌ی رمزگذار (Encoder).

💡 ویژگی اصلی:
معماری AnyUp یک معماری feature-agnostic است که تنها در زمان استنتاج (inference) عمل می‌کند و کیفیت بازسازی ویژگی‌ها را در تصاویر به شکل چشمگیری بهبود می‌دهد.

🔹 قابل استفاده برای تمام معماری‌های بینایی (CNN، ViT و غیره)
🔹 بدون نیاز به داده‌ی اضافی یا تنظیم مجدد مدل
🔹 بهبود کیفیت جزئیات و مرزهای دقیق در تصاویر بازسازی‌شده

📘 منابع:
👉 مقاله: arxiv.org/pdf/2510.12764
👉 پروژه: wimmerth.github.io/anyup
👉 کد: github.com/wimmerth/anyup
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #DeepLearning #AnyUp #ComputerVision #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Anthropic معرفی کرد:
Claude Haiku 4.5

نسخه‌ی جدید مدل Claude Haiku 4.5 منتشر شد — مدلی در سطح Sonnet 4، اما با سرعتی بیش از دو برابر و هزینه‌ای سه‌برابر کمتر!

📊 نتایج عملکرد:

♻️در آزمون SWE-Bench Verified برای تولید کد: ۷۳٪
♻️در آزمون Terminal-Bench برای مهارت‌های خط فرمان: ۴۱٪


🔸 این نتایج کمی پایین‌تر از Sonnet 4.5 هستند، اما مدل جدید Haiku 4.5 توانسته از Sonnet 4 و Gemini 2.5 پیشی بگیرد.

💰 هزینه استفاده:

♻️ورودی (input): ۱ دلار
♻️خروجی (output): ۵ دلار


🧠 همچنین Haiku 4.5 اکنون در Claude Code در دسترس است — طراحی‌شده برای سرعت بالا در برنامه‌نویسی، تحلیل و تعامل زبانی در محیط‌های فنی.

🔗 جزئیات رسمی
https://www.anthropic.com/news/claude-haiku-4-5

#هوش_مصنوعی #Claude #Anthropic #Haiku #LLM #AI
🤖 مینی-ChatGPT آماده از آندری کارپاتی!

آندری کارپاتی، نابغه‌ی یادگیری عمیق و خالق پروژه‌ی معروف nanoGPT، حالا نسخه‌ی جدیدی از آن را معرفی کرده است — nanochat
این پروژه یک کلون کوچک ChatGPT است که می‌تواند از صفر تا مرحله‌ی نهایی استنتاج (Inference) آموزش ببیند.

📊 جزئیات نسخه جدید – nanochat d32:

آموزش کامل در ۳۳ ساعت

هزینه‌ی آموزش فقط حدود ۱۰۰۰ دلار 💸

دارای ۳۲ لایه ترنسفورمر

شامل تمام مراحل آموزش از پایه تا تقویتی:
Pretrain → Midtrain → SFT → RL

حتی از Tool Use هم پشتیبانی می‌کند 🔧


💡 نتایج عملکرد:

امتیاز CORE score = 0.31 (بهتر از GPT-2 با امتیاز ≈ 0.26)

در آزمون GSM8K (ریاضی) دقت از ۸٪ به ۲۰٪ افزایش یافته است 📈


کارپاتی با شوخ‌طبعی می‌گوید:

> «مدل هنوز مثل یک کودک پیش‌دبستانی است، ولی یاد گرفته همه‌چیز را از صفر تا ابزارمحور شدن انجام دهد!» 😄



💰 جالب‌تر اینکه کوچک‌ترین نسخه‌های این مدل را می‌توان فقط با ۱۰۰ دلار آموزش داد.
به گفته‌ی آندری، به‌زودی نسخه‌ی وبی این مدل هم منتشر خواهد شد.

🔗 مشاهده در GitHub

#هوش_مصنوعی #nanochat #Karpathy #ChatGPT #LLM #DeepLearning
1
⚡️ رسماً تأیید شد: همکاری OpenAI و Broadcom برای تولید تراشه‌های اختصاصی هوش مصنوعی

شب گذشته، OpenAI اعلام کرد که با شرکت Broadcom قراردادی امضا کرده است تا به‌طور مشترک تراشه‌های اختصاصی خود را توسعه دهد.

🔋 جزئیات پروژه:

✳️ظرفیت کل زیرساخت: ۱۰ گیگاوات (معادل برق مصرفی حدود ۸ میلیون خانه)

✳️نخستین راه‌اندازی‌ها: نیمه دوم سال ۲۰۲۶

✳️تکمیل کامل زیرساخت: تا سال ۲۰۲۹


این تراشه‌ها عمدتاً برای مرحله‌ی استنتاج (Inference) طراحی می‌شوند، نه آموزش مدل‌ها.
این یعنی OpenAI می‌تواند تراشه‌ها را دقیقاً متناسب با نیازهای خود بهینه کند — کاهش چشمگیر هزینه‌ها، افزایش کارایی، و مهم‌تر از همه، کاهش وابستگی به Nvidia 🟢

به‌نظر می‌رسد OpenAI در حال آماده‌سازی زیرساختی است که در آینده بتواند به‌صورت مستقل اکوسیستم سخت‌افزاری و نرم‌افزاری خود را کنترل کند.

🧠 دنیای تراشه‌های هوش مصنوعی وارد مرحله‌ی جدیدی شد...
https://openai.com/index/openai-and-broadcom-announce-strategic-collaboration/

#OpenAI #Broadcom #AIChip #Nvidia #هوش_مصنوعی #تراشه #DeepLearning
This media is not supported in your browser
VIEW IN TELEGRAM
🫧 تشخیص هرچیز با مدل چندوجهی Rex-Omni 🫧

مدل Rex-Omni با ۳ میلیارد پارامتر، یک مدل چندوجهی (Multimodal) جدید است که طیف گسترده‌ای از وظایف بینایی را در یک چارچوب واحد ادغام می‌کند:

🔹 تشخیص اشیا (Object Detection)
🔹 تشخیص متن (OCR)
🔹 همچنین Pointing و Key-pointing
🔹 و Visual Prompting

همه‌ی این وظایف در قالب یک چارچوب واحد مبتنی بر پیش‌بینی نقطه بعدی (Next-Point Prediction) انجام می‌شوند — رویکردی که باعث شده مدل نتایج چشم‌گیری در دقت و سرعت به دست آورد ⚡️

📘 ویژگی‌ها:

پارامترها: ۳B

یکپارچه‌سازی تمام وظایف ادراکی در یک معماری ساده

مجوز: IDEA License 1.0 💙


🔗 لینک‌ها:
📄 Review
📘 Paper
🌐 Project Page
💻 GitHub Repo

@rss_ai_ir

#AI #RexOmni #Multimodal #MLLM #ComputerVision #OCR #Detection #هوش_مصنوعی
🎬 استوری‌برد Sora 2 Pro منتشر شد!

نسخه‌ی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگی‌ای که اجازه می‌دهد سکانس‌های ویدیو را به‌صورت دقیق و سینمایی برنامه‌ریزی کنید.

🎞 با این قابلیت می‌توانید:

طرح صحنه‌ها را فریم‌به‌فریم بچینید

زاویه، ترکیب‌بندی و حرکت دوربین را از قبل تعریف کنید

ویدیوهای ۲۵ ثانیه‌ای با جزئیات فوق‌العاده بسازید


به‌نوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»


@rss_ai_ir

#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI
1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 FlashWorld —
تولید صحنه‌های سه‌بعدی در ۵ ثانیه با یک GPU ⚡️

سیستم جدید FlashWorld معرفی شد — مدلی که می‌تواند از یک تصویر یا فقط یک توضیح متنی، صحنه‌های سه‌بعدی واقعی و با جزئیات بالا تولید کند.

🚀 ویژگی‌ها:

♻️تا ۱۰۰ برابر سریع‌تر از روش‌های قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU


به زبان ساده، FlashWorld کاری می‌کند که با یک کلیک، جهان سه‌بعدی‌ات ساخته شود — مثل فشردن دکمه «render reality».

🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page

#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین
🧬 ShinkaEvolve —
تکامل کدهای علمی با کمک هوش مصنوعی

پروژه‌ی ShinkaEvolve یک فریم‌ورک نوآورانه است که مدل‌های زبانی بزرگ (LLM) را با الگوریتم‌های تکاملی (Evolutionary Algorithms) ترکیب می‌کند تا فرآیند کشف علمی و بهینه‌سازی کد را خودکار کند.

💡 ویژگی‌های کلیدی:

✳️ترکیب هوش مصنوعی خلاق با بهینه‌سازی تکاملی.

✳️پشتیبانی از ارزیابی موازی در رایانه‌های محلی یا خوشه‌های محاسباتی.

✳️ذخیره‌ی راه‌حل‌های موفق برای انتقال دانش و تجربه به نسل‌های بعدی مدل.

✳️بهینه‌سازی عملکرد کد در حالی که درستی آن حفظ می‌شود.

✳️مناسب برای پژوهش‌های علمی که تست یا validator مشخص دارند.


این سیستم به‌نوعی «زیست‌شناسی تکاملی برای کد» است — هر نسل از نسخه‌ها بهینه‌تر و خلاق‌تر از قبل می‌شود.

📌 GitHub:
github.com/SakanaAI/ShinkaEvolve

#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی
⚡️ Omni-Embed-Nemotron —
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو

انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانه‌ای یکپارچه برای تبدیل انواع داده‌ها به نمایش برداری مشترک (Unified Embedding).

🎯 ویژگی‌های کلیدی:

پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو

مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)

طول زمینه تا ۳۲٬۷۶۸ توکن

اندازه‌ی بردار نهائی (Embedding) برابر ۲۰۴۸

بهینه‌شده برای GPU و پشتیبانی از FlashAttention 2


🚀 کاربردها:

♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)

♻️بهبود پروژه‌های RAG (Retrieval-Augmented Generation)

♻️توسعه سیستم‌های درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان داده‌های متنی و دیداری را از میان برمی‌دارد.

🌐 مدل متن‌باز:
huggingface.co/nvidia/omni-embed-nemotron-3b

#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 AGIBOT Genie G2 —
نسل جدید ربات انسان‌نما بر پایه پلتفرم چرخ‌دار

شرکت AGIBOT از ربات انسان‌نمای جدید خود با نام Genie G2 رونمایی کرد — مدلی صنعتی که برای کارهایی چون جابه‌جایی، مونتاژ دقیق، و بازرسی تجهیزات طراحی شده است.

💡 ویژگی‌های کلیدی:

✳️کمر و پاهای انسان‌نما

✳️تنه‌ی تاشو و تحرک همه‌جهته

✳️حسگرهای لمسی سه‌بعدی (3D Tactile Sensors)

✳️بازوهای رباتیکی با ۱۹ درجه آزادی

✳️ناوبری سه‌بعدی ۳۶۰ درجه برای حرکت آزاد در کارخانه‌ها و آزمایشگاه‌ها


✳️این ربات علاوه بر کارهای صنعتی، قابلیت‌های خدماتی نیز دارد — از حراست و پذیرایی از مهمانان گرفته تا نمایش‌های آموزشی و کمک در خانه.

📦 قرارداد تولید:
همچنین AGIBOT با شرکت Shanghai Longcheer قرارداد چند میلیون دلاری امضا کرده و نزدیک به ۱۰۰۰ واحد Genie G2 قرار است به‌صورت مرحله‌ای در کارخانه‌ها نصب و راه‌اندازی شود.

#Robotics #AGIBOT #GenieG2 #AI #Humanoid #Automation #Industry40 #هوش_مصنوعی #رباتیک
1
This media is not supported in your browser
VIEW IN TELEGRAM
😂 وقتی جوک‌ها از شوخی به واقعیت تبدیل می‌شن!

📢 خبر فناوری از دوران قدیم:
دستگاهی اختراع شده برای اصلاح خودکار ریش و سبیل!

یه سکه می‌ندازی، سرتو می‌کنی توی شکاف،
و دستگاه خودش به‌صورت خودکار می‌تراشه!

ولی مگه همه آدما صورتشون یکیه؟! 😨

آره، فقط بار اول! 😅


@rss_ai_ir
2🔥2👎1👏1😁1
FlashVSR —
ارتقای ویدیو در زمان واقعی بر پایه‌ی دیفیوشن

پروژه‌ی FlashVSR به هدف رسیدن به Super-Resolution ویدیوهای استریم در زمان واقعی طراحی شده است — نه بهترین، اما کاملاً متن‌باز و قابل استفاده برای همه 🔓

📦 کد منبع:

🔗 github.com/OpenImagingLab/FlashVSR

🧩 نودها برای ComfyUI:

🔗 github.com/smthemex/ComfyUI_FlashVSR

💡 ویژگی‌ها و نکات فنی:

✳️مصرف حافظه بالا (مثل اکثر آپ‌اسکیلرهای دیفیوشنی)

✳️مبتنی بر Block-Sparse Attention — ممکن است روی کارت‌های گرافیکی ضعیف ناپایدار عمل کند

✳️کیفیت خروجی مناسب با تأکید بر سرعت پردازش


در مجموع، گزینه‌ای عالی برای کسانی که دنبال راه‌حل متن‌باز ارتقای ویدیو با انعطاف بالا هستند.

#FlashVSR #AI #Upscaling #VideoAI #SuperResolution #OpenSource #MachineLearning #DiffusionModels #ComfyUI #DeepLearning #BlockSparseAttention
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 واقعیت افزوده + هوش مصنوعی مولد (Generative AGI) یعنی حالا انسان‌ها می‌تونن کارهایی در سطح کارشناسان انجام بدن — بدون هیچ آموزش قبلی!

و این آینده نیست...
این الان اتفاق می‌افته ⚡️

@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 Perplexity
حالت جدید آموزش تعاملی زبان را معرفی کرد

مجموعه Perplexity حالت تازه‌ای برای یادگیری زبان اضافه کرده که چت‌بات هوش مصنوعی آن را به یک مدرس تعاملی تبدیل می‌کند — ابزاری که به کاربران کمک می‌کند در لحظه دایره لغات خود را گسترش دهند و گرامر را بهتر بفهمند.

🔸 این قابلیت در خود چت کارت‌های آموزشی (فلش‌کارت) با لغات جدید، تلفظ صحیح و جملات نمونه تولید می‌کند.
🔸 کاربران همچنین می‌توانند در همان گفتگو سؤالات گرامری بپرسند یا درخواست توضیح بدهند.
🔸 حالت جدید هم‌اکنون در نسخه‌های iOS و وب فعال است و استفاده از Perplexity را فراتر از جست‌وجو و تحقیق گسترش می‌دهد.

⛔️همچنین Perplexity حالا خود را به‌عنوان ترکیبی از موتور دانش و مربی شخصی زبان معرفی می‌کند.

📊 @rss_ai_ir

#AI #Perplexity #LanguageLearning #EdTech #Chatbot #ArtificialIntelligence
2
مدل GPT-5 تنها ۵۸ درصد به AGI نزدیک است 🧠

۲۸ آزمایشگاه بزرگ و تأثیرگذار در حوزه‌ی هوش مصنوعی گرد هم آمده‌اند تا سرانجام تعریف دقیقی از AGI (هوش عمومی مصنوعی) ارائه دهند — و این نخستین پژوهش علمی است که این مفهوم را به‌صورت کمّی تبیین می‌کند. در میان نویسندگان مقاله، نام یوشوا بنجیو (Yoshua Bengio)، یکی از پدران هوش مصنوعی نیز دیده می‌شود.

💡 تعریف AGI (کوتاه اما پرمغز):

> مفهوم AGI یعنی سامانه‌ای از هوش مصنوعی که می‌تواند در گستره (versatility) و عمق (proficiency) توانایی‌های شناختی، با یک انسان بالغ تحصیل‌کرده قابل مقایسه باشد.

---

🔬 اما چطور می‌توان آن را اندازه‌گیری کرد؟

پژوهشگران از یک مدل شناخته‌شده در روان‌سنجی به نام مدل Cattell–Horn–Carroll (CHC) استفاده کردند — مدلی که هوش انسان را به ۱۰ توانایی شناختی اصلی تقسیم می‌کند:

1. دانش عمومی و عقل سلیم
2. درک و نگارش متن
3. ریاضیات
4. حل مسائل جدید و استدلال منطقی
5. حافظه‌ی کوتاه‌مدت
6. حافظه‌ی بلندمدت و یادگیری
7. بازیابی و استخراج دانش
8. درک و خلق تصاویر
9. درک گفتار و موسیقی
10. سرعت پردازش اطلاعات

بر اساس این شاخص‌ها، پژوهشگران هم انسان و هم مدل‌های زبانی را ارزیابی کردند.

---

📊 نتایج:

اول GPT-4: تنها ۲۷٪ از AGI
دوم GPT-5: حدود ۵۸٪ از AGI


یعنی GPT-5 اکنون بیش از نیمی از پروفایل شناختی یک انسان بالغ تحصیل‌کرده را دارد — پیشرفتی چشمگیر، اما هنوز راه درازی تا دستیابی به هوش عمومی کامل در پیش است.
---

⚠️ نقاط ضعف GPT-5:

♻️حافظه‌ی بلندمدت
♻️درک دیداری و شنیداری
♻️سرعت واکنش
♻️تفکر انعطاف‌پذیر
---

⛔️به‌نظر می‌رسد این تعریف عینی، علمی و قابل‌اندازه‌گیری است — قطعاً بسیار بهتر از تعریف شرکت‌هایی مانند OpenAI و Microsoft، که AGI را به‌سادگی "هوشی که سالانه ۱۰۰ میلیارد دلار سود تولید کند" 💀 توصیف کرده‌اند!

#هوش_مصنوعی #AGI #GPT5 #یوشوا_بنجیو #یادگیری_ماشین #AI #ArtificialIntelligence