VIRSUN
8.89K subscribers
767 photos
449 videos
3 files
495 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🇬🇧 ربات انسان‌نمای صنعتی Humanoid ساخته‌ی آرتیوم ساکولوف (بنیان‌گذار سابق جواهرات Sokolov) رونمایی شد!

📌 فقط در ۷ ماه ساخته شده و ویدیوی ساختش هم منتشر شده.

🔹 ساکولوف برند جواهراتش را در ۲۰۲۴ فروخت و حالا بیش از ۷۵٪ سهام پروژه Humanoid در بریتانیا را دارد.

🔹 او پیش‌تر با SKL.vc در استارتاپ‌ها سرمایه‌گذاری می‌کرد، اما به نظر می‌رسد حالا سرمایه اصلی‌اش را روی رباتیک گذاشته.

🔹 خبری از سرمایه‌گذاران بیرونی نیست — احتمالاً پول حاصل از فروش Sokolov به Humanoid تزریق شده.

👀 پرسش:
شما این ربات را چطور می‌بینید؟
❤️ — فوق‌العاده!
🙈 — خب، یک ربات دیگر!


#رباتیک #Humanoid #استارتاپ #سرمایه‌گذاری #فناوری #انسان_نما
🥰9👏6😁6🔥5👍3🎉32🙈2
This media is not supported in your browser
VIEW IN TELEGRAM
🌊🐳 SI-SOD: شناسایی سالینسی ناوردا در تصاویر پیچیده

🔍 پژوهشگران SI-SOD را معرفی کردند، مدلی برای Invariant Salient Object Detection که در سناریوهایی کار می‌کند که چندین شیء سالینت با اندازه‌های بسیار متفاوت در یک تصویر ظاهر می‌شوند.

چرا مهم است؟
در تشخیص سالینت، وقتی اشیاء کوچک و بزرگ همزمان حضور دارند، مدل‌های سنتی دچار خطا می‌شوند. SI-SOD با طراحی جدید خود می‌تواند تمرکز را روی همه‌ی اشیاء حفظ کند و ناوردا عمل کند.

📌 منابع:

📄 مقاله

🌐 پروژه

💻 کد روی GitHub



💙 این ریپو منتشر شده و برای کسانی که روی سالینسی، بینایی ماشین و SOD کار می‌کنند می‌تونه ابزار ارزشمندی باشه.

#AI #ComputerVision #SaliencyDetection #SISOD #DeepLearning #CVPR

@rss_ai_ir
7😁6🔥5🥰4🎉4👍3👏2
🖥️💡 به‌روزرسانی مدل Tab در Cursor

⛔️حدود یک هفته پیش در Cursor مدل Tab (مدلی که هنگام تایپ کد به‌صورت لحظه‌ای پیشنهاد می‌دهد) به‌روزرسانی شد. اگر در ۹ روز اخیر تغییراتی دیدید، این دقیقاً به همین خاطر است.

🔧 ویژگی کلیدی این آپدیت:

♻️مدل با یادگیری تقویتی on-policy RL آموزش داده می‌شود.

♻️یعنی هر بار که شما یک پیشنهاد را می‌پذیرید یا رد می‌کنید، این بازخورد وارد یک batch آموزشی می‌شود. بعد از یک مرحله آموزش، داده‌ها حذف می‌شوند و batch جدید ساخته می‌شود.
♻️به‌صورت تئوری تیم می‌تواند مدل را هر ۲ ساعت یک بار آپدیت کند.


📊 تغییرات در متریک‌ها:

✳️۲۱٪ کاهش در نمایش پیشنهادهای بی‌ربط → یعنی مدل حالا کمتر کد نامرتبط نشان می‌دهد.
✳️۲۸٪ افزایش در پذیرش پیشنهادها → یعنی وقتی پیشنهادی نمایش داده می‌شود، کاربران بیشتر آن را قبول می‌کنند.


این تغییرات نشان می‌دهد که Tab هوشمندتر شده و بازدهی بیشتری در تکمیل کد دارد. 🚀
@rss_ai_ir
#AI #Cursor #کدنویسی #یادگیری_تقویتی #برنامه‌نویسی
6👏6😁5🔥4🥰4🎉4👍2
💸 چین با ۲۹۴ هزار دلار مدل هوش مصنوعی آموزش داد!

در حالی که آزمایشگاه‌های آمریکایی برای آموزش مدل‌های شبیه GPT میلیون‌ها دلار هزینه می‌کنند، شرکت DeepSeek چین توانست همین کار را با کمتر از ۳۰۰ هزار دلار انجام دهد.

چطور این کار را کردند؟

♻️استفاده از ۵۱۲ چیپ Nvidia H800 برای پردازش اصلی.

♻️مراحل اولیه روی چند چیپ A100 انجام شد، اما اصل ماجرا ترکیب سخت‌افزار بهینه + مهندسی هوشمندانه بود.


🌍 چرا مهم است؟

✳️این خبر شوک بزرگی به غول‌هایی مثل Nvidia وارد کرد.

✳️نشان می‌دهد که هوش مصنوعی ارزان می‌تواند نوآوری را شتاب دهد بدون نیاز به بودجه‌های میلیاردی.


👀 بنیان‌گذار: لیانگ ون‌فنگ (Liang Wenfeng) فردی کم‌حاشیه است، اما با همین حرکت quietly دنیای AI را تکان داده.

همچنین DeepSeek ثابت کرد برای حضور در لیگ بزرگان هوش مصنوعی، همیشه بودجه میلیاردی لازم نیست.

Link

#هوش_مصنوعی #چین #DeepSeek #Nvidia #AI #دیپ_لرنینگ
🎉97😁7🥰6🔥4👍2👏2
🚀 نتایج شگفت‌انگیز برای Grok 4 Fast

🔥 مدل Grok 4 Fast موفق شد در رتبه‌بندی Search Arena از LMArena جایگاه اول را کسب کند.

📊 ویژگی‌ها:

سرعت بسیار بالا

هزینه پایین 💸

کیفیت نزدیک به مدل کامل Grok 4 🎯


🔗 جزئیات بیشتر: لینک

#هوش_مصنوعی #Grok #xAI #مدل_زبان #AI
🥰1412🔥10🎉10👏9😁4👍3
🐳 نسخه‌ی جدید DeepSeek-V3.1-Terminus منتشر شد!

این نسخه نسبت به ورژن قبلی، نتایج پایدارتر و کامل‌تری در تست‌ها ارائه می‌دهد.

📲 در دسترس از طریق:

♻️اپلیکیشن
♻️نسخه‌ی وب
✳️و همینطور از طریق API


🔗 وزن‌های باز: HuggingFace

#DeepSeek #opensource #LLM #هوش_مصنوعی #مدل_زبان
🥰75👍5🔥4🎉4👏3😁3
🚀 مروری بر مدل‌ها و دیتاست‌های تازه روی Hugging Face (۱۶ سپتامبر)

تازه‌ترین ریلیزها از حوزه‌های مختلف: متن، صدا، تصویر و حتی ویدئو 👇

مدل‌های جدید:

📄 Granite-Docling-258M —
ابزار همه‌کاره برای کار با اسناد (تبدیل و Q&A).

🎵 MiMo-Audio-7B-Base —
مدل قدرتمند برای درک و تولید صوت.
۰
🖼 ScaleCUA-3B —
مدل چندوجهی (تبدیل تصویر به متن).

🎬 Lucy-Edit-Dev —
مدل ویژه‌ی ویرایش ویدئو.

✍️ Ling-flash-2.0 —
مدل متنی عظیم با ۱۰۳ میلیارد پارامتر.


📌 این مجموعه کمک می‌کنه سریع ببینید چه ابزارهای جدید و مفیدی طی روزهای اخیر عرضه شده.

🔗 لیست کامل: Hugging Face Collection

#هوش_مصنوعی #HuggingFace #مدل_زبان #AI #LLM #مدل_چندوجهی
10🥰9👍5🔥3🎉3👏2😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🤯 دست؛ سخت‌ترین بخش ربات‌های انسان‌نما

ساخت دست برای ربات انسان‌نما همیشه یکی از بزرگ‌ترین چالش‌ها بوده است: حرکات پیچیده، ده‌ها درجه آزادی، و نیاز به دقتی در حد میلی‌متر. 🤖

اما پیشرفت‌های اخیر واقعاً شگفت‌انگیز است — از توانایی گرفتن اجسام ظریف گرفته تا انجام حرکات طبیعی و سریع، ربات‌ها حالا به دست‌هایی نزدیک به انسان مجهز می‌شوند.

این یعنی آینده‌ای که در آن ربات‌ها می‌توانند نه‌تنها کارهای صنعتی سنگین، بلکه وظایف روزمره‌ی ظریف مثل نوشتن، باز کردن بطری یا حتی جراحی را انجام دهند، دیگر دور نیست. ⚡️
@rss_ai_ir
#رباتیک #Humanoid #هوش_مصنوعی #فناوری #ربات_انسان‌نما #AI
🔥9🎉7🥰64👍3😁2👏1
💰 سرمایه‌گذاری ۱۰۰ میلیارد دلاری انویدیا روی OpenAI

انویدیا اعلام کرده تا ۱۰۰ میلیارد دلار برای تأمین نسل بعدی مدل‌های عظیم OpenAI سرمایه‌گذاری می‌کند — نه در دنیای مد، بلکه در ابرمدل‌های هوش مصنوعی. این بودجه صرف ساخت مراکز داده‌ای با توان ۱۰ گیگاوات خواهد شد؛ ظرفیتی معادل برق‌رسانی به میلیون‌ها خانه.

🔹 چطور اجرا می‌شود؟

♻️سرمایه‌گذاری به‌صورت مرحله‌ای آزاد می‌شود: هر گیگاوات جدید → سرمایه بیشتر.

♻️نخستین «نیروگاه هوش مصنوعی» در سال ۲۰۲۶ روی پلتفرم Vera Rubin انویدیا راه‌اندازی می‌شود.

♻️همچنین OpenAI دسترسی انحصاری به چیپ‌ها، شبکه‌ها و نقشه‌راه‌های آینده انویدیا خواهد داشت.


🌍 چرا مهم است؟

✳️آموزش مدل‌های غول‌پیکر GPT نیازمند محاسبات در مقیاس سیاره‌ای است.

✳️انویدیا جایگاه خود را به‌عنوان «عوارضی دنیای هوش مصنوعی» تثبیت می‌کند، در حالی‌که مایکروسافت، آمازون و گوگل برای دسترسی به چیپ‌ها رقابت می‌کنند.

✳️انرژی به گلوگاه اصلی تبدیل می‌شود: ۱۰ گیگاوات معادل یک شبکه برق ملی است.


✳️آینده‌ی هوش مصنوعی تنها با کد نوشته نمی‌شود؛ بلکه با سیلیکون ساخته می‌شود و با گیگاوات‌ها انرژی قدرت می‌گیرد. 🔥

#Nvidia #OpenAI #هوش_مصنوعی #ابررایانه #انرژی #AI
7🔥7🎉7😁5🥰3👏3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🚚 کامیون‌های تمام‌خودران برقی وارد جاده‌های چین شدند 🇨🇳

چین یک گام بزرگ دیگر در حمل‌ونقل هوشمند برداشت: کامیون‌های برقی و تمام‌خودران حالا رسماً روی جاده‌ها حرکت می‌کنند.

این کامیون‌ها بدون راننده، با تکیه بر ترکیب هوش مصنوعی، لیدار، رادار و دوربین‌های پیشرفته مسیر را شناسایی کرده و بارها را با ایمنی و بهره‌وری بالا جابه‌جا می‌کنند.

🔋 تماماً برقی هستند، یعنی علاوه بر کاهش هزینه، آلایندگی کربنی را هم به‌شدت پایین می‌آورند.

این فناوری می‌تواند صنعت حمل‌ونقل و لجستیک را متحول کند:

کاهش هزینه‌های عملیاتی 🚛

افزایش ایمنی در جاده‌ها 🛡

تحویل سریع‌تر و پایدارتر 🌍


آینده‌ای که در آن بارهای سنگین بدون راننده و با انرژی پاک جابه‌جا شوند، رسماً شروع شده است.

#حمل_و_نقل #خودران #کامیون_برقی #چین #AI #لجستیک
6👍6🥰6🔥5😁4🎉4👏3
🌸 رونمایی از GAIA2 — عامل‌ها در محیط واقع‌گرایانه 😘

🚀 نسخه دوم بِنچمارک چندمرحله‌ای GAIA2 و محیط شبیه‌سازی واقع‌گرایانه‌ی Agentic Research Environment (ARE) منتشر شد — هر دو کاملاً متن‌باز!

در GAIA2 عامل‌ها باید در محیطی کار کنند که پر از API، اپلیکیشن‌ها، بازخورد کاربر و حتی سایر عامل‌هاست. وظایف چندمرحله‌ای هستند و مسیرهای حل مختلفی دارند.

🟣 توانایی‌هایی که سنجیده می‌شوند:

♻️اجرای درست دستورها و استفاده از ابزارها (Execution)
♻️جستجو و استخراج اطلاعات (Search)
♻️برخورد با اطلاعات مبهم (Ambiguity)
♻️سازگاری با شرایط متغیر (Adaptability)
♻️مدیریت زمان و وظایف تکرارشونده (Time)
♻️رسیدن به نتیجه با وجود اطلاعات اضافی یا غلط (Noise)
♻️همکاری با سایر عامل‌ها (Agent2Agent)


💡 Agentic Research Environment:

✳️محیط شبیه‌سازی با گذر زمان و تغییر شرایط
✳️پشتیبانی از اجرای async
✳️اپلیکیشن‌های آماده مثل تقویم، ایمیل، تاکسی و ... (سازگار با MCP)
✳️کاربرد برای تست امنیت (red teaming)، آموزش و ساخت دیتاست


📊 این بِنچمارک در حال حاضر بزرگ‌ترین معیار عمومی برای ارزیابی عامل‌هاست و هیچ مدل SOTA نتوانسته در همه بخش‌ها برتری کامل بگیرد.
@rss_ai_ir
🔗 منابع:
👉 Leaderboard
👉 Github
👉 HF Demo
👉 HF Blog
👉 Dataset

#AI #Agents #GAIA2 #Benchmark #DeepResearch
🥰18😁14👍1312🎉12👏11🔥10👎1
Media is too big
VIEW IN TELEGRAM
😳🤖 «دره‌ی وهم‌آور» در دنیای واقعی

شرکت چینی AheadForm از یک سر اندروید رونمایی کرده که می‌تواند با حرکت‌های فوق‌واقعی عضلات صورت، حالات انسانی را بازسازی کند.

این ربات‌ها نه‌تنها ظاهر طبیعی دارند، بلکه به گفته‌ی شرکت:

می‌توانند یاد بگیرند 📚

با انسان‌ها تعامل کنند 🗣

و به محیط اطراف پاسخ بدهند 🌍


🔮 پیش‌بینی AheadForm: در چند سال آینده 💚💚، تفاوت میان انسان و ربات تقریباً غیرقابل تشخیص خواهد شد.

آیا این آغاز عصر همزیستی واقعی انسان و ربات است یا قدمی به سمت دنیای «ترسناک»؟
@rss_ai_ir
#رباتیک #اندروید #دره_وهم‌آور #AI #چین
👍7🔥7😁64🥰4👏3🎉2🙏1
📌 وب‌واکر — سیستم دو عامله برای دیپ ریسرچ

محققان همراه دیتاست جدید، سیستمی به نام WebWalker معرفی کرده‌اند که نسخه پیشرفته‌ای از ReAct است و با دو عامل کار می‌کند:

🧑‍💻 عامل پژوهشگر

سؤال + سایت (تبدیل‌شده به Markdown توسط کتابخانه ai4crawl) را دریافت می‌کند.

تصمیم می‌گیرد روی کدام لینک کلیک کند.


🕵️ عامل منتقد

محتوای صفحه را تحلیل کرده و اطلاعات مفید را در «حافظه» ثبت می‌کند.

تشخیص می‌دهد آیا جستجو باید ادامه یابد یا داده‌ها کافی هستند.


🔄 این چرخه ادامه دارد تا زمانی که منتقد بگوید اطلاعات کامل است، سپس پاسخ نهایی تولید می‌شود.

⚡️ نتایج (دیتاست قدیمی‌تر از ۹ ماه است):

GPT-4o → دقت ۳۷.۵٪ (با محدودیت ۱۵ کلیک)

Gemini-Search → دقت ۲۷.۹۴٪

Tongyi → دقت ۴۰.۷٪ (بهترین نتیجه)

پیش‌تر مدل o3 با دقت ۷۱.۷٪ در صدر بود.


📊 کیفیت پاسخ‌ها با مقایسه خروجی سیستم و جواب مرجع (ترکیب GPT-4o + انسان) ارزیابی می‌شود.

🔗 دیتاست در مقاله منتشر شده و آزادانه در دسترس است.

https://huggingface.co/datasets/callanwu/WebWalkerQA

https://tongyi-agent.github.io/blog/introducing-tongyi-deep-research/


#هوش_مصنوعی #عامل_هوشمند #دیپ_ریسرچ #وب_واکـر

@rss_ai_ir
👏9😁98👍8🔥5🥰4🎉1
🛸 هوش مصنوعی آینده سلامت شما را پیش‌بینی می‌کند

دانشمندان مدل جدیدی به نام Delphi-2M معرفی کرده‌اند که می‌تواند بیش از ۱۰۰۰ بیماری را سال‌ها قبل از بروز، پیش‌بینی کند. این مدل سوابق پزشکی افراد را مانند جمله‌های یک کتاب می‌خواند.

📊 آموزش دیده روی دیتاست UK Biobank (۵۰۰ هزار نفر) و تست شده روی ۲ میلیون نفر در دانمارک.
ریسک‌هایی مثل حمله قلبی را خیلی زودتر از پزشکان تشخیص می‌دهد.

🔍 چرا مهم است؟

تغییر پارادایم از درمان → به پیشگیری
کمک به بیمارستان‌ها برای برنامه‌ریزی منابع
هشدارهای زودهنگام برای بیماران


⚠️ اما محدودیت‌ها:

✳️داده‌ها بیشتر اروپامحور هستند → بایاس واقعی
✳️هنوز در مرحله تحقیق است، نه برای استفاده مستقیم در مطب پزشک
✳️اگر این سیستم مقیاس جهانی بگیرد، چکاپ سلامتی شما در آینده ممکن است همراه با «پیش‌بینی بیماری» باشد؛ درست مثل پیش‌بینی هوا 🌦️

@rss_ai_ir

https://www.sciencealert.com/scientists-train-ai-to-forecast-over-1000-diseases-years-in-advance

#هوش_مصنوعی #سلامت #پیشگیری #AIHealth
👍9🥰8🎉7👏54🔥4😁2
🚀 مدل جدید چینی LongCat-Flash-Thinking

🧠 مدلی مخصوص استدلال که بین تمام مدل‌های اوپن‌سورس به رکورد SOTA رسیده است.

⚡️ ویژگی‌ها:

معماری MoE با ۵۶۰B پارامتر (۲۷B فعال در هر بار اجرا)
صرفه‌جویی بزرگ: ‌برای رسیدن به نتایج برتر در AIME25 به ۶۴.۵٪ توکن کمتر نیاز دارد
پشتیبانی از 128k context
آموزش با تقویت (RL) روی مسائل استدلالی و کد + چندمرحله‌ای با سینتِز چندعاملی
همچنین RL آسنکرون → ‌۳ برابر سریع‌تر از فریم‌ورک‌های سنتی


⚙️ بهینه‌سازی برای پروداکشن:

♻️هسته‌های اختصاصی برای MoE و آموزش توزیع‌شده
♻️کاهش KV-cache، کوانتیزیشن، chunked prefill
♻️مسیریابی استاتیک/الاستیک، انتقال کش همتا‌به‌همتا، replication هوشمند
♻️سازگار با SGLang و vLLM برای استقرار سریع


📊 نتایج:

✳️صدرنشین در tool use (τ²-Bench, VitaBench)
✳️عملکرد عالی در instruction following (IFEval, COLLIE, Meeseeks-zh)
✳️چین همچنان پرچم‌دار مدل‌های reasoning است. 🇨🇳🤖

🔗 HF: huggingface.co/meituan-longcat/LongCat-Flash-Thinking

#هوش_مصنوعی #مدل_زبانی #MoE #یادگیری_عمیق #OpenSource

@rss_ai_ir
🔥6🥰6👏6👍5😁43🎉3
🚀 روز انتشار: Qwen مدل Qwen3-Omni را معرفی کرد — اولین هوش مصنوعی omni-modal بومی و انتها به انتها

این مدل می‌تواند متن، تصویر، صوت و ویدئو را در یک چارچوب واحد پردازش کند.

📊 در بنچمارک‌ها نشان داده که تمام حالت‌ها (modality) با کیفیت تقریباً برابر کار می‌کنند.

⚡️ ویژگی‌ها

♻️رتبه اول در ۲۲ مورد از ۳۶ بنچمارک صوتی و چندحالتی
♻️پشتیبانی از ۱۱۹ زبان متنی
♻️حداقل تأخیر: ۲۱۱ میلی‌ثانیه
♻️پردازش فایل‌های صوتی تا ۳۰ دقیقه
♻️قابلیت شخصی‌سازی با system prompt
♻️پشتیبانی داخلی از tool calling


🌟 نسخه‌های متن‌باز منتشرشده

Qwen3-Omni-30B-A3B-Instruct
Qwen3-Omni-30B-A3B-Thinking
Qwen3-Omni-30B-A3B-Captioner


👉 می‌توانید این مدل را تست کنید:
💬 Chat
💻 GitHub
🤗 Hugging Face
🤖 ModelScope
🎬 Demo

@rss_ai_ir

#Qwen #هوش_مصنوعی #چندحالتی #متن_باز #AI
🥰1413🔥13👏9👍6😁6🎉6