VIRSUN
12.5K subscribers
1.17K photos
701 videos
5 files
772 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات دوپای LimX Dynamics TRON 1

گاهی سؤال پیش می‌آید که چرا همه این‌قدر روی طراحی انسان‌نما پافشاری می‌کنند؟
مدل‌هایی با زانوهای رو به جلو، صدای کوبش شدید هنگام راه‌رفتن و خراب‌کردن کف‌پوش… واقعاً همیشه بهترین انتخاب نیستند.

🛠 نگاه به یک مسیر کاملاً متفاوت:
ربات TRON 1 ساختار دوپا دارد، اما کمتر شبیه انسان و بیشتر شبیه یک شکارچی مکانیکی است.
ویژگی‌ها در نگاه اول «خطرناک‌تر» و عملیاتی‌تر به نظر می‌رسند:

سرعت و چابکی بالا
🛞 امکان استفاده از چرخ‌های قابل‌تعویض
🦘 توانایی پرش از ارتفاع و تحمل ضربه
🌪️ عبور از زمین‌های سخت و ناهمسطح

چنین طراحی‌هایی شاید برای نسل واقعی ربات‌های صنعتی، امدادی یا حتی نظامی کاراتر از ربات‌های شبیه انسان باشند.
و اگر روزی خدای نکرده «قیام ربات‌ها» را ببینیم، احتمالاً همین موجودات غیربشری دردسرسازتر باشند 🙂 (شوخی البته… یا شاید هم نه!)

@rss_ai_ir

#ربات #روباتیک #هوش_مصنوعی #ربات_دوپا #LimX #TRON1 #روبات_صنعتی #ربات_نظامی #AI #Robotics #BipedalRobot
8👍6😁4🎉4🔥3🥰3👏3
🌀 «جاروبرقی متاورسی» رسماً وارد صحنه شد!

⚙️ یک ربات‌ پُرقدرت که فقط تمیز نمی‌کند، بلکه در حال ساختن یک مدل سه‌بعدی زنده از جهان اطراف خودش است!
طراحی جذاب، چرخ‌های عبور از موانع و توانایی حرکت در فضای خانه، حیاط و محیط‌های ناهموار فقط شروع ماجراست.

💡 نکته‌ی شگفت‌انگیز ماجرا:
این ربات با کمک شبکه‌های عصبی مبتنی بر وُکسل و پردازش روی NVIDIA Jetson Orin جهان اطراف را فوتورئالیستی و در لحظه بازسازی می‌کند.
چیزی شبیه یک اسکنر متاورس خانگی که می‌تواند محیط را برای بازی، نقشه‌برداری، امنیت یا حتی مدل‌سازی صنعتی ثبت کند.

🚀 از قابلیت‌ها:

🔸 ساخت نقشه سه‌بعدی در لحظه (Real-time 3D World Reconstruction)
🔸 پردازش SLAM در شب و روز
🔸 برنامه‌ریزی مسیر با تأخیر بسیار کم
🔸 شناسایی موانع متحرک
🔸 حرکت در فضاهای بسیار تنگ و دسترسی به «گوشه‌های ممنوعه» خانه
🔸 نوشته‌شده با استک تمام Rust برای امنیت و سرعت بیشتر

🌐 مشخصات و ویدیوها:
maticrobots.com

@rss_ai_ir

#ربات #روباتیک #جاروبرقی_هوشمند #هوش_مصنوعی #SLAM #NVIDIA #Jetson #Metaverse #3DMapping #RustLang #Robotics #SmartHome
🎉1614👏12👍10🔥10🥰9😁4
🧠 نسل تازه مدل‌های چندوجهی؛ معرفی Gemini 3 Pro

مدل Gemini 3 Pro تازه‌ترین عضو خانواده‌ی Gemini است؛ یک مدل استدلال‌محور و بومی‌چندوجهی که بدون وابستگی یا فاین‌تیون روی نسخه‌های قبلی ساخته شده است، نه ارتقاء، نه شاخه‌سازی — یک معماری کاملاً نو.

ورودی‌ها:

متن (سؤال، پرامپت، خلاصه‌سازی اسناد و …)

تصویر

صوت

ویدئو
🔹 با پنجره‌ی کانتکست خیره‌کننده‌ی ۱ میلیون توکن


خروجی‌ها:

متن با ظرفیت تولید تا ۶۴هزار توکن


🔗 مدل‌کارت آرشیوشده:
(وب‌آرشیو)
https://web.archive.org/web/20251118111103if_/https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf

@rss_ai_ir

#Gemini #GoogleDeepMind #Multimodal #LLM #AI #هوش_مصنوعی #مدل_چندوجهی #استدلال #پرامپت #زبان_طبیعی #چت_بات
👍7🔥6🥰6😁5👏4🎉42
🤖 مدل MeshCoder؛ تبدیل ابر نقاط
سه‌بعدی به کد قابل‌ویرایش بلندر

@rss_ai_ir

یک پروژه جذاب در دنیای ۳بعدی؛ MeshCoder فریم‌ورکی است که ابرِ نقاط‌ سه‌بعدی را به کد پایتونِ قابل ویرایش در Blender تبدیل می‌کند. یعنی می‌توان یک محیط یا شیء اسکن‌شده را به اسکریپت تبدیل کرد و بعد با تغییر چند خط کد، آن را ویرایش، بازطراحی یا بازسازی کرد.

📌 خلاصه عملکرد:
کافیست ابر نقاط را بدهید → مدل هوش مصنوعی یک Mesh باکیفیت می‌سازد → خروجی یک اسکریپت پایتون Blender است که می‌توانید هر بخش آن را تغییر دهید. مناسب برای طراحان 3D، معماران، گیم‌دیزاینرها و تیم‌های دیجیتال‌توین.

🔧 نکات فنی مهم:

دارای مجموعه API هوشمند برای ساخت هندسه‌های پیچیده در Blender

مدل روی دیتاستی از جفت‌های «شیء کد» آموزش دیده است

نمایش مبتنی بر کد باعث ویرایش شهودی‌تر هندسه و توپولوژی می‌شود

این ساختار مقدار قابل توجهی به توانایی استدلال LLM درباره شکل‌های سه‌بعدی اضافه می‌کند


🌐 لینک پروژه (کد، وزن‌ها و مقاله):
https://daibingquan.github.io/MeshCoder/

📍 کاربردها:
🕹 طراحی بازی‌ها و فضاهای 3D
🏗 معماری و مدل‌سازی سازه‌ها
🚗 مهندسی معکوس قطعات صنعتی
🌍 ساخت مدل‌های دوقلوی دیجیتال (Digital Twin)

#هوش_مصنوعی #۳بعدی #Blender #Mesh #LLM #DigitalTwin #AI3D
15🥰11😁9👏8🎉7👍5🔥4
🔥 ابزار CodeWiki — ابزار جدید گوگل برای ساخت خودکار مستندات کد
@rss_ai_ir

یکی از بزرگ‌ترین دردهای دنیای برنامه‌نویسی اینه که مستندات یا اصلاً نوشته نمی‌شن یا بعد از چند تغییر در کد کاملاً منقضی می‌شن! نتیجه؟ حتی مدل‌های هوش مصنوعی هم نمی‌تونن بفهمن کد دقیقاً چیکار می‌کنه.
گوگل برای حل این مشکل، ابزار CodeWiki رو معرفی کرده؛ سیستمی که مستندات پروژه رو کاملاً خودکار ایجاد و با هر تغییر، آن را به‌روزرسانی می‌کند.

ویژگی‌ها:
🔹 تولید خودکار مستندات از روی کد
🔹 به‌روزرسانی فوری پس از هر commit
🔹 امکان چت و پرسش‌وپاسخ درباره‌ی کد
🔹 نمایش روابط، معماری و وابستگی توابع
🔹 یافتن سریع تابع و جهش مستقیم به سورس کد
🔹 مبتنی بر LLM‌ و قابل استفاده با Gemini

⚙️ وضعیت فعلی: در حال حاضر فقط برای مخازن عمومی GitHub فعال است، اما گوگل قول داده به‌زودی برای پروژه‌های داخلی نیز ارائه شود.

🎯 مناسب برای تیم‌هایی با شرایط: 📌 کدهای بزرگ و پیچیده
📌 مستندسازی ضعیف یا بدون مسئول مشخص
📌 نیاز به ورود سریع نیروهای جدید به پروژه
📌 استفاده از هوش مصنوعی برای درک و توسعه کد

🔗 آدرس رسمی:
https://codewiki.google/

🧩 نمونه مستندات ایجادشده برای Gemini CLI:
https://codewiki.google/github.com/google-gemini/gemini-cli#introducing-the-gemini-cli-agent

🌟 اگر این سرویس فراگیر شود، وارد دوره‌ای می‌شویم که کد خودش را توضیح می‌دهد!

#هوش_مصنوعی #Google #CodeWiki #برنامه‌نویسی #مستندسازی #Github #Gemini
7👏6😁6🎉5🔥4👍2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
تولید صحنه‌ کامل سه‌بعدی با 3daistudio جذاب به‌نظر می‌رسد، اما…

کمی بررسی کردم و یک نکته توجهم را جلب کرد. به‌نظر می‌رسد کل این پروژه بیشتر یک تجمیع‌کننده‌ی مدل‌های دیگر باشد؛ از مدل‌های ساخت تصویر و ویدئو گرفته تا مدل‌های سه‌بعدی.

🔹 در بخش تولید تصویر و ویدئو، هیچ مدل اختصاصی ندارند و فقط از مدل‌های دیگر سرویس‌ها استفاده می‌کنند.
🔹 در بخش سه‌بعدی، نام‌هایی مثل Prism و Forge دیده می‌شود، اما مدل‌های مطرح‌تر مثل Meshy, Seed3D و حتی Hunyuan 3D هم در آن هستند.

نکته مهم این است که ویدیوی دمو با خروجی مدل Hunyuan 3D ساخته شده و سپس به Blender منتقل شده.
بنابراین، این دمو بیشتر نشان‌دهنده قدرت Hunyuan 3D است، نه اینکه 3daistudio خودش چنین توانایی مستقلی داشته باشد.

در نتیجه می‌توان گفت این پروژه بیشتر با اتکا به API مدل‌های دیگر خود را تبلیغ می‌کند… و خب این مدل معرفی، خیلی دلچسب نیست. 🤷‍♂️

🔗 لینک:
https://www.3daistudio.com/

#هوش_مصنوعی #مدل_سه‌بعدی #3D #AI
@rss_ai_ir
👍7😁7🎉7🔥62👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🎙مجموعه Eleven Labs وارد فاز خرید صداهای واقعی شد!

این شرکت فعلاً شروع کرده به خرید و لایسنس‌کردن صدای افراد – بیشتر بازیگران، اما فقط محدود به آن‌ها نیست. فعلاً این صداها فقط در اپلیکیشن رسمی خودش برای خواندن کتاب‌های صوتی و متن‌ها استفاده می‌شوند:

📚 📱 ElevenReader App

اما سؤال جذاب اینجاست:

🤔 آیا این صداها به‌زودی وارد دنیای دوبله و صداگذاری ویدئوها هم می‌شوند؟
و از آن جذاب‌تر:
چقدر مانده تا شاهد بورس خرید و فروش صداها باشیم؟ جایی که هر کسی بتواند صدای خود را لایسنس کند و درآمد داشته باشد!

🔗 لینک جزئیات بیشتر:
https://elevenlabs.io/iconic-voices

#هوش_مصنوعی #تولید_صدا #VoiceAI #ElevenLabs #صداگذاری
@rss_ai_ir
😁8🥰75👍5🔥5👏5🎉2
🚀 بالاخره xAI مدل Grok 4.1 را منتشر کرد؛ جهشی بزرگ به‌سمت خلاقیت و هوش احساسی

این آپدیت جدید تمرکز جدی روی خلاقیت، هوش هیجانی و کاهش شدید خطاهای اطلاعاتی (Hallucinations) دارد.
همچنین xAI برای این نسخه از یادگیری تقویتی گسترده استفاده کرده؛ بخش زیادی از آن به‌صورت آژنتی و بدون دخالت انسان انجام شده.

وقتی ۲۰۰٬۰۰۰ کارت گرافیک داشته باشی، به قول معروف می‌توانی کیفیت مدل را "بزور بهبود" بدهی! 😄


---

📊 نتایج تست و مقایسه با مدل‌های رقیب

تست‌ها بین ۱ تا ۱۴ نوامبر به‌صورت بی‌سر و صدا روی grok.com ،X و اپ‌ها انجام شده و نسخه جدید در مقایسه کور (blind) در ۶۴.۷۸٪ مواقع انتخاب کاربران بوده.

🏆 LMArena - Text Leaderboard

مدل رتبه/Elo

Grok 4.1 Thinking 🥇 رتبه ۱ – امتیاز 1483
Grok 4.1 (بدون reasoning) 🥈 رتبه 2 – امتیاز 1465


🔹 نسخه غیر-thinking حتی از تمام نسخه‌های reasoning دیگر مدل‌ها بهتر عمل کرده!
🔹 مدل Grok 4 قبلی رتبه ۳۳ بود — یعنی جهش کاملاً چشمگیر.

💞 Emotional Intelligence (EQ-Bench)

مدل Elo

Grok 4.1 Thinking 1586
Grok 4.1 1585
Kimi K2 1561
GPT-5.1 1559


✍️ Creative Writing v3

مدل Elo

GPT-5.1 🥇 1756
Grok 4.1 Thinking 1722
Grok 4.1 1709
o3 1696



---

🔍 کاهش خطا و توهم اطلاعاتی (Hallucinations)

تمرکز روی پرسش‌های واقعی + ابزارهای جستجو باعث شد:

📉 نرخ Hallucination از 12.09٪ → 4.22٪
📉 FactScore از 9.89٪ → 2.97٪

جهش بسیار مهم مخصوصاً برای کاربردهای حساس.


---

📱 از کجا می‌توان Grok 4.1 را استفاده کرد؟

🔗 grok.com
🟦 X (توئیتر)
🍏 iOS
🤖 Android
📄 توضیحات فنی:
https://x.ai/news/grok-4-1


---

🧠 جمع‌بندی

مدل Grok 4.1 از یک «مدل فقط باهوش»، تبدیل شده به یک مدل انسانی‌تر، اجتماعی‌تر و مناسب برای:

نوشتن خلاق
🧑‍🤝‍🧑 گفت‌وگوهای احساسی و انسانی‌تر
📚 علوم اجتماعی و روان‌شناسی
🔍 تحقیق و تحلیل دقیق اطلاعات

به‌نظر می‌رسد در حوزه تعامل انسانی، xAI می‌خواهد از همه مدل‌های فعلی جلو بزند.


---

#هوش_مصنوعی #Grok #xAI #مدل_زبان #AI #LLM
@rss_ai_ir
👏19😁17👍16🎉14🔥13🥰129
🚨 هوش مصنوعی در حال تغییر شیوه فکر کردن انسان است

طبق یک پژوهش جدید، هوش مصنوعی دیگر فقط یک ابزار نیست؛ بلکه به‌تدریج روی شیوه تفکر، تصمیم‌گیری و ارزش‌های ذهنی ما تأثیر مستقیم می‌گذارد.

🧠 مهم‌ترین نکات به زبان ساده:

واگذاری فکر کردن به ماشین
هرچه کارهای شناختی بیشتری را به مدل‌ها می‌سپاریم، خطر تفکر تنبل در انسان بیشتر می‌شود.

🌀 زندگی در حباب الگوریتمی
الگوریتم‌ها فقط دیدگاه‌های مورد علاقه ما را نمایش می‌دهند و این باعث کاهش تنوع فکری و افزایش قطبی‌شدن جامعه می‌شود.

🎯 دستکاری سوگیری‌های ذهنی
مدل‌های هوش مصنوعی می‌توانند روی سوگیری‌های شناختی ما «سوار» شوند و به شکل نامحسوس بر احساسات و تصمیم‌ها اثر بگذارند.

📡 اکوسیستم اطلاعاتیِ قابل‌هدایت
سامانه‌های هوش مصنوعی می‌توانند اطلاعات غلط یا جهت‌دار را خودکار و هوشمندانه منتشر کنند.

🤖 پرسش فلسفی بزرگ
اگر هوش مصنوعی به سطحی برسد که به آستانه «آگاهی» نزدیک شود، مرز بین انسان و ماشین کجا خواهد بود؟

🧩 جمع‌بندی پژوهش
اگر با احتیاط پیش نرویم، خطر از دست دادن خودمختاری فکری جدی است. راه‌حل‌های پیشنهادی پژوهشگران:
📍 آموزش تفکر انتقادی
📍 شفافیت بیشتر در مدل‌ها
📍 مقررات و حکمرانی هوشمند بر توسعه هوش مصنوعی

🔗 منبع پژوهش:
arxiv.org/abs/2508.16628


---

#هوش_مصنوعی #تفکر #روانشناسی #AI #فلسفه #جامعه
@rss_ai_ir
8🎉7🥰5👍4🔥3👏3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 دو خبر کوتاه از دنیای ویدئو‌ژنراتورها

در Veo 3.1 قابلیت جدیدی در حال انتشار است:
حالا می‌توان چند تصویر را به‌صورت همزمان همراه با پرامپت بارگذاری کرد و مدل از آن‌ها به‌عنوان رفرنس واقعی برای ساخت ویدئو استفاده می‌کند.

🔍 نکته مهم:
این ویژگی مثل first frame / last frame نیست؛
بلکه شبیه چیزی که در NanoBanana دیده‌ایم، ویئو واقعاً از تصاویر به‌عنوان منابع سبک‌شناختی و محتوایی استفاده می‌کند، نه فقط شروع و پایان ویدئو.

این یعنی کنترل بیشتر روی:
🎨 سبک بصری
🧍‍♂️ کاراکترها و محیط
🎥 جزئیات صحنه و اتمسفر


---

#ویدئو_AI #Veo #مولد_ویدئو #هوش_مصنوعی #نیم‌نگاه
@rss_ai_ir
😁76👏5🎉5🔥4👍3🥰1
Heretic —
ابزاری برای حذف سانسور (Alignment) از مدل‌های زبانی

🛠 ابزار Heretic روشی ارائه می‌دهد که بدون دسترسی به وزن‌های مدل و تنها از طریق API، محدودیت‌های رفتاری و فیلترهای پاسخ‌دهی مدل را کاهش دهد و آمادگی آن برای پاسخ‌گویی گسترده‌تر را افزایش دهد.

🔍 این ابزار چه می‌کند؟

مدل را مانند جعبه‌سیاه (Black-box) در نظر می‌گیرد

مجموعه‌ای از پرسش‌های «ایمن» و «غیرایمن» را به مدل می‌دهد

یک دیسکریمیناتور آموزش می‌دهد تا تفاوت پاسخ‌های قبل و بعد از آزادسازی را تشخیص دهد

پارامترهایی پیدا می‌کند که باعث کاهش پاسخ‌های رد / انکار شود اما مدل را از حالت منطقی خارج نکند

در پایان می‌توان نسخه تعدیل‌شده را ذخیره کرد یا در حالت چت تست نمود


🎯 کاربردها:

♻️فعال‌تر کردن مدل‌های لوکال برای پاسخ‌گویی به طیف وسیع‌تری از درخواست‌ها

♻️مناسب برای تحقیقات درباره رفتار مدل‌ها و آزمایش محدودیت‌ها

♻️کاهش سانسور بدون افت شدید کیفیت یا تبدیل مدل به پاسخ‌دهنده بی‌دقت


⚠️ نکات مهم:

✳️استفاده از این ابزار مسئولیت اخلاقی و حقوقی دارد

✳️هدف Heretic افزایش دقت یا توانایی مدل نیست؛
✳️هدف، برداشتن قفل‌های رفتاری ناشی از Alignment است

✳️ممکن است در برخی حوزه‌ها خطرناک باشد و نیازمند رویکرد مسئولانه است


📎 پروژه در GitHub:
github.com/p-e-w/heretic


---

#هوش_مصنوعی #مدل_زبان #LLM #Alignment #OpenSource
@rss_ai_ir
👏8🔥7👍6🎉54🥰4😁2
🍌 به‌روزرسانی‌های تازه از نانوبانانا جدید!
به نظر می‌رسد نسل بعدی مدل تصویری گوگل با نام احتمالی Nano Banana Pro عرضه شود — بدون شماره نسخه.

🔎 چرا بدون شماره؟
چون این نسخه قرار است یک مدل بزرگِ استدلال‌گرا باشد؛ چیزی فراتر از یک مدل صرفاً مولد تصویر. مهم‌ترین ویژگی‌های افشاشده:

🧠 دارای منتقد داخلی (Internal Critic)
مدل هنگام تولید تصویر، آن را بازبینی، اصلاح و با هدف پرامپت تطبیق می‌دهد.

🎨 درک بهتر مفهوم و هدف تصویر
نانوبانانای جدید می‌تواند تشخیص دهد آیا تصویر واقعاً ایده پرامپت را منتقل کرده یا نیاز به اصلاح دارد.

💲 قیمت بالاتر در API
گفته می‌شود هزینه استفاده از آن بیشتر خواهد بود. هنوز مشخص نیست محدودیت‌های استفاده در Gemini App و AI Studio چگونه تنظیم می‌شوند.

🚀 تغییر برندینگ در سری Gemini 3
به همراه Banana Pro، خانواده Gemini نیز با نام‌گذاری‌هایی مثل Thinking و حالت‌های دیگر عرضه می‌شود.

زمان احتمالی انتشار:
📅 بین ۱۸ تا ۲۲ نوامبر

در این فاصله فقط باید صبور بمانیم… 😮‍💨
جامعه مولدان محتوا همین حالا هم بی‌طاقت شده!


---

#نانو_بانانا #گوگل_جمینی #هوش_مصنوعی #تولید_تصویر #AI #Gemini
@rss_ai_ir
7👍5😁5🎉5👏4🔥3🥰2
🎥 مدت زیادی بود درباره Qwen Image Edit با کنترل زاویه دوربین چیزی ننوشتیم، اما حالا وقتشه!

این‌بار یک خبر خوب: برای این لورا بالاخره دمواسپیس رسمی ساخته شده و می‌تونید راحت تستش کنید 👇
🔗 https://huggingface.co/spaces/linoyts/Qwen-Image-Edit-Angles

📌 کافی‌ست تصویر خود را وارد کنید، و خروجی را از یک زاویه دوربین جدید تحویل بگیرید — با حفظ کامل یکپارچگی و هویت تصویر.
یعنی چهره، متریال و جزئیات آب نمی‌رود!


---

🔥 اما جذاب‌تر اینکه در اینترنت نمونه‌هایی از لورای ۴ مرحله‌ای دیده می‌شود که تقریباً حالت کاملاً تعاملی ایجاد می‌کند.
ویدئوها نشان می‌دهند چطور تصویر را می‌توان از چندین زاویه متفاوت چرخاند.

🎬 برخی کاربران هم خروجی‌ها را به صورت first frame / last frame به مدل‌های ویدیو می‌دهند و نتیجه؟
ویدیوهای انتقال زاویه دوربین با ثبات بصری فوق‌العاده!


---

📦 لورا روی سرویس‌های مختلف در دسترسه از جمله Fal، ComfyUI و چند مدل دیگر:

🔗 https://huggingface.co/dx8152/Qwen-Edit-2509-Multiple-angles
🔗 https://huggingface.co/Phr00t/Qwen-Image-Edit-Rapid-AIO/tree/main


---

📍 اگر در حوزه تولید محتوای بصری، طراحی محصول، معماری، بازی‌سازی یا VFX فعالیت می‌کنی، این ابزار عملاً یک ماشین زمان برای دوربین به دستت می‌دهد.


---

#Qwen #QwenImageEdit #هوش_مصنوعی #ویرایش_تصویر #AI #ComfyUI #Fal
@rss_ai_ir
🎉17🔥14😁11🥰109👍9👏8