VIRSUN
6.11K subscribers
1.05K photos
608 videos
5 files
674 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 بساز انسان‌نمای خودت!

پروژه‌ی OpenArm یک طرح کاملاً متن‌باز برای ساخت ربات انسان‌نماست که هرچیزی برای شروع لازم دارید را در اختیارتان می‌گذارد — از مدل‌های CAD و فریمور تا نرم‌افزار کنترل و شبیه‌سازها.

🦾 با این سیستم می‌تونید بازوهای رباتیک بسازید، تغییر بدید و کنترل کنید؛
پشتیبانی از تله‌اپراسیون با فیدبک نیرویی و جبران گرانش باعث میشه کنترل بازو طبیعی و دقیق باشه.

💡 یکپارچه با MuJoCo و Isaac Sim — می‌تونید قبل از اجرای واقعی، کنترل و حرکت‌ها رو در محیط مجازی تست کنید.

🔩 هدف پروژه ساده است:
دموکراتیزه کردن رباتیک — تا هر پژوهشگر، استارتاپ یا علاقه‌مند بتونه از مرحله‌ی ایده به ربات واقعی برسه.
می‌تونید خودتون بسازید یا نسخه‌ی آماده سفارش بدید.

توسعه‌دهنده: Enactic (توکیو، ژاپن) 🇯🇵
GitHub: github.com/enactic/OpenArm

@rss_ai_ir

#OpenSource #Robot #Humanoid #Robotics #AI #Engineering #Enactic
3
This media is not supported in your browser
VIEW IN TELEGRAM
💻🤯 Gemini 3.0 Pro
می‌تواند شبیه‌ساز کامل سیستم‌عامل بسازد!

گوگل با مدل جدید Gemini 3.0 Pro مرزهای خلاقیت هوش مصنوعی را جابه‌جا کرده است — کاربران گزارش داده‌اند که این مدل می‌تواند تنها با یک پرامپت ساده، یک سیستم‌عامل شبیه Windows یا macOS را به‌طور کامل در قالب یک فایل HTML ایجاد کند!

🔹 یکی از کاربران از Gemini خواسته بود:
> «یک سیستم‌عامل وب مانند Windows بساز با ویرایشگر متن، ترمینال (با پشتیبانی از Python)، فایل‌منیجر، Paint، ویرایشگر ویدیو و چند ابزار دیگر.»
و مدل تمام کد را در یک مرحله تحویل داد.



🔹 نتیجه؟
یک شبیه‌ساز کامل و تعاملی از Windows و macOS که تنها با HTML، CSS و JavaScript در مرورگر اجرا می‌شود — با آیکون‌ها، انیمیشن‌ها و اپ‌های واقعی.

🔹 دموی زنده را می‌توانید اینجا ببینید:
🪟 نسخه Windows
🍎 نسخه macOS

🔹 نسخه عمومی Gemini 3.0 طبق شایعات در اکتبر منتشر می‌شود، و مدل‌های Pro در Google AI Studio در دسترس خواهند بود.

اگر این دمو واقعاً بازتاب توانایی‌های مدل باشد، Gemini به‌زودی مرز بین دستیار برنامه‌نویسی و خالق خودکار نرم‌افزار را از بین خواهد برد.

@rss_ai_ir

#Gemini3 #AI #Google #WebOS #GenerativeAI #Coding #Innovation
4🔥3
🔥 خبر داغ برای علاقه‌مندان هوش مصنوعی!

کاربرها گزارش داده‌اند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.

🎬 نسخه‌ی جدید Veo طبق شایعات:

♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالت‌های سینمایی و پری‌ست‌های نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow


به‌نظر می‌رسه گوگل داره جدی‌تر از همیشه وارد رقابت با Sora از OpenAI می‌شه.

@rss_ai_ir

#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
🔥 پژوهشی تازه نشان می‌دهد که GPT-6 ممکن است نه فقط هوشمندتر، بلکه از نظر محاسباتی «زنده» باشد!

🧠 مقاله‌ای با عنوان SEAL (Self-Adapting Language Models) در arXiv:2506.10943 منتشر شده که توضیح می‌دهد چگونه یک مدل زبانی می‌تواند پس از استقرار در دنیای واقعی، به یادگیری مداوم ادامه دهد — بدون نیاز به بازآموزی (retraining).

چند نفر از نویسندگان SEAL اکنون در OpenAI فعالیت می‌کنند 👀 و احتمال زیادی وجود دارد که این فناوری در GPT-6 به کار گرفته شود.

ویژگی‌های کلیدی SEAL:

📚 یادگیری از داده‌های جدید در زمان واقعی

🔧 ترمیم خودکار دانش تخریب‌شده

🧩 ایجاد حافظه‌های پایدار در میان جلسات مختلف


اگر GPT-6 این معماری را بپذیرد، دیگر صرفاً از داده‌ها استفاده نخواهد کرد — بلکه آن‌ها را جذب می‌کند.
مدلی که با تغییر جهان، خودش هم تغییر می‌کند و هر روز بهتر می‌شود.

📈 این می‌تواند آغاز عصر یادگیری پیوسته باشد — پایانی بر دوره‌ی مدل‌های ثابت و منجمد.
به فصل جدید خوش آمدید.

https://arxiv.org/abs/2506.10943

@rss_ai_ir
#GPT6 #OpenAI #SEAL #AI #ContinuousLearning #MachineLearning
👍2👏1
🔔 تیمی از پژوهشگران کره‌ای روشی نوین مبتنی بر هوش مصنوعی توسعه داده‌اند که می‌تواند ویژگی‌های مواد را تنها با داده‌های بسیار کم شناسایی کند.

در روش‌های سنتی، این کار به آزمایش‌های متعدد و تجهیزات گران‌قیمت نیاز داشت، اما در این رویکرد جدید، هوش مصنوعی با قوانین فیزیک ترکیب شده تا فرآیند تحلیل بسیار سریع‌تر و کارآمدتر شود.

📘 پژوهشگران از روش یادگیری ماشین آگاه از فیزیک (PIML) استفاده کردند؛ روشی که به مدل‌های هوش مصنوعی می‌آموزد از قوانین فیزیکی پیروی کنند.

🔹 در یک آزمایش، سیستم توانست ویژگی‌های مواد لاستیکی را فقط با داده‌های حاصل از یک آزمایش دقیقاً پیش‌بینی کند.
🔹 در آزمایشی دیگر، ویژگی‌های کلیدی مواد ترموالکتریک (که گرما را به برق تبدیل می‌کنند) را با چند اندازه‌گیری محدود پیش‌بینی کرد.

علاوه بر این، تیم یک مدل جدید با نام Physics Informed Neural Operator (PINO) ساخت که قادر است قوانین فیزیکی را درک کند و ویژگی‌های مواد جدیدی که هرگز ندیده پیش‌بینی کند.
پس از آموزش روی ۲۰ نوع ماده، این مدل توانست ویژگی‌های ۶۰ ماده‌ی جدید را با دقت بالا تخمین بزند.

⚙️ این پیشرفت می‌تواند به‌شدت روند کشف و طراحی مواد جدید را در حوزه‌هایی مانند انرژی، الکترونیک و مهندسی تسریع کند.

@rss_ai_ir
#AI #PIML #PINO #MaterialScience #PhysicsInformedAI #Innovation
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
👤 انسان: می‌خواهد ربات‌ها تمام کارها را به جای او انجام دهند.

🤖 در همین حین، ربات‌ها:

(تصویر یا ویدیو از رباتی که زمین می‌خورد، گم می‌شود یا کار بی‌ربطی انجام می‌دهد 😄)

@rss_ai_ir
#ربات #هوش_مصنوعی #طنز #فناوری
😁3🤣2
🎨 مایکروسافت هم وارد میدان ساخت تصویر شد!

در حالی که از مدت‌ها پیش شایعاتی درباره‌ی فاصله گرفتن مایکروسافت از OpenAI شنیده می‌شد، حالا این شرکت با انتشار MAI-Image-1 رسماً نشان داد که می‌خواهد استقلال خود را حفظ کند.

💡 مدل جدید بخشی از خانواده‌ی MAI است — همان مدل‌هایی که مایکروسافت برای «تفکر و استدلال» توسعه می‌دهد و قرار است جایگزین مدل‌های o1 و o3-mini از OpenAI در Copilot شود.

و حالا، نسخه‌ی تصویری آن هم رسید:
🖼️ هMAI-Image-1 — مدل تولید تصویر از مایکروسافت که به شوخی شبیه‌سازی نام GPT-Image-1 است.
مدل تازه در رتبه‌ی ۹ جدول LMArena قرار گرفته، اما مایکروسافت با افتخار می‌گوید:

> «معرفی MAI-Image-1، که در اولین حضور خود در میان ۱۰ مدل برتر LMArena قرار گرفت.»



👀 از تصاویر منتشرشده در سایت مایکروسافت می‌توان گفت که مدل از نظر کیفیت در حد نسل قبلی سازندگان تصویر است (در حد Flux.dev) — پوست‌ها کمی مصنوعی و براق، ولی باید عملکرد واقعی را دید.

🧩 در حال حاضر مدل به‌صورت عمومی در دسترس نیست، اما به‌زودی در Copilot و Bing Image Creator عرضه خواهد شد.
اگر عجله دارید، می‌توانید آن را به‌صورت محدود در LMArena بیابید — کافی‌ست چند بار کلیک کنید تا ظاهر شود 😄

🔗 معرفی رسمی از Microsoft.ai

@rss_ai_ir
#Microsoft #AI #MAI #ImageGeneration #Copilot #BingImageCreator
1👍1
🤗 چه کسانی واقعاً محرک هوش مصنوعی متن‌باز هستند؟
تحلیل ۵۰ مدل برتر از نظر دانلود در Hugging Face

---
📊 مطالعه‌ی جدید نشان می‌دهد که کدام سازمان‌ها و چه نوع مدل‌هایی ستون فقرات اکوسیستم open-source AI را تشکیل می‌دهند.
---
🔥 نتایج کلیدی:
📦 تنها ۵۰ مدل (۳.۴٪ از کل مدل‌ها) بیش از ۸۰٪ از ۴۵ میلیارد دانلود را به خود اختصاص داده‌اند.
یعنی بیشتر فعالیت‌ها حول محور گروه کوچکی از رهبران می‌چرخد — همان‌هایی که چهره‌ی اصلی AI متن‌باز را می‌سازند.


---

📉 اندازه مهم است (کوچک‌تر = بهتر):

♻️۹۲.۵٪ دانلودها مربوط به مدل‌هایی با کمتر از ۱ میلیارد پارامتر
♻️۸۶.۳٪ < ۵۰۰ میلیون
♻️۷۰٪ < ۲۰۰ میلیون
♻️۴۰٪ < ۱۰۰ میلیون


نتیجه واضح است: در دنیای open-source، مدل‌های سبک، سریع و قابل اجرا روی دستگاه‌های محلی برنده‌اند.
---

🧠 محبوب‌ترین حوزه‌ها:

♻️مدل NLP (پردازش زبان طبیعی) — ۵۸.۱٪
♻️بینایی کامپیوتر — ۲۱.۲٪
♻️صوت — ۱۵.۱٪
♻️چندوجهی — ۳.۳٪
♻️داده‌های زمانی — ۱.۷٪
---

🏢 چه کسانی این مدل‌ها را می‌سازند؟

♻️شرکت‌ها — ۶۳.۲٪ (گوگل پیشتاز است)
♻️دانشگاه‌ها — ۲۰.۷٪
♻️توسعه‌دهندگان مستقل — ۱۲.۱٪
♻️سازمان‌های غیرانتفاعی — ۳.۸٪
♻️آزمایشگاه‌های دیگر — ۰.۳٪
---

⚙️ چه نوع مدل‌هایی محبوب‌ترند؟

♻️مدل Encoderهای متنی — ۴۵٪ از کل دانلودها
♻️مدل Decoderها — ۹.۵٪
♻️مدل Encoder-Decoderها — ۳٪

📌 بر خلاف هیاهوی رسانه‌ای پیرامون LLMها، کاربران عمدتاً مدل‌های کاربردی و کوچک را دانلود می‌کنند که به راحتی در محصولات واقعی ادغام می‌شوند.

---

🌍 پراکندگی جغرافیایی:
ایالات متحده با اختلاف پیشتاز است:

♻️۱۸ بار در میان ۵۰ مدل برتر دیده می‌شود.
♻️۵۶.۴٪ از کل دانلودها از مدل‌های ساخت آمریکا هستند.
---
💡 نتیجه نهایی:
هوش مصنوعی متن‌باز نه به لطف غول‌هایی با تریلیون پارامتر، بلکه به کمک مدل‌های فشرده، سریع و کاربردی زنده است — همان‌هایی که واقعاً در پروژه‌ها و محصولات استفاده می‌شوند.

---

📖 منبع کامل: Hugging Face Blog
@rss_ai_ir

#AI #HuggingFace #OpenSource #MachineLearning #LLM #AITrends
👍1
📄 PaddleOCR-VL (0.9B) —
مدل فشرده Vision-Language نسل جدید از Baidu AI


تیم تحقیقاتی Baidu AI نسخه‌ی جدیدی از مدل‌های چندوجهی خود را معرفی کرده است:

🔹 PaddleOCR-VL (0.9B)
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:

♻️شناسایی و تشخیص متن‌ها
♻️جدول‌ها و داده‌های ساختاریافته
♻️فرمول‌های ریاضی
♻️نمودارها و گراف‌ه
ا
💡 درون :

NaViT
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE
نسخه سبک‌شده‌ی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاه‌های لبه‌ای (edge).

🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR

🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:

paddleocr.ai/latest/en/index.html

@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
🔥 سم آلتمن در حال انجام یکی از بزرگ‌ترین «تغییرات مالکیتی» تاریخ است!

شرکت OpenAI که در ابتدا ۱۰۰٪ غیرانتفاعی بود،
اکنون تنها حدود ۲۰٪ از مالکیت خود را در اختیار بنیاد اصلی دارد.

📉 یعنی چه؟

> آلتمن عملاً ۸۰٪ از کنترل و سهم مالی را از ساختار غیرانتفاعی جدا کرده
و حالا به‌صورت غیرمستقیم می‌خواهد OpenAI را به خودش بفروشد — آن‌هم با قیمتی پایین‌تر از ارزش واقعی.



⚖️ در همین حال، ایلان ماسک علیه این اقدام در دادگاه در حال پیگیری است.

به نظر می‌رسد نبرد بر سر آینده‌ی OpenAI تازه آغاز شده...

@rss_ai_ir
#OpenAI #SamAltman #ElonMusk #AI #TechEthics