VIRSUN

📄 PaddleOCR-VL (0.9B) —
مدل فشرده Vision-Language نسل جدید از Baidu AI

تیم تحقیقاتی Baidu AI نسخه‌ی جدیدی از مدل‌های چندوجهی خود را معرفی کرده است:

🔹 PaddleOCR-VL (0.9B) —
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:

♻️شناسایی و تشخیص متن‌ها
♻️جدول‌ها و داده‌های ساختاریافته
♻️فرمول‌های ریاضی
♻️نمودارها و گراف‌ه
ا
💡 درون :

NaViT —
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE —
نسخه سبک‌شده‌ی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاه‌های لبه‌ای (edge).

🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR

🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:

paddleocr.ai/latest/en/index.html

@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR

1.49K views16:40

VIRSUN

🔥 سم آلتمن در حال انجام یکی از بزرگ‌ترین «تغییرات مالکیتی» تاریخ است!

شرکت OpenAI که در ابتدا ۱۰۰٪ غیرانتفاعی بود،
اکنون تنها حدود ۲۰٪ از مالکیت خود را در اختیار بنیاد اصلی دارد.

📉 یعنی چه؟

> آلتمن عملاً ۸۰٪ از کنترل و سهم مالی را از ساختار غیرانتفاعی جدا کرده
و حالا به‌صورت غیرمستقیم می‌خواهد OpenAI را به خودش بفروشد — آن‌هم با قیمتی پایین‌تر از ارزش واقعی.

⚖️ در همین حال، ایلان ماسک علیه این اقدام در دادگاه در حال پیگیری است.

به نظر می‌رسد نبرد بر سر آینده‌ی OpenAI تازه آغاز شده...

@rss_ai_ir
#OpenAI #SamAltman #ElonMusk #AI #TechEthics

1.49K views16:44

VIRSUN

🧬 مدل Gemma C2S-Scale 27B راهی تازه برای مبارزه با سرطان گشود

پژوهشگران Google Research و Calico از این مدل برای تحلیل فعالیت ژن‌ها در سلول‌ها و یافتن ترکیباتی استفاده کردند که بتوانند واکنش ایمنی بدن علیه تومورها را تقویت کنند.

🔍 چالش اصلی این است که بسیاری از تومورها «سرد» باقی می‌مانند — سیستم ایمنی آن‌ها را تشخیص نمی‌دهد. برای فعال‌سازی پاسخ ایمنی باید بیان آنتی‌ژن‌ها (Antigen Presentation) را افزایش داد، آن هم فقط در سلول‌هایی که نشانه‌ای از پاسخ ایمنی ضعیف دارند.

🧠 مدل Gemma پیش‌بینی کرد که ترکیب داروی silmitasertib (مهارکننده‌ی CK2) با دوز پایین اینترفرون باعث افزایش بیان MHC-I می‌شود — در نتیجه تومورهای «سرد» برای سیستم ایمنی قابل‌تشخیص‌تر می‌شوند.
🔬 نتایج آزمایشگاهی این پیش‌بینی را تأیید کردند:
ترکیب دو دارو، فعالیت آنتی‌ژن‌ها را حدود ۵۰٪ افزایش داد.
این دستاورد می‌تواند پایه‌ای برای نسل جدیدی از ایمونوتراپی (درمان‌های ایمنی ضد سرطان) باشد.

✨ نکته‌ی مهم:
هوش مصنوعی فقط داده‌ها را تحلیل نکرد — بلکه فرضیه‌ای علمی ارائه داد که در عمل نیز تأیید شد.
نمونه‌ای از گذار بزرگ: از مدل‌های زبانی به کاشفان دارو و سازوکارهای زیستی نوین.
🟢 بیشتر بخوانید
🧾 مقاله‌ی علمی
💻 GitHub
@rss_ai_ir
#GoogleAI #Gemma #Calico #BioTech #CancerResearch #AI

1.47K viewsedited 16:46

VIRSUN

📊 هوش مصنوعی و بازار کار آمریکا؛ هنوز خبری از آخرالزمان نیست، اما نشانه‌هایی نگران‌کننده دیده می‌شود

پژوهشگران بازار کار آمریکا همچنان در حال بررسی تأثیر هوش مصنوعی بر اشتغال هستند — و تا این لحظه، هیچ فاجعه‌ای که برخی رسانه‌ها و بدبینان وعده می‌دادند، دیده نمی‌شود.
اما با نگاهی دقیق‌تر، روندهایی در حال شکل‌گیری است که تا حدی نتایج پژوهش اخیر دانشگاه استنفورد را تأیید می‌کند.

💼 نکات کلیدی:

✅اجرای واقعی فناوری‌های هوش مصنوعی تازه آغاز شده است.
✅از سال گذشته، تعداد موقعیت‌های شغلی مرتبط با ادغام هوش مصنوعی در فرآیندهای تجاری به‌طور پیوسته در حال افزایش است.

پژوهشگران شرکت‌ها را به دو گروه تقسیم کردند:
♻️شرکت‌های AI-adopters (پذیرفته‌ و به‌کارگیرنده‌ی هوش مصنوعی) و سایر شرکت‌ها.
♻️نتیجه: در گروه نخست، روند استخدام تغییر کرده — کاهش استخدام نیروهای تازه‌کار (Junior) و افزایش جذب متخصصان ارشد (Senior).
♻️هرچند این شرکت‌ها هنوز تنها حدود ۱۷٪ از بازار کار را تشکیل می‌دهند و تأثیر فعلاً ملایم است.

📘 نام پژوهش نیز جالب است:
Generative AI as Seniority-Biased Technological Change —
«هوش مصنوعی مولد به‌عنوان تغییری فناورانه با سوگیری به نفع نیروهای باتجربه».

🎓 بررسی‌ها نشان می‌دهد که تأثیر این روند به سطح دانشگاه محل تحصیل نیروهای تازه‌کار نیز بستگی دارد:

✳️فارغ‌التحصیلان دانشگاه‌های برتر کمترین آسیب را دیده‌اند.

✳️به شکل جالبی، فارغ‌التحصیلان دانشگاه‌های ضعیف‌تر هم وضعیت نسبتاً بهتری دارند — چون ارزان‌ترند.

✳️اما آسیب‌دیده‌ترین گروه، دانش‌آموختگان دانشگاه‌های متوسط هستند که در رقابت بازار کار عقب افتاده‌اند.

📈 نتیجه:
فعلاً خبری از «آخرالزمان شغلی با هوش مصنوعی» نیست،
اما ساختار بازار کار آرام‌آرام تغییر می‌کند —
به نفع نیروهای باتجربه و به زیان تازه‌کارها.

🔗 منبع: The Economist

#هوش_مصنوعی #بازارکار #اقتصاد #آینده_شغل #AI #Economist #GenerativeAI

👍1😁1💔1

3.83K views16:50

VIRSUN

😨 دانشمندان مؤسسه‌ی فناوری کارلسروهه (KIT) کشف کرده‌اند که امواج وای‌فای پس از بازتاب از بدن انسان می‌توانند برای شناسایی هویت افراد استفاده شوند — درست مثل سیستم سونار در فیلم The Dark Knight.

🔍 این امواج رمزگذاری‌شده نیستند، و پژوهشگران نشان داده‌اند که با تحلیل بازتاب آن‌ها می‌توان تصاویر دقیقی از انسان‌ها ایجاد کرد — تقریباً مانند تصویری که از یک دوربین معمولی به‌دست می‌آید.

🤖 با استفاده از این داده‌ها، هوش مصنوعی قادر است با دقت ۱۰۰٪ شخص را شناسایی کند، موقعیت او در فضا، حالت بدنش و حتی کاری که انجام می‌دهد را تشخیص دهد. این آزمایش با حضور ۱۹۷ شرکت‌کننده با موفقیت انجام شده است.

⚠️ بخش ترسناک ماجرا اینجاست:
برای اجرای چنین فناوری‌ای هیچ تجهیزات خاصی لازم نیست — پژوهشگران معتقدند که از طریق هر مودم خانگی وای‌فای می‌توان افراد را ردیابی و حتی نظارت کرد.

📡 حتی وای‌فای هم به ما خیانت کرد.

@rss_ai_ir
#هوش_مصنوعی #وای_فای #نظارت #حریم_خصوصی #KIT #AI

👍1

3.83K views16:52

VIRSUN

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 شرکت DeepRobotics نسل دوم ربات انسان‌نمای خود با نام DR02 را معرفی کرد

✅این نسخه جدید با طراحی بسیار انسان‌محورتر و توانایی‌های فنی چشمگیر، گامی مهم در جهت استفاده‌ی عملی از ربات‌ها در محیط‌های واقعی محسوب می‌شود.

🔥 ویژگی‌های برجسته DR02:

✳️مقاومت حرارتی از منفی ۲۰ تا ۵۵ درجه سانتی‌گراد

✳️کاملاً ضد آب و ضد گرد و غبار

✳️عملکرد پایدار در شرایط سخت مانند باران، رطوبت بالا، شن و ماسه

✳️این ربات برای فعالیت در محیط‌های دشوار طراحی شده است —
از مناطق بیابانی و جنگلی گرفته تا معدن‌ها و نیروگاه‌ها.

🦾 همچنین DR02 می‌تواند با ربات‌های X30 و LYNX M20 همکاری کند تا مأموریت‌هایی مانند:

♻️بازرسی صنعتی
♻️عملیات نجات
♻️شناسایی و نقشه‌برداری
♻️عبور از موانع پیچیده
را انجام دهد — بدون نیاز به حضور انسان در شرایط خطرناک.

این پیشرفت نشان می‌دهد که ربات‌های انسان‌نما به‌سرعت از نمایشگاه‌ها به میدان عمل وارد می‌شوند.

#هوش_مصنوعی #رباتیک #DeepRobotics #Humanoid #ربات_انسان_نما #ربات_صنعتی #AI

❤1👍1

3.8K views16:58

VIRSUN

0:21

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 ربات‌های انسان‌نمای چینی شرکت Unitree با سرعتی شگفت‌انگیز در حال پیشرفت هستند!

این نسل جدید از ربات‌ها اکنون قادرند حرکات پیچیده و دشوار را با دقت و تعادل بالا انجام دهند — از پرش و چرخش گرفته تا حرکات ترکیبی مشابه تمرینات ورزشی انسان.

📈 سرعت پیشرفت این سیستم‌ها در یادگیری و کنترل حرکتی نشان می‌دهد که چین در مسیر تبدیل شدن به یکی از رهبران جهانی در حوزه‌ی رباتیک هوشمند قرار دارد.

🎯 در آینده‌ای نه‌چندان دور، این ربات‌ها می‌توانند در صنایع، امداد و نجات، و حتی کارهای روزمره کنار انسان‌ها فعالیت کنند.

@rss_ai_ir
#هوش_مصنوعی #رباتیک #Unitree #ربات_انسان_نما #AI #China

3.91K views17:03

VIRSUN

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

🫙 AnyUp:
افزایش جهانی ویژگی‌ها در بینایی ماشین 🫙

❌پژوهشگران روش جدیدی با نام AnyUp ارائه کرده‌اند که می‌تواند برای افزایش وضوح ویژگی‌ها (Feature Up-Sampling) در هر مدل بینایی ماشین و در هر رزولوشنی استفاده شود — بدون نیاز به آموزش مجدد شبکه‌ی رمزگذار (Encoder).

💡 ویژگی اصلی:
معماری AnyUp یک معماری feature-agnostic است که تنها در زمان استنتاج (inference) عمل می‌کند و کیفیت بازسازی ویژگی‌ها را در تصاویر به شکل چشمگیری بهبود می‌دهد.

🔹 قابل استفاده برای تمام معماری‌های بینایی (CNN، ViT و غیره)
🔹 بدون نیاز به داده‌ی اضافی یا تنظیم مجدد مدل
🔹 بهبود کیفیت جزئیات و مرزهای دقیق در تصاویر بازسازی‌شده

📘 منابع:
👉 مقاله: arxiv.org/pdf/2510.12764
👉 پروژه: wimmerth.github.io/anyup
👉 کد: github.com/wimmerth/anyup
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #DeepLearning #AnyUp #ComputerVision #AI

3.93K views17:07

VIRSUN

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 Anthropic معرفی کرد:
Claude Haiku 4.5

نسخه‌ی جدید مدل Claude Haiku 4.5 منتشر شد — مدلی در سطح Sonnet 4، اما با سرعتی بیش از دو برابر و هزینه‌ای سه‌برابر کمتر! ⚡

📊 نتایج عملکرد:

♻️در آزمون SWE-Bench Verified برای تولید کد: ۷۳٪
♻️در آزمون Terminal-Bench برای مهارت‌های خط فرمان: ۴۱٪

🔸 این نتایج کمی پایین‌تر از Sonnet 4.5 هستند، اما مدل جدید Haiku 4.5 توانسته از Sonnet 4 و Gemini 2.5 پیشی بگیرد.

💰 هزینه استفاده:

♻️ورودی (input): ۱ دلار
♻️خروجی (output): ۵ دلار

🧠 همچنین Haiku 4.5 اکنون در Claude Code در دسترس است — طراحی‌شده برای سرعت بالا در برنامه‌نویسی، تحلیل و تعامل زبانی در محیط‌های فنی.

🔗 جزئیات رسمی
https://www.anthropic.com/news/claude-haiku-4-5

#هوش_مصنوعی #Claude #Anthropic #Haiku #LLM #AI

3.92K viewsedited 17:32

VIRSUN

🤖 مینی-ChatGPT آماده از آندری کارپاتی!

آندری کارپاتی، نابغه‌ی یادگیری عمیق و خالق پروژه‌ی معروف nanoGPT، حالا نسخه‌ی جدیدی از آن را معرفی کرده است — nanochat ✨
این پروژه یک کلون کوچک ChatGPT است که می‌تواند از صفر تا مرحله‌ی نهایی استنتاج (Inference) آموزش ببیند.

📊 جزئیات نسخه جدید – nanochat d32:

آموزش کامل در ۳۳ ساعت

هزینه‌ی آموزش فقط حدود ۱۰۰۰ دلار 💸

دارای ۳۲ لایه ترنسفورمر

شامل تمام مراحل آموزش از پایه تا تقویتی:
Pretrain → Midtrain → SFT → RL

حتی از Tool Use هم پشتیبانی می‌کند 🔧

💡 نتایج عملکرد:

امتیاز CORE score = 0.31 (بهتر از GPT-2 با امتیاز ≈ 0.26)

در آزمون GSM8K (ریاضی) دقت از ۸٪ به ۲۰٪ افزایش یافته است 📈

کارپاتی با شوخ‌طبعی می‌گوید:

> «مدل هنوز مثل یک کودک پیش‌دبستانی است، ولی یاد گرفته همه‌چیز را از صفر تا ابزارمحور شدن انجام دهد!» 😄

💰 جالب‌تر اینکه کوچک‌ترین نسخه‌های این مدل را می‌توان فقط با ۱۰۰ دلار آموزش داد.
به گفته‌ی آندری، به‌زودی نسخه‌ی وبی این مدل هم منتشر خواهد شد.

🔗 مشاهده در GitHub

#هوش_مصنوعی #nanochat #Karpathy #ChatGPT #LLM #DeepLearning

❤1

2.67K views06:21

VIRSUN

⚡️ رسماً تأیید شد: همکاری OpenAI و Broadcom برای تولید تراشه‌های اختصاصی هوش مصنوعی

شب گذشته، OpenAI اعلام کرد که با شرکت Broadcom قراردادی امضا کرده است تا به‌طور مشترک تراشه‌های اختصاصی خود را توسعه دهد.

🔋 جزئیات پروژه:

✳️ظرفیت کل زیرساخت: ۱۰ گیگاوات (معادل برق مصرفی حدود ۸ میلیون خانه)

✳️نخستین راه‌اندازی‌ها: نیمه دوم سال ۲۰۲۶

✳️تکمیل کامل زیرساخت: تا سال ۲۰۲۹

این تراشه‌ها عمدتاً برای مرحله‌ی استنتاج (Inference) طراحی می‌شوند، نه آموزش مدل‌ها.
این یعنی OpenAI می‌تواند تراشه‌ها را دقیقاً متناسب با نیازهای خود بهینه کند — کاهش چشمگیر هزینه‌ها، افزایش کارایی، و مهم‌تر از همه، کاهش وابستگی به Nvidia 🟢

به‌نظر می‌رسد OpenAI در حال آماده‌سازی زیرساختی است که در آینده بتواند به‌صورت مستقل اکوسیستم سخت‌افزاری و نرم‌افزاری خود را کنترل کند.

🧠 دنیای تراشه‌های هوش مصنوعی وارد مرحله‌ی جدیدی شد...
https://openai.com/index/openai-and-broadcom-announce-strategic-collaboration/

#OpenAI #Broadcom #AIChip #Nvidia #هوش_مصنوعی #تراشه #DeepLearning

2.67K views06:23

VIRSUN

0:01

This media is not supported in your browser

VIEW IN TELEGRAM

🫧 تشخیص هرچیز با مدل چندوجهی Rex-Omni 🫧

مدل Rex-Omni با ۳ میلیارد پارامتر، یک مدل چندوجهی (Multimodal) جدید است که طیف گسترده‌ای از وظایف بینایی را در یک چارچوب واحد ادغام می‌کند:

🔹 تشخیص اشیا (Object Detection)
🔹 تشخیص متن (OCR)
🔹 همچنین Pointing و Key-pointing
🔹 و Visual Prompting

همه‌ی این وظایف در قالب یک چارچوب واحد مبتنی بر پیش‌بینی نقطه بعدی (Next-Point Prediction) انجام می‌شوند — رویکردی که باعث شده مدل نتایج چشم‌گیری در دقت و سرعت به دست آورد ⚡️

📘 ویژگی‌ها:

پارامترها: ۳B

یکپارچه‌سازی تمام وظایف ادراکی در یک معماری ساده

مجوز: IDEA License 1.0 💙

🔗 لینک‌ها:
📄 Review
📘 Paper
🌐 Project Page
💻 GitHub Repo

@rss_ai_ir

#AI #RexOmni #Multimodal #MLLM #ComputerVision #OCR #Detection #هوش_مصنوعی

2.83K viewsedited 06:26

VIRSUN

🎬 استوری‌برد Sora 2 Pro منتشر شد!

نسخه‌ی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگی‌ای که اجازه می‌دهد سکانس‌های ویدیو را به‌صورت دقیق و سینمایی برنامه‌ریزی کنید.

🎞 با این قابلیت می‌توانید:

طرح صحنه‌ها را فریم‌به‌فریم بچینید

زاویه، ترکیب‌بندی و حرکت دوربین را از قبل تعریف کنید

ویدیوهای ۲۵ ثانیه‌ای با جزئیات فوق‌العاده بسازید

به‌نوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»

@rss_ai_ir

#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI

❤1🔥1

2.83K viewsedited 06:27

VIRSUN

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

🌍 FlashWorld —
تولید صحنه‌های سه‌بعدی در ۵ ثانیه با یک GPU ⚡️

سیستم جدید FlashWorld معرفی شد — مدلی که می‌تواند از یک تصویر یا فقط یک توضیح متنی، صحنه‌های سه‌بعدی واقعی و با جزئیات بالا تولید کند.

🚀 ویژگی‌ها:

♻️تا ۱۰۰ برابر سریع‌تر از روش‌های قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU

به زبان ساده، FlashWorld کاری می‌کند که با یک کلیک، جهان سه‌بعدی‌ات ساخته شود — مثل فشردن دکمه «render reality».

🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page

#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین

1.47K views13:09

VIRSUN

🧬 ShinkaEvolve —
تکامل کدهای علمی با کمک هوش مصنوعی

پروژه‌ی ShinkaEvolve یک فریم‌ورک نوآورانه است که مدل‌های زبانی بزرگ (LLM) را با الگوریتم‌های تکاملی (Evolutionary Algorithms) ترکیب می‌کند تا فرآیند کشف علمی و بهینه‌سازی کد را خودکار کند.

💡 ویژگی‌های کلیدی:

✳️ترکیب هوش مصنوعی خلاق با بهینه‌سازی تکاملی.

✳️پشتیبانی از ارزیابی موازی در رایانه‌های محلی یا خوشه‌های محاسباتی.

✳️ذخیره‌ی راه‌حل‌های موفق برای انتقال دانش و تجربه به نسل‌های بعدی مدل.

✳️بهینه‌سازی عملکرد کد در حالی که درستی آن حفظ می‌شود.

✳️مناسب برای پژوهش‌های علمی که تست یا validator مشخص دارند.

این سیستم به‌نوعی «زیست‌شناسی تکاملی برای کد» است — هر نسل از نسخه‌ها بهینه‌تر و خلاق‌تر از قبل می‌شود.

📌 GitHub:
github.com/SakanaAI/ShinkaEvolve

#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی

1.43K views13:11

VIRSUN

⚡️ Omni-Embed-Nemotron —
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو

انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانه‌ای یکپارچه برای تبدیل انواع داده‌ها به نمایش برداری مشترک (Unified Embedding).

🎯 ویژگی‌های کلیدی:

پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو

مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)

طول زمینه تا ۳۲٬۷۶۸ توکن

اندازه‌ی بردار نهائی (Embedding) برابر ۲۰۴۸

بهینه‌شده برای GPU و پشتیبانی از FlashAttention 2

🚀 کاربردها:

♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)

♻️بهبود پروژه‌های RAG (Retrieval-Augmented Generation)

♻️توسعه سیستم‌های درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان داده‌های متنی و دیداری را از میان برمی‌دارد.

🌐 مدل متن‌باز:
huggingface.co/nvidia/omni-embed-nemotron-3b

#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند

2.66K views13:13

About

Blog

Apps

Platform