VIRSUN

🎬 استوری‌برد Sora 2 Pro منتشر شد!

نسخه‌ی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگی‌ای که اجازه می‌دهد سکانس‌های ویدیو را به‌صورت دقیق و سینمایی برنامه‌ریزی کنید.

🎞 با این قابلیت می‌توانید:

طرح صحنه‌ها را فریم‌به‌فریم بچینید

زاویه، ترکیب‌بندی و حرکت دوربین را از قبل تعریف کنید

ویدیوهای ۲۵ ثانیه‌ای با جزئیات فوق‌العاده بسازید

به‌نوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»

@rss_ai_ir

#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI

❤1🔥1

2.83K viewsedited 06:27

VIRSUN

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

🌍 FlashWorld —
تولید صحنه‌های سه‌بعدی در ۵ ثانیه با یک GPU ⚡️

سیستم جدید FlashWorld معرفی شد — مدلی که می‌تواند از یک تصویر یا فقط یک توضیح متنی، صحنه‌های سه‌بعدی واقعی و با جزئیات بالا تولید کند.

🚀 ویژگی‌ها:

♻️تا ۱۰۰ برابر سریع‌تر از روش‌های قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU

به زبان ساده، FlashWorld کاری می‌کند که با یک کلیک، جهان سه‌بعدی‌ات ساخته شود — مثل فشردن دکمه «render reality».

🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page

#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین

1.46K views13:09

VIRSUN

🧬 ShinkaEvolve —
تکامل کدهای علمی با کمک هوش مصنوعی

پروژه‌ی ShinkaEvolve یک فریم‌ورک نوآورانه است که مدل‌های زبانی بزرگ (LLM) را با الگوریتم‌های تکاملی (Evolutionary Algorithms) ترکیب می‌کند تا فرآیند کشف علمی و بهینه‌سازی کد را خودکار کند.

💡 ویژگی‌های کلیدی:

✳️ترکیب هوش مصنوعی خلاق با بهینه‌سازی تکاملی.

✳️پشتیبانی از ارزیابی موازی در رایانه‌های محلی یا خوشه‌های محاسباتی.

✳️ذخیره‌ی راه‌حل‌های موفق برای انتقال دانش و تجربه به نسل‌های بعدی مدل.

✳️بهینه‌سازی عملکرد کد در حالی که درستی آن حفظ می‌شود.

✳️مناسب برای پژوهش‌های علمی که تست یا validator مشخص دارند.

این سیستم به‌نوعی «زیست‌شناسی تکاملی برای کد» است — هر نسل از نسخه‌ها بهینه‌تر و خلاق‌تر از قبل می‌شود.

📌 GitHub:
github.com/SakanaAI/ShinkaEvolve

#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی

1.43K views13:11

VIRSUN

⚡️ Omni-Embed-Nemotron —
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو

انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانه‌ای یکپارچه برای تبدیل انواع داده‌ها به نمایش برداری مشترک (Unified Embedding).

🎯 ویژگی‌های کلیدی:

پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو

مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)

طول زمینه تا ۳۲٬۷۶۸ توکن

اندازه‌ی بردار نهائی (Embedding) برابر ۲۰۴۸

بهینه‌شده برای GPU و پشتیبانی از FlashAttention 2

🚀 کاربردها:

♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)

♻️بهبود پروژه‌های RAG (Retrieval-Augmented Generation)

♻️توسعه سیستم‌های درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان داده‌های متنی و دیداری را از میان برمی‌دارد.

🌐 مدل متن‌باز:
huggingface.co/nvidia/omni-embed-nemotron-3b

#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند

2.65K views13:13

VIRSUN

2:08

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 AGIBOT Genie G2 —
نسل جدید ربات انسان‌نما بر پایه پلتفرم چرخ‌دار

شرکت AGIBOT از ربات انسان‌نمای جدید خود با نام Genie G2 رونمایی کرد — مدلی صنعتی که برای کارهایی چون جابه‌جایی، مونتاژ دقیق، و بازرسی تجهیزات طراحی شده است.

💡 ویژگی‌های کلیدی:

✳️کمر و پاهای انسان‌نما

✳️تنه‌ی تاشو و تحرک همه‌جهته

✳️حسگرهای لمسی سه‌بعدی (3D Tactile Sensors)

✳️بازوهای رباتیکی با ۱۹ درجه آزادی

✳️ناوبری سه‌بعدی ۳۶۰ درجه برای حرکت آزاد در کارخانه‌ها و آزمایشگاه‌ها

✳️این ربات علاوه بر کارهای صنعتی، قابلیت‌های خدماتی نیز دارد — از حراست و پذیرایی از مهمانان گرفته تا نمایش‌های آموزشی و کمک در خانه.

📦 قرارداد تولید:
همچنین AGIBOT با شرکت Shanghai Longcheer قرارداد چند میلیون دلاری امضا کرده و نزدیک به ۱۰۰۰ واحد Genie G2 قرار است به‌صورت مرحله‌ای در کارخانه‌ها نصب و راه‌اندازی شود.

#Robotics #AGIBOT #GenieG2 #AI #Humanoid #Automation #Industry40 #هوش_مصنوعی #رباتیک

❤1

2.68K views13:15

VIRSUN

0:56

This media is not supported in your browser

VIEW IN TELEGRAM

😂 وقتی جوک‌ها از شوخی به واقعیت تبدیل می‌شن!

📢 خبر فناوری از دوران قدیم:
دستگاهی اختراع شده برای اصلاح خودکار ریش و سبیل!

یه سکه می‌ندازی، سرتو می‌کنی توی شکاف،
و دستگاه خودش به‌صورت خودکار می‌تراشه!

ولی مگه همه آدما صورتشون یکیه؟! 😨

آره، فقط بار اول! 😅

@rss_ai_ir

❤2🔥2👎1👏1😁1

2.67K views13:20

VIRSUN

⚡ FlashVSR —
ارتقای ویدیو در زمان واقعی بر پایه‌ی دیفیوشن

پروژه‌ی FlashVSR به هدف رسیدن به Super-Resolution ویدیوهای استریم در زمان واقعی طراحی شده است — نه بهترین، اما کاملاً متن‌باز و قابل استفاده برای همه 🔓

📦 کد منبع:

🔗 github.com/OpenImagingLab/FlashVSR

🧩 نودها برای ComfyUI:

🔗 github.com/smthemex/ComfyUI_FlashVSR

💡 ویژگی‌ها و نکات فنی:

✳️مصرف حافظه بالا (مثل اکثر آپ‌اسکیلرهای دیفیوشنی)

✳️مبتنی بر Block-Sparse Attention — ممکن است روی کارت‌های گرافیکی ضعیف ناپایدار عمل کند

✳️کیفیت خروجی مناسب با تأکید بر سرعت پردازش

در مجموع، گزینه‌ای عالی برای کسانی که دنبال راه‌حل متن‌باز ارتقای ویدیو با انعطاف بالا هستند.

#FlashVSR #AI #Upscaling #VideoAI #SuperResolution #OpenSource #MachineLearning #DiffusionModels #ComfyUI #DeepLearning #BlockSparseAttention

👍1🔥1👏1

2.68K viewsedited 14:24

VIRSUN

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 واقعیت افزوده + هوش مصنوعی مولد (Generative AGI) یعنی حالا انسان‌ها می‌تونن کارهایی در سطح کارشناسان انجام بدن — بدون هیچ آموزش قبلی!

و این آینده نیست...
این الان اتفاق می‌افته ⚡️

@rss_ai_ir

1.46K views02:44

VIRSUN

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 Perplexity
حالت جدید آموزش تعاملی زبان را معرفی کرد

مجموعه Perplexity حالت تازه‌ای برای یادگیری زبان اضافه کرده که چت‌بات هوش مصنوعی آن را به یک مدرس تعاملی تبدیل می‌کند — ابزاری که به کاربران کمک می‌کند در لحظه دایره لغات خود را گسترش دهند و گرامر را بهتر بفهمند.

🔸 این قابلیت در خود چت کارت‌های آموزشی (فلش‌کارت) با لغات جدید، تلفظ صحیح و جملات نمونه تولید می‌کند.
🔸 کاربران همچنین می‌توانند در همان گفتگو سؤالات گرامری بپرسند یا درخواست توضیح بدهند.
🔸 حالت جدید هم‌اکنون در نسخه‌های iOS و وب فعال است و استفاده از Perplexity را فراتر از جست‌وجو و تحقیق گسترش می‌دهد.

⛔️همچنین Perplexity حالا خود را به‌عنوان ترکیبی از موتور دانش و مربی شخصی زبان معرفی می‌کند.

📊 @rss_ai_ir

#AI #Perplexity #LanguageLearning #EdTech #Chatbot #ArtificialIntelligence

❤2

1.52K views02:44

VIRSUN

مدل GPT-5 تنها ۵۸ درصد به AGI نزدیک است 🧠

۲۸ آزمایشگاه بزرگ و تأثیرگذار در حوزه‌ی هوش مصنوعی گرد هم آمده‌اند تا سرانجام تعریف دقیقی از AGI (هوش عمومی مصنوعی) ارائه دهند — و این نخستین پژوهش علمی است که این مفهوم را به‌صورت کمّی تبیین می‌کند. در میان نویسندگان مقاله، نام یوشوا بنجیو (Yoshua Bengio)، یکی از پدران هوش مصنوعی نیز دیده می‌شود.

💡 تعریف AGI (کوتاه اما پرمغز):

> مفهوم AGI یعنی سامانه‌ای از هوش مصنوعی که می‌تواند در گستره (versatility) و عمق (proficiency) توانایی‌های شناختی، با یک انسان بالغ تحصیل‌کرده قابل مقایسه باشد.

---

🔬 اما چطور می‌توان آن را اندازه‌گیری کرد؟

پژوهشگران از یک مدل شناخته‌شده در روان‌سنجی به نام مدل Cattell–Horn–Carroll (CHC) استفاده کردند — مدلی که هوش انسان را به ۱۰ توانایی شناختی اصلی تقسیم می‌کند:

1. دانش عمومی و عقل سلیم
2. درک و نگارش متن
3. ریاضیات
4. حل مسائل جدید و استدلال منطقی
5. حافظه‌ی کوتاه‌مدت
6. حافظه‌ی بلندمدت و یادگیری
7. بازیابی و استخراج دانش
8. درک و خلق تصاویر
9. درک گفتار و موسیقی
10. سرعت پردازش اطلاعات

بر اساس این شاخص‌ها، پژوهشگران هم انسان و هم مدل‌های زبانی را ارزیابی کردند.

---

📊 نتایج:

اول GPT-4: تنها ۲۷٪ از AGI
دوم GPT-5: حدود ۵۸٪ از AGI

✅یعنی GPT-5 اکنون بیش از نیمی از پروفایل شناختی یک انسان بالغ تحصیل‌کرده را دارد — پیشرفتی چشمگیر، اما هنوز راه درازی تا دستیابی به هوش عمومی کامل در پیش است.
---

⚠️ نقاط ضعف GPT-5:

♻️حافظه‌ی بلندمدت
♻️درک دیداری و شنیداری
♻️سرعت واکنش
♻️تفکر انعطاف‌پذیر
---

⛔️به‌نظر می‌رسد این تعریف عینی، علمی و قابل‌اندازه‌گیری است — قطعاً بسیار بهتر از تعریف شرکت‌هایی مانند OpenAI و Microsoft، که AGI را به‌سادگی "هوشی که سالانه ۱۰۰ میلیارد دلار سود تولید کند" 💀 توصیف کرده‌اند!

#هوش_مصنوعی #AGI #GPT5 #یوشوا_بنجیو #یادگیری_ماشین #AI #ArtificialIntelligence

1.61K views02:44

VIRSUN

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 Krea Realtime 14B —
مدل جدید متن‌به‌ویدیو با کدباز از Krea AI

مدل جدید Krea Realtime 14B با ۱۴ میلیارد پارامتر عرضه شد — بیش از ۱۰ برابر بزرگ‌تر از اکثر مدل‌های بلادرنگ (Realtime) فعلی.

⚙️ ویژگی‌ها و نوآوری‌ها:

🚀 سرعت بالا: تولید ویدیو با نرخ حدود ۱۱ فریم بر ثانیه با تنها ۴ مرحله استنتاج روی یک GPU از نوع NVIDIA B200.

🧩 فناوری Self-Forcing: این روش مدل دیفیوژنی ویدیو را به معماری خودبازگشتی (autoregressive) تبدیل می‌کند و باعث افزایش پایداری و کنترل می‌شود.

🎬 حالت‌ها:

Text-to-Video (تبدیل متن به ویدیو)

Video-to-Video (تبدیل سبک ویدیو به ویدیو – هنوز در حال توسعه)

🎨 تعامل زنده: کاربر می‌تواند در حین تولید، پرامپت را تغییر دهد، سبک تصویر را عوض کند و اولین فریم‌ها را در حدود ۱ ثانیه ببیند.

🔓 مجوز: Apache 2.0
📦 کد باز در HuggingFace:
👉 huggingface.co/krea/krea-realtime-video

#AI #TextToVideo #KreaAI #OpenSource #GenerativeAI #Realtime #VideoAI

296 views03:44

VIRSUN

🚀 علی‌بابا با سیستم جدید Aegaeon مصرف GPU را تا ۸۲٪ کاهش داد 🤯

شرکت Alibaba از سامانه‌ی انقلابی خود به نام Aegaeon رونمایی کرد — سیستمی برای اشتراک‌گذاری هوشمند GPU که بهره‌وری در سرویس‌دهی مدل‌های زبانی بزرگ (LLM) را تا ۸ برابر افزایش می‌دهد! ⚙️

📊 نتایج حیرت‌انگیز:

🔻 ۸۲٪ کاهش مصرف GPUهای انویدیا

💡 در آزمایش بتای سه‌ماهه در Alibaba Cloud:
از ۱٬۱۹۲ GPU به ۲۱۳ GPU برای پشتیبانی از چندین مدل تا ۷۲ میلیارد پارامتر

---

🔥 چطور کار می‌کند؟

در حالت عادی، بسیاری از GPUها در زمان سرویس‌دهی به مدل‌های «سرد» (کم‌استفاده) بلااستفاده می‌مانند —
مثلاً ۱۷.۷٪ از GPUها فقط ۱.۳۵٪ درخواست‌ها را انجام می‌دادند.

💡 علاوه براین Aegaeon این مشکل را با رویکردی جدید حل می‌کند:

یعنی GPUها می‌توانند در حین تولید پاسخ (در سطح توکن) بین مدل‌ها سوئیچ کنند،
بدون اینکه منتظر پایان پاسخ قبلی بمانند! ⚙️

---

⚡ نتیجه:

✳️هر GPU می‌تواند تا ۷ مدل را هم‌زمان پشتیبانی کند (در سیستم‌های دیگر: ۲ تا ۳ مدل)

✳️تأخیر هنگام سوئیچ بین مدل‌ها تا ۹۷٪ کاهش یافته است

✳️مدل‌های «داغ» (پُرکاربرد) در اولویت می‌مانند، مدل‌های «سرد» فقط در لحظه‌های کوتاه منابع می‌گیرند

---

🧩 ویژه برای مرحله استنتاج (Inference):

همچنین، Aegaeon بر اساس ساختار تولید توکنی طراحی شده و با زمان‌بندی دقیق بار کاری (load scheduling) بهینه شده است.

در شرایط کمبود تراشه در چین، این سیستم یک پیشرفت استراتژیک محسوب می‌شود —
یعنی GPU کمتر، ترافیک بیشتر، هزینه پایین‌تر. 💰

---

✅ مزایا:

♻️کاهش چشمگیر هزینه‌ی هر توکن
♻️افزایش بهره‌وری سخت‌افزار
♻️کاهش نیاز به خرید GPUهای جدید بدون افت عملکرد

🔗 منبع: South China Morning Post

#Alibaba #Aegaeon #AI #LLM #GPU #CloudComputing #Efficiency #Nvidia #GenerativeAI

👍4🔥1

265 views03:49

VIRSUN

📄 مدل DeepSeek-OCR — شناسایی متن با دقت بالا 🔍

شرکت DeepSeek مدل جدیدی از OCR را معرفی کرده است که می‌تواند تصاویر اسناد را مستقیماً به متن یا فایل Markdown تبدیل کند.

✨ قابلیت‌ها:

♻️تشخیص متن در تصاویر و فایل‌های PDF
♻️پشتیبانی از جداول، نمودارها و قالب‌های پیچیده‌ی اسناد
♻️چهار نسخه‌ی بهینه‌شده: Tiny، Small، Base، Large
♻️سازگار با GPU (PyTorch + CUDA 11.8)
♻️دارای مجوز MIT — استفاده و ویرایش آزادانه

⚡ ویژگی کلیدی:
همچنین DeepSeek-OCR با استفاده از فشرده‌سازی توکن‌های تصویری (Visual Tokens Compression)،
به دقت و سرعتی بی‌نظیر دست یافته است.
در بنچمارک OmnidocBench،
این مدل بالاترین دقت را با کمترین مصرف منابع کسب کرده و از سایر مدل‌های OCR موجود سریع‌تر و کارآمدتر عمل می‌کند.

🟠 Hugging Face
🟠 GitHub
🟠 Paper

@rss_ai_ir

#هوش_مصنوعی #OCR #DeepSeek #بینایی_ماشین #AI #متن #تشخیص_متن #مدل_باز

❤1👍1

260 views09:12

VIRSUN

📊 ترافیک GenAI — آمار جدید از رقابت غول‌های هوش مصنوعی

📈 داده‌های تازه نشان می‌دهد که تعادل بازار بین مدل‌های تولیدی (Generative AI) در حال تغییر است:

مدل ChatGPT به‌آرامی در حال از دست دادن سهم بازار است.

همچنین Perplexity برای نخستین بار از مرز ۲٪ عبور کرد.

🗓️ یک سال پیش:
ChatGPT — 87.1%
Gemini — 6.4%
Perplexity — 1.7%
Claude — 1.7%
Copilot — 1.1%

🗓️ ۶ ماه پیش:
ChatGPT — 78.8%
DeepSeek — 6.8%
Gemini — 5.5%
Grok — 3.1%
Perplexity — 1.5%
Claude — 1.3%
Copilot — 1.3%

🗓️ ۳ ماه پیش:
ChatGPT — 78.3%
Gemini — 8.7%
DeepSeek — 4.5%
Grok — 2.6%
Perplexity — 1.6%
Claude — 1.5%
Copilot — 1.2%

🗓️ ماه گذشته:
ChatGPT — 76.4%
Gemini — 10.8%
DeepSeek — 4.0%
Grok — 2.2%
Perplexity — 2.0%
Claude — 1.9%
Copilot — 1.2%

🗓️ امروز:
ChatGPT — 74.1%
Gemini — 12.9%
DeepSeek — 3.7%
Perplexity — 2.4%
Grok — 2.0%
Claude — 2.0%
Copilot — 1.2%

📊 نتیجه:
بازار به‌تدریج از انحصار ChatGPT خارج می‌شود.
مدل‌های Gemini و Perplexity با رشد پیوسته، جایگاه خود را تقویت کرده‌اند،
و با عرضه‌ی Gemini 3.0 انتظار می‌رود گوگل موقعیت خود را بیش از پیش بهبود بخشد.

@rss_ai_ir

#هوش_مصنوعی #ChatGPT #Gemini #Perplexity #Claude #DeepSeek #Copilot #آمار #GenAI #تحلیل_داده

👍1

1.44K viewsedited 09:14

About

Blog

Apps

Platform