🎬 استوریبرد Sora 2 Pro منتشر شد!
نسخهی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگیای که اجازه میدهد سکانسهای ویدیو را بهصورت دقیق و سینمایی برنامهریزی کنید.
🎞 با این قابلیت میتوانید:
طرح صحنهها را فریمبهفریم بچینید
زاویه، ترکیببندی و حرکت دوربین را از قبل تعریف کنید
ویدیوهای ۲۵ ثانیهای با جزئیات فوقالعاده بسازید
بهنوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»
@rss_ai_ir
#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI
نسخهی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگیای که اجازه میدهد سکانسهای ویدیو را بهصورت دقیق و سینمایی برنامهریزی کنید.
🎞 با این قابلیت میتوانید:
طرح صحنهها را فریمبهفریم بچینید
زاویه، ترکیببندی و حرکت دوربین را از قبل تعریف کنید
ویدیوهای ۲۵ ثانیهای با جزئیات فوقالعاده بسازید
بهنوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»
@rss_ai_ir
#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI
❤1🔥1
  This media is not supported in your browser
    VIEW IN TELEGRAM
  🌍 FlashWorld —
تولید صحنههای سهبعدی در ۵ ثانیه با یک GPU ⚡️
سیستم جدید FlashWorld معرفی شد — مدلی که میتواند از یک تصویر یا فقط یک توضیح متنی، صحنههای سهبعدی واقعی و با جزئیات بالا تولید کند.
🚀 ویژگیها:
♻️تا ۱۰۰ برابر سریعتر از روشهای قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU
به زبان ساده، FlashWorld کاری میکند که با یک کلیک، جهان سهبعدیات ساخته شود — مثل فشردن دکمه «render reality».
🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page
#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین
  تولید صحنههای سهبعدی در ۵ ثانیه با یک GPU ⚡️
سیستم جدید FlashWorld معرفی شد — مدلی که میتواند از یک تصویر یا فقط یک توضیح متنی، صحنههای سهبعدی واقعی و با جزئیات بالا تولید کند.
🚀 ویژگیها:
♻️تا ۱۰۰ برابر سریعتر از روشهای قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU
به زبان ساده، FlashWorld کاری میکند که با یک کلیک، جهان سهبعدیات ساخته شود — مثل فشردن دکمه «render reality».
🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page
#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین
🧬 ShinkaEvolve — 
تکامل کدهای علمی با کمک هوش مصنوعی
پروژهی ShinkaEvolve یک فریمورک نوآورانه است که مدلهای زبانی بزرگ (LLM) را با الگوریتمهای تکاملی (Evolutionary Algorithms) ترکیب میکند تا فرآیند کشف علمی و بهینهسازی کد را خودکار کند.
💡 ویژگیهای کلیدی:
✳️ترکیب هوش مصنوعی خلاق با بهینهسازی تکاملی.
✳️پشتیبانی از ارزیابی موازی در رایانههای محلی یا خوشههای محاسباتی.
✳️ذخیرهی راهحلهای موفق برای انتقال دانش و تجربه به نسلهای بعدی مدل.
✳️بهینهسازی عملکرد کد در حالی که درستی آن حفظ میشود.
✳️مناسب برای پژوهشهای علمی که تست یا validator مشخص دارند.
این سیستم بهنوعی «زیستشناسی تکاملی برای کد» است — هر نسل از نسخهها بهینهتر و خلاقتر از قبل میشود.
📌 GitHub:
github.com/SakanaAI/ShinkaEvolve
#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی
  تکامل کدهای علمی با کمک هوش مصنوعی
پروژهی ShinkaEvolve یک فریمورک نوآورانه است که مدلهای زبانی بزرگ (LLM) را با الگوریتمهای تکاملی (Evolutionary Algorithms) ترکیب میکند تا فرآیند کشف علمی و بهینهسازی کد را خودکار کند.
💡 ویژگیهای کلیدی:
✳️ترکیب هوش مصنوعی خلاق با بهینهسازی تکاملی.
✳️پشتیبانی از ارزیابی موازی در رایانههای محلی یا خوشههای محاسباتی.
✳️ذخیرهی راهحلهای موفق برای انتقال دانش و تجربه به نسلهای بعدی مدل.
✳️بهینهسازی عملکرد کد در حالی که درستی آن حفظ میشود.
✳️مناسب برای پژوهشهای علمی که تست یا validator مشخص دارند.
این سیستم بهنوعی «زیستشناسی تکاملی برای کد» است — هر نسل از نسخهها بهینهتر و خلاقتر از قبل میشود.
📌 GitHub:
github.com/SakanaAI/ShinkaEvolve
#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی
⚡️ Omni-Embed-Nemotron — 
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند
This media is not supported in your browser
    VIEW IN TELEGRAM
  🤖 AGIBOT Genie G2 —
نسل جدید ربات انساننما بر پایه پلتفرم چرخدار
شرکت AGIBOT از ربات انساننمای جدید خود با نام Genie G2 رونمایی کرد — مدلی صنعتی که برای کارهایی چون جابهجایی، مونتاژ دقیق، و بازرسی تجهیزات طراحی شده است.
💡 ویژگیهای کلیدی:
✳️کمر و پاهای انساننما
✳️تنهی تاشو و تحرک همهجهته
✳️حسگرهای لمسی سهبعدی (3D Tactile Sensors)
✳️بازوهای رباتیکی با ۱۹ درجه آزادی
✳️ناوبری سهبعدی ۳۶۰ درجه برای حرکت آزاد در کارخانهها و آزمایشگاهها
✳️این ربات علاوه بر کارهای صنعتی، قابلیتهای خدماتی نیز دارد — از حراست و پذیرایی از مهمانان گرفته تا نمایشهای آموزشی و کمک در خانه.
📦 قرارداد تولید:
همچنین AGIBOT با شرکت Shanghai Longcheer قرارداد چند میلیون دلاری امضا کرده و نزدیک به ۱۰۰۰ واحد Genie G2 قرار است بهصورت مرحلهای در کارخانهها نصب و راهاندازی شود.
#Robotics #AGIBOT #GenieG2 #AI #Humanoid #Automation #Industry40 #هوش_مصنوعی #رباتیک
نسل جدید ربات انساننما بر پایه پلتفرم چرخدار
شرکت AGIBOT از ربات انساننمای جدید خود با نام Genie G2 رونمایی کرد — مدلی صنعتی که برای کارهایی چون جابهجایی، مونتاژ دقیق، و بازرسی تجهیزات طراحی شده است.
💡 ویژگیهای کلیدی:
✳️کمر و پاهای انساننما
✳️تنهی تاشو و تحرک همهجهته
✳️حسگرهای لمسی سهبعدی (3D Tactile Sensors)
✳️بازوهای رباتیکی با ۱۹ درجه آزادی
✳️ناوبری سهبعدی ۳۶۰ درجه برای حرکت آزاد در کارخانهها و آزمایشگاهها
✳️این ربات علاوه بر کارهای صنعتی، قابلیتهای خدماتی نیز دارد — از حراست و پذیرایی از مهمانان گرفته تا نمایشهای آموزشی و کمک در خانه.
📦 قرارداد تولید:
همچنین AGIBOT با شرکت Shanghai Longcheer قرارداد چند میلیون دلاری امضا کرده و نزدیک به ۱۰۰۰ واحد Genie G2 قرار است بهصورت مرحلهای در کارخانهها نصب و راهاندازی شود.
#Robotics #AGIBOT #GenieG2 #AI #Humanoid #Automation #Industry40 #هوش_مصنوعی #رباتیک
❤1
  This media is not supported in your browser
    VIEW IN TELEGRAM
  😂 وقتی جوکها از شوخی به واقعیت تبدیل میشن!
📢 خبر فناوری از دوران قدیم:
دستگاهی اختراع شده برای اصلاح خودکار ریش و سبیل!
یه سکه میندازی، سرتو میکنی توی شکاف،
و دستگاه خودش بهصورت خودکار میتراشه!
ولی مگه همه آدما صورتشون یکیه؟! 😨
آره، فقط بار اول! 😅
@rss_ai_ir
📢 خبر فناوری از دوران قدیم:
دستگاهی اختراع شده برای اصلاح خودکار ریش و سبیل!
یه سکه میندازی، سرتو میکنی توی شکاف،
و دستگاه خودش بهصورت خودکار میتراشه!
ولی مگه همه آدما صورتشون یکیه؟! 😨
آره، فقط بار اول! 😅
@rss_ai_ir
❤2🔥2👎1👏1😁1
  ⚡ FlashVSR —
ارتقای ویدیو در زمان واقعی بر پایهی دیفیوشن
پروژهی FlashVSR به هدف رسیدن به Super-Resolution ویدیوهای استریم در زمان واقعی طراحی شده است — نه بهترین، اما کاملاً متنباز و قابل استفاده برای همه 🔓
📦 کد منبع:
🔗 github.com/OpenImagingLab/FlashVSR
🧩 نودها برای ComfyUI:
🔗 github.com/smthemex/ComfyUI_FlashVSR
💡 ویژگیها و نکات فنی:
✳️مصرف حافظه بالا (مثل اکثر آپاسکیلرهای دیفیوشنی)
✳️مبتنی بر Block-Sparse Attention — ممکن است روی کارتهای گرافیکی ضعیف ناپایدار عمل کند
✳️کیفیت خروجی مناسب با تأکید بر سرعت پردازش
در مجموع، گزینهای عالی برای کسانی که دنبال راهحل متنباز ارتقای ویدیو با انعطاف بالا هستند.
#FlashVSR #AI #Upscaling #VideoAI #SuperResolution #OpenSource #MachineLearning #DiffusionModels #ComfyUI #DeepLearning #BlockSparseAttention
ارتقای ویدیو در زمان واقعی بر پایهی دیفیوشن
پروژهی FlashVSR به هدف رسیدن به Super-Resolution ویدیوهای استریم در زمان واقعی طراحی شده است — نه بهترین، اما کاملاً متنباز و قابل استفاده برای همه 🔓
📦 کد منبع:
🔗 github.com/OpenImagingLab/FlashVSR
🧩 نودها برای ComfyUI:
🔗 github.com/smthemex/ComfyUI_FlashVSR
💡 ویژگیها و نکات فنی:
✳️مصرف حافظه بالا (مثل اکثر آپاسکیلرهای دیفیوشنی)
✳️مبتنی بر Block-Sparse Attention — ممکن است روی کارتهای گرافیکی ضعیف ناپایدار عمل کند
✳️کیفیت خروجی مناسب با تأکید بر سرعت پردازش
در مجموع، گزینهای عالی برای کسانی که دنبال راهحل متنباز ارتقای ویدیو با انعطاف بالا هستند.
#FlashVSR #AI #Upscaling #VideoAI #SuperResolution #OpenSource #MachineLearning #DiffusionModels #ComfyUI #DeepLearning #BlockSparseAttention
👍1🔥1👏1
  This media is not supported in your browser
    VIEW IN TELEGRAM
  🧠 واقعیت افزوده + هوش مصنوعی مولد (Generative AGI) یعنی حالا انسانها میتونن کارهایی در سطح کارشناسان انجام بدن — بدون هیچ آموزش قبلی!
و این آینده نیست...
این الان اتفاق میافته ⚡️
@rss_ai_ir
  و این آینده نیست...
این الان اتفاق میافته ⚡️
@rss_ai_ir
This media is not supported in your browser
    VIEW IN TELEGRAM
  🧠 Perplexity
حالت جدید آموزش تعاملی زبان را معرفی کرد
مجموعه Perplexity حالت تازهای برای یادگیری زبان اضافه کرده که چتبات هوش مصنوعی آن را به یک مدرس تعاملی تبدیل میکند — ابزاری که به کاربران کمک میکند در لحظه دایره لغات خود را گسترش دهند و گرامر را بهتر بفهمند.
🔸 این قابلیت در خود چت کارتهای آموزشی (فلشکارت) با لغات جدید، تلفظ صحیح و جملات نمونه تولید میکند.
🔸 کاربران همچنین میتوانند در همان گفتگو سؤالات گرامری بپرسند یا درخواست توضیح بدهند.
🔸 حالت جدید هماکنون در نسخههای iOS و وب فعال است و استفاده از Perplexity را فراتر از جستوجو و تحقیق گسترش میدهد.
⛔️همچنین Perplexity حالا خود را بهعنوان ترکیبی از موتور دانش و مربی شخصی زبان معرفی میکند.
📊 @rss_ai_ir
#AI #Perplexity #LanguageLearning #EdTech #Chatbot #ArtificialIntelligence
حالت جدید آموزش تعاملی زبان را معرفی کرد
مجموعه Perplexity حالت تازهای برای یادگیری زبان اضافه کرده که چتبات هوش مصنوعی آن را به یک مدرس تعاملی تبدیل میکند — ابزاری که به کاربران کمک میکند در لحظه دایره لغات خود را گسترش دهند و گرامر را بهتر بفهمند.
🔸 این قابلیت در خود چت کارتهای آموزشی (فلشکارت) با لغات جدید، تلفظ صحیح و جملات نمونه تولید میکند.
🔸 کاربران همچنین میتوانند در همان گفتگو سؤالات گرامری بپرسند یا درخواست توضیح بدهند.
🔸 حالت جدید هماکنون در نسخههای iOS و وب فعال است و استفاده از Perplexity را فراتر از جستوجو و تحقیق گسترش میدهد.
⛔️همچنین Perplexity حالا خود را بهعنوان ترکیبی از موتور دانش و مربی شخصی زبان معرفی میکند.
📊 @rss_ai_ir
#AI #Perplexity #LanguageLearning #EdTech #Chatbot #ArtificialIntelligence
❤2
  مدل GPT-5 تنها ۵۸ درصد به AGI نزدیک است 🧠
۲۸ آزمایشگاه بزرگ و تأثیرگذار در حوزهی هوش مصنوعی گرد هم آمدهاند تا سرانجام تعریف دقیقی از AGI (هوش عمومی مصنوعی) ارائه دهند — و این نخستین پژوهش علمی است که این مفهوم را بهصورت کمّی تبیین میکند. در میان نویسندگان مقاله، نام یوشوا بنجیو (Yoshua Bengio)، یکی از پدران هوش مصنوعی نیز دیده میشود.
💡 تعریف AGI (کوتاه اما پرمغز):
> مفهوم AGI یعنی سامانهای از هوش مصنوعی که میتواند در گستره (versatility) و عمق (proficiency) تواناییهای شناختی، با یک انسان بالغ تحصیلکرده قابل مقایسه باشد.
---
🔬 اما چطور میتوان آن را اندازهگیری کرد؟
پژوهشگران از یک مدل شناختهشده در روانسنجی به نام مدل Cattell–Horn–Carroll (CHC) استفاده کردند — مدلی که هوش انسان را به ۱۰ توانایی شناختی اصلی تقسیم میکند:
1. دانش عمومی و عقل سلیم
2. درک و نگارش متن
3. ریاضیات
4. حل مسائل جدید و استدلال منطقی
5. حافظهی کوتاهمدت
6. حافظهی بلندمدت و یادگیری
7. بازیابی و استخراج دانش
8. درک و خلق تصاویر
9. درک گفتار و موسیقی
10. سرعت پردازش اطلاعات
بر اساس این شاخصها، پژوهشگران هم انسان و هم مدلهای زبانی را ارزیابی کردند.
---
📊 نتایج:
اول GPT-4: تنها ۲۷٪ از AGI
دوم GPT-5: حدود ۵۸٪ از AGI
✅یعنی GPT-5 اکنون بیش از نیمی از پروفایل شناختی یک انسان بالغ تحصیلکرده را دارد — پیشرفتی چشمگیر، اما هنوز راه درازی تا دستیابی به هوش عمومی کامل در پیش است.
---
⚠️ نقاط ضعف GPT-5:
♻️حافظهی بلندمدت
♻️درک دیداری و شنیداری
♻️سرعت واکنش
♻️تفکر انعطافپذیر
---
⛔️بهنظر میرسد این تعریف عینی، علمی و قابلاندازهگیری است — قطعاً بسیار بهتر از تعریف شرکتهایی مانند OpenAI و Microsoft، که AGI را بهسادگی "هوشی که سالانه ۱۰۰ میلیارد دلار سود تولید کند" 💀 توصیف کردهاند!
#هوش_مصنوعی #AGI #GPT5 #یوشوا_بنجیو #یادگیری_ماشین #AI #ArtificialIntelligence
۲۸ آزمایشگاه بزرگ و تأثیرگذار در حوزهی هوش مصنوعی گرد هم آمدهاند تا سرانجام تعریف دقیقی از AGI (هوش عمومی مصنوعی) ارائه دهند — و این نخستین پژوهش علمی است که این مفهوم را بهصورت کمّی تبیین میکند. در میان نویسندگان مقاله، نام یوشوا بنجیو (Yoshua Bengio)، یکی از پدران هوش مصنوعی نیز دیده میشود.
💡 تعریف AGI (کوتاه اما پرمغز):
> مفهوم AGI یعنی سامانهای از هوش مصنوعی که میتواند در گستره (versatility) و عمق (proficiency) تواناییهای شناختی، با یک انسان بالغ تحصیلکرده قابل مقایسه باشد.
---
🔬 اما چطور میتوان آن را اندازهگیری کرد؟
پژوهشگران از یک مدل شناختهشده در روانسنجی به نام مدل Cattell–Horn–Carroll (CHC) استفاده کردند — مدلی که هوش انسان را به ۱۰ توانایی شناختی اصلی تقسیم میکند:
1. دانش عمومی و عقل سلیم
2. درک و نگارش متن
3. ریاضیات
4. حل مسائل جدید و استدلال منطقی
5. حافظهی کوتاهمدت
6. حافظهی بلندمدت و یادگیری
7. بازیابی و استخراج دانش
8. درک و خلق تصاویر
9. درک گفتار و موسیقی
10. سرعت پردازش اطلاعات
بر اساس این شاخصها، پژوهشگران هم انسان و هم مدلهای زبانی را ارزیابی کردند.
---
📊 نتایج:
اول GPT-4: تنها ۲۷٪ از AGI
دوم GPT-5: حدود ۵۸٪ از AGI
✅یعنی GPT-5 اکنون بیش از نیمی از پروفایل شناختی یک انسان بالغ تحصیلکرده را دارد — پیشرفتی چشمگیر، اما هنوز راه درازی تا دستیابی به هوش عمومی کامل در پیش است.
---
⚠️ نقاط ضعف GPT-5:
♻️حافظهی بلندمدت
♻️درک دیداری و شنیداری
♻️سرعت واکنش
♻️تفکر انعطافپذیر
---
⛔️بهنظر میرسد این تعریف عینی، علمی و قابلاندازهگیری است — قطعاً بسیار بهتر از تعریف شرکتهایی مانند OpenAI و Microsoft، که AGI را بهسادگی "هوشی که سالانه ۱۰۰ میلیارد دلار سود تولید کند" 💀 توصیف کردهاند!
#هوش_مصنوعی #AGI #GPT5 #یوشوا_بنجیو #یادگیری_ماشین #AI #ArtificialIntelligence
This media is not supported in your browser
    VIEW IN TELEGRAM
  🎥 Krea Realtime 14B — 
مدل جدید متنبهویدیو با کدباز از Krea AI
مدل جدید Krea Realtime 14B با ۱۴ میلیارد پارامتر عرضه شد — بیش از ۱۰ برابر بزرگتر از اکثر مدلهای بلادرنگ (Realtime) فعلی.
⚙️ ویژگیها و نوآوریها:
🚀 سرعت بالا: تولید ویدیو با نرخ حدود ۱۱ فریم بر ثانیه با تنها ۴ مرحله استنتاج روی یک GPU از نوع NVIDIA B200.
🧩 فناوری Self-Forcing: این روش مدل دیفیوژنی ویدیو را به معماری خودبازگشتی (autoregressive) تبدیل میکند و باعث افزایش پایداری و کنترل میشود.
🎬 حالتها:
Text-to-Video (تبدیل متن به ویدیو)
Video-to-Video (تبدیل سبک ویدیو به ویدیو – هنوز در حال توسعه)
🎨 تعامل زنده: کاربر میتواند در حین تولید، پرامپت را تغییر دهد، سبک تصویر را عوض کند و اولین فریمها را در حدود ۱ ثانیه ببیند.
🔓 مجوز: Apache 2.0
📦 کد باز در HuggingFace:
👉 huggingface.co/krea/krea-realtime-video
#AI #TextToVideo #KreaAI #OpenSource #GenerativeAI #Realtime #VideoAI
  مدل جدید متنبهویدیو با کدباز از Krea AI
مدل جدید Krea Realtime 14B با ۱۴ میلیارد پارامتر عرضه شد — بیش از ۱۰ برابر بزرگتر از اکثر مدلهای بلادرنگ (Realtime) فعلی.
⚙️ ویژگیها و نوآوریها:
🚀 سرعت بالا: تولید ویدیو با نرخ حدود ۱۱ فریم بر ثانیه با تنها ۴ مرحله استنتاج روی یک GPU از نوع NVIDIA B200.
🧩 فناوری Self-Forcing: این روش مدل دیفیوژنی ویدیو را به معماری خودبازگشتی (autoregressive) تبدیل میکند و باعث افزایش پایداری و کنترل میشود.
🎬 حالتها:
Text-to-Video (تبدیل متن به ویدیو)
Video-to-Video (تبدیل سبک ویدیو به ویدیو – هنوز در حال توسعه)
🎨 تعامل زنده: کاربر میتواند در حین تولید، پرامپت را تغییر دهد، سبک تصویر را عوض کند و اولین فریمها را در حدود ۱ ثانیه ببیند.
🔓 مجوز: Apache 2.0
📦 کد باز در HuggingFace:
👉 huggingface.co/krea/krea-realtime-video
#AI #TextToVideo #KreaAI #OpenSource #GenerativeAI #Realtime #VideoAI
🚀 علیبابا با سیستم جدید Aegaeon مصرف GPU را تا ۸۲٪ کاهش داد 🤯
شرکت Alibaba از سامانهی انقلابی خود به نام Aegaeon رونمایی کرد — سیستمی برای اشتراکگذاری هوشمند GPU که بهرهوری در سرویسدهی مدلهای زبانی بزرگ (LLM) را تا ۸ برابر افزایش میدهد! ⚙️
📊 نتایج حیرتانگیز:
🔻 ۸۲٪ کاهش مصرف GPUهای انویدیا
💡 در آزمایش بتای سهماهه در Alibaba Cloud:
از ۱٬۱۹۲ GPU به ۲۱۳ GPU برای پشتیبانی از چندین مدل تا ۷۲ میلیارد پارامتر
---
🔥 چطور کار میکند؟
در حالت عادی، بسیاری از GPUها در زمان سرویسدهی به مدلهای «سرد» (کماستفاده) بلااستفاده میمانند —
مثلاً ۱۷.۷٪ از GPUها فقط ۱.۳۵٪ درخواستها را انجام میدادند.
💡 علاوه براین Aegaeon این مشکل را با رویکردی جدید حل میکند:
یعنی GPUها میتوانند در حین تولید پاسخ (در سطح توکن) بین مدلها سوئیچ کنند،
بدون اینکه منتظر پایان پاسخ قبلی بمانند! ⚙️
---
⚡ نتیجه:
✳️هر GPU میتواند تا ۷ مدل را همزمان پشتیبانی کند (در سیستمهای دیگر: ۲ تا ۳ مدل)
✳️تأخیر هنگام سوئیچ بین مدلها تا ۹۷٪ کاهش یافته است
✳️مدلهای «داغ» (پُرکاربرد) در اولویت میمانند، مدلهای «سرد» فقط در لحظههای کوتاه منابع میگیرند
---
🧩 ویژه برای مرحله استنتاج (Inference):
همچنین، Aegaeon بر اساس ساختار تولید توکنی طراحی شده و با زمانبندی دقیق بار کاری (load scheduling) بهینه شده است.
در شرایط کمبود تراشه در چین، این سیستم یک پیشرفت استراتژیک محسوب میشود —
یعنی GPU کمتر، ترافیک بیشتر، هزینه پایینتر. 💰
---
✅ مزایا:
♻️کاهش چشمگیر هزینهی هر توکن
♻️افزایش بهرهوری سختافزار
♻️کاهش نیاز به خرید GPUهای جدید بدون افت عملکرد
🔗 منبع: South China Morning Post
#Alibaba #Aegaeon #AI #LLM #GPU #CloudComputing #Efficiency #Nvidia #GenerativeAI
شرکت Alibaba از سامانهی انقلابی خود به نام Aegaeon رونمایی کرد — سیستمی برای اشتراکگذاری هوشمند GPU که بهرهوری در سرویسدهی مدلهای زبانی بزرگ (LLM) را تا ۸ برابر افزایش میدهد! ⚙️
📊 نتایج حیرتانگیز:
🔻 ۸۲٪ کاهش مصرف GPUهای انویدیا
💡 در آزمایش بتای سهماهه در Alibaba Cloud:
از ۱٬۱۹۲ GPU به ۲۱۳ GPU برای پشتیبانی از چندین مدل تا ۷۲ میلیارد پارامتر
---
🔥 چطور کار میکند؟
در حالت عادی، بسیاری از GPUها در زمان سرویسدهی به مدلهای «سرد» (کماستفاده) بلااستفاده میمانند —
مثلاً ۱۷.۷٪ از GPUها فقط ۱.۳۵٪ درخواستها را انجام میدادند.
💡 علاوه براین Aegaeon این مشکل را با رویکردی جدید حل میکند:
یعنی GPUها میتوانند در حین تولید پاسخ (در سطح توکن) بین مدلها سوئیچ کنند،
بدون اینکه منتظر پایان پاسخ قبلی بمانند! ⚙️
---
⚡ نتیجه:
✳️هر GPU میتواند تا ۷ مدل را همزمان پشتیبانی کند (در سیستمهای دیگر: ۲ تا ۳ مدل)
✳️تأخیر هنگام سوئیچ بین مدلها تا ۹۷٪ کاهش یافته است
✳️مدلهای «داغ» (پُرکاربرد) در اولویت میمانند، مدلهای «سرد» فقط در لحظههای کوتاه منابع میگیرند
---
🧩 ویژه برای مرحله استنتاج (Inference):
همچنین، Aegaeon بر اساس ساختار تولید توکنی طراحی شده و با زمانبندی دقیق بار کاری (load scheduling) بهینه شده است.
در شرایط کمبود تراشه در چین، این سیستم یک پیشرفت استراتژیک محسوب میشود —
یعنی GPU کمتر، ترافیک بیشتر، هزینه پایینتر. 💰
---
✅ مزایا:
♻️کاهش چشمگیر هزینهی هر توکن
♻️افزایش بهرهوری سختافزار
♻️کاهش نیاز به خرید GPUهای جدید بدون افت عملکرد
🔗 منبع: South China Morning Post
#Alibaba #Aegaeon #AI #LLM #GPU #CloudComputing #Efficiency #Nvidia #GenerativeAI
👍4🔥1
  📄 مدل DeepSeek-OCR — شناسایی متن با دقت بالا 🔍
شرکت DeepSeek مدل جدیدی از OCR را معرفی کرده است که میتواند تصاویر اسناد را مستقیماً به متن یا فایل Markdown تبدیل کند.
✨ قابلیتها:
♻️تشخیص متن در تصاویر و فایلهای PDF
♻️پشتیبانی از جداول، نمودارها و قالبهای پیچیدهی اسناد
♻️چهار نسخهی بهینهشده: Tiny، Small، Base، Large
♻️سازگار با GPU (PyTorch + CUDA 11.8)
♻️دارای مجوز MIT — استفاده و ویرایش آزادانه
⚡ ویژگی کلیدی:
همچنین DeepSeek-OCR با استفاده از فشردهسازی توکنهای تصویری (Visual Tokens Compression)،
به دقت و سرعتی بینظیر دست یافته است.
در بنچمارک OmnidocBench،
این مدل بالاترین دقت را با کمترین مصرف منابع کسب کرده و از سایر مدلهای OCR موجود سریعتر و کارآمدتر عمل میکند.
🟠 Hugging Face
🟠 GitHub
🟠 Paper
@rss_ai_ir
#هوش_مصنوعی #OCR #DeepSeek #بینایی_ماشین #AI #متن #تشخیص_متن #مدل_باز
شرکت DeepSeek مدل جدیدی از OCR را معرفی کرده است که میتواند تصاویر اسناد را مستقیماً به متن یا فایل Markdown تبدیل کند.
✨ قابلیتها:
♻️تشخیص متن در تصاویر و فایلهای PDF
♻️پشتیبانی از جداول، نمودارها و قالبهای پیچیدهی اسناد
♻️چهار نسخهی بهینهشده: Tiny، Small، Base، Large
♻️سازگار با GPU (PyTorch + CUDA 11.8)
♻️دارای مجوز MIT — استفاده و ویرایش آزادانه
⚡ ویژگی کلیدی:
همچنین DeepSeek-OCR با استفاده از فشردهسازی توکنهای تصویری (Visual Tokens Compression)،
به دقت و سرعتی بینظیر دست یافته است.
در بنچمارک OmnidocBench،
این مدل بالاترین دقت را با کمترین مصرف منابع کسب کرده و از سایر مدلهای OCR موجود سریعتر و کارآمدتر عمل میکند.
🟠 Hugging Face
🟠 GitHub
🟠 Paper
@rss_ai_ir
#هوش_مصنوعی #OCR #DeepSeek #بینایی_ماشین #AI #متن #تشخیص_متن #مدل_باز
❤1👍1
  📊 ترافیک GenAI — آمار جدید از رقابت غولهای هوش مصنوعی
📈 دادههای تازه نشان میدهد که تعادل بازار بین مدلهای تولیدی (Generative AI) در حال تغییر است:
مدل ChatGPT بهآرامی در حال از دست دادن سهم بازار است.
همچنین Perplexity برای نخستین بار از مرز ۲٪ عبور کرد.
🗓️ یک سال پیش:
ChatGPT — 87.1%
Gemini — 6.4%
Perplexity — 1.7%
Claude — 1.7%
Copilot — 1.1%
🗓️ ۶ ماه پیش:
ChatGPT — 78.8%
DeepSeek — 6.8%
Gemini — 5.5%
Grok — 3.1%
Perplexity — 1.5%
Claude — 1.3%
Copilot — 1.3%
🗓️ ۳ ماه پیش:
ChatGPT — 78.3%
Gemini — 8.7%
DeepSeek — 4.5%
Grok — 2.6%
Perplexity — 1.6%
Claude — 1.5%
Copilot — 1.2%
🗓️ ماه گذشته:
ChatGPT — 76.4%
Gemini — 10.8%
DeepSeek — 4.0%
Grok — 2.2%
Perplexity — 2.0%
Claude — 1.9%
Copilot — 1.2%
🗓️ امروز:
ChatGPT — 74.1%
Gemini — 12.9%
DeepSeek — 3.7%
Perplexity — 2.4%
Grok — 2.0%
Claude — 2.0%
Copilot — 1.2%
📊 نتیجه:
بازار بهتدریج از انحصار ChatGPT خارج میشود.
مدلهای Gemini و Perplexity با رشد پیوسته، جایگاه خود را تقویت کردهاند،
و با عرضهی Gemini 3.0 انتظار میرود گوگل موقعیت خود را بیش از پیش بهبود بخشد.
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #Gemini #Perplexity #Claude #DeepSeek #Copilot #آمار #GenAI #تحلیل_داده
📈 دادههای تازه نشان میدهد که تعادل بازار بین مدلهای تولیدی (Generative AI) در حال تغییر است:
مدل ChatGPT بهآرامی در حال از دست دادن سهم بازار است.
همچنین Perplexity برای نخستین بار از مرز ۲٪ عبور کرد.
🗓️ یک سال پیش:
ChatGPT — 87.1%
Gemini — 6.4%
Perplexity — 1.7%
Claude — 1.7%
Copilot — 1.1%
🗓️ ۶ ماه پیش:
ChatGPT — 78.8%
DeepSeek — 6.8%
Gemini — 5.5%
Grok — 3.1%
Perplexity — 1.5%
Claude — 1.3%
Copilot — 1.3%
🗓️ ۳ ماه پیش:
ChatGPT — 78.3%
Gemini — 8.7%
DeepSeek — 4.5%
Grok — 2.6%
Perplexity — 1.6%
Claude — 1.5%
Copilot — 1.2%
🗓️ ماه گذشته:
ChatGPT — 76.4%
Gemini — 10.8%
DeepSeek — 4.0%
Grok — 2.2%
Perplexity — 2.0%
Claude — 1.9%
Copilot — 1.2%
🗓️ امروز:
ChatGPT — 74.1%
Gemini — 12.9%
DeepSeek — 3.7%
Perplexity — 2.4%
Grok — 2.0%
Claude — 2.0%
Copilot — 1.2%
📊 نتیجه:
بازار بهتدریج از انحصار ChatGPT خارج میشود.
مدلهای Gemini و Perplexity با رشد پیوسته، جایگاه خود را تقویت کردهاند،
و با عرضهی Gemini 3.0 انتظار میرود گوگل موقعیت خود را بیش از پیش بهبود بخشد.
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #Gemini #Perplexity #Claude #DeepSeek #Copilot #آمار #GenAI #تحلیل_داده
👍1