VIRSUN
7.45K subscribers
792 photos
461 videos
3 files
507 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
Media is too big
VIEW IN TELEGRAM
🎥 بررسی تخصصی ویدیوی
Score-based Diffusion Models | Generative AI Animated


---

مدل‌های انتشار (Diffusion) به یکی از دقیق‌ترین و پیشرفته‌ترین روش‌ها در تولید داده‌های مصنوعی با کیفیت بالا تبدیل شده‌اند. این ویدیو با زبان انیمیشنی مفاهیم مدل‌های Score-based Diffusion را به‌شکل حرفه‌ای و قابل فهم نمایش می‌دهد 🚀

---

🔍 مهم‌ترین نکات این مدل‌ها:
🧠 فرایند یادگیری با افزودن نویز به داده‌ها و سپس حذف نویز
🎯 کنترل دقیق‌تر نسبت به GAN در تولید محتوا
🖼 کاربرد در تولید تصویر، بازسازی داده، طراحی هوشمند

---

⚙️ مزایا:
✔️ کیفیت بالا در خروجی
✔️ پایداری بهتر نسبت به GAN
✔️ مناسب برای پروژه‌های دقیق و خلاقانه

⚠️ محدودیت‌ها:
🔸 زمان آموزش زیاد
🔸 نیازمند منابع سخت‌افزاری بالا
🔸 حساس به تنظیمات مدل

---

💡 اگر به Generative AI علاقه‌مند هستی یا پروژه‌ای در زمینه بازسازی تصویر، طراحی صنعتی یا تولید داده مصنوعی داری، این مدل‌ها یک انتخاب آینده‌دار و بسیار کاربردی هستن.
ویدیوی کامل رو از این لینک ببین:
📺 https://www.youtube.com/watch?v=lUljxdkolK8

♨️زیرنویس فارسی
---

#هوش_مصنوعی #یادگیری_عمیق #DiffusionModel #ScoreBased #GenerativeAI #مدل_انتشار #OpenAI #AIResearch #پردازش_تصویر #تولید_داده

📡 کانال تخصصی ما:
🔗 https://t.iss.one/rss_ai_ir
2🔥1🙏1
Media is too big
VIEW IN TELEGRAM
🧠 مدل‌های انتشار (Diffusion Models) – با تمرکز بر DDPM

در دنیای مدل‌های مولد، روش‌های مبتنی بر «انتشار» به‌عنوان یکی از دقیق‌ترین و قابل‌کنترل‌ترین رویکردها شناخته می‌شوند. به‌ویژه DDPM (مدل احتمالاتی انتشار کاهش نویز) که ساختار ساده اما بسیار قدرتمندی دارد، پایه‌گذار بسیاری از مدل‌های موفق مانند Stable Diffusion است.

---

🔄 منطق مدل چگونه کار می‌کند؟

مدل DDPM ابتدا تصویر واقعی را طی چند مرحله با نویز مخدوش می‌کند تا به نویز کامل برسد. سپس در مسیر معکوس، گام‌به‌گام تلاش می‌کند تا آن نویز را حذف کرده و تصویر اصلی را بازسازی کند. این فرآیند آموزش باعث می‌شود مدل یاد بگیرد که از یک نویز خالص، تصویری دقیق و واقعی تولید کند.

در واقع، این مدل نه «یاد می‌گیرد چه چیزی بسازد»، بلکه «یاد می‌گیرد چگونه نویز را حذف کند».

---

⚙️ چرا DDPM اهمیت دارد؟

فرآیند آموزش پایدارتر از GAN است و مدل دچار نوسانات یادگیری نمی‌شود.
در تولید محتواهای تصویری، قابلیت کنترل و هدایت بیشتری در اختیار کاربر قرار می‌دهد.
برخلاف مدل‌های تصادفی ساده، خروجی‌هایی با جزئیات بالا و بافت دقیق ارائه می‌دهد.
امکان شرطی‌سازی وجود دارد؛ یعنی می‌توان تصویر خاصی را بر اساس متن، دسته‌بندی یا اطلاعات زمینه‌ای تولید کرد.

---

🧪 کاربردهای صنعتی و علمی


🔸 تولید تصویر از روی متن (Text-to-Image Generation)
🔸 بازسازی تصاویر آسیب‌دیده یا نویزی (Image Denoising)
🔸 ساخت انیمیشن و ویدئوهای تعاملی
🔸 تولید داده برای حوزه‌های پزشکی، رادار، سنجش‌ازدور و طراحی صنعتی
🔸 جایگزین‌سازی قطعات گمشده در تصاویر قدیمی یا ناقص

---

📌 جمع‌بندی

مدل‌های انتشار، انقلابی در هوش مصنوعی مولد به‌وجود آورده‌اند. DDPM به‌عنوان ساده‌ترین و پایه‌ای‌ترین نوع این مدل‌ها، درک مفهومی بسیار شفافی دارد و درعین‌حال قدرت بالایی در تولید تصاویر دقیق و کنترل‌پذیر ارائه می‌دهد.

در آینده، به‌کمک نسخه‌های سریع‌تر مانند DDIM یا مدل‌های ترکیبی با ترنسفورمر، سرعت و دقت این نسل از معماری‌ها حتی بیشتر خواهد شد.

---

📎 اگر دوست داری پیاده‌سازی عملی این مدل‌ها با PyTorch یا HuggingFace را هم بررسی کنیم، کافیه توی کامنت بگی تا آموزش گام‌به‌گامش رو هم آماده کنیم.

@rss_ai_ir
#هوش_مصنوعی #مدل_مولد #مدل_انتشار #پردازش_تصویر #یادگیری_عمیق #AI #DiffusionModels #DDPM #StableDiffusion #GenerativeAI
22👍18🔥16🥰16😁16👏15🎉9🙏1
🧩 مدل OmniPart: نسل جدید تولید سه‌بعدی با آگاهی از اجزای شیء

پژوهشگران در مدل OmniPart روشی دو‌مرحله‌ای برای ساخت اشیاء سه‌بعدی قابل‌ویرایش از روی تصاویر و ماسک‌های دوبعدی ارائه کرده‌اند.

🔹 ویژگی‌های کلیدی:

1. جدا‌سازی معنایی قوی بین اجزاء (Semantic Decoupling)
2. انسجام ساختاری بالا بین کل مدل (Structural Cohesion)
3. امکان کنترل و ویرایش بخش‌های جداگانه مدل پس از تولید



🔹 روش کار:

مرحله اول: یک ترنسفورمر خودبازگشتی (Autoregressive Transformer) چیدمان سه‌بعدی اجزاء را به صورت توالی باکس‌ها، بر اساس ماسک‌های ۲بعدی، طراحی می‌کند.

مرحله دوم: یک ماژول سنتز مکانی (Spatially-Conditioned Synthesis) — آموزش‌دیده از یک مدل تولیدی پیش‌فرض — همه اجزاء را به طور همزمان در این چیدمان می‌سازد.


🔹 نتایج:

دقت F1 Score = 0.74 در سطح جزء (با آستانه Chamfer Distance < 0.1)

عملکرد بهتر نسبت به تمام مدل‌های موجود در تولید سه‌بعدی مبتنی بر اجزاء


🔹 کاربردها:

♻️ویرایش جزئی مدل‌های سه‌بعدی
♻️انیمیشن‌سازی بخشی
♻️اختصاص متریال به قسمت‌های خاص در سیستم‌های تعاملی


📄 مطالعه کامل: arXiv
💻 کد و مدل: HuggingFace

#3D #ComputerVision #GenerativeAI
@rss_ai_ir
👍14😁13🥰10👏10🎉9🔥83
🚀 معرفی 4DNeX: نسل تازه‌ی مدل‌سازی 4 بعدی (تصویر → صحنه‌ی پویا)

🔹 پژوهشگران Zeng Tao, Jiawei Ren, Long Zhuo, Tianqi Liu, Zhaoxi Chen یک چارچوب نوین به نام 4DNeX ارائه داده‌اند؛ روشی feed-forward برای تولید نمایش‌های سه‌بعدی پویا (۴D) تنها از یک تصویر.

ویژگی‌های کلیدی:

* استفاده از مدل دیفیوشن ویدئویی از پیش‌آموزش‌دیده.
* معرفی دیتاست جدید 4DNeX-10M.
* نمایش یکپارچه‌ی ویدئو در ۶ بُعد (RGB + XYZ).
* استراتژی‌های ساده مانند width-wise fusion و XYZ normalization.

⚡️ کارایی چشمگیر:

* تولید صحنه‌ی 4D تنها در ۱۵ دقیقه (درحالی‌که روش‌هایی مثل Free4D حدود ۶۰ دقیقه زمان می‌گیرند).
* دستیابی به ۹۷.۲٪ سازگاری و ۵۸.۳٪ پویایی در وظایف image-to-4D.

🌍 اهمیت:
این روش یک گام بزرگ در مدل‌سازی مولد ۴D است؛ راهکاری مقیاس‌پذیر و دسترس‌پذیر برای شبیه‌سازی تکامل پویای صحنه‌ها، که می‌تواند به عنوان پایه‌ای برای جهان‌های مجازی و مدل‌های شبیه‌سازی هوشمند عمل کند.

📖 جزئیات بیشتر: [arXiv](https://arxiv.org/abs/2508.13154) | [HuggingFace](https://huggingface.co/papers/2508.13154)

@rss_ai_ir

#هوش_مصنوعی #4D #دیفیوشن #GenerativeAI #ComputerVision #arXiv
👍1610🎉10🔥9👏9😁7🥰4👌1
This media is not supported in your browser
VIEW IN TELEGRAM
⛔️ تازه یک مدل جدید برای ساخت دنیا معرفی شده!

🔗 همچنین WorldLabs ابزاری ساخته که فقط با یک تصویر، یک دنیا کامل سه‌بعدی می‌سازد.

ویژگی‌ها:

♻️جهان‌ها برای همیشه در حافظه ذخیره می‌شوند و جزئیات از بین نمی‌رود.
♻️مبتنی بر 3D Gaussian Splatting (3DGS) است، پس می‌توان صحنه‌ها را با هم ترکیب یا تغییر داد.
♻️برخلاف روش‌های قدیمی، دنیاها مقیاس‌پذیر و قابل ویرایش در زمان واقعی هستند.


📌 فعلاً در حالت بتای خصوصی قرار دارد.

به‌نظرتان آینده‌ی بازی‌سازی و متاورس دقیقاً همین مسیر نیست؟ 🎮🌍

#AI #3D #WorldModel #GenerativeAI #Metaverse #GameTech
@rss_ai_ir
🔥7👏7😁7👍65🎉2
📊 کاربردهای هوش مصنوعی مولد در سال ۲۰۲۵
@rss_ai_ir

بر اساس تحلیل Harvard Business Review، این‌ها پرکاربردترین موارد استفاده از Generative AI در سال ۲۰۲۵ هستند (در مقایسه با ۲۰۲۴):


---

🔺 رشد چشمگیر

🧑‍⚕️ سلامت و سبک زندگی (Healthy Living): +۶۵
👨‍💻 کدنویسی (Generate Code): +۴۲
🖼️ تولید تصویر با AI: +۵۳
🎨 خلاقیت (Creativity): +۱۸
🎤 آمادگی برای مصاحبه: +۲۴
📚 یادگیری و آموزش (Enhance Learning): +۴

---
🔻 افت رتبه

🔍 جستجوی تخصصی (Specific Search): –۱۰
🛠️ رفع اشکال (Troubleshoot): –۹
🎓 یادگیری شخصی‌سازی‌شده: –۸

---

🆕 ورود کاربردهای تازه

👶 سرگرمی کودک (Child Entertainment)
🍼 کمک در نگهداری کودک (Childcare Help)
🧳 برنامه‌ریزی سفر (Travel Itinerary)
🏢 مدل‌های سازمانی (Corporate LLM)
✍️ مقاله‌های دانشجویی (Student Essays)
🚫 مقابله با مزاحمت آنلاین (Anti-trolling)

---

📌 نتیجه‌گیری:
هوش مصنوعی مولد در سال ۲۰۲۵ از مرحله‌ی ایده‌پردازی فراتر رفته و وارد زندگی روزمره، سلامت، آموزش و حتی خانواده شده است.


---

#هوش_مصنوعی #AI #GenerativeAI
@rss_ai_ir
👍10😁75🎉5👏3🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ویدئو‌سازی همزمان با Krea.ai

استارتاپ Krea ثبت‌نام در لیست انتظار برای قابلیت جدید تولید ویدئو در زمان واقعی را آغاز کرد.

مشخصات:

♻️نرخ فریم بیش از ۱۲ فریم بر ثانیه
♻️ورودی می‌تواند شامل پرامپت متنی، تصویر، اسکرین‌شات یا حتی وبکم باشد
♻️خروجی: ویدئویی که تقریباً به‌صورت همزمان ساخته می‌شود


🖌️ شاید یادتان باشد که Krea اولین تیمی بود که قابلیت نقاشی زنده یا همان تولید تصویر همزمان را معرفی کرد (همزمان با Vizcom). حالا یک گام فراتر رفته و با استفاده از چیزی شبیه به «مدل جهان» توانسته یک زیررندر زنده از آنچه کاربر می‌خواهد ایجاد کند.

🔗 جزئیات بیشتر: krea.ai/blog/announcing-realtime-video

📌 به نظر می‌رسد این قابلیت بتواند انقلابی در طراحی، بازی‌سازی و تولید محتوا به وجود بیاورد.

#ویدئو #هوش_مصنوعی #Realtime #AI #GenerativeAI

@rss_ai_ir
7👍6🎉6🔥4😁4
🎬 نسل جدید ویدئوهای طولانی با روش Mixture of Contexts

محققان ByteDance و استنفورد روشی نوین برای تولید ویدئوهای طولانی معرفی کرده‌اند که مشکل اصلی مدل‌ها را حل می‌کند:
وقتی ویدئو طولانی می‌شود، توجه مدل بیش از حد «پف می‌کند»؛ محاسبات سنگین‌تر می‌شود، جزئیات از بین می‌رود، کاراکترها فراموش می‌شوند و تصویر «سر می‌خورد».


---

🔑 ایده اصلی: Mixture of Contexts

♻️ویدئو به چند بخش (فریم، شات، کپشن) تقسیم می‌شود.
♻️هر کوئری فقط بخش‌های مرتبط را انتخاب می‌کند، نه کل تاریخچه را.
♻️انتخاب با یک امتیاز شباهت ساده انجام می‌شود (مقایسه ویژگی بخش‌ها با کوئری).
♻️دو «لنگر» همیشه حاضرند: پرامپت کامل و شات محلی برای جزئیات تصویری.
♻️یک ماسک علّی دسترسی به فریم‌های آینده را می‌بندد تا حلقه ایجاد نشود.
♻️در نهایت، Flash Attention فقط روی بخش‌های انتخاب‌شده اعمال می‌شود → رشد محاسبات وابسته به طول کل ویدئو نیست، بلکه فقط به محتوای مفید بستگی دارد.



---

📊 نتایج

♻️۷ برابر کاهش FLOPs
♻️۲.۲ برابر سرعت بیشتر
♻️در صحنه‌های طولانی (۱۸۰هزار توکن)، ۸۵٪ از توجه غیرضروری حذف شد.



---

🎥 جمع‌بندی

✳️در ویدئوهای کوتاه، کیفیت حفظ می‌شود.
✳️در ویدئوهای طولانی، صحنه‌ها روان‌تر و کاراکترها پایدارتر هستند.
✳️زمان تولید به‌طور محسوسی کاهش می‌یابد.


🔑 نکته مهم:
مدل خودش یاد می‌گیرد روی چه چیزی تمرکز کند، بدون نیاز به تغییر معماری پایه؛ یعنی نوعی «حافظه» برای چند دقیقه ویدئو پیدا می‌کند.

🔖 لینک مقاله

#AI #ML #VideoGeneration #ByteDance #Stanford #DeepLearning #GenerativeAI #هوش_مصنوعی #یادگیری_عمیق #ویدئو #تولید_ویدئو
🎉26👍2523🥰23😁22🔥18👏16
This media is not supported in your browser
VIEW IN TELEGRAM
💛 نسل جدید تولیدکننده‌های SVG مقیاس‌پذیر 💛

🔹 پروژه OmniSVG معرفی شد؛ اولین خانواده‌ی مولدهای چندوجهی (multimodal) انتهابه‌انتها (e2e) که با استفاده از مدل‌های زبانی-بینایی (VLMs) قادر به تولید SVGهای دقیق و مقیاس‌پذیر هستند.

📌 نکته مهم: کد، مدل‌ها و دیتاست این پروژه تحت لایسنس MIT منتشر خواهند شد 💙

🔗 منابع بیشتر:

👉 Paper
👉 Project
👉 Repo
👉 Dataset

@rss_ai_ir

#AI #SVG #OmniSVG #VLM #OpenSource #GenerativeAI
18🔥14🥰14🎉13👍10🤩9💯9👏8❤‍🔥8😁7🙏1
🎯 ۷ گام تا تسلط بر مدل‌های زبانی بزرگ (LLM)

تسلط بر LLMها یک مسیر تدریجی است، نه یک مقصد. این اینفوگرافیک نقشه‌ی راه را نشان می‌دهد؛ از مبانی اولیه تا ساخت اپلیکیشن‌های واقعی:

1️⃣ درک مبانی LLM
🔹 پردازش زبان طبیعی (NLP)
🔹 یادگیری عمیق (Deep Learning)
🔹 ترنسفورمرها (Transformers)

2️⃣ بررسی معماری‌های LLM
🔹معماری BERT
🔹 معماری GPT
🔹معماری XLNet

3️⃣ پیش‌تمرین مدل‌ها
🔹 پیش‌بینی جمله‌ی بعدی
🔹 پیش‌تمرین متضاد زبان–تصویر (Contrastive Pre-training)

4️⃣ فاین‌تیونینگ LLMها
🔹 توابع زیان اختصاصی (Task-specific Loss)
🔹 افزایش داده (Data Augmentation)
🔹 توقف زودهنگام (Early Stopping)

5️⃣ تنظیم و پس‌آموزش
🔹 کاهش سوگیری (Bias Mitigation)
🔹 ارزیابی عدالت (Fairness Evaluation)
🔹 قابلیت توضیح‌پذیری (Explainability)

6️⃣ ارزیابی مدل
🔹 دقت (Accuracy)
🔹 روانی متن (Fluency)
🔹 مرتبط بودن پاسخ‌ها (Relevancy)

7️⃣ ساخت اپلیکیشن‌های LLM
🔹 چت‌بات‌ها
🔹 تولید محتوا
🔹 ترجمه‌ی زبان


---

🌟 اگر این مسیر را دنبال کنید، می‌توانید از درک مبانی تا پیاده‌سازی اپلیکیشن‌های پیشرفته مبتنی بر LLM حرکت کنید.

#هوش_مصنوعی #LLM #یادگیری_ماشین #مدل_زبان #دیپ_لرنینگ #NLP #AI #MachineLearning #DeepLearning #Chatbot #GenerativeAI

@rss_ai_ir
😁9👍8🔥8👏8🎉85🥰4🙏1
✳️⛔️این پرامپت برای تولید کاپوچینو با آرت فومی خاص طراحی شده. توصیف به مدل کمک می‌کنه که ویژگی‌های سوژه (subject) رو به‌صورت هنری و بامزه داخل کف شیر نمایش بده.


Prompt:
A cappuccino with foam art shaped like [subject], chubby features and defining traits etched in milk art, surrounded by soft crema bubbles, top-down view, served in a clean white ceramic cup.

@rss_ai_ir

#Prompt #AIArt #FoamArt #LatteArt #GenerativeAI #CoffeeLovers ☕️
👍32🥰2928🔥28🎉26😁18👏171🙏1👌1🕊1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥ابزار Seedream 4 به‌عنوان ابزار تغییر استایل (پوشاندن لباس روی فرد) واقعاً عالی عمل می‌کنه.

📸 ورودی فقط دو تصویر هست:

1. یک سلفی معمولی
2. یک کاراکتر با لباس انتخابی



🎞️ خروجی؟ تصویر ترکیبی دقیق، و وقتی انیمیشن با Kling 2.1 روش سوار میشه، نتیجه واقعاً چشمگیر میشه.

👕👗 برای تغییر پوشش و ساختن استایل‌های متنوع روی افراد، Seedream 4 داره به یکی از بهترین ابزارهای این حوزه تبدیل میشه.

@rss_ai_ir

#AI #Seedream4 #Kling21 #GenerativeAI #FashionAI #AIart
👍42🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Lucy

تازه‌ترین محصول تیم Decart.ai معرفی شد: генератор ویدیویی Lucy که سرعت بالایی دارد و توجه زیادی جلب کرده است.

🔹 نسخه اصلی با ۱۴ میلیارد پارامتر عرضه شده (نسخه سبک‌تر ۵B هم وجود دارد).
🔹 سرعت: تولید یک ویدئو ۵ ثانیه‌ای در حدود ۱۲ ثانیه — ادعا ۶ ثانیه است، اما همین هم در مقایسه عالی محسوب می‌شود.
🔹 کیفیت خروجی: ۷۲۰p
🔹 طول ویدئو: فعلاً در Fal.ai فقط ۵ ثانیه (برخی منابع از ۱۰ ثانیه خبر داده‌اند).
🔹 هزینه: ۰.۰۸ دلار به ازای هر ثانیه تولید

💡 نکته مهم: این مدل اپن‌سورس نیست و فعلاً فقط روی Fal.ai در دسترس است.
اگر بخواهیم با Wan مقایسه کنیم، تفاوت سرعت قابل توجه است (۱۲ ثانیه در مقابل ۶۸ ثانیه)، اما در کیفیت هنوز جای بحث وجود دارد.

👾 جالب اینکه Decart.ai اخیراً Mirage (ژنراتور ریل‌تایم دنیاها) و Oasis 2.0 (ژنراتور دنیای Minecraft) را هم معرفی کرده بود — نشانه‌ای که احتمالاً مسیر آینده ترکیب «ژنراتورهای دنیا» و «ژنراتورهای ویدیو» خواهد بود (مشابه Veo و Genie از گوگل).

🔗 تست در Lucy Playground
🔗 معرفی رسمی: Decart.ai
@rss_ai_ir

---

#Lucy #AI #VideoGeneration #Decart #FalAI #GenerativeAI #cgevent
😁10👍5🔥53🎉3
This media is not supported in your browser
VIEW IN TELEGRAM
🪄 Higgsfield
دوباره غافلگیر کرد: Fashion Factory

حالا می‌توانید در چند مرحله ساده یک فوتوشوت حرفه‌ای بسازید:
👤 ساخت کاراکتر
🌆 انتخاب پس‌زمینه
📸 تولید اولین ست عکس
👗 آپلود لباس دلخواه
زدن روی «پیرایش» → و یک آلبوم کامل در همان لباس جدید تحویل بگیرید!

🔧 «هیگزها» مرتب فیچرهای قدیمی‌شان را در قالب مینی‌محصولات تازه بسته‌بندی می‌کنند.
ولی حیف که نسخه رایگان برای تست وجود نداره.

🔗 تست کنید:

Higgsfield Fashion Factory

@rss_ai_ir

#AI #FashionTech #GenerativeAI #هگزفیلد
🔥16🎉14👍119😁7🥰6👏4
این تصویر ۹ اصل کلیدی برای بهبود عملکرد سیستم‌های RAG را نشون میده:

1️⃣ Chunking
تقسیم بهینه اسناد (۵۱۲–۱۰۲۴ توکن) و استفاده از پنجره‌های لغزان برای پوشش بهتر محتوا.

2️⃣ Embeddings
استفاده از مدل‌های بردار پیشرفته مثل BAAI یا MPNET برای دقت بالا.

3️⃣ Vector Store
انتخاب دیتابیس مناسب (مثل Milvus, Weaviate, Pinecone) بر اساس مقیاس و سرعت.

4️⃣ Query Processing
استفاده از تکنیک‌های HYDE و hybrid search برای بهبود بازیابی.

5️⃣ Reranking
اعمال مدل‌های بازچینش مثل MonoBERT یا TILDE برای افزایش دقت.

6️⃣ Summarization
ترکیب رویکردهای extractive و abstractive برای خلاصه‌سازی جامع.

7️⃣ Fine-tuning
تنظیم دقیق مدل برای بهبود عملکرد در دامنه‌های خاص.

8️⃣ Evaluation
پایش متریک‌های عمومی و دامنه‌ای برای بهبود مستمر سیستم.

9️⃣ LLM Integration
ادغام هوشمند مدل‌های زبانی بزرگ با retrieval.

🔟 Repacking
پیاده‌سازی استراتژی‌های sides, forward, reverse برای بسته‌بندی بهینه محتوا.


#هوش_مصنوعی #RAG #LLM #یادگیری_ماشین #AI #MachineLearning #GenerativeAI
🔥21👏16🎉1512🥰12👍11😁11
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 استارتاپ جدید برای ساخت دنیا از روی عکس!

⛔️یک استارتاپ تازه‌نفس مدلی معرفی کرده که می‌تواند از یک عکس ساده → یک دنیای سه‌بعدی قابل اکتشاف بسازد. فعلاً امکان آپلود تصاویر شخصی وجود ندارد، اما می‌توانید وارد دنیاهای ساخته‌شده توسط دیگران شوید و در آن‌ها قدم بزنید:
👉 marble.worldlabs.ai

نکته جالب: همین «نوارهای رنگی» یا Gaussian Splatting پایه‌ی اصلی این شبیه‌سازی‌ها هستند.

📱 از موبایل هم می‌شود دید، ولی کیفیت شبیه‌سازی‌ها پایین‌تر است.

@rss_ai_ir

#هوش_مصنوعی #سه‌بعدی #مولد #AI #3D #GenerativeAI #Metaverse
👏18😁1615🔥14🥰13👍12🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 Ray3 —
مدل جدید تولید ویدئو از Luma AI

⛔️این اولین مدل reasoning برای ویدئو است؛ مدلی که فقط تولید نمی‌کند، بلکه می‌فهمد: تحلیل می‌کند، خودش را اصلاح می‌کند و خروجی‌هایی در سطح استودیو ارائه می‌دهد.
امکان تست رایگان با Dream Machine وجود دارد.

🔥 ویژگی‌های Ray3:

Draft Mode —
♻️ساخت سریع صحنه و سپس خروجی در کیفیت 4K HDR.

Reasoning —
♻️درک زبان و دستورات بصری، طراحی منطق حرکت و ترکیب‌بندی، «تفکر» درباره‌ی آنچه تولید می‌شود.

Visual Annotations —
♻️کشیدن فلش یا دایره روی فریم کافیست تا مدل جهت حرکت دوربین یا شیء را بفهمد.

♻️فیزیک و رئالیسم — شبیه‌سازی حرکت، جمعیت، آناتومی، نور، بازتاب، و Motion Blur.

HDR Video —
♻️ خروجی ۱۰، ۱۲ و ۱۶ بیت HDR با رنگ‌های زنده، جزئیات در سایه‌ها و روشنایی‌ها، و امکان خروجی EXR برای پست‌پروداکشن.


⚡️ نکات برجسته:

✳️سرعت و هزینه تولید ویدئو ۵ برابر بهتر شده.
✳️مناسب برای هنرمندان و کارگردانان: تست ایده‌ها در لحظه و ارتقا تا سطح تولید حرفه‌ای.
✳️خروجی‌ها کیفیت بسیار بالایی دارند.


🟠 جزییات بیشتر:
lumalabs.ai/ray3

@rss_ai_ir

#Ray3 #LumaAI #هوش_مصنوعی #ویدئو #AIVideo #GenerativeAI #ReasoningAI
👍8🔥86🎉5🥰4😁4👏2🤔1
🌍📊 OmniWorld:
مجموعه‌داده چندمنظوره برای مدل‌سازی 4D

✳️مجموعه OmniWorld یک مجموعه‌داده عظیم و چندوجهی است که برای مدل‌سازی 4D طراحی شده و حوزه‌هایی چون بازسازی هندسی و تولید ویدئو را پوشش می‌دهد. این دیتاست، دامنه‌ها و فرمت‌های متنوعی را در بر می‌گیرد و چندوجهی بودن غنی را تضمین می‌کند.

🚀 ویژگی‌های کلیدی:

بیش از 4000 ساعت داده، 600 هزار توالی و 300 میلیون فریم
منابع متنوع: شبیه‌سازها، ربات‌ها، انسان‌ها و اینترنت
کیفیت بالای برچسب‌گذاری برای مدل‌سازی 4D و تولید ویدئو


📌 GitHub: OmniWorld

@rss_ai_ir

#OmniWorld #هوش_مصنوعی #مدل_سازی #GenerativeAI #Dataset #4D
😁8🔥7🎉7👍4👏43🥰3🙏1