VIRSUN

🎬مدل Veo 3.1 با کنترل بیشتر بر حرکت دوربین منتشر شد!

در جدیدترین به‌روزرسانی Veo 3.1 حالا می‌توانید کنترل کامل‌تری روی ویدیوهای تولیدشده با هوش مصنوعی داشته باشید:

🎥 قابلیت‌های جدید:
— تغییر موقعیت دوربین در ویدیوی از پیش ساخته‌شده تنها با یک پرامپت؛
— کنترل حرکت دوربین تنها با چند کلیک ساده.

🔐 فعلاً فقط کاربران Gemini Ultra می‌توانند این قابلیت‌ها را تست کنند.

🎞 امتحانش کنید و ببینید چقدر طبیعی‌تر شده 👇
https://labs.google/fx/en/tools/flow

#Veo #نقاشی_ویدیویی #Neural #هوش_مصنوعی #AI #GeminiUltra

@rss_ai_ir

❤3👍1

1.16K viewsedited 16:37

VIRSUN

0:13

This media is not supported in your browser

VIEW IN TELEGRAM

📸مدل Qwen Image Edit حالا می‌تواند دوربین را در عکس جابه‌جا کند!

با به‌روزرسانی جدید، فقط با چند کلیک می‌توانید زاویه‌ی دید تصویر را تغییر دهید — از نزدیک‌تر یا دورتر شدن گرفته تا تغییر پرسپکتیو و حتی خلق زاویه‌ای کاملاً تازه از همان صحنه.

نتیجه؟ تصاویری سه‌بعدی و زنده که انگار با دوربین واقعی گرفته شده‌اند 🫢

🎨 امتحان کنید 👇
https://huggingface.co/spaces/tori29umai/Qwen-Image-2509-MultipleAngles

#هوش_مصنوعی #Qwen #Neural #AI #ویرایش_تصویر

@rss_ai_ir

❤5👍1👏1

2.02K views16:41

VIRSUN

🔥 Kimi K2 Thinking —
عامل متن‌باز که واقعاً فکر می‌کند!

شرکت Moonshot AI مدل جدید خود با نام Kimi K2 Thinking را منتشر کرده است — عاملی متن‌باز برای استدلال خودکار و استفاده از ابزارها که در حال شکستن رکوردهای جدید است.

🔹 عملکرد:
• بهترین نتایج (SOTA) در HLE با ۴۴.۹٪ و BrowseComp با ۶۰.۲٪
• انجام ۲۰۰ تا ۳۰۰ فراخوان ابزاری بدون نیاز به دخالت انسان
• تخصص در استدلال، جستجوی عامل‌محور و کدنویسی
• دارای پنجره‌ی زمینه‌ی ۲۵۶K

🧠 طراحی‌شده برای “test-time scaling”:
همچنین K2 فقط برای پیش‌بینی توکن‌ها آموزش ندیده، بلکه برای تفکر گام‌به‌گام در حل مسائل ساخته شده — با مقیاس‌پذیری در عمق استدلال و تعداد گام‌های ابزاری.

🌐 در دسترس:
• حالت گفتگو:
kimi.com
• API:
platform.moonshot.ai
• وبلاگ فنی:
moonshotai.github.io/Kimi-K2/thinking
• وزن‌ها و کد:
huggingface.co/moonshotai

عامل‌های متن‌باز با سرعتی باور نکردنی در حال پیشرفت‌اند.
چالش بعدی Kimi: تبدیل قدرت خام استدلال به خودمختاری واقعی در دنیای فیزیکی. 🤖

#هوش_مصنوعی #عامل_هوشمند #KimiK2 #MoonshotAI #AGI #AI #OpenSource #Neural

❤1🔥1

1.12K views15:48

VIRSUN

0:22

This media is not supported in your browser

VIEW IN TELEGRAM

0:48

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 ابزارهای تولیدی هوش مصنوعی حالا به سمت کاربران حرفه‌ای حرکت می‌کنند

در هفته‌های اخیر، پلتفرم‌های Krea و Runway با فاصله‌ای کوتاه از هم، رابط‌های نودبیس (Node-based) خود را معرفی کردند — در واقع نسخه‌های ساده‌تر و کاربرپسندتری از ComfyUI.

این رابط‌ها به کاربران اجازه می‌دهند چندین مدل را در قالب یک pipeline سفارشی ترکیب کنند و تولیدهای پیچیده‌تر و قابل‌کنترل‌تری بسازند. هرچند از نظر امکانات هنوز به سطح ComfyUI نمی‌رسند، اما از نظر کاربردپذیری و سادگی استفاده بسیار بهتر هستند — بدون نیاز به دانلود وزن‌ها یا تنظیم کلیدهای API.

💡 نکته مهم: ظهور چنین ابزارهایی نشان می‌دهد که استودیوها و فریلنسرها حاضرند برای کنترل بیشتر و کیفیت بالاتر در پروژه‌های تجاری هزینه کنند، زیرا این ابزارها زمان لازم برای اصلاح و تکرار را کاهش می‌دهند.

🔧 اگر دوست دارید امتحان کنید:

برنامهRunway Workflows برای همه مشترکین فعال است

برنامه Krea Nodes فعلاً در دسترسی محدود (early access) قرار دارد

#هوش_مصنوعی #تولید_محتوا #Runway #Krea #ComfyUI #AI_Tools #neural

🔥2👍1👏1

1.17K views19:55

VIRSUN

⚡️ چرا مدل‌های زبانی مدرن (LLM) نمی‌توانند نقش «شرور» را درست بازی کنند؟

گزارش جدید Tencent نشان می‌دهد که مدل‌هایی که روی امنیت و اخلاق آموزش دیده‌اند، در ایفای نقش‌های منفی مثل شرور، فریب‌کار یا خودخواه تقریباً شکست می‌خورند.
دلیل ساده است: آموزش‌های ایمنی آن‌ها را مجبور می‌کند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگی‌های یک ضدقهرمان است.

🧩 پژوهشگران تستی به نام Moral RolePlay ساخته‌اند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.

📊 نتایج جالب بودند:

♻️هرچه شخصیت «تاریک‌تر» می‌شود، کیفیت بازی مدل به‌شدت افت می‌کند.

♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد به‌طور ناگهانی سقوط می‌کند.

♻️مدل‌ها به‌جای برنامه‌ریزی فریبکارانه، معمولاً دچار "انفجار عصبی" می‌شوند و فضای نقش را می‌شکنند.

♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.

♻️تنظیمات ایمنی قوی‌تر، اوضاع را حتی بدتر می‌کنند.

🎭 نتیجه: متدهای فعلی ایمنی با حوزه‌هایی مثل بازی، فیلم‌نامه‌نویسی و داستان‌پردازی واقعی در تضاد هستند، چون این حوزه‌ها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.

📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural

❤1👍1

2K viewsedited 15:32

VIRSUN

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

🐼مدل Pixel-Dense Embedding در مدل FlowFeat 🐼

محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کرده‌اند — یک نمایش ویژگی چندوظیفه‌ای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را به‌صورت بردارهای فشرده (Embedding) نمایش دهد.

🧠 ایده‌ی کلیدی:
به‌جای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل می‌کند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنه‌های پویا می‌شود.

💡 ویژگی‌ها:

♻️دقت بالا در پیش‌بینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone

📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat

#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI

1.11K views11:24

VIRSUN

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

🎥 مجموعه Freepik قابلیت Camera Angle را به فضای نودی Spaces اضافه کرد

در Freepik Spaces حالا می‌توانید زاویهٔ دوربین را به‌صورت سه‌بعدی کنترل کنید:

🟦 تصویر خود را آپلود می‌کنید
🟧 آن را به نود Camera Angle وصل می‌کنید
🟩 تصویر روی یکی از وجه‌های یک مکعب مجازی قرار می‌گیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید می‌شود

می‌توانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.

🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.

🌐 سایت

#neural #ai #image_editing
@rss_ai_ir

🔥2

1.14K viewsedited 09:37

About

Blog

Apps

Platform