VIRSUN
7.31K subscribers
799 photos
465 videos
3 files
509 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🎥 در Sora حالا پر از دیپ‌فیک‌های سم آلتمن شده!

🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راه‌اندازی کرده:

♻️افراد می‌تونن اجازه بدن چهره‌شون در ویدئوهای ساخته‌شده استفاده بشه.

♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.


😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچ‌های فست‌فود و حتی «سرقت‌های GPU تقلبی» دیده میشه.

🚀 اما Sora فقط به متن بسنده نمی‌کنه:

✳️همچنین IP کاربر رو تحلیل می‌کنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده می‌کنه تا علایق و سبک شما وارد ویدئو بشه.


📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora به‌طور خودکار ویدئویی از Phillies ساخت.

👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصی‌سازی عمیق، جایی که داده‌های شما و محیط اطراف‌تون بخشی از خروجی میشن.

@rss_ai_ir 🤖


#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا
1
📘 Anthropic منتشر کرد:
گاید عالی برای تنظیم مؤثر ایجنت‌ها

🔑 فرق اصلی با پرامپت‌نویسی کلاسیک اینجاست:

Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.

Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.


💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.

📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents

@rss_ai_ir 🤖

#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 در meta.ai حالا میشه نمونه‌هایی شبیه Vine دید.

⛔️به نظرم از نظر مکانیک خیلی عقب‌تر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپ‌فیک #AI #GenerativeAI
🔦 تولید تصویر با نور، نه GPU!

محققان دانشگاه UCLA یک مدل مولد نوری معرفی کرده‌اند که به جای تراشه‌ها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده می‌کند.

🔬 چطور کار می‌کند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل می‌کند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری می‌شود.
3️⃣ نور از یک دی‌کدر پراش عبور می‌کند و تصویر مستقیم روی سنسور شکل می‌گیرد.

✔️ نتایج آزمایشی:

♻️تولید اعداد، چهره‌ها، پروانه‌ها و حتی نقاشی‌هایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدل‌های دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یک‌مرحله‌ای) و تولید تدریجی (چند مرحله‌ای مثل دیفیوژن)


چرا مهم است؟

بدون بار محاسباتی CPU/GPU
فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام می‌دهند که GPU با میلیاردها عملیات محاسبه می‌کند
گامی به سوی هوش مصنوعی فوق کم‌مصرف برای دستگاه‌های AR/VR، دوربین‌های موبایل و سنسورهای فشرده


⚠️ چالش‌ها:

✳️دشواری در هم‌ترازی اجزای اپتیکی
✳️محدودیت در دقت ماسک‌های فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)


⛔️با وجود این محدودیت‌ها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور می‌دهند.

منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir
🚀 IBM Granite 4.0 معرفی شد
— خانواده‌ای تازه از مدل‌های زبانی متن‌باز با وزن‌های آزاد، از ۳B تا ۳۲B پارامتر.

🔹 چهار مدل جدید:

♻️Granite 4.0 H Small — 32B / 9B پارامتر فعال
♻️Granite 4.0 H Tiny — 7B / 1B
♻️Granite 4.0 H Micro — 3B / 3B
♻️Granite 4.0 Micro — 3B / 3B


📊 بنچمارک (Artificial Analysis Index):

Granite 4.0 H Small → امتیاز 23 (۸ امتیاز بالاتر از Granite 3.3 8B) — بهتر از Gemma 3 27B (22)، اما ضعیف‌تر از Mistral Small 3.2 (29) و Qwen3 30B A3B (37).

Granite 4.0 Micro → امتیاز 16 — بهتر از Gemma 3 4B (15) و LFM 2 2.6B (12).


کارایی توکن:

Granite 4.0 Small → 5.2M tokens

Granite 4.0 Micro → 6.7M tokens
(کارایی به‌مراتب بالاتر از Granite 3.3 8B و بیشتر مدل‌های زیر 40B بدون قابلیت reasoning).


🔑 جزئیات فنی:

✳️کانتکست: تا 128K tokens
✳️لایسنس: Apache 2.0
✳️همچنین Granite 4.0 H Small روی Replicate با هزینه 0.06$ / 0.25$ به ازای ۱M توکن ورودی/خروجی
✳️همه مدل‌ها روی Hugging Face در دسترس هستند
✳️مدل Micro (3.4B) را می‌توان کاملاً لوکال اجرا کرد.


🔗 Hugging Face
🔗 Unsloth

@rss_ai_ir

#AI #IBM #Granite4 #LLM #OpenWeights
Media is too big
VIEW IN TELEGRAM
🚀🤖 ربات کروی 3.0 از آزمایشگاه Guangming و شرکت FLERA

🔵 چین دوباره با یک نوآوری جالب در حوزه رباتیک خبرساز شد: ربات کروی 3.0 که در نمایش ویدیویی جدید معرفی شده است.

ویژگی‌ها:

✳️طراحی کاملاً کروی برای حرکت روان و همه‌جهته روی سطوح مختلف
✳️بهبود چشمگیر در پایداری (Stability Enhancement) نسبت به نسخه‌های قبلی
✳️قابلیت عبور از موانع و حرکت در شرایط پیچیده محیطی
✳️وزن سبک و ابعاد جمع‌وجور، مناسب برای آزمایش‌های رباتیک و محیط‌های واقعی


⚙️ نکته جالب این نسخه، استفاده از سیستم‌های تقویت‌کننده پایداری است که باعث می‌شود ربات در زمان حرکت یا توقف کمتر دچار لرزش شود. همچنین تست‌های عبور از موانع نشان داده‌اند که این ربات به‌راحتی می‌تواند از سیم‌ها، اشیاء کوچک و سطح‌های ناهموار عبور کند.

📽 در ویدیوی منتشرشده، می‌توان مقایسه‌ی حالت قبل و بعد (Before/After) را دید که نشان‌دهنده‌ی ارتقای محسوس در عملکرد است.

🌍 چنین ربات‌هایی می‌توانند در آینده برای کاوش محیط‌های خطرناک، عملیات نجات، پایش صنعتی و حتی مأموریت‌های فضایی استفاده شوند.

@rss_ai_ir

#رباتیک #AI #چین #ربات_کروی #نوآوری #فناوری
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ انتشار Agent S3 – عامل هوشمند پیشرفته برای کنترل رایانه در سطح نزدیک به انسان

🔹 تیم Simular AI از نسل جدید عامل‌ها رونمایی کرد: Agent S3.
به‌جای پیچیده‌تر کردن یک مدل، این رویکرد چندین عامل را به‌طور موازی اجرا می‌کند و سپس بهترین نتیجه انتخاب می‌شود. این روش جدید با نام Behavior Best-of-N (bBoN) معرفی شده است.

🔍 نحوه کار:

✳️هر عامل تلاش می‌کند مسئله را حل کند.
✳️اقدامات او به یک روایت رفتاری (Behavioral Narrative) تبدیل می‌شود – توضیح کوتاهی از تغییرات واقعی روی صفحه.
✳️یک داور ویژه این روایت‌ها را مقایسه کرده و بهترین عملکرد را انتخاب می‌کند.


📊 نتایج کلیدی:

♻️GPT-5 با 10 عامل موازی → دقت 69.9٪
♻️GPT-5 Mini → دقت 60.2٪
♻️Agent S3 → بیش از 10٪ بهتر از بهترین روش‌های قبلی (SOTA)


📄 مقاله: arxiv.org/abs/2510.02250
💻 کد: github.com/simular-ai/Agent-S
📝 بلاگ: simular.ai/articles/agent-s3

@rss_ai_ir

#هوش_مصنوعی #AgentS3 #SimularAI #عامل_هوشمند #AI #Agents
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 سی‌دریم ۴ یک هفته رایگان + آواتارهای هوش مصنوعی

🎉 در یک حرکت غافلگیرانه، Dreamina امکان استفاده رایگان از Seedream 4 را تا تاریخ ۹ اکتبر فراهم کرده است 🚀

قابلیت جدید:

با اتصال از طریق VPN آمریکا گزینه AI Avatars فعال می‌شود.

مشابه Hedra: یک عکس + یک فایل صوتی (حداکثر ۱۵ ثانیه در حالت رایگان) آپلود کنید → یک آواتار متحرک واقعی تحویل بگیرید.

در تست‌ها (مثلاً با پرنسس 👑) حرکات سر و میمیک بسیار هماهنگ و طبیعی بود.

خروجی با رزولوشن ۱۰۸۸×۱۰۸۸ است، کیفیت هم بالاست و خبری از افت وضوح نیست.


🔗 امتحان کنید: dreamina.capcut.com/ai-tool/generate

@rss_ai_ir

#Seedream4 #Dreamina #هوش_مصنوعی #آواتار #AI
🔥1
🚀 خبر داغ از دنیای هوش مصنوعی

استارتاپ Thinking Machines (تأسیس‌شده توسط چهره‌های سابق OpenAI از جمله میرا موراتی و جان شولمن) اولین محصول خود را معرفی کرد: Tinker

🔹 چی هست؟
پلتفرم Tinker یک پلتفرم ساده‌سازی‌شده برای فاین‌تیونینگ مدل‌های بزرگه، بدون نیاز به زیرساخت‌های سنگین.

🔹 ویژگی‌ها

ارائه API برای فاین‌تیون مدل‌هایی مثل Llama و Qwen 🦙

اتوماسیون کامل در راه‌اندازی خوشه‌های GPU، پایداری آموزش و دیپلوی 🚦

امکان خروجی گرفتن از مدل‌های سفارشی برای استفاده‌ی پژوهشگران 📦

رایگان در نسخه بتا (با برنامه‌ریزی برای درآمدزایی در آینده) 💰

هدف: دموکراتیزه کردن دسترسی به ابزارهایی که قبلاً فقط در دسترس غول‌های فناوری بودن 🌍


🔹 اهمیت
پلتفرمTinker نشون می‌ده رقابت آینده‌ی AI فقط در ساخت مدل‌های بزرگ‌تر نیست، بلکه در انطباق و شخصی‌سازی مدل‌های موجود خواهد بود.
البته همین موضوع نگرانی‌هایی درباره ایمنی و دستکاری گسترده‌تر مدل‌ها ایجاد کرده ⚠️

📊 ارزش‌گذاری استارتاپ: ۱۲ میلیارد دلار
سرمایه اولیه: ۲ میلیارد دلار


---

✍️ به‌نوعی Tinker می‌خواد تبدیل بشه به قطعه‌ی کلیدی زیرساخت هوش مصنوعی در جهان.

🔖 #AI #ThinkingMachines #FineTuning #Tinker #LLM
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 چین پیشرو در به‌کارگیری تجهیزات نظامی با کنترل از راه دور

🔹 ارتش آزادی‌بخش خلق چین (PLA) تمریناتی را آغاز کرده که در آن اپراتورها با استفاده از کنترل‌کننده‌ها و کابین‌های ویژه، ماشین‌آلات سنگین مانند بیل مکانیکی و بولدوزر را از راه دور هدایت می‌کنند.

🔹 این فناوری به‌ویژه برای عملیات در مناطق خطرناک یا جنگی اهمیت دارد، جایی که حضور مستقیم نیروی انسانی می‌تواند تهدیدآمیز باشد.

🔹 هدف اصلی، افزایش ایمنی، کارایی و انعطاف‌پذیری عملیاتی در میدان نبرد است.

📡 چین با این اقدام نشان می‌دهد که سرمایه‌گذاری در اتوماسیون و کنترل از راه دور تجهیزات نظامی را به عنوان بخشی از استراتژی مدرن‌سازی ارتش خود جدی گرفته است.


---

⚔️ شما چه فکر می‌کنید؟
آیا کنترل از راه دور تجهیزات سنگین می‌تواند آینده جنگ‌ها را تغییر دهد؟

#چین #تجهیزات_نظامی #هوش_مصنوعی #اتوماسیون #پهپاد_زمینی

👉 @rss_ai_ir
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🎷 تشخیص اشیای صدازا در ویدیو 🎷

⛔️در یک محیط ممکن است ده‌ها شیء وجود داشته باشد، اما تنها برخی از آن‌ها در تولید صدا نقش دارند 🎧


مدل جدید Sounding Object Detection دقیقاً همین را انجام می‌دهد — تشخیص می‌دهد کدام شیء در ویدیو واقعاً منبع صداست 🔍

📄 مقاله: لینک
🔗 پروژه: Sounding Object Detection
💙 کد و داده‌ها به‌زودی منتشر می‌شوند

#هوش_مصنوعی #بینایی_کامپیوتر #پردازش_صوت #AI #SoundDetection
@rss_ai_ir 🎵
⚡️ مصرف برق مدل GPT-5 معادل مصرف یک کشور! ⚡️

📣بر اساس برآوردها، مصرف سالانه‌ی برق GPT-5 حدود ۱۶٫۴ تراوات‌ساعت است — یعنی بیشتر از کل مصرف برق کشور اسلوونی 😳

⛔️به زبان ساده، این مدل هوش مصنوعی به‌تنهایی در رتبه‌ی ۸۱ جهان از نظر میزان مصرف برق قرار می‌گیرد!

💡 رشد سریع مدل‌های زبانی بزرگ حالا نه‌تنها یک چالش فنی، بلکه یک مسئله‌ی جدی زیست‌محیطی و انرژی محسوب می‌شود.

#هوش_مصنوعی #GPT5 #انرژی #پایداری #AI
@rss_ai_ir 🔋
Please open Telegram to view this post
VIEW IN TELEGRAM