VIRSUN
7.85K subscribers
782 photos
457 videos
3 files
503 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
⚡️ WAN 2.5 —
نسل تازه ویدئو‌ساز هوش مصنوعی

دیگه فقط text-to-video نیست، بلکه یک مدل چندوجهی کامله:

🎬 ویدئو

ورودی و خروجی: متن، تصویر، ویدئو و صدا
لیپ‌سینک همزمان برای چند شخصیت
همگام‌سازی تصویر و صدا (صداها، افکت‌ها، موسیقی)
کیفیت سینمایی: ۱۰۸۰p، تا ۱۰ ثانیه


🖼 تصویر

درک بهتر پرامپت و تولید باکیفیت‌تر
پشتیبانی از استایل‌های هنری و فتو‌رئالیسم

ادیت تعاملی و دقیق:
▫️ تغییر رنگ محصولات
▫️ ترکیب مفاهیم مختلف
▫️ افکت‌های تایپوگرافی


🧠 معماری

♻️چارچوب یکپارچه چندوجهی (متن + صدا + تصویر)
♻️هماهنگی با ترجیحات انسانی از طریق RLHF


✳️همچنین WAN 2.5 تبدیل شده به یک ابزار حرفه‌ای برای تولید و ادیت ویدئو با کیفیت سینمایی.

🔗 wan.video

#WAN #ویدئوژن #چندوجهی #هوش_مصنوعی
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
😳 ایلان ماسک چندین میلیارد دلار خرج کرده تا ربات Optimus پاپ‌کورن پخش کنه؟! 🍿

🤖 آینده ربات‌ها داره عجیب‌تر از چیزی میشه که فکر می‌کردیم...

#Optimus #ربات #ایلان_ماسک #هوش_مصنوعی

@rss_ai_ir
😁1
📢 در حالی که کانال‌های تلگرامی مشغول شیرین‌کاری با نمونه‌های به‌ظاهر «بی‌خطر» از Wan 2.5 هستند، پرسش اصلی اینجاست: وضعیت سانسور چطور است؟

✖️ پاسخ: هیچ سانسوری در کار نیست!
مدل به‌راحتی با ورودی image2video کار می‌کند و هر تخیلی—even ممنوعه—را به ویدیو تبدیل می‌کند.

🔍 نکته جالب این است که وزن‌های اصلی مدل در دسترس عمومی نیستند (فعلاً علی‌بابا آن‌ها را نگه داشته)، بنابراین چیزی مثل LoRA هم قابل استفاده نیست. با این حال، به نظر می‌رسد تیم Higgsfield سانسور را در سطح پرامپت غیرفعال کرده تا برای جذب مخاطب، آزادی بیشتری در خروجی‌ها ایجاد شود.

⚠️ حالا تصور کنید اگر پای LoRAها هم وسط بیاید، چه محتوایی ممکن است تولید شود...

@rss_ai_ir

#هوش_مصنوعی #Wan25 #ویدیوژنریشن #بدون_سانسور
👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ ShinkaEvolve —
فریم‌ورک متن‌باز ساکانا AI برای شتاب‌دادن به کشفیات علمی

🔍 محققان Sakana AI فریم‌ورک جدیدی به نام ShinkaEvolve معرفی کردند که با الهام از طبیعت و با تکیه بر LLM کار می‌کند و چندین برابر کارآمدتر از الگوریتم‌های تکاملی سنتی است.

⛔️در حالی که روش‌های کلاسیک برای یافتن راه‌حل مناسب به هزاران نمونه نیاز دارند، ShinkaEvolve می‌تواند تنها با چند صد تلاش به جواب بهینه برسد.

🌟 نمونه‌ها:

♻️در مسئله‌ی کلاسیک بسته‌بندی دایره‌ها، این سیستم با تنها ۱۵۰ نمونه به SOTA جدید رسید، در حالی‌که روش‌های قبلی به هزاران نمونه نیاز داشتند.

♻️در AIME Math Reasoning، توانست الگوهای جدیدی برای عامل‌ها ایجاد کند که قوی‌تر از متدهای موجود بودند.

♻️در ALE-Bench (برنامه‌نویسی رقابتی)، رتبه‌ی راه‌حل‌ها را از جایگاه ۵ به جایگاه ۲ ارتقا داد.

♻️در آموزش LLM‌ها، تابع خطای جدیدی برای مدل‌های MoE کشف کرد که باعث بهبود تخصصی‌شدن کارشناسان و کاهش perplexity شد.


⚙️ نوآوری‌های کلیدی:

✳️انتخاب هوشمند والدین برای تعادل بین اکتشاف ایده‌های جدید و بهبود راه‌حل‌های قدیمی.

✳️فیلترسازی بر اساس نوآوری، تا از هدر رفت منابع روی تکرار جلوگیری شود.

✳️استفاده از یک انسمبل چند LLM، جایی که الگوریتم bandit در لحظه بهترین مدل را برای وظیفه انتخاب می‌کند.


📌 هدف: ایجاد یک دستیار عمومی برای دانشمندان و مهندسان که کشف راه‌حل‌های نو را سریع‌تر و در دسترس‌تر کند.

🔗 بلاگ
🔗 کد
📄 گزارش arXiv

@rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #الگوریتم_تکاملی #ShinkaEvolve #متن_باز
👍31
🧠 Hallucination Risk Toolkit
برای LLMها

ابزاری سبک برای برآورد ریسک هَلوسینیشن بدون نیاز به آموزش مجدد مدل. طبق «قانون دِکمپرِشن» پرسش را بازنویسی می‌کند و بر اساس سطح خدمتِ هدف (SLO) تصمیم می‌گیرد پاسخ بدهد یا مؤدبانه امتناع کند.

ویژگی‌ها:

✳️مدل‌سازی ریاضیِ شفاف برای ریسک هَلوسینیشن

✳️دو حالت: با کانتکست (RAG/زمینه) و بدون کانتکست

✳️فقط با OpenAI Chat Completions API کار می‌کند

✳️پیاده‌سازی ساده برای قرار دادن جلوی هر LLM بعنوان «دروازه‌بان اعتماد»


گیت‌هاب:
https://github.com/leochlon/hallbayes

@rss_ai_ir

#LLM #AI_Safety #RAG #PromptEngineering #RiskAssessment #OpenAI #python
🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Kimi و حالت عامل جدید OK Computer

مدل K2 حالا با یک مود عامل قدرتمند عرضه شده است که امکانات کاربردی زیادی به همراه دارد:

ساخت سایت‌ها، داشبورد اپلیکیشن و پرزنتیشن‌ها
کار با فایل‌ها، مرورگر و ترمینال
مجموعه‌ای بزرگ از ابزارهای داخلی برای اجرای وظایف

🟢 تست رایگان: kimi.com

#AI #Agents #Kimi #K2 #OKComputer #هوش_مصنوعی #عامل_هوشمند

@rss_ai_ir
👍1🔥1👏1
Media is too big
VIEW IN TELEGRAM
🤖 استارتاپ نروژی 1X به ارزش‌گذاری 10 میلیارد دلاری رسید

🔹 شرکت 1X که توسط OpenAI، EQT و Tiger Global پشتیبانی می‌شود، حالا در حال جذب سرمایه با ارزش‌گذاری ۱۰ میلیارد دلار است؛ جهشی ۱۲ برابری نسبت به ۸۲۰ میلیون دلار در ابتدای امسال.

🚀 ربات پرچمدار Neo Gamma توانایی انجام کارهای روزمره مثل جارو کشیدن، آبیاری گیاهان و کمک در کارهای خانه را دارد.
🛡️ طراحی ایمن آن تضمین می‌کند حتی در صورت افتادن، آسیبی به انسان‌ها نرساند.
🌍 این شرکت از نروژ به سیلیکون‌ولی نقل مکان کرده تا مقیاس‌پذیری سریع‌تری داشته باشد.
📦 برنامه دارد تا پایان سال «صدها یا حتی هزاران» ربات به بازار عرضه کند.

به نظر می‌رسد 1X رویای ربات‌های خانگی را یک گام به واقعیت نزدیک‌تر کرده است.

#ربات #هوش_مصنوعی #1X #NeoGamma #سرمایه‌گذاری #تکنولوژی

@rss_ai_ir
👍1🔥1👏1
🌐 بنچمارک جدید هوش مصنوعی روی ۹ حوزه‌ی اصلی و ۴۴ شغل تمرکز دارد.
اینجا خبری از کارهای فیزیکی نیست، بلکه همه‌چیز درباره‌ی وظایف تحلیلی و ذهنی است.

🔹 حوزه‌های پوشش داده شده:
1️⃣ املاک، اجاره و لیزینگ
2️⃣ خدمات دولتی
3️⃣ تولید (غیر فیزیکی؛ مثل نقشه‌کشی و بررسی اسناد)
4️⃣ خدمات حرفه‌ای، علمی و فنی
5️⃣ بهداشت و درمان و خدمات اجتماعی
6️⃣ مالی و بیمه
7️⃣ خرده‌فروشی
8️⃣ عمده‌فروشی
9️⃣ کار با اطلاعات

📌 حتی در بخش «تولید» هم تمرکز روی مدیریت، تحلیل و بررسی داده‌هاست، نه کار فیزیکی.

@rss_ai_ir 🤖
#AI #Industry #Benchmark #هوش_مصنوعی #صنعت
🔎 کیفیت مدل‌های هوش مصنوعی در همه‌ی ۹ حوزه یکسان نیست

طبق نتایج (تصویر اول)، بعضی گروه‌های وظایف هنوز عقب‌ماندگی جدی دارند. چند شغل با عملکرد ضعیف‌تر (از تصویر دوم):

♻️تدوین‌گرهای صدا و تصویر
♻️حسابرسان و حسابداران
♻️کانسیرژ/پذیرش


برای اینکه دقیق ببینید هر گروه چه وظایفی داشته، این صفحه‌ی دیتاست را بررسی کنید:

https://huggingface.co/datasets/openai/gdpval

#هوش_مصنوعی #ارزیابی_مدل #GDPVal #LLM #AI #تحلیل_شغلی #مولتی_مدال #داده_باز
This media is not supported in your browser
VIEW IN TELEGRAM
🌐 گوگل دوباره یک ابزار تازه معرفی کرده: Learn Your Way

ایده ساده اما جذابه:
📖 یک فصل خسته‌کننده از کتاب درسی رو می‌دید به سیستم، و خروجی همون فصل رو می‌گیرید ولی بازنویسی‌شده بر اساس علاقه‌ها و سبک یادگیری خودتون.

🎮 مثال‌ها:

عاشق بسکتبال هستید؟ قوانین نیوتن رو با توپ و حلقه براتون توضیح میده.
اهل هنر هستید؟ اقتصاد رو مثل مزایده‌ی تابلوهای نقاشی نشون میده.

و فقط عوض کردن مثال‌ها نیست — سیستم فرمت‌ها رو هم تغییر میده:

♻️همچنین Mindmap برای کسانی که بصری یاد می‌گیرن
♻️درس‌های صوتی در قالب گفتگوی «معلم – دانش‌آموز»
♻️تایم‌لاین‌های تعاملی
♻️آزمون‌هایی که براساس اشتباهات شما تغییر می‌کنن


📊 نتایج یک آزمایش روی ۶۰ دانش‌آموز در شیکاگو:

✳️بلافاصله بعد از مطالعه: نمره میانگین ۷۷٪ با AI، مقابل ۶۴٪ با PDF معمولی
✳️سه روز بعد: دوباره ۷۷٪ در برابر ۶۴٪
✳️۱۰۰٪ گفتند فهم مطالب راحت‌تر بود (در برابر ۷۰٪ با کتاب معمولی)
✳️۹۰٪ از تجربه لذت بردند (در برابر ۵۷٪ با PDF)

https://research.google/blog/learn-your-way-reimagining-textbooks-with-generative-ai/

@rss_ai_ir
#گوگل #آموزش_هوشمند #هوش_مصنوعی #EdTech #یادگیری
👍1🔥1👏1
🤖 آموزش ربات‌ها با ویدئو – فریم‌ورک جدید محققان چینی

ویدئوها منبعی عالی برای یادگیری هستند: حجم زیادی داده وجود دارد و دیگر نیازی به شبیه‌سازی حرکات یا استفاده از لباس‌های motion capture نیست.

تا امروز، روش‌های موجود فقط به ربات‌های انسان‌نما اجازه می‌دادند یا بالاتنه را کنترل کنند یا صرفاً راه بروند. اما پژوهشگران چینی پا را فراتر گذاشتند: با فریم‌ورک جدیدشان به نام HDMI (HumanoiD iMitation for Interaction) می‌توان حرکات کامل انسان و تعامل با اشیا را آموزش داد.

🔹 روند کار:
1️⃣ استخراج حرکات انسان از ویدئوهای ضبط‌شده
2️⃣ آموزش ربات در شبیه‌ساز
3️⃣ انتقال مستقیم کد به ربات واقعی (و بلافاصله قابل اجراست 🔥)

📊 نتایج: ربات توانست ۶۷ بار درب را باز کند و از آن عبور کند، جعبه‌ها را جابه‌جا کند و حتی از پله‌ها بالا برود.

این دستاورد نشان می‌دهد یادگیری مستقیم از ویدئو می‌تواند آینده‌ی رباتیک را متحول کند.

https://hdmi-humanoid.github.io/#/

#هوش_مصنوعی #رباتیک #یادگیری_ماشین #HDMI #چین
1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 تنسنت بخشی از Hunyuan Studio را که مسئول سگمنتیشن اشیای سه‌بعدی است به صورت اوپن‌سورس منتشر کرد!

🔹 دو متد کلیدی:

P3-SAM —
مدل سگمنتیشن قطعات در فرمت سه‌بعدی.

X-Part —
مدل تولید قطعات با نتایج عالی در کنترل‌پذیری و کیفیت شکل.


📂 کد: GitHub
📦 وزن‌ها: Hugging Face

🌐 جزئیات بیشتر:

P3-SAM
X-Part


👉 یک گام دیگر برای دسترس‌پذیرتر شدن پایپ‌لاین‌های پیچیده کار با 3D برای جامعه پژوهشگران و توسعه‌دهندگان.

#AI #3D #Segmentation #OpenSource #Hunyuan #Tencent #DeepLearning

@rss_ai_ir
1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 کاربرد جالب نانابانانا – افکت زوم بی‌نهایت 🎥

اینجا همه‌چیز در یک اپ داخل AI Google Studio بسته‌بندی شده؛ فقط کافیه تصویر خودت رو آپلود کنی و روی بخش‌های دلخواه زوم کنی. هر بار زوم، هوش مصنوعی ادامه‌ی تصویر رو خلق می‌کنه.

⚡️ نکته جالب:

می‌تونی بارها و بارها زوم کنی و ببینی تصویر به چه دنیای عجیبی می‌رسه.

کار باهاش خیلی ساده‌ست، فقط انتخاب بخش دلخواه → ادامه‌ی سفر تصویری.

تنها ضعف: سرعت تولید بالایی نداره (ویدیوها برای نمایش سریع‌تر، چند برابر سرعت داده شدن).


🎨 تست کن اینجا:
👉 AI Studio Zoom

خیلی زود می‌فهمی چرا اینقدر زوم بی‌نهایت اعتیادآوره 😅
#نانابانانا #AI #گوگل #زوم_بی‌نهایت #خلاقیت #هوش_مصنوعی #AIArt #cgevent



@rss_ai_ir
Media is too big
VIEW IN TELEGRAM
⚡️ ChatGPT Pulse: گزارش صبحگاهی هوشمند ⚡️

دیگه لازم نیست خودت موضوعات مهم رو دنبال کنی — ChatGPT Pulse هر صبح برات یک گزارش آماده می‌کنه.
این گزارش‌ها براساس:
🔹 چت‌های اخیرت
🔹 حافظه شخصی ChatGPT
🔹 اپلیکیشن‌های متصل
🔹 و علایق و خواسته‌های خودت

تهیه می‌شن و یک مرور کامل از موضوعات مهم روز بهت می‌دن.

📱 این قابلیت فعلاً برای کاربران Pro در اپلیکیشن موبایل فعال شده.

@rss_ai_ir

#ChatGPT #OpenAI #هوش_مصنوعی #اخبار
👍2🔥2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
✔️ تنسنت از Hunyuan3D-Omni رونمایی کرد؛ اولین مدل صنعتی برای تولید سه‌بعدی با کنترل چندگانه 🎉

🟣 این مدل روی پایه‌ی Hunyuan3D 2.1 ساخته شده و به «ControlNet برای 3D» معروفه.
هدف؟ حل مشکل اعوجاج هندسه و تولیدهای بی‌کیفیت، با امکان ترکیب همزمان ۴ شرط کنترلی.

🚀 نوآوری‌های کلیدی:

✳️انکودر سبک و یکپارچه برای فیوژن مولتی‌مدال
✳️آموزش تدریجی بر اساس پیچیدگی برای افزایش پایداری


⚡️ امکانات:

کنترل با تصویر یا اسکچ → مناسب برای تعیین دقیق ژست‌ها در انیمیشن و آواتار

استفاده از ابر نقاط → حذف عدم قطعیت و بهبود واقع‌گرایی هندسی

Bounding Box →
تعریف نسبت‌ها(طول، عرض، ارتفاع) طبق طراحی

Voxel-Control →
ساخت توپولوژی برای سناریوهای مهندسی و خلاقانه


🟢 کد: GitHub
🟢 وزن‌ها: Hugging Face
🟢 گزارش: arXiv

#3DGenAI #TencentHunyuan #OpenSourceAI
@rss_ai_ir
🔥2👍1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🚢 ربات بازرس کشتی‌ها

⛔️دانشگاه برمن از یک ربات کوچک و هوشمند رونمایی کرده که برای بازرسی دیواره‌های کشتی طراحی شده است. این ربات مثل یک مارمولک آهنربایی روی سطوح فلزی حرکت می‌کند.

🔹 ویژگی‌ها:

✳️حرکت با دو چرخ مغناطیسی و موتورهای دنده‌ای
✳️دم الاستیکی برای حفظ تعادل (ترکیبی از ربات و مارمولک 🦎)
✳️دوربین بی‌سیم کوچک در قسمت جلو برای ارسال ویدئوی زنده به اپراتور
✳️فعلاً به‌صورت کنترل از راه دور کار می‌کند، اما در آینده می‌تواند کاملاً خودران شود.
✳️هدف اصلی: ایمن‌تر کردن کارهای پرخطر برای انسان‌ها با کمک ربات‌های کوچک و تخصصی.

@rss_ai_ir

#رباتیک #کشتی #ایمنی #بازرسی #AI
1
This media is not supported in your browser
VIEW IN TELEGRAM
🌀 Tripo V3.0 Ultra
منتشر شد!

⛔️تمرکز اصلی این نسخه روی بافت‌ها (Textures) و جزئیات بسیار ظریف است.
نمایش مش با ۲ میلیون پلی‌گان هم اضافه شده – اما واقعاً سؤال اینجاست: آیا همیشه به این حجم نیاز داریم؟ 🤔

🔗 تست کنید:
studio.tripo3d.ai

@rss_ai_ir

#Tripo3D #مدل‌سازی_سه‌بعدی #AI #3DGenAI #تکسچر
🦾 Google
معرفی کرد: Gemini Robotics-ER 1.5 – مدلی تازه برای ربات‌ها که توانایی دیدن، استدلال، برنامه‌ریزی و عمل در دنیای واقعی را دارد.

قابلیت‌ها:

✳️درک فضا و اشیاء اطراف 🏠
✳️شکستن وظایف به مراحل (مثلاً: «میز را جمع کن» → گام‌های اجرایی)
✳️اتصال به ابزارهای بیرونی: جستجو، مدل‌های تحلیل تصویر و ...
✳️تعادل میان سرعت و دقت ⚡️
✳️ایمنی بالاتر: توجه به وزن و محدودیت‌های فیزیکی اجسام

📌 نمونه: رباتی که زباله را تفکیک می‌کند.
او قوانین محلی را می‌فهمد، اشیاء را تشخیص می‌دهد، مراحل را طراحی می‌کند و همه را ایمن اجرا می‌کند.

🔗 جزئیات: Google Blog

@rss_ai_ir

#Google #Gemini #Robotics #هوش_مصنوعی #رباتیک #PhysicalAgents

@rss_ai_ir