VIRSUN
12.1K subscribers
1.18K photos
701 videos
5 files
773 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
⚡️ خبر: Ai2 مدل‌های جدید Olmo 3 را معرفی کرد — مجموعه‌ای کاملاً متن‌باز در نسخه‌های 7B و 32B که از نظر کیفیت به سطح بهترین مدل‌های بازار نزدیک شده‌اند.

🔹 مدل 32B base
به‌عنوان یک مدل پایه، بسیار قدرتمند عمل می‌کند و در بسیاری از بِنچمارک‌ها هم‌سطح Qwen 2.5 بوده و حتی از Google Gemma 3 نیز جلو می‌زند.

🔹 مدل‌های 7B instruct و 7B reasoning
در میان مدل‌های غربی، بهترین عملکرد را دارند و مخصوصاً نسخهٔ reasoning نتایج بسیار قوی ارائه می‌دهد.

🔹 مدل 32B Think
نخستین مدل 32B کاملاً باز برای وظایف سنگینِ استدلالی؛ کیفیت آن به Qwen 3 نسخه‌های 8B و 32B بسیار نزدیک است.

🔸 تمام داده‌ها، کدها و چک‌پوینت‌ها به‌طور کامل منتشر شده‌اند.
🔸 نسخهٔ 32B بدون مشکل روی یک GPU با 80GB یا حتی یک لپ‌تاپ قدرتمند اجرا می‌شود.
🔸 این مدل یک خلأ مهم را پر کرده، زیرا Qwen نسخهٔ open-source برای 32B base ندارد.

🟠 Paper

https://allenai.org/papers/olmo3
🟠 Artifacts

https://huggingface.co/collections/allenai/olmo-3
🟠 Demo

https://playground.allenai.org
🟠 Blog

https://allenai.org/blog/olmo3

@rss_ai_ir
#هوش_مصنوعی #مدل_زبان #Olmo3 #LLM #AI2
1
نانابانانا پرو به‌صورت رسمی در حال تسخیر تمام پلتفرم‌هاست؛
از Freepik گرفته تا ده‌ها سرویس دیگر و حتی داخل فتوشاپ هم اضافه شده.

کیفیت تولید تصویر فوق‌العاده است و دقت در اجرای پرامپت کاملاً خیره‌کننده. اما چند قابلیت جدید دارد که قبلاً اصلاً با «مدل‌های ساخت تصویر» مرتبط نمی‌دانستیم:

۱. کار حرفه‌ای با متن داخل تصویر
فقط نوشتن یک متن بدون غلط نیست؛ بلکه تحلیل و تولید متن در سطح LLM انجام می‌شود.
مثال جالب: می‌توان تمام نوشته‌های واضح روی یک پوستر تبلیغاتی را به زبان دیگری ترجمه کرد.

🔍 ۲. اتصال به جستجو و دانش واقعی
توانایی جستجو در وب دارد و می‌تواند تصاویر به‌روز و مطابق داده‌های لحظه‌ای بسازد.
در واقع، Gemini 3 پشت صحنه برایش کار می‌کند.

📊 ۳. تولید کامل یک ارائه
ترکیب متن، داده، تحلیل، نمودار، طرح‌بندی اسلایدها و حتی ساخت موکاپ و اسکچ—all-in-one.

🖼 ۴. ورودی تا ۱۴ تصویر به‌عنوان رفرنس
برای حفظ کنسیستنتی در طراحی کاراکترها، محصول‌ها، دنیاهای فانتزی و… فوق‌العاده است.

👁 ۵. درک و توصیف تصاویر با دقت عجیب
سطح تفسیر و تحلیل محتوا به‌شدت پیشرفته‌تر از نسل قبلی است.

@rss_ai_ir
#نانابانانا #Gemini #تولید_تصویر #هوش_مصنوعی #پرامپت #مدل_مولد
👏21
برای بچه‌های آرک‌ویز خبر جذاب داریم 🤌🔥

نانابانانی‌شا حالا ورودی تصویری را واقعاً تحلیل می‌کند و بعد براساس نقشه‌ها و پلان‌ها، رندر کامل می‌سازد.
یعنی از یک عکس خام → برداشت فضا → تبدیل به رندر معماری با نور، متریال و پرسپکتیو درست.
دقیقاً همان چیزی که همیشه آرک‌ویز دنبال آن بود.

@rss_ai_ir
#معماری #ArchViz #نانابانانا #هوش_مصنوعی #رندر #پلان #طراحی_داخلی
📣و در نهایت خبر آخر دربارهٔ نسخهٔ جدید نانابانانا 🍌⚡️
تمام جزئیات رسمی در بلاگ گوگل منتشر شده:
اعداد، نمونه‌پرامپت‌ها، تست‌ها و مثال‌های دقیق کیفیت خروجی.
اگر می‌خواهید بدانید این نسخه دقیقاً چه تغییراتی کرده و چرا همه درباره‌اش حرف می‌زنند، این لینک بهترین مرجع است👇
https://deepmind.google/models/gemini-image/pro/

@rss_ai_ir
#نانابانانا #هوش_مصنوعی #گوگل #Gemini #مولتی‌مودال
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
🔶 نسخهٔ ۵.۰ مدل‌های Kandinsky منتشر شد؛ یکی از بزرگ‌ترین آپدیت‌های متن‌باز در حوزهٔ تولید تصویر و ویدیو

اسبر تمام مجموعهٔ Kandinsky 5.0 را کاملاً متن‌باز عرضه کرد:
همچنین Video Pro، Video Lite، Image Lite و توکنایزرهای K-VAE 1.0 — همه با لایسنس MIT و همراه با کد و وزن‌ها.

🎬 Video Pro
نسخهٔ پرچم‌دار که ویدئوهای HD تا ۱۰ ثانیه می‌سازد، با کنترل دقیق حرکت دوربین.
آموزش‌دیده روی: ۵۲۰ میلیون تصویر + ۲۵۰ میلیون ویدیو + مرحلهٔ نهایی روی دیتاست ویدیوهای بسیار باکیفیت.
در تست‌ها از Wan 2.2-A14B بهتر و از نظر کیفیت نزدیک Veo 3 است.

پشتیبانی کامل از زبان روسی و انگلیسی؛ تولید متن روی تصویر (لاتین/سیریلیک) بدون خطا.

🎥 Video Lite
نسخهٔ سبک برای GPUهای ۱۲GB، با کیفیت بالا و داینامیک عالی.
در کیفیت، ۷ برابر بهتر از Wan 2.1-14B عمل می‌کند، هم در Text-to-Video هم Image-to-Video.

🖼 Image Lite
برای تولید تصویر و ادیت پیشرفته.
آموزش‌دیده روی ۵۲۰ میلیون تصویر + ۱۵۰ میلیون زوج ادیت + SFT نهایی روی ۱۵۰هزار تصویر.
به‌طور چشمگیر از FLUX.1 بهتر عمل می‌کند و در ادیت با FLUX.1 Kontext برابری می‌کند.

🎛 K-VAE 1.0 (نسخه ۲D و ۳D)
اتو‌انکودر واریاسیونی برای فشرده‌سازی ورودی‌ها (۸×۸ برای تصویر و ۴×۸×۸ برای ویدیو).
کیفیت بازسازی +۰.۵ dB بهتر از Flux / Wan / Hunyuan با همین ضریب فشرده‌سازی.

📦 تمام مدل‌ها و وزن‌ها در GitHub، Gitverse و HuggingFace موجود است.

@rss_ai_ir
#Kandinsky #AI #نشر_متن_باز #تولید_ویدیو #دیفیوژن #هوش_مصنوعی
👏4🔥1
🤖 خبر: AITradeGame؛ شبیه‌ساز معامله‌گری با هوش مصنوعی

اینکه AITradeGame یک شبیه‌ساز متن‌باز است که به شما امکان می‌دهد استراتژی‌های معاملاتی را با کمک مدل‌های هوش مصنوعی آزمایش کنید.
نسخهٔ آفلاین با حفظ کامل حریم خصوصی ارائه شده و نسخهٔ آنلاین هم قابلیت‌های تعاملی و جدول رتبه‌بندی دارد.

نکات برجسته:
• پشتیبانی از مدل‌های مختلف، از جمله OpenAI و Claude
• ذخیره‌سازی کاملاً محلی بدون ردیابی ابری
• جدول رتبه‌بندی برای رقابت با دیگران
• رابط کاربری ساده با امکان تنظیم پارامترهای معامله‌گری

📌 GitHub:
https://github.com/chadyi/AITradeGame

@rss_ai_ir
#AI #Trade #شبیه_ساز #معامله_گری #هوش_مصنوعی
🔥2👍1👏1
🔍 در صنعت، فرقِ «بلد بودن» با «ادعا داشتن» از کیلومترها پیداست

در پروژه‌های واقعی — چه اتوماسیون باشد، چه هوش مصنوعی، چه بهره‌برداری — همیشه دو نوع نیرو دیده می‌شود:

🟩 نیروهای واقعاً بلد:
• قبل از حرف‌زدن، مسئله را دقیق می‌فهمند
• خروجی قابل اندازه‌گیری می‌دهند، نه داستان
• در جلسه کمتر حرف می‌زنند، اما بیشتر حل می‌کنند
• مسئولیت‌پذیرند و اگر اشتباه کنند، اصلاح می‌کنند
• نیاز به «نمایش» ندارند؛ کارشان خودش حرف می‌زند

🟥 نیروهای پرادعا و پرحرف:
• به‌جای تحلیل مسئله، شعار می‌دهند
• خروجی ندارند اما جلسه زیاد می‌گیرند
• هنگام خرابکاری، تقصیر را به گردن سیستم و دیگران می‌اندازند
• از اصطلاحات پیچیده برای پنهان کردن نابلدی استفاده می‌کنند
• انرژی تیم را می‌گیرند و سرعت پروژه را پایین می‌آورند

🎯 جمع‌بندی صنعتی:
در هر کارخانه یا سازمان، ارزش نیرو با «میزان صدای او» سنجیده نمی‌شود،
بلکه با میزان تأثیر او روی خروجی، بهره‌وری و حل مسئله سنجیده می‌شود.

@rss_ai_ir
#مدیریت_صنعتی #اتوماسیون #مهندسی #بهره‌وری #تجربه_صنعتی
👌62👏2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 مدل HunyuanVideo-1.5؛ نسل جدید مدل‌های سبکِ تولید ویدیو

مدل تازه‌ی HunyuanVideo-1.5 منتشر شد؛ یک ویدئوژنراتور اوپن‌سورس با کیفیت بالا و حجم بسیار کم (۸.۳ میلیارد پارامتر) که برای سخت‌افزارهای محدود واقعاً غنیمت است.


ویژگی‌های مهم

• امکان اجرا در حدود ۱۴ گیگابایت VRAM با فعال‌کردن offload به CPU
• کیفیت خروجی عالی با وجود سبک بودن مدل
• وجود ماژول آپ‌اسکیل تا رزولوشن 1080p
• پشتیبانی کامل از ComfyUI
• مناسب برای سیستم‌های خانگی و ورک‌استیشن‌های متوسط

🌐 لینک‌ها
کد:
github.com/Tencent-Hunyuan/HunyuanVideo-1.5
وزن‌ها:
huggingface.co/tencent/HunyuanVideo-1.5
سایت مدل:
hunyuan.tencent.com/video/en

#هوش_مصنوعی #ویدئوژنریشن @rss_ai_ir
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🍯 بازکردن هوشمندانه‌ی UV برای مش‌های سه‌بعدی 🍯

روش PartUV یک تکنیک جدید برای UV Unwrapping است که به‌جای باز کردن کامل مش، آن را بر اساس «قطعات» تجزیه می‌کند. این مدل، ترکیبی از دانش یادگرفته‌شده دربارهٔ بخش‌های مختلف جسم و نشانه‌های هندسی است و در نهایت یک مجموعه کوچک، منظم و کاملاً هم‌راستا با ساختار قطعه‌ها تولید می‌کند.

مناسب برای:
مدل‌سازی سه‌بعدی، گیم، انیمیشن، ری‌تاپو، تکسچرینگ حرفه‌ای.
🎁 ریپوی پروژه هم منتشر شده.

🔗 لینک‌ها

• Paper: arxiv.org/pdf/2511.16659
• Project: www.zhaoningwang.com/PartUV/
• Repo: github.com/EricWang12/PartUV

#سه_بعدی #UV #Mesh #AI3D
👍1
📌 مجموعه Figure گزارشی مفصل منتشر کرد از اینکه ربات‌های Figure 02 چگونه به مدت ۱۱ ماه در کارخانه BMW کار کردند.

داستان اصلاً آزمایشگاهی نبود؛ این اولین جنگ واقعی صنعتی برای ربات‌ها بود. تنها ۶ ماه بعد از معرفی مدل 02، آن‌ها وارد خط تولید BMW شدند و تا ماه دهم به ظرفیت کاری کامل رسیدند.

🔧 شیفت کاری:
▪️ ۱۰ ساعت در روز
▪️ از دوشنبه تا جمعه
▪️ بیش از ۱۲۵۰ ساعت کار واقعی روی خط تولید

در مجموع، ربات‌ها بیش از ۹۰ هزار قطعه را جابه‌جا کردند و در تولید ۳۰ هزار خودرو سری X3 نقش مستقیم داشتند. همچنین بیش از ۱.۲ میلیون قدم برداشتند و حدود ۳۲۰ کیلومتر در فضای کارخانه راه رفتند.


---

🎯 وظیفه اصلی ربات‌ها

«لود کردن ورق‌های فلزی» — یک کار کلاسیک صنعتی، اما بسیار دقیق.
ربات باید ورق فلزی را بردارد و با دقت ۵ میلی‌متر داخل دستگاه جوش قرار دهد.

برای سنجش عملکرد، مهندسان KPIهای سختی تعیین کرده بودند:

🟢 ۸۴ ثانیه برای کامل‌کردن هر چرخه
🟢 بیش از ۹۹٪ نرخ موفقیت
🟢 صفر دخالت انسانی در هر شیفت

این اهداف باعث شد Figure الگوریتم‌های جدید هماهنگی چشم–دست و گام‌برداری تطبیقی را توسعه دهد.


---

🚧 چه چیزی خراب شد؟ تجربه واقعی یعنی پیدا کردن گلوگاه‌ها.

با ورود Figure 03، نسل دوم رسماً بازنشسته شد. مهم‌ترین نقطه‌ضعف Figure 02 در عمل چه بود؟

❗️ پیش‌دستی (Forearm)
به‌دلیل طراحی فشرده و نیاز به چابکی، این بخش:
— داغ می‌کرد
— تعمیرش سخت بود
— نقطه‌ضعف کل سیستم محسوب می‌شد

در Figure 03 معماری این بخش کاملاً اصلاح شد:
🔵 برد توزیع برق حذف شد
🔵 سیم‌کشی دینامیک کنار گذاشته شد
🔵 کنترلرهای موتور مستقیماً به کامپیوتر مرکزی وصل شدند

اساساً تجربه سخت کارخانه BMW تبدیل شد به یک نسخه‌ی کاملاً بهتر و مهندسی‌شده.

https://www.figure.ai/news/production-at-bmw

---
@rss_ai_ir
#هوش_مصنوعی #رباتیک #BMW #Figure #AI #Industry4_0
3
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 مدل Nano Banana Pro؛ یک دمو جذاب از قدرت نسل جدید مدل‌های تصویری گوگل

⛔️در این نمونه، مدل با یک پرامپت ساده توانسته یک تصویر کاملاً سبک‌دار و دقیق بسازد:


🎨 پرامپت:
Generate a diagram of a two-layer neural network in the style of Stephen Biesty

🔧 نکته:
حرکت و انیمیشن نهایی هم با Veo 3 ساخته شده.

@rss_ai_ir
#هوش_مصنوعی #نقشه‌کشی #NanoBananaPro #گوگل #تولید_تصویر #AI
This media is not supported in your browser
VIEW IN TELEGRAM
ابزار مخصوص کسانی که از جدول‌سازی متنفرند

این سرویس فقط با یک پرامپت، خودش جدول را برایتان تکمیل می‌کند.
کافی است فایل را آپلود کنید یا لینک بدهید — بقیه کارها را هوش مصنوعی خودش انجام می‌دهد.

🔗 لینک
https://labs.ramp.com/sheets

@rss_ai_ir
#هوش_مصنوعی #جدول #بهره‌وری #AITools #اتوماسیون
🧠 نشانه‌های واقعی یک جهش علمی با GPT-5

هوش مصنوعی فقط ابزار نیست—کم‌کم تبدیل می‌شود به عضو فعال تیم پژوهشی.
نتایج جدید OpenAI دقیقاً همین را نشان می‌دهد:

همچنین GPT-5 دیگر فقط خلاصه نمی‌کند؛ خودش فرمول و قضیهٔ جدید می‌سازد
مدل توانایی استنتاج ریاضی و تولید روابط پیچیده را به‌صورت مستقل پیدا کرده است.

🌀 در فیزیک، روی تقارن‌های سیاه‌چاله‌ها کار می‌کند—و درست هم کار می‌کند
تحلیل ساختارهای SL(2,R) در فضا-زمان خمیده، چیزی فراتر از اتوکامپلیت است.
این یعنی فهم انتزاع، نه حفظ متن.

📚 منابع علمی فراموش‌شده را در چند دقیقه پیدا می‌کند
مقاله‌هایی که پژوهشگر انسانی شاید هرگز نبیند، توسط مدل از عمق آرشیوها بیرون کشیده می‌شود.

🧬 در زیست‌شناسی هم سازوکارهای جدید پیشنهاد می‌دهد
و حیرت‌انگیزتر اینکه برخی از این پیشنهادها با نتایج آزمایش‌هایی که هنوز منتشر نشده‌اند هم‌خوانی دارد.

🧪 پیشنهاد آزمایش در سطح یک هم‌نویسنده
دیگر نقش مدل فقط “کمک‌کننده” نیست؛ به بخشی از فرایند علمی تبدیل شده است.

📌 این یعنی چه؟

• هزینهٔ کشف علمی نزدیک به صفر می‌شود
• گلوگاه‌های تخصصی کلاسیک از بین می‌روند
• تیم‌های «انسان + هوش مصنوعی» از کل یک شاخه علمی سریع‌تر خواهند بود
• چرخهٔ کامل پژوهش—from idea to result—فشرده و خودکار می‌شود

اگر می‌پرسید شروع تکینگی فناورانه چه شکلی است…
احتمالاً بسیار شبیه همین چیزی است که اکنون می‌بینیم.

🔗 جزئیات کامل:
https://openai.com/index/accelerating-science-gpt-5/

@rss_ai_ir
#openai #chatgpt #هوش_مصنوعی #پژوهش #علم #GPT5
🔥2👍1👏1
🌉🤖 ابزار CodexMCP؛ پل هوشمند بین Claude Code و Codex برای کدنویسی تعاملی

ابزار CodexMCP مثل یک «لایه هماهنگ‌کننده» بین Claude Code و Codex عمل می‌کند و کمک می‌کند چند ایجنت هوش مصنوعی هم‌زمان روی یک پروژه کدنویسی کار کنند و خروجی منسجم‌تری بدهند.

🔹 پشتیبانی از دیالوگ‌های چندمرحله‌ای و انجام هم‌زمان چند تسک برنامه‌نویسی
🔹 مدیریت حرفه‌ای کانتکست و حفظ سشن‌ها برای کارهای طولانی و تکرارشونده
🔹 استفاده از Claude Code برای تحلیل نیازمندی، معماری و طراحی قبل از نوشتن کد
🔹 امکان ردیابی لاگ، جزییات خروجی و هندل‌کردن خطاها در فرآیند اجرای تسک‌ها

لینک GitHub:
https://github.com/GuDaStudio/codexmcp

@rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #کدنویسی_خودکار #MCP #Claude #Codex #python
👍1🔥1🥰1
🍕 Upsample Anything —
آپ‌سمپل‌کننده یونیورسال بدون نیاز به آموزش 🍕

مدل Upsample Anything یک روش جدید و بدون نیاز به آموزش برای بزرگ‌کردن هر نوع تصویر، ویدیو یا داده تصویری است.
این روش با یک بهینه‌سازی بسیار سبک در زمان اجرا کار می‌کند و نیاز به مدل‌های سنگین یا دیتاست‌های بزرگ ندارد.

🔍 برای کسانی که با سوپررزولوشن کار می‌کنند، این مقاله ارزش دیدن دارد.


📑 Paper:
https://lnkd.in/dsUfdtih

@rss_ai_ir
#Upsample #ImageAI #SuperResolution #ComputerVision #AI
1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬

در اکوسیستم گوگل، این کار حالا فوق‌العاده ساده شده است. Google Vids به‌همراه Gemini می‌تواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم به‌طور خودکار.

در این فرآیند چه اتفاقی می‌افتد؟
اسکریپت نوشته می‌شود
صداگذاری انجام می‌شود
موسیقی اضافه می‌شود
ویدئو بر اساس سبک انتخابی شما ساخته می‌شود

کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام می‌دهد. این یعنی تبدیل ارائه‌های خشک به محتوای ویدئویی حرفه‌ای — بدون دردسر تدوین.

🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1