VIRSUN
13.5K subscribers
1.16K photos
693 videos
5 files
768 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🍌 به‌روزرسانی‌های تازه از نانوبانانا جدید!
به نظر می‌رسد نسل بعدی مدل تصویری گوگل با نام احتمالی Nano Banana Pro عرضه شود — بدون شماره نسخه.

🔎 چرا بدون شماره؟
چون این نسخه قرار است یک مدل بزرگِ استدلال‌گرا باشد؛ چیزی فراتر از یک مدل صرفاً مولد تصویر. مهم‌ترین ویژگی‌های افشاشده:

🧠 دارای منتقد داخلی (Internal Critic)
مدل هنگام تولید تصویر، آن را بازبینی، اصلاح و با هدف پرامپت تطبیق می‌دهد.

🎨 درک بهتر مفهوم و هدف تصویر
نانوبانانای جدید می‌تواند تشخیص دهد آیا تصویر واقعاً ایده پرامپت را منتقل کرده یا نیاز به اصلاح دارد.

💲 قیمت بالاتر در API
گفته می‌شود هزینه استفاده از آن بیشتر خواهد بود. هنوز مشخص نیست محدودیت‌های استفاده در Gemini App و AI Studio چگونه تنظیم می‌شوند.

🚀 تغییر برندینگ در سری Gemini 3
به همراه Banana Pro، خانواده Gemini نیز با نام‌گذاری‌هایی مثل Thinking و حالت‌های دیگر عرضه می‌شود.

زمان احتمالی انتشار:
📅 بین ۱۸ تا ۲۲ نوامبر

در این فاصله فقط باید صبور بمانیم… 😮‍💨
جامعه مولدان محتوا همین حالا هم بی‌طاقت شده!


---

#نانو_بانانا #گوگل_جمینی #هوش_مصنوعی #تولید_تصویر #AI #Gemini
@rss_ai_ir
7👍5😁5🎉5👏4🔥3🥰2
🎥 مدت زیادی بود درباره Qwen Image Edit با کنترل زاویه دوربین چیزی ننوشتیم، اما حالا وقتشه!

این‌بار یک خبر خوب: برای این لورا بالاخره دمواسپیس رسمی ساخته شده و می‌تونید راحت تستش کنید 👇
🔗 https://huggingface.co/spaces/linoyts/Qwen-Image-Edit-Angles

📌 کافی‌ست تصویر خود را وارد کنید، و خروجی را از یک زاویه دوربین جدید تحویل بگیرید — با حفظ کامل یکپارچگی و هویت تصویر.
یعنی چهره، متریال و جزئیات آب نمی‌رود!


---

🔥 اما جذاب‌تر اینکه در اینترنت نمونه‌هایی از لورای ۴ مرحله‌ای دیده می‌شود که تقریباً حالت کاملاً تعاملی ایجاد می‌کند.
ویدئوها نشان می‌دهند چطور تصویر را می‌توان از چندین زاویه متفاوت چرخاند.

🎬 برخی کاربران هم خروجی‌ها را به صورت first frame / last frame به مدل‌های ویدیو می‌دهند و نتیجه؟
ویدیوهای انتقال زاویه دوربین با ثبات بصری فوق‌العاده!


---

📦 لورا روی سرویس‌های مختلف در دسترسه از جمله Fal، ComfyUI و چند مدل دیگر:

🔗 https://huggingface.co/dx8152/Qwen-Edit-2509-Multiple-angles
🔗 https://huggingface.co/Phr00t/Qwen-Image-Edit-Rapid-AIO/tree/main


---

📍 اگر در حوزه تولید محتوای بصری، طراحی محصول، معماری، بازی‌سازی یا VFX فعالیت می‌کنی، این ابزار عملاً یک ماشین زمان برای دوربین به دستت می‌دهد.


---

#Qwen #QwenImageEdit #هوش_مصنوعی #ویرایش_تصویر #AI #ComfyUI #Fal
@rss_ai_ir
🎉17🔥14😁11🥰109👍9👏8
🧠 ۱۰ پرامپت قدرتمند ChatGPT برای اتوماسیون کارها

اگر کسب‌وکار، تولید محتوا، آموزش، مدیریت یا تحلیل داده انجام می‌دهید، این پرامپت‌ها می‌توانند بخشی از کارهای شما را خودکار کنند و زمان ارزشمندتان را آزاد کنند. ذخیره کنید! 🔖


---

📩 Email Writing
«یک ایمیل جذاب و غیرتکراری درباره {موضوع} بنویس؛ لحن انسانی و مکالمه‌ای داشته باشد، از داستان‌سرایی و مثال استفاده کن و برای مخاطب {صنعت/حوزه} کاملاً متقاعدکننده باشد.»

📊 Market Research
«یک تحقیق بازار درباره {صنعت/محصول} انجام بده؛ رقبا، رفتار مشتری، ترندها و فرصت‌های رشد را تحلیل کن و با داده، آمار کلیدی و توصیه‌های استراتژیک نتیجه بده.»

✍️ Content Creation
«برای {موضوع} محتوای جذاب و غیرکلیشه‌ای تولید کن؛ لحن انسانی، مثال‌ها و ایده‌های منحصربه‌فرد استفاده کن و برای مخاطب {صنعت/حوزه} تازه و ارزشمند باشد.»

📈 Data Analysis
«این دیتاست را تحلیل کن: {توضیح داده}. بینش‌های کلیدی و روندها را استخراج کن، نتایج را ساده و قابل‌فهم ارائه بده و تحلیل مقایسه‌ای و توصیه‌های کاربردی ارائه کن.»

🛍 Product Description Writing
«یک توضیح محصول جذاب برای {محصول} در سبک برند {نام برند} بنویس؛ ارزش، مزایا و ویژگی‌های احساسی و عملکردی را منتقل کن. متن کوتاه، گیرا و منطبق با لحن برند باشد.»

📚 Education & Learning
«مفهوم {موضوع} را به‌صورتی ساده برای {نوع مخاطب} توضیح بده؛ از تشبیه‌ها، مراحل گام‌به‌گام و مثال‌های کاربردی استفاده کن و مفاهیم پیچیده را قابل‌فهم کن.»

🎬 Script Writing
«یک اسکریپت پرانرژی برای ویدئوی {YouTube/Reels/TikTok} درباره {موضوع} بنویس؛ شروع ۵ ثانیه اول بسیار جذاب، روایت داستانی، و CTA قوی داشته باشد.»

👥 Management
«بهترین روش‌های مدیریت تیم {نوع تیم/حوزه} را ارائه بده؛ شامل راهکارهای رهبری، انگیزش، حل تعارض، افزایش بهره‌وری و توصیه‌های عملی برای محیط کار.»

💡 Idea Generation
«ایده‌های خلاقانه و خارج از چارچوب برای {موضوع} ارائه کن؛ راه‌حل‌های نوآورانه و قابل‌اجرا بده و از تکنیک‌هایی مثل SCAMPER، مایندمپ و تفکر جانبی استفاده کن.»

#ChatGPT #AI #اتوماسیون #پرامپت #کسب_و_کار #تولید_محتوا #بازاریابی
@rss_ai_ir
7🥰7👏7👍6🔥5😁4🎉4
This media is not supported in your browser
VIEW IN TELEGRAM
🔔 گوگل روی سیستم‌های چندعاملی کار می‌کند که می‌توانند مثل یک تورنمنت، ایده‌های پژوهشی را تولید و ارزیابی کنند.

هر اجرا حدود ۴۰ دقیقه طول می‌کشد و حدود ۱۰۰ ایده‌ی دقیق و قابل‌استفاده روی یک موضوع تحقیقاتی به شما می‌دهد!

دو عامل جدید در حال اضافه شدن به Gemini Enterprise هستند:

🤖 Idea Generation
دستور: Create a multi-agent innovation session
🎯 هدف: تولید بارش فکری چندعاملی برای رسیدن به ایده‌های کاربردی

🧪 Co-Scientist
دستور: Drive novel scientific discovery with Co-Scientist
🎯 هدف: کشف علمیِ نوآورانه، با کمک تیمی از عامل‌های هوشمند


---

🧬 فرآیند سه‌مرحله‌ای Co-Scientist

1️⃣ موضوع تحقیق، داده‌های مرتبط و معیارهای ارزیابی را مشخص می‌کنید.
2️⃣ تیمی از عامل‌های هوشمند، با استفاده از داده‌ها، ایده‌های پژوهشی جدید تولید می‌کنند.
3️⃣ عامل‌ها با ارزیابی و رتبه‌بندی تورنمنتی ایده‌ها، بهترین‌ آن‌ها را انتخاب می‌کنند.


---

🎯 گوگل فقط پژوهش را خودکار نمی‌کند؛
دارد محصولی می‌سازد که دیگران را هم به پژوهش‌گر تقویت‌شده با AI تبدیل کند.

https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

#GoogleAI #Gemini #MultiAgent #ResearchAI #Innovation #AIResearch
@rss_ai_ir
👍2🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🌩️ Time-to-Move —
فریم‌ورک جدید برای کنترل حرکت در ویدئوهای مولد 🌩️⚡️

پژوهش مشترک Technion + Nvidia معرفی کرد:
🌀 فریم ورکTime-to-Move (TTM) — یک فریم‌ورک بدون نیاز به آموزش و کاملاً Plug-and-Play برای کنترل حرکت و ظاهر در مدل‌های تولید ویدئو I2V مثل:

Wan 2.2
CogVideoX
Stable Video Diffusion


فریم ورکTTM اجازه می‌دهد حرکت، ریتم، مسیر، و ظاهر سوژه در ویدئو به‌طور دقیق کنترل شود — آن هم بدون اینکه مدل دوباره آموزش ببیند. نتایج واقعاً چشمگیرند.
🔗 Paper: https://lnkd.in/dxD3uHYb
🔗 Project: https://lnkd.in/dcE5juyM
🔗 Repo: https://lnkd.in/dMMUjybJ

---

#VideoAI #DiffusionModels #TTM #Nvidia #Technion #AIGeneration
@rss_ai_ir
🥰1👏1
🍨کتابخانه Gelato — کتابخانه‌ای تازه برای مدیریت و بهینه‌سازی گراف‌های محاسباتی در ML

پروژه‌ی Gelato از mlfoundations یک کتابخانه‌ی مینیمال و بسیار کاربردی است که کمک می‌کند:

✳️گراف محاسباتی هر مدل ML را شفاف ببینیم

✳️وابستگی‌ها و مسیرها را تحلیل کنیم

✳️گراف را به‌صورت مستقیم اصلاح یا بهینه‌سازی کنیم

✳️معماری‌های جدید را آزمایش کنیم و گلوگاه‌های محاسباتی را پیدا کنیم


اگر با مدل‌های پیچیده، معماری‌های سفارشی، یا تحقیق روی طراحی شبکه‌ها کار می‌کنید، Gelato ابزار فوق‌العاده‌ای برای مهندسی و تحلیل ساختار مدل است.

🔗 Blog:
https://github.com/mlfoundations/Gelato
🔗 🍨 Gelato-30B-A3B (Model):
https://huggingface.co/mlfoundations/Gelato-30B-A3B
🔗 🖱️ Click-100k (Data):
https://huggingface.co/datasets/mlfoundations/Click-100k


---

#MachineLearning #Gelato #MLGraphs #AIGeneration
@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ساخت ویدیو با LongCat-Video؛ غول ۱۳.۶ میلیارد پارامتری تولید ویدیو

مدل LongCat-Video یکی از قدرتمندترین سیستم‌های تولید ویدیو است که می‌تواند متن را به ویدیو، تصویر را به ویدیو و حتی ادامهٔ ویدیو تولید کند — آن هم با کیفیت بالا و بدون افت در ویدیوهای طولانی.

🚀 ویژگی‌های کلیدی:

✳️معماری یکپارچه برای تمام وظایف تولید ویدیو

✳️توانایی ساخت ویدیوهایی با مدت چند دقیقه

✳️تولید کارآمد با رزولوشن بالا

✳️کیفیت رقابتی در سطح مدل‌های تجاری مطرح


📌 گیت‌هاب:
https://github.com/meituan-longcat/LongCat-Video


---

#LongCatVideo #AIvideo #VideoGeneration #DeepLearning
@rss_ai_ir
1👏1
🛠️ گوگل از Google Antigravity رونمایی کرد؛ IDE جدید با معماری کاملاً Agentic

✳️گوگل به‌تازگی Google Antigravity را معرفی کرده؛ یک محیط توسعه‌ٔ نرم‌افزار که از پایه برای کار با ایجنت‌های هوشمند طراحی شده است.

✳️این IDE نسل جدید، توسعهٔ نرم‌افزار را از حالت سنتی خارج می‌کند و بخش زیادی از تحلیل، برنامه‌ریزی، تولید کد و دیباگ را به ایجنت‌های داخلی می‌سپارد.

نکتهٔ مهم:
این اعلامیه نشان می‌دهد که دورهٔ IDEهای معمولی رو به پایان است و دنیای توسعه در حال حرکت به سمت Agentic-first است.


---

#Google #Antigravity #AItools #AgenticIDE
@rss_ai_ir
👍21🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 شرکت Clone دست انسان‌نما را با عضلات مصنوعی معرفی کرد

نسخهٔ جدید این دست رباتیک حالا ۲۷ درجهٔ آزادی دارد و از نظر قدرت، سرعت و نرمی حرکت بسیار نزدیک به دست واقعی انسان شده است.

قلب این دست، عضلات مصنوعی بسیار بادوام است که توان تحمل فشارهایی را دارد که اغلب نمونه‌های آزمایشگاهی از پس آن برنمی‌آیند.

حرکت‌ها نیز نسبت به قبل دقیق‌تر، روان‌تر و هماهنگ‌تر شده‌اند — یک قدم بزرگ برای رباتیک انسان‌نما 👍


---

#رباتیک #Humanoid #ArtificialMuscles
@rss_ai_ir
👌21👏1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

Multi-Shot Video Segmentation —
گامی تازه در بخش‌بندی ویدیو

پژوهشگران فودان روی یک وظیفه کمتر بررسی‌شده تمرکز کرده‌اند: بخش‌بندی اشیاء در ویدیوهای چندشات (MVOS)؛ یعنی مدل بتواند یک شیء را در شات‌های مختلف، با زوایا و نور متفاوت، پیوسته و دقیق دنبال کند.

این کار به‌عنوان گسترش SAM ارائه شده و همراه با بنچمارک و ریپوی کامل، تحت لایسنس Apache 2.0 منتشر شده است.

🔗 Paper
https://arxiv.org/pdf/2511.13715

🔗 Project
https://henghuiding.com/SAAS/

🔗 Repo
https://github.com/FudanCVL/SAAS

#VideoSegmentation #SAM #MVOS
@rss_ai_ir
2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🤖 در نمایشگاه AIJ از ربات انسان‌نمای جدیدِ Sber رونمایی شد! 🇷🇺

اسبر طراحی، مکانیک، نرم‌افزار و کل معماری ربات را خودش توسعه داده — البته موتور و برخی قطعات الکترونیکی آماده بوده‌اند.

نتیجه؟
حرکت‌ها فوق‌العاده نرم، طراحی حرفه‌ای، و قدمی بزرگ برای رباتیک روسیه 👏🦾


جالب‌تر اینکه امسال در روسیه دو شرکت جدید وارد حوزه ربات‌های انسان‌نما شدند — و چند استارتاپ کوچک دیگر هم روی ربات‌های دوپا کار می‌کنند. سرعت پیشرفت فوق‌العاده شده 🔥🚀



#رباتیک #Sber #AI #HumanoidRobots #روبات #فناوری
@rss_ai_ir
👌21👏1🐳1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🔥 گوگل کولب بالاخره با VSCode یکپارچه شد!

از این به بعد می‌تونی نوت‌بوک‌های محلی VSCode رو مستقیم به Colab وصل کنی و داخل IDE خودت از GPU / TPU کولب استفاده کنی — بدون هیچ دردسری! 💥🧠

این یعنی:
سرعت بیشتر
محیط کدنویسی حرفه‌ای‌تر
اتصال بی‌واسطه VSCode → Colab Runtime

روش فعال‌سازی:
1️⃣ توی VSCode وارد Extensions شو و افزونه Google Colab رو نصب کن.
2️⃣ یک فایل ‎.ipynb‎ بساز یا وارد کن.
3️⃣ از گوشه بالا راست روی Select Kernel کلیک کن → گزینه Colab رو بزن → یک Runtime انتخاب کن.
4️⃣ وارد حساب گوگلت شو و تمام!

حالا به‌صورت مستقیم از VSCode داری روی Colab کار می‌کنی 😍
Happy coding 🐝

https://developers.googleblog.com/en/google-colab-is-coming-to-vs-code/


#هوش_مصنوعی #GoogleColab #VSCode #برنامه‌نویسی #DeepLearning
@rss_ai_ir
5🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🔥مدل SAM 3 / SAM 3D رسماً منتشر شد! 🔥
متا خانواده‌ی SAM 3 را معرفی کرد — یک مدل یکپارچه برای Detection، Segmentation و Tracking اشیاء در تصاویر و ویدیو با استفاده از:
🟦 متن
🟦 نمونه (Exemplar)
🟦 پرامپت‌های بصری

این نسخه ادامه‌ی مسیر Segment Anything است، اما این‌بار سه‌بعدی، دقیق‌تر، سریع‌تر و چندمنظوره‌تر.
📌 مدل‌ها و ریپو تحت مجوز اختصاصی SAM منتشر شده‌اند.


---

چرا SAM 3 مهم است؟

✳️یک مدل واحد برای تمام وظایف سگمنتیشن
✳️پشتیبانی از ویدیو + دنبال‌کردن اشیا

✳️ورودی‌های چندنوعی (text / exemplar / visual prompt)
✳️نسخه‌ی 3D برای کاربردهای حرفه‌ای‌تر—رباتیک، AR/VR، مهندسی، پزشکی



---

🔗 لینک‌های مهم

📄 Paper: https://t.ly/5tq9N
🌐 Project: https://ai.meta.com/sam3/
🎛 Demo: https://segment-anything.com
💻 Repo: https://github.com/facebookresearch/sam3


---

مدل SAM دوباره استانداردهای سگمنتیشن و درک صحنه را جابه‌جا کرد.
منتظر کاربردهای انفجاری در رباتیک، ویدیو، مدیا و دیجیتال توین باشید!

#SAM3 #Segmentation #ComputerVision #MetaAI
@rss_ai_ir
🚀 مجموعه ASystem سورس Awex را منتشر کرد — سریع‌ترین فریم‌ورک برای همگام‌سازی وزن‌ها در RL!

✳️همچنین Awex یکی از اساسی‌ترین مشکلات زیرساخت‌های یادگیری تقویتی (RL) را حل می‌کند:
همگام‌سازی مدل‌هایی با اندازه تا ۱ تریلیون پارامتر روی هزاران GPU در کمتر از ۶ ثانیه.

این دقیقاً همان گلوگاهی بود که مقیاس‌پذیری سیستم‌های RL را محدود می‌کرد — و حالا با Awex، چرخه‌های آموزش چندین برابر سریع‌تر می‌شوند.

مجموعه ASystem اعلام کرده که طی ۵ تا ۶ هفته آینده مجموعه‌ای از مطالب تخصصی منتشر خواهد کرد:

♻️تحلیل معماری Awex
♻️بهترین روش‌ها برای ساخت سیستم‌های گسترده RL
♻️بهینه‌سازی‌ها و راهکارهای مهندسی
♻️تجربیات عملی در مقیاس فوق‌بزرگ


به جامعه ASystem خوش آمدید! 🌐

📦 GitHub:
https://github.com/inclusionAI/asystem-awex

🤗 Hugging Face:
https://huggingface.co/inclusionAI
🤖 ModelScope:
https://modelscope.cn/models/inclusionAI


@rss_ai_ir
2🔥1
🍌 نسخه Nano Banana Pro در Gemini فعال شد!

نسخه‌ی Nano Banana Pro (همان Nano Banana 2) حالا رسماً در Gemini در دسترس است:
🔗 https://gemini.google.com/app

و خبر جذاب؟
مدلی که هیچ‌کدام از رقبای قبلی از پسش برنیامده بودند، حالا این کار را انجام می‌دهد:

📌 Plot sin(x) from 0 to 2*pi. Generate the resulting graph image. make picture christmas style

🎄📈مدل Nano Banana Pro این کار را بدون دردسر انجام داد!

فعلاً بروید تست کنید، من هم در حال جمع کردن جزئیات بیشتر درباره رزولوشن و پارامترهای جدیدش هستم.

@rss_ai_ir
👍3🔥3👏1
🧠⚙️خبر: PINA وارد اکوسیستم رسمی PyTorch شد!

یک خبر مهم برای جامعه Scientific Machine Learning 🌡️📐

کتابخانه‌ی PINA حالا بخشی از PyTorch Ecosystem است و یک فریم‌ورک یکپارچه برای تمام مراحل SciML ارائه می‌دهد — از مدل‌سازی سیستم‌های فیزیکی تا حل PDEها و ساخت مدل‌های ML برای شبیه‌سازی دینامیک.

ویژگی‌ها:

✳️ساخته‌شده بر پایه PyTorch و PyTorch Lightning

✳️سازگار با PyTorch Geometric

✳️ساختار ماژولار: تعریف مسئله، طراحی مدل، انتخاب حل‌کننده و فرایند آموزش

✳️مناسب برای تحقیقات عمیق و پروژه‌های مهندسی قابل تکثیر


✳️این حرکت PyTorch می‌تواند توسعه SciML را بسیار سریع‌تر، استانداردتر و در دسترس‌تر کند.

🔗 لینک پروژه:
https://pytorch.org/blog/pina-joins-the-pytorch-ecosystem-a-unified-framework-for-scientific-machine-learning/

@rss_ai_ir
#SciML #PyTorch #AI 🚀
🔥1