VIRSUN
6.11K subscribers
1.05K photos
612 videos
5 files
677 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🧠 فرمت ONNX — زبان مشترک مدل‌های هوش مصنوعی

در دنیای یادگیری عمیق، هر فریم‌ورک (مثل PyTorch، TensorFlow یا Scikit-learn) مدل‌ها را به فرمت مخصوص خودش ذخیره می‌کند.
اما اگر بخواهیم مدلی را در پایتورچ آموزش دهیم و بعد در محیط دیگری مثل OpenCV، C++، یا موبایل اجرا کنیم چه؟ 🤔

🔹 پاسخ: ONNX (Open Neural Network Exchange)

فرمت ONNX یک فرمت استاندارد و متن‌باز است که برای انتقال و اجرای مدل‌های هوش مصنوعی در پلتفرم‌های مختلف طراحی شده است.

💡 به زبان ساده:
فرمت ONNX مثل فایل PDF برای مدل‌های هوش مصنوعی است —
فرقی نمی‌کند در چه فریم‌ورکی ساخته شده، در هر جایی باز و اجرا می‌شود.

⚙️ مزایا:

♻️انتقال آسان مدل‌ها بین فریم‌ورک‌ها (PyTorch → TensorFlow → OpenCV) 🔄

♻️اجرا روی دستگاه‌های مختلف (CPU، GPU، موبایل، Edge) ⚙️

♻️پشتیبانی از بهینه‌سازها مثل ONNX Runtime برای سرعت بیشتر 🚀

♻️پشتیبانی رسمی توسط شرکت‌هایی مثل Microsoft, NVIDIA, Meta و Intel 💼


📦 مثال:
در پایتورچ، می‌توان مدل را با یک خط کد به ONNX صادر کرد:
torch.onnx.export(model, inputs, "model.onnx")

و سپس با ONNX Runtime در هر محیطی اجرا کرد:
import onnxruntime as ort  
session = ort.InferenceSession("model.onnx")
outputs = session.run(None, {"input": data})

🌍 کاربردهای رایج:

♻️به‌کارگیری مدل‌ها در سیستم‌های صنعتی
♻️اجرای مدل‌ها روی وب یا موبایل
♻️ترکیب مدل‌های ساخته‌شده در فریم‌ورک‌های مختلف


📌 فرمتONNX پلی است میان آموزش و استقرار —
به کمک آن، مدل شما می‌تواند از آزمایشگاه تا دنیای واقعی سفر کند 🌐

@rss_ai_ir
#هوش_مصنوعی #ONNX #DeepLearning #AI #PyTorch #TensorFlow #MachineLearning #EdgeAI
4🔥2👌2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌊 پروتکل جدید ردیابی دینامیکی — ITTO از Caltech 🐠

محققان دانشگاه Caltech مجموعه‌بنچ‌مارک جدیدی به نام ITTO معرفی کرده‌اند —
سیستمی برای ارزیابی و تحلیل روش‌های ردیابی در حرکات پیچیده و بلندمدت 🔍

💡 ویژگی‌ها:

♻️طراحی‌شده برای حرکات طولانی، پیچیده و غیرخطی

♻️تمرکز بر ارزیابی پایداری در فریم‌های زیاد

♻️مناسب برای آموزش و تست الگوریتم‌های بینایی ماشین در سناریوهای واقعی


📘 مجوز: CC BY-NC 4.0 — استفاده‌ی آزاد برای اهداف پژوهشی

🔗 لینک‌ها:
📄 مقاله
🌐 پروژه
💾 کد منبع

@rss_ai_ir
#AI #Tracking #ComputerVision #Caltech #Research #OpenSource
1
🚀 NVIDIA
دوباره صحنه رو آتیش زد!

روش جدیدشون به نام GenCluster باعث شد برای اولین بار یک مدل متن‌باز بتونه به سطح مدل‌های بسته‌ی شرکت‌های بزرگ برسه 💥

🧠 مدل gpt-oss-120b موفق شد در المپیاد بین‌المللی انفورماتیک (IOI 2025) مدال طلا بگیره —
اولین باریه در تاریخ که این افتخار نصیب یک مدل open-source شده! 🥇

📊 چطور کار می‌کنه؟
مدل هزاران راه‌حل برنامه‌نویسی تولید می‌کنه،
اون‌ها رو تست و گروه‌بندی می‌کنه،
و بین بهترین‌ها یک «تورنمنت هوش مصنوعی» برگزار می‌کنه،
که داوری‌اش هم با یک مدل هوش مصنوعی دیگه‌ست 😎

📈 نتیجه:
۴۴۶.۷۵ امتیاز و مدال طلای رسمی IOI
یک جهش بزرگ در سمت استدلال و حل مسئله‌ی سطح انسانی توسط مدل‌های باز

📄 جزئیات مقاله:

🔗 arxiv.org/abs/2510.14232v1

#NVIDIA #GenCluster #AI #OpenSource #LLM #Research #MachineLearning #IOI2025
1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 در چین از ربات انسان‌نمای جدیدی به نام Bumi رونمایی شد

این ربات تنها(حدود ۱۵۰ میلیون تومان) قیمت دارد — عددی که می‌تواند انقلابی در صنعت رباتیک ایجاد کند! ⚙️

ویژگی‌ها:

♻️راه رفتن، رقصیدن و واکنش به فرمان‌های صوتی

♻️قابلیت ارتقا برای انجام کارهای بیشتر مانند نظافت یا جست‌وجوی اشیا

♻️طراحی جمع‌وجور و مقرون‌به‌صرفه برای استفاده در خانه‌ها و مدارس


♻️با چنین قیمتی، چین می‌تواند ورود ربات‌های انسان‌نما به زندگی روزمره را چند سال جلو بیندازد.

@rss_ai_ir
#ربات #هوش_مصنوعی #Bumi #چین #رباتیک #AI
3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🌐 ChatGPT Atlas —
مرورگر هوشمند OpenAI با قابلیت‌های تمام‌عیار هوش مصنوعی

شرکت OpenAI بالاخره مرورگر خودش رو معرفی کرد: ChatGPT Atlas.
برخلاف انتظارها، خبری از انقلاب جدید نیست — در واقع نسخه‌ای از Chromium هست که با امکانات کامل هوش مصنوعی ادغام شده ⚙️

💡 ویژگی‌های کلیدی:

چت مستقیم با تب‌ها: حالا می‌تونی با هر صفحه‌ای که باز کردی، گفتگو کنی و ازش اطلاعات بگیری.

دستیار هوشمند برای نوشتن متن در هر فیلد (مثل فرم‌ها یا ایمیل‌ها).

حالت Agent Mode نه‌تنها در فضای ابری، بلکه به‌صورت محلی در تب‌ها اجرا می‌شه و به تمام داده‌های کاربر دسترسی داره — البته هنوز سواله که چقدر از باتری مصرف می‌کنه! 🔋

جست‌وجو در تاریخچه مرورگر به کمک توصیف متنی صفحات — اولین بار که ویژگی «حافظه» ChatGPT واقعا مفید به نظر می‌رسه! 🧠


🔒 نکته مهم:
به‌صورت پیش‌فرض، داده‌های مرورگر برای آموزش مدل استفاده نمی‌شن، ولی کاربر می‌تونه خودش فعالش کنه (opt-in).

📱 مرورگر فعلا برای کاربران مک در دسترسه،
اما Agent Mode فقط برای مشترکین پولی فعال می‌شه. نسخه‌های ویندوز و موبایل هم به‌زودی منتشر می‌شن.

🔗 chatgpt.com/atlas

@rss_ai_ir
#ChatGPT #Atlas #OpenAI #مرورگر #هوش_مصنوعی #AgentMode #AI
2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
😄 فری‌پیک حالا خودش رو به کامفی‌یوآی رسونده!

بعد از اینکه ComfyUI با رابط نودی‌اش همه رو شگفت‌زده کرد، حالا Freepik هم همون مسیر رو در پیش گرفته.
در ویدیوی پیش‌نمایش جدیدشون، می‌شه دید که کاربران می‌تونن با نودها صحنه بسازن، عناصر رو ترکیب کنن و در نهایت ویدیو تولید کنن 🎥

جالبه بدونی که اولین‌ها در این حوزه بعد از Comfy، تیم glif.app بودن —
اون‌ها هم رابط نودی خیلی قوی دارن، ولی چون زودتر از بازار اومدن، هنوز اون‌جوری که باید، رشد نکردن.

اما وقتی بازیگران بزرگی مثل Freepik وارد می‌شن و چنین سیستم‌هایی رو برای میلیون‌ها کاربر عادی ارائه می‌دن،
موضوع دیگه صرفاً «ابزار حرفه‌ای» نیست — تبدیل می‌شه به استاندارد جدید در خلاقیت مولد.

📦 ضمناً فری‌پیک همزمان مدل Magnific Precision v2 رو معرفی کرده با سه حالت جدید:

Sublime

📸 Photo

🧹 Photo Denoiser


اگر عضو پریمیوم هستی — برو تستش کن، می‌گن خروجی‌ها واقعاً خیره‌کننده‌ان.

@rss_ai_ir
#هوش_مصنوعی #ComfyUI #Freepik #Magnific #AI #ویدیو #مولد
🧠 مدل ChatGPT دیگر داده‌های حذف‌شده یا گفتگوهای موقت را نگه نمی‌دارد

شرکت OpenAI اعلام کرد که از این پس هیچ داده‌ای از گفت‌وگوهای حذف‌شده یا چت‌های موقت را ذخیره نخواهد کرد،
و دیگر تحت هیچ دستور قانونی برای نگه‌داری داده‌ها نیست. ⚖️

🔹 گفت‌وگوهای حذف‌شده و چت‌های موقت حداکثر تا ۳۰ روز پس از حذف، به‌طور کامل از سیستم‌ها پاک می‌شوند.
🔹 داده‌های مربوط به API نیز به‌صورت خودکار پس از ۳۰ روز حذف خواهند شد.

این تغییر بزرگ به معنی افزایش حریم خصوصی کاربران و شفافیت بیشتر در نحوه‌ی مدیریت داده‌ها توسط OpenAI است.

@rss_ai_ir
#ChatGPT #OpenAI #Privacy #AI #DataSecurity #هوش_مصنوعی
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 خبر بزرگ از CNBC: احتمال عرضه GPT-6 تا پایان سال جاری!

⛔️یکی از خبرنگاران CNBC اعلام کرده که طبق گفته‌های Brad Gerstner — سرمایه‌گذار رسمی OpenAI و فردی نزدیک به مدیران ارشد این شرکت — مدل GPT-6 تا قبل از پایان امسال منتشر خواهد شد.

همچنین Brad Gerstner از افراد «کاملاً در جریان» محسوب می‌شود و ارتباط مستقیم با رهبری OpenAI دارد.
بنابراین وقتی در CNBC گفته می‌شود: «Brad گفت GPT-6 امسال می‌آید»،
می‌توان آن را جدی‌ترین نشانه‌ی نزدیک بودن عرضه نسل بعدی ChatGPT دانست.

🔥 اگر این خبر تأیید شود، ما تا کمتر از سه ماه دیگر شاهد ورود یکی از مهم‌ترین مدل‌های تاریخ هوش مصنوعی خواهیم بود.

@rss_ai_ir
#GPT6 #OpenAI #ChatGPT #هوش_مصنوعی #AI #CNBC #TechNews
🔥2👏21
This media is not supported in your browser
VIEW IN TELEGRAM
📘 NotebookLM
بروزرسانی شد!

در بخش 🎬 ویدیو ریویوها حالا ۶ سبک جدید اضافه شده که همگی بر پایه‌ی مدل Nano Banana ساخته شدن — ویدیوها حالا طبیعی‌تر و سینمایی‌تر از قبل به‌نظر می‌رسن.

✳️همچنین فرمت جدیدی به‌نام Brief معرفی شده که مخصوص خلاصه‌سازی هوشمند پرزنتیشن‌ها و ویدیوها است — ایده‌آل برای مرور سریع پروژه‌ها و جلسات.

📆 کاربران نسخه‌ی Pro این هفته بروزرسانی رو دریافت می‌کنن، و طی چند هفته‌ی آینده برای همه‌ی کاربران عرضه می‌شه.

@rss_ai_ir
#Google #NotebookLM #هوش_مصنوعی #AI #NanoBanana #Productivity
4👍1👏1
روندهای جهانی در تولید برق

تولید برق در سراسر جهان همچنان در حال رشد است، اما ساختار منابع انرژی به‌طور محسوسی در حال تغییر است — سهم زغال‌سنگ و گاز به‌تدریج کاهش می‌یابد، در حالی‌که انرژی‌های تجدیدپذیر (باد، خورشید و نیروگاه‌های آبی) با سرعتی پایدار جای خود را در تراز انرژی باز می‌کنند.

📊 سرانه تولید (Per-Capita Generation)

♻️آمریکای شمالی و اروپا سطح تولید نسبتاً ثابتی دارند،
♻️آسیا رشد چشمگیری نشان می‌دهد، به‌ویژه چین و هند،
♻️آفریقا و آمریکای جنوبی هنوز پایین‌تر از میانگین جهانی هستند، اگرچه تقاضا در حال افزایش است.


📈 بر اساس گزارش‌های:
Ember (۲۰۲۵) و Energy Institute – Statistical Review of World Energy (۲۰۲۴)

💬 طبق برآورد ICF، برای تأمین تقاضای رو‌به‌افزایش، ایالات متحده باید سالانه حدود ۸۰ گیگاوات ظرفیت جدید ایجاد کند.
اما در واقعیت کمتر از ۶۵ گیگاوات ساخته می‌شود — یعنی کمبودی معادل مصرف برق دو شهر منهتن در ساعات اوج تابستان.
منبع: The Wall Street Journal

این «شکاف انرژی» نتیجه‌ی رشد سریع مصرف برق در حوزه‌های هوش مصنوعی، مراکز داده، سرویس‌های ابری، استخراج رمزارز و برق‌رسانی صنعتی است — روندهایی که معماری سیستم‌های انرژی دهه آینده را شکل خواهند داد.

🔗 منبع:
Reddit — Global Electricity Generation Trends

@rss_ai_ir
#انرژی #AI #هوش_مصنوعی #DataCenters #پایداری #زیرساخت #برق
1
This media is not supported in your browser
VIEW IN TELEGRAM
🌏 Hunyuan World 1.1 (WorldMirror) —
نسخه‌ی جدید مدل متن‌باز تولید جهان سه‌بعدی از Tencent Hunyuan

در حالی‌که نسخه‌ی قبلی Hunyuan World 1.0 برای ساخت جهان‌های سه‌بعدی از متن یا تصاویر تک‌زاویه‌ای طراحی شده بود و روی GPUهای معمولی اجرا می‌شد، نسخه‌ی جدید 1.1 حالا از ویدیوها و تصاویر چندزاویه‌ای پشتیبانی می‌کند.

🎯 ویژگی‌های کلیدی:

ورودی آزاد (Any Input): از ویدیو، تصویر، نقشه عمق و پارامترهای دوربین پشتیبانی می‌کند و ساختار سه‌بعدی دقیق و بدون اعوجاج می‌سازد.

خروجی آزاد (Any Output): تولید هم‌زمان چندین نمای سه‌بعدی — از جمله نقشه عمق، ابر نقاط (Point Cloud)، نرمال سطوح و Gaussian Splatting.

سرعت بالا: مدل از نوع Feed-Forward است و تمام ویژگی‌های سه‌بعدی را تنها در چند ثانیه و در یک GPU تولید می‌کند.


⚙️ این مدل به‌نوعی ادامه‌ی مسیر تکاملی مدل‌های تولید ویدیو است — با این تفاوت که حالا می‌تواند جهان‌های کامل را بازسازی کند.
در حالی‌که گوگل با مدل GENIE-3 پاسخ داده، OpenAI هنوز هیچ معادل مستقیمی برای این فناوری ندارد.

💻 منابع:
🔹 کد: github.com/Tencent-Hunyuan/HunyuanWorld-Mirror
🔹 پروژه: 3d-models.hunyuan.tencent.com/world/
🔹 دمو: Hugging Face Space
🔹 مقاله: Tech Report PDF

@rss_ai_ir
#AI #3D #GenerativeAI #Hunyuan #Tencent #OpenSource #هوش_مصنوعی #سه‌بعدی #مدل_تولیدی
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
😮 نشت جدید از Google –
نسخه‌ای از GENIE 3!

در ویدئوی تازه‌ای که منتشر شده، نسخه‌ای از GENIE 3 (مدل تولید جهان‌های سه‌بعدی گوگل) دیده می‌شود که به کاربران اجازه می‌دهد نه‌تنها محیط، بلکه کاراکترها را نیز بسازند! 🎮
به‌نظر می‌رسد این نسخه تعاملی‌تر از نمونه‌های قبلی است — چیزی بین بازی، شبیه‌سازی و مدل‌سازی زنده‌ی جهان‌های مولد.

📺 در پایین ویدیو چند نکته جالب نوشته شده بود:

♻️پس از ساخت جهان، کاربر ۶۰ ثانیه فرصت دارد تا در محیط قدم بزند.

♻️در بالا پیام خطایی دیده می‌شود: «نیاز به بازخورد از کاربر».

♻️هر سشن می‌تواند به‌صورت ویدیو ذخیره و به‌اشتراک گذاشته شود.


👀 هنوز مشخص نیست ویدیو واقعی است یا نه، اما شباهت زیادی به محیط آزمایشی Google DeepMind GENIE-3 دارد.
احتمالاً تا پایان سال باید منتظر خبر رسمی از گوگل باشیم…

@rss_ai_ir
#Google #Genie3 #AI #3D #WorldModel #هوش_مصنوعی #مدل_جهان #ژنراتیو
2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 دست رباتیک ضدآب با استاندارد IP68 از شرکت چینی Heyman Tech

این دست رباتیک جدید قادر است حتی در محیط‌های عمیق زیر دریا نیز کار کند.

⛔️شرکت Heyman Tech موفق شده طراحی مکانیکی و الکترونیکی آن را به‌گونه‌ای انجام دهد که در برابر آب و فشار مقاوم بماند، بدون نیاز به عایق‌کاری اضافی.

این دست می‌تواند برای ربات‌های صنعتی، عملیات زیرآبی، نجات اضطراری و پروژه‌های نظامی به‌کار گرفته شود — گامی بزرگ در جهت ساخت ربات‌های مقاوم برای محیط‌های سخت.

@rss_ai_ir
#رباتیک #هوش_مصنوعی #HeymanTech #ربات #فناوری #DeepSea #AI
🚀 Mistral AI Studio —
پلتفرم جدید برای تولید و اجرای هوش مصنوعی در مقیاس صنعتی

♻️شرکت Mistral AI از پلتفرم جدید خود با نام AI Studio رونمایی کرده که آن را به‌عنوان «پلتفرم برای تولید و استقرار هوش مصنوعی در محیط واقعی» معرفی می‌کند.

🧩 این پلتفرم بر سه ستون اصلی استوار است:

Observability —
مشاهده و تحلیل دقیق عملکرد مدل‌ها:
نمایش کامل ترافیک، فیلترگذاری، تحلیل خطاها و جمع‌آوری داده‌های استفاده برای پایش و بهبود مدل‌ها.

Agent Runtime —
اجرای ایزوله و پایدار ایجنت‌ها:
امکان اجرای ایجنت‌ها در محیط‌های ابری، ترکیبی (hybrid) یا on-prem با قابلیت تکرار، ردیابی و مانیتورینگ در زمان واقعی.

AI Registry —
ثبت و مدیریت متمرکز دارایی‌های هوش مصنوعی:
شامل مدل‌ها، دیتاست‌ها، ابزارها و ورک‌فلوها همراه با نسخه‌بندی، کنترل دسترسی و ثبت کامل تاریخچه.

🧠 هدف نهایی Mistral: ایجاد زیرساختی صنعتی برای ساخت، رصد و استقرار ایجنت‌ها و مدل‌های هوش مصنوعی در پروژه‌های واقعی.

🔗 مشاهده جزئیات رسمی

@rss_ai_ir
#MistralAI #AIStudio #هوش_مصنوعی #Agent #MLOps #Observability #AIRegistry #Automation
1
🦉 LightOnOCR-1B —
مدل جدید و فوق‌سریع OCR از LightOn

شرکت LightOn از مدل جدید LightOnOCR-1B رونمایی کرد — مدلی که از Qwen2-VL-72B-Instruct استخراج (distill) شده و روی دیتاستی شامل ۱۷.۶ میلیون صفحه / ۴۵.۵ میلیارد توکن آموزش دیده است.

🔥 ویژگی‌های کلیدی:

♻️۱ میلیارد پارامتر
♻️پردازش ۵.۷ صفحه در ثانیه روی یک GPU نوع H100 (≈ حدود ۴۹۳٬۰۰۰ صفحه در روز)
♻️پشتیبانی از جدول‌ها، فرم‌ها، معادلات و چیدمان‌های پیچیده
♻️۶.۵ برابر سریع‌تر از dots.ocr و ۱.۷ برابر سریع‌تر از DeepSeekOCR
♻️هزینه پردازش کمتر از $0.01 برای هر ۱۰۰۰ صفحه A4


📊 دقت (Olmo-Bench):

♻️دقیق‌تر از DeepSeekOCR
♻️هم‌تراز با dots.ocr (در حالی‌که ۳ برابر سبک‌تر است)
♻️+۱۶ امتیاز نسبت به Qwen3-VL-2B-Instruct


⚙️ ترکیب عالی از کیفیت، سرعت و هزینه پایین — مناسب برای پروژه‌های مقیاس‌بالا و سرویس‌های ابری OCR.

🟢 مدل ۱B:
LightOnOCR-1B-1025
🟢 مدل 0.9B (32k):
LightOnOCR-0.9B-32k-1025
🟢 بلاگ رسمی:
huggingface.co/blog/lightonai/lightonocr
🟢 دموی آنلاین:
LightOnOCR-1B Demo

@rss_ai_ir
#OCR #هوش_مصنوعی #پردازش_تصویر #LightOn #Qwen #AI #ML #ComputerVision
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 Google Earth
با قابلیت استدلال فضایی (Geospatial Reasoning) هوشمندتر شد!

گوگل از فریم‌ورک جدیدی با نام Geospatial Reasoning رونمایی کرده که بر پایه مدل Gemini کار می‌کند و می‌تواند مدل‌های پیش‌بینی و داده‌های جغرافیایی مختلف را در یک سیستم تحلیلی یکپارچه کند.

💡 نتیجه؟ یک «مغز استدلالی» برای زمین که می‌تواند به پرسش‌هایی مانند:

> «کجا احتمال زلزله بیشتر است و چگونه باید از مردم محافظت کرد؟»
پاسخ دهد.



♻️مدل ابتدا داده‌های لرزه‌نگاری را بررسی می‌کند تا مکان و زمان احتمالی زلزله را پیش‌بینی کند، سپس آن را با اطلاعات تراکم جمعیت، مقاومت ساختمان‌ها، دسترسی به جاده‌ها، بیمارستان‌ها و پناهگاه‌ها ترکیب کرده و بهترین طرح تخلیه و امداد را پیشنهاد می‌دهد.

🌐 این سیستم اکنون در پروژه‌های واقعی نیز استفاده می‌شود:

♻️در WHO AFRO (آفریقا) برای پیش‌بینی خطر شیوع بیماری‌هایی مثل وبا و برنامه‌ریزی واکسیناسیون و کمک‌های پزشکی.

♻️برای شرکت McGill & Partners جهت برآورد خسارت احتمالی املاک پس از طوفان‌ها و بلایای طبیعی.


♻️گوگل با این حرکت، Earth را از یک ابزار نمایش نقشه، به پلتفرمی برای تحلیل و تصمیم‌سازی جهانی تبدیل کرده است.

@rss_ai_ir
#Google #Gemini #AI #Geospatial #Earth #هوش_مصنوعی #تحلیل_داده #زلزله #WHO #DigitalTwin
🎶 OpenAI
وارد دنیای موسیقی شد!

طبق گزارش منابع مختلف، OpenAI در حال توسعه‌ی یک مولد موسیقی (Music Generator) است — و ماجرا جدی‌تر از چیزی‌ست که به نظر می‌رسد.
گفته می‌شود این شرکت حتی با دانشجویان مدرسه‌ی موسیقی جولیارد (Juilliard School) در نیویورک همکاری می‌کند تا نت‌های موسیقایی را برای مدل‌هایش به‌صورت دقیق برچسب‌گذاری (annotate) کنند. 🎼

💡 هدف OpenAI
ایجاد ابزاری که کاربران بتوانند از طریق متن یا صدای خود موسیقی تولید کنند؛ مثلاً بنویسند:

> «به این وکال، یک گیتار الکتریک اضافه کن» 🎸
یا موسیقی متن مناسب برای یک ویدیو بسازند. 🎬



⚖️ اما چالش بزرگ — حقوق موسیقی (Copyright)
مجموعه OpenAI احتمالاً باید با شرکت‌های بزرگ ضبط موسیقی مانند Sony، Universal Music Group و Warner Bros. قرارداد ببندد تا از شکایت‌های احتمالی جلوگیری کند. (این شرکت‌ها هم‌اکنون از Suno و Udio به دلیل استفاده از آهنگ‌های دارای کپی‌رایت شکایت کرده‌اند).

👀 برخی تحلیلگران می‌گویند اگر OpenAI از داده‌های مجاز استفاده نکند، ممکن است سرنوشت مشابه مدل‌های Firefly از Adobe را پیدا کند — امن از نظر حقوقی، ولی بدون محبوبیت واقعی در بازار.

⛔️اما اگر این پروژه درست پیش برود، می‌تواند نقطه‌ی عطفی در دنیای تولید موسیقی با هوش مصنوعی باشد — از خلق قطعات جدید گرفته تا ساخت موسیقی‌های پویا برای فیلم و بازی.

@rss_ai_ir
#OpenAI #MusicAI #هوش_مصنوعی #موسیقی #AI #GenerativeAI #Suno #Udio #Juilliard #Firefly
1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 نسخه‌ی جدید مدل تولید سه‌بعدی HiTem3D منتشر شد!

مدلی که قبلاً هم با کیفیت فوق‌العاده در تولید مش‌های سه‌بعدی شناخته می‌شد، حالا با نسخه‌ی جدید v1.5_1536 Pro بازگشته است — با جزئیاتی حتی دقیق‌تر و واقع‌گرایانه‌تر. 🤯

💎 ویژگی‌ها:

♻️کیفیت مش بسیار بالا برای مدل‌سازی دقیق اجسام
♻️مناسب برای کاربردهای طراحی صنعتی، بازی‌سازی و انیمیشن
♻️قابلیت تولید مدل‌های پیچیده با حفظ جزئیات ظریف بافت‌ها


🧩 امتحانش کنید:
https://www.hitem3d.ai/
(به‌نظر می‌رسد که هنوز اعتبار رایگان (Free Credits) هم ارائه می‌دهد 💰)

مدل HiTem3D واقعاً یکی از پیشرفته‌ترین ژنراتورهای سه‌بعدی فعلی است — مخصوصاً در ترکیب کیفیت هندسی بالا + سرعت پردازش مناسب. 🚀

@rss_ai_ir
#AI #3D #GenerativeAI #HiTem3D #هوش_مصنوعی #مدلسازی #انیمیشن #طراحی_صنعتی
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ درک شهودی از مکانیزم توجه (Attention Mechanism)

یکی از بهترین و ساده‌ترین بصری‌سازی‌هایی که تا حالا از مکانیزم توجه در ترنسفورمرها منتشر شده — مفهومی که خیلی از توسعه‌دهندگان سال‌ها طول کشید تا به‌صورت شهودی آن را درک کنند. 🎯

در نگاه اول، فرمول ساده به نظر می‌رسد؛
می‌توان آن را حفظ کرد و حتی بازنویسی کرد،
اما درک عمیق اینکه چطور Q (Query)، K (Key) و V (Value) با هم تعامل دارند، چیز دیگری‌ست. 🧠

این ویدیو یا شماتیک دقیقاً همان چیزی است که کمک می‌کند درون ترنسفورمر را «ببینیم» — جایی که مدل یاد می‌گیرد چگونه توجه را میان بخش‌های مختلف داده توزیع کند.

@rss_ai_ir
#هوش_مصنوعی #یادگیری_عمیق #ترنسفورمر #LLM #Attention #MachineLearning