VIRSUN

📘 کتاب جدید و رایگان دانشگاه برکلی: یادگیری نمایش‌های عمیق از توزیع داده‌ها

تیمی از پژوهشگران دانشگاه UC Berkeley (شامل Sam Buchanan، Druv Pai، Peng Wang و Yi Ma) کتابی با عنوان Learning Deep Representations of Data Distributions منتشر کرده‌اند — اثری که به‌زبان ساده توضیح می‌دهد چرا و چگونه شبکه‌های عصبی عمیق می‌توانند از داده‌های پیچیده، نمایش‌های فشرده و معنادار استخراج کنند.

💡 در این کتاب می‌خوانید:

🟠 توضیح مفهومی و قابل‌درک از اصول بنیادی معماری‌های یادگیری عمیق بر پایه‌ی بهینه‌سازی و نظریه اطلاعات
🟠 چگونگی شکل‌گیری نمایش‌های مقاوم و ناوردا در مدل‌ها
🟠 ارتباط شبکه‌های عصبی با PCA، خودرمزگذارها (Autoencoders) و نگاشت‌های قابل‌تفاضل — و اینکه چگونه یادگیری عمیق در واقع تعمیمی از روش‌های کلاسیک فشرده‌سازی داده است
🟠 نگاهی نو به یادگیری از منظر انرژی، آنتروپی و ساختار داده‌ها
🟠 ایده‌های تازه برای درک بهتر مدل‌های زبانی بزرگ (LLM) و مدل‌های مولد

📖 نسخه آنلاین:
🔗 ma-lab-berkeley.github.io/deep-representation-learning-book

💻 کد منبع در گیت‌هاب:
🔗 github.com/Ma-Lab-Berkeley/deep-representation-learning-book

#هوش_مصنوعی #یادگیری_عمیق #نمایش_ویژگی #یادگیری_نمایش #دانشگاه_برکلی #کتاب
@rss_ai_ir

372 views09:51

VIRSUN

0:35

This media is not supported in your browser

VIEW IN TELEGRAM

😄 تسلا Optimus حالا کونگ‌فو تمرین می‌کنه!
اما سوال اینجاست... برای چی؟! آیا باید خودمون رو برای چیزی آماده کنیم؟ 🥋🤖

شاید ایلان ماسک بالاخره تصمیم گرفته ارتش ربات‌های رزمی بسازه، یا شاید فقط دنبال اینه که Optimus بتونه توی کارخانه‌ها تعادل، انعطاف‌پذیری و واکنش فیزیکی بهتری داشته باشه.
در واقع یادگیری حرکات رزمی مثل کونگ‌فو می‌تونه به ربات کمک کنه تا:

هماهنگی دقیق بین مفاصل و سنسورها پیدا کنه 🦾

تعادل خودشو در شرایط پیچیده حفظ کنه ⚖️

و واکنش سریع به تغییرات محیطی داشته باشه ⚡

ولی خب... تا وقتی یکی از اینا با لگد وارد خونه‌مون نشده، فعلاً می‌تونیم فقط بخندیم 😅

🚀 شاید “Matrix mode” نزدیک‌تر از اونه که فکر می‌کنیم.

#Tesla #Optimus #AI #Robot #ElonMusk #Humanoid #KungFu
@rss_ai_ir

241 views09:54

VIRSUN

🎯 بردار جدید حمله به سامانه‌های هوش‌مصنوعی — پرامپت‌های پنهان داخل تصاویر

✅تحقیقات Trail of Bits نشون داد که هکرها می‌تونن دستورالعمل‌هایی رو داخل تصویر مخفی کنن. وقتی تصویر در اندازه‌ی اصلی باشه، مشکلی دیده نمی‌شه — اما به محض این‌که سرویس (مثلاً Gemini CLI یا Vertex AI Studio) تصویر رو به‌صورت خودکار فشرده یا مقیاس‌بندی کنه، متن پنهان «ظاهر» می‌شه.

📌 اهمیت ماجرا:

♻️مدل‌ها ممکنه این «پرامپت پنهان» رو به‌عنوان دستور کاربری بخونن و اجرا کنن.

♻️با این روش می‌شه فیلترها و محدودیت‌های ورودی رو دور زد و مدل رو وادار به کاری کرد که مهاجم می‌خواد.

🛠 راه‌های مقابله (عملی و فوری):

✳️استفاده از ابزارهایی مثل Anamorpher برای تولید و شناسایی چنین حملاتی (اوپن‌سورس).

✳️چندلایه‌سازی بررسی تصاویر: قبل از فرایندهای پردازش/اسکیلینگ، تصویر رو از جهت آرتیفکت‌ها و الگوهای غیرمعمول آنالیز کنین.

✳️لاگ‌برداری از همه تغییرات تصویر هنگام تبدیل/فشرده‌سازی تا در صورت رفتار عجیب مدل، بفهمین چه تغییری رخ داده.

✳️در زنجیره‌ی پردازش، «نودهای پاک‌سازی» قرار بدین که تصویر رو به فرمت‌هایی تبدیل کنن که احتمال پنهان‌سازی در اونها خیلی کمتره (مثلاً رندر دوباره پیکسل‌ها یا نویز تصادفی کنترل‌شده).

⚠️ خلاصه: حتی یک عکسِ «بی‌ضرر» می‌تونه به یک درِ پشتی برای سیستم‌های مولتی‌مدال تبدیل بشه. بهتره پیشگیری و بازرسی تصاویر جزو خط‌مشی امنیتی هر پلتفرم هوش‌مصنوعی باشه.

🔗 منابع:
• Anamorpher (Trail of Bits):
https://github.com/trailofbits/anamorpher
• توضیحات و بلاگ‌پست:
blog.trailofbits.com/2025/08/21/weaponizing-image-scaling-against-production-ai-systems/

#AI #Security #PromptInjection #TrailOfBits

@rss_ai_ir

286 viewsedited 09:58

VIRSUN

0:30

This media is not supported in your browser

VIEW IN TELEGRAM

🧠 برای علاقه‌مندان به فناوری گفتار مصنوعی

مدل neutts-air از شرکت Neuphonic یکی از جذاب‌ترین ابزارهای جدید در حوزه تبدیل متن به گفتار (TTS) است — چون:

🎧 به‌صورت آفلاین و در لحظه (Real-time) روی CPU اجرا می‌شود، بدون نیاز به GPU یا اتصال به سرور.
🗣️ صدای کاربر را فقط با ۳ ثانیه نمونه صدا شبیه‌سازی می‌کند.
⚙️ از مدل Qwen-0.5B و کدک اختصاصی NeuCodec استفاده می‌کند که برای اجرای سریع روی دستگاه‌های سبک (مثل موبایل و ربات‌ها) طراحی شده است.

🔗 کد منبع:
github.com/neuphonic/neutts-air
🔗 محصولات Neuphonic
: neuphonic.com

💡 مزایا:

♻️بدون هزینه API و بدون تأخیر سرور
♻️مناسب برای دستگاه‌های قابل حمل و ربات‌های تعاملی
♻️امنیت و حریم خصوصی بالا (تمام پردازش روی دستگاه انجام می‌شود)

⚠️ نکات مهم:

✳️برای کیفیت بهتر صدا، نمونه‌های طولانی‌تر (۱۰ تا ۳۰ ثانیه) نتیجه‌ی طبیعی‌تری می‌دهند.
✳️در استفاده از صداهای واقعی، حتماً قوانین حقوقی و رضایت صاحب صدا را رعایت کنید.

🎙 در دنیای TTS، این مدل‌ها در حال نزدیک شدن به گفتار انسانی هستند — و حالا می‌توانید آن را حتی روی لپ‌تاپ بدون GPU اجرا کنید!

#هوش_مصنوعی #تبدیل_متن_به_گفتار #Neuphonic #Qwen #صدا #TTS

@rss_ai_ir

333 viewsedited 10:01

VIRSUN

⚡ رشد هوش مصنوعی در آستانه‌ی بحران انرژی

❌بر اساس پیش‌بینی‌ها، مراکز داده‌ی هوش مصنوعی تا سال ۲۰۳۵ حدود ۱۶۰۰ تراوات‌ساعت برق مصرف خواهند کرد — یعنی ۴٫۴٪ از کل برق تولیدی جهان.

❌به زبان ساده، مصرف انرژی مراکز داده‌ی هوش مصنوعی طی ده سال آینده چهار برابر می‌شود.

❌اگر این مراکز را به‌عنوان یک کشور در نظر بگیریم، از نظر مصرف برق در رتبه‌ی چهارم جهان قرار می‌گیرند — بعد از چین، آمریکا و هند.

❌در ایالات متحده، رشد تقاضای برق برای مراکز داده سریع‌تر از خودروهای برقی، هیدروژن و سایر فناوری‌های نو است.

🔋 نتیجه روشن است:
رشد آینده‌ی هوش مصنوعی نه با پردازنده‌ها، بلکه با برق محدود خواهد شد.

#هوش_مصنوعی #انرژی #مراکز_داده #AI #DataCenters #EnergyCrisis
@rss_ai_ir

371 views10:05

VIRSUN

⚠️ تغییر مهم در قوانین Sora

شب گذشته توافق‌نامه‌ی جدید آپلود محتوا در Sora فعال شد.
این مفاد در زمان راه‌اندازی هم وجود داشتند، اما اکنون برای ادامه‌ی استفاده باید به‌صورت مستقیم تأییدشان کنید.

📌 نکته‌ی مهم:
حساب‌های ChatGPT و Sora اکنون به‌هم پیوند داده شده‌اند.
به این معنا که اگر از Sora بن شوید، دسترسی شما به هر دو سرویس به‌طور دائم مسدود خواهد شد.

🧠 پس قبل از بارگذاری محتوا یا استفاده از Sora، حتماً قوانین جدید را با دقت مرور کنید.

#Sora #ChatGPT #OpenAI #هوش_مصنوعی
@rss_ai_ir

268 viewsedited 19:27

VIRSUN

🧠 مجموعه‌ای از نمونه‌کدها و راهنماهای مدل‌های Gemini از Google DeepMind

⛔️مخزن جدیدی در گیت‌هاب منتشر شده که شامل نمونه‌کدهای کوچک، اسکریپت‌ها و راهنماهایی برای کار با مدل‌های Gemini است. این مجموعه برای توسعه‌دهندگانی که می‌خواهند به‌صورت عملی با قابلیت‌های Gemini کار کنند بسیار مفید است.

📘 ویژگی‌های شاخص:

✳️نمونه‌هایی برای استفاده از Gemini با OpenAI SDK و Google Search

✳️راهنماهای کامل برای Function Calling و طراحی Agent‌ها

✳️اسکریپت‌هایی برای تعامل مرورگر و تولید محتوای تصویری

✳️یکپارچگی با فریم‌ورک‌های LangChain و PydanticAI

✳️مثال‌هایی برای پردازش صوت، ویدیو و حافظه‌ی بلندمدت

🔗 گیت‌هاب:
github.com/philschmid/gemini-samples

💡 اگر به دنبال یادگیری عملی از ساخت ایجنت‌های هوشمند یا ادغام Gemini در پروژه‌های خود هستید، این ریپو یک نقطه‌ی شروع عالی است.

#Gemini #DeepMind #GoogleAI #LangChain #AItools #هوش_مصنوعی @rss_ai_ir

276 viewsedited 19:30

VIRSUN

🚛 فروشگاه زنجیره‌ای Азبوکا وکوسا روسیه از کامیون‌های خودران Evocargo استفاده می‌کند

⛔️در مرکز توزیع این شرکت در شهر ایسترا، کامیون‌های بدون راننده آغاز به کار کرده‌اند. این خودروها با استفاده از هوش مصنوعی، داده‌های دریافتی از سنسورها، دوربین‌ها و لیدار را در زمان واقعی تحلیل کرده و بدون نیاز به راننده بین سوله‌ها حرکت می‌کنند.

💡 این پروژه در قالب مدل «ربات به‌عنوان سرویس» (RaaS) اجرا شده است.
هدف آن کاهش اثرات زیست‌محیطی و پیشبرد راهبرد توسعه‌ی پایدار است.

🔋 علاوه بر این، «Азбука وکوسا» پیش‌تر نیز از ربات‌های موجودی‌بردار یاندکس برای بهینه‌سازی فرایندهای فروشگاه استفاده کرده بود.

#روباتیک #هوش_مصنوعی #حمل_و_نقل_هوشمند #Evocargo #خودران #پایداری @rss_ai_ir

257 views19:32

VIRSUN

0:39

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️ یک توسعه‌دهنده خلاق اپلیکیشنی ساخته که تماشای فیلم‌های ۳بعدی را مستقیماً روی لپ‌تاپ ممکن می‌سازد! 🎬💻

این فناوری با نام True3D Window Mode مانند «پنجره‌ای به فضای سه‌بعدی» عمل می‌کند.
📸 دوربین وب‌کم، موقعیت و حرکت سر کاربر را دنبال می‌کند و به‌صورت بلادرنگ عمق تصویر را با زاویه دید او هماهنگ می‌سازد — بدون نیاز به عینک سه‌بعدی!

📱 جالب‌تر اینکه حتی می‌توانید با iPhone (iOS 26) هم آن را امتحان کنید.

🔗 لینک تست در سایت توسعه‌دهنده موجود است.

هوش مصنوعی حالا حتی تماشای فیلم را هم به تجربه‌ای تعاملی و زنده تبدیل کرده است 🎥✨

#هوش_مصنوعی #3D #RealityTech #AInews @rss_ai_ir

🔥1

263 views19:36

VIRSUN

🤖 رویداد OpenAI Dev Day و معرفی ابزار جدید Agent Kit

✅این ابزار شباهت زیادی به n8n دارد، اما برخلاف نامش، فرآیند کار چندان No-Code نیست.
✅در دموها حجم زیادی از کپی‌پیست کد دیده شد و برای ساخت ایجنت‌ها همچنان نیاز به مهارت برنامه‌نویسی وجود دارد.

✅با این حال، Agent Kit گامی مهم در جهت توسعه‌ی ایجنت‌های مستقل با قابلیت اجرای وظایف پیچیده در اکوسیستم OpenAI است — چیزی میان هوش مصنوعی، اتوماسیون و ابزارهای توسعه‌محور.

💡 به‌نوعی می‌توان گفت OpenAI در حال ساخت نسخه‌ی حرفه‌ای‌تر و توسعه‌پذیرتر از n8n برای دنیای AI است.

#OpenAI #AgentKit #AIagents #DevDay #Automation

@rss_ai_ir

263 views19:38

VIRSUN

1:14

This media is not supported in your browser

VIEW IN TELEGRAM

https://platform.openai.com/agent-builder

🤖 معرفی ابزار جدید OpenAI: Agent Builder

مجموعه OpenAI در بخش جدیدی از پلتفرم خود، ابزاری با نام Agent Builder معرفی کرده که به توسعه‌دهندگان اجازه می‌دهد عامل‌های هوشمند (AI Agents) را بدون نیاز به ساختارهای پیچیده ایجاد کنند.

این ابزار در واقع نسخه‌ی ساده‌سازی‌شده‌ای از Agent Kit است که در رویداد Dev Day معرفی شد، اما برخلاف ظاهرش، کاملاً No-Code نیست و برای برخی تنظیمات نیاز به مهارت برنامه‌نویسی دارد.

---

🔹 ویژگی‌های کلیدی Agent Builder:

ساخت Workflow تعاملی برای چت‌بات‌ها و ایجنت‌های اختصاصی

استفاده از قالب‌های آماده (Templates) مانند:
• Planning Helper → ساخت برنامه‌کاری چندمرحله‌ای
• Customer Service → پاسخ‌گویی هوشمند به مشتریان با سیاست‌های اختصاصی
• Structured Data Q/A → جست‌وجوی پایگاه داده با زبان طبیعی
• Document Comparison → تحلیل و مقایسه خودکار اسناد
• Internal Knowledge Assistant → دستیار دانشی داخلی برای سازمان‌ها

---

🔸 ویژگی جالب دیگر:
شما می‌توانید با فشردن دکمه‌ی “Create”، از صفر یک Workflow سفارشی بسازید و ابزارها و منطق مخصوص خود را به آن اضافه کنید.

---

به‌طور خلاصه، Agent Builder پلی میان برنامه‌نویسی کلاسیک و هوش مصنوعی تعاملی است — گامی مهم برای تبدیل چت‌بات‌ها به ایجنت‌هایی که واقعاً کار انجام می‌دهند. ⚙️

#OpenAI #AgentBuilder #AIagents #DevDay #Automation

@rss_ai_ir

322 viewsedited 19:41

VIRSUN

🚀 خلاصه مهم‌ترین رویدادهای OpenAI DevDay 2025

⛔️رویداد امسال OpenAI با تمرکز بر مقیاس‌پذیری عظیم و ابزارهای جدید برای توسعه‌دهندگان برگزار شد — اعدادی که واقعاً خیره‌کننده‌اند:

📊
→ بیش از ۸۰۰ میلیون کاربر هفتگی ChatGPT
→ پردازش ۶ میلیارد توکن در هر دقیقه
→ پیش‌بینی دستیابی به ۱ میلیارد کاربر تا پایان سال
---

🧩 ۱. اپلیکیشن‌ها درون ChatGPT

مجموعه OpenAI با معرفی Apps SDK اجازه داده توسعه‌دهندگان اپلیکیشن‌های کامل درون ChatGPT بسازند.

🔹 قابلیت‌ها:

✳️اجرای مستقیم اپ‌ها داخل ChatGPT
✳️همکاری با برندهای اولیه مانند Canva، Zillow، Coursera، Figma
✳️علاوهSDK در مرحله بتا؛ فروشگاه و مدل درآمدزایی به‌زودی فعال می‌شود

---

🤖 ۲. معرفی AgentKit — نسل بعدی ایجنت‌ها

پکیج جدید OpenAI برای ساخت و استقرار ایجنت‌های هوشمند شامل:

Agent Builder →
ساخت ایجنت با رابط Drag & Drop (شبیه n8n)
ChatKit →
افزودن رابط گفت‌وگویی شبیه ChatGPT
Evals →
ارزیابی و بهبود عملکرد ایجنت
Connectors →
اتصال ایجنت به اپلیکیشن‌ها، وب‌سایت‌ها یا دیتابیس‌های زنده

---
💻 ۳. به‌روزرسانی‌های Codex

♻️همچنین GPT-5 Codex اکنون برای عموم در دسترس است
♻️افزوده‌شدن یکپارچه‌سازی با Slack و SDK مخصوص توسعه‌دهندگان
♻️ابزارهای تحلیلی و کنترل سازمانی جدید برای شرکت‌ها

---
⚙️ ۴. همچنین API و مدل‌ها

✳️ب)GPT-5 Pro API فعال شد — هزینه: ۱۵ دلار برای ورودی و ۱۲۰ دلار برای خروجی در هر ۱ میلیون توکن
✳️د)GPT-Realtime-Mini معرفی شد؛ ۷۰٪ ارزان‌تر، بهینه برای گفت‌وگوهای زنده صوتی
✳️ه) Sora 2 به API افزوده شد — شامل صدا، گزینه‌های Remix و کنترل طول ویدیو

---

📍به‌طور خلاصه، OpenAI با DevDay 2025 مرز بین چت‌بات‌ها، اپلیکیشن‌ها و ایجنت‌های هوشمند را از بین برد. آینده ChatGPT فقط مکالمه نیست — یک پلتفرم کامل هوش مصنوعی است. ⚡️

#OpenAI #DevDay2025 #ChatGPT #AgentKit #AppsSDK #AIagents #Sora2 #GPT5
@rss_ai_ir

👍1

241 views03:07

VIRSUN

0:57

This media is not supported in your browser

VIEW IN TELEGRAM

🎤 تجربه‌ای فراتر از گفتار با Octave 2 از Hume AI

✅مدل جدید Octave 2 درک گفتار مصنوعی را به سطحی تازه رسانده — آن‌قدر طبیعی که حتی می‌تواند زمزمه (whisper) کند و اصطلاحات عامیانه را به خاطر بسپارد! 😮
---

🎧 ویژگی‌های کلیدی:

♻️شبیه‌سازی کامل صدا، لهجه، لحن و سبک گفتار
♻️قابلیت تنظیم دقیق تلفظ هر واژه به‌صورت جداگانه
♻️پشتیبانی از ۱۱ زبان زنده دنیا، از جمله فارسی و روسی
♻️امکان ساخت صداهای جدید یا کلون‌کردن صدای واقعی
♻️کاملاً مناسب برای ساخت پادکست، دیالوگ‌های تعاملی و اپلیکیشن‌های صوتی هوش مصنوعی

---

💸 نسخه رایگان:
تا ۲۰ دقیقه تولید صوت در ماه رایگان در دسترس است.

🎙 می‌توانید همین حالا آن را امتحان کنید 👇
🌐 Hume AI - Octave 2

#AI #VoiceAI #TTS #HumeAI #Octave2 #SpeechSynthesis #GenerativeAI @rss_ai_ir

👍1

1.39K views03:12

About

Blog

Apps

Platform