🚀 راهنمای جدید Qwen برای مدل چندوجهی Qwen3-VL منتشر شد!
شرکت Qwen (وابسته به Alibaba) مجموعهای از دفترچههای تعاملی (Notebooks) منتشر کرده که کاربردهای قدرتمند مدل چندوجهی Qwen3-VL را بهصورت گامبهگام نشان میدهد — هم برای اجرا روی سیستم محلی و هم از طریق API.
📚 در این مجموعه، دهها مثال واقعی با توضیحات دقیق وجود دارد، از جمله:
🔸 تحلیل و استدلال روی تصاویر
🔸 عامل تعاملی با رابط کاربری (Computer-Use Agent)
🔸 برنامهنویسی چندوجهی (Multimodal Programming)
🔸 تشخیص اشیاء و صحنهها (Omni Recognition)
🔸 استخراج داده از اسناد و PDFها
🔸 تشخیص دقیق اشیاء در تصاویر
🔸 OCR
و استخراج اطلاعات کلیدی
🔸 تحلیل سهبعدی و لنگرگذاری اشیاء (3D Anchoring)
🔸 درک متون طولانی
🔸 استدلال فضایی (Spatial Reasoning)
🔸 عامل موبایل (Mobile Agent)
🔸 تحلیل و درک ویدیو 🎥
🔗 منابع رسمی:
🟠 گیتهاب:
github.com/QwenLM/Qwen3-VL/tree/main/cookbooks
🟠 مستندات
API: alibabacloud.com/help/en/model-studio/user-guide/vision
🟠 تجربه آنلاین:
chat.qwen.ai/?models=qwen3-vl-plus
📌 اگر به دنبال مدلی هستید که بینایی، زبان و منطق فضایی را همزمان ترکیب کند، Qwen3-VL یکی از پیشرفتهترین گزینههای متنباز امروز است.
@rss_ai_ir
#Qwen #Qwen3VL #هوش_مصنوعی #LLM #Multimodal #VisionLanguage #AI
شرکت Qwen (وابسته به Alibaba) مجموعهای از دفترچههای تعاملی (Notebooks) منتشر کرده که کاربردهای قدرتمند مدل چندوجهی Qwen3-VL را بهصورت گامبهگام نشان میدهد — هم برای اجرا روی سیستم محلی و هم از طریق API.
📚 در این مجموعه، دهها مثال واقعی با توضیحات دقیق وجود دارد، از جمله:
🔸 تحلیل و استدلال روی تصاویر
🔸 عامل تعاملی با رابط کاربری (Computer-Use Agent)
🔸 برنامهنویسی چندوجهی (Multimodal Programming)
🔸 تشخیص اشیاء و صحنهها (Omni Recognition)
🔸 استخراج داده از اسناد و PDFها
🔸 تشخیص دقیق اشیاء در تصاویر
🔸 OCR
و استخراج اطلاعات کلیدی
🔸 تحلیل سهبعدی و لنگرگذاری اشیاء (3D Anchoring)
🔸 درک متون طولانی
🔸 استدلال فضایی (Spatial Reasoning)
🔸 عامل موبایل (Mobile Agent)
🔸 تحلیل و درک ویدیو 🎥
🔗 منابع رسمی:
🟠 گیتهاب:
github.com/QwenLM/Qwen3-VL/tree/main/cookbooks
🟠 مستندات
API: alibabacloud.com/help/en/model-studio/user-guide/vision
🟠 تجربه آنلاین:
chat.qwen.ai/?models=qwen3-vl-plus
📌 اگر به دنبال مدلی هستید که بینایی، زبان و منطق فضایی را همزمان ترکیب کند، Qwen3-VL یکی از پیشرفتهترین گزینههای متنباز امروز است.
@rss_ai_ir
#Qwen #Qwen3VL #هوش_مصنوعی #LLM #Multimodal #VisionLanguage #AI
❤1
Media is too big
VIEW IN TELEGRAM
🤖 Figure 03 —
نخستین ربات انساننمای تجاری برای بازار انبوه
شرکت Figure AI از نسل سوم ربات انساننمای خود با نام Figure 03 رونمایی کرد — نخستین مدلی که بهطور ویژه برای تولید انبوه طراحی شده است.
این ربات با استفاده از تعامل مستقیم با انسانها آموزش میبیند و میتواند مجموعهای از وظایف خانگی و صنعتی را انجام دهد — از خانه و هتل گرفته تا انبارها و مراکز خدماتی.
🧠 سیستم هوش مصنوعی آن با نام Helix، بینایی، زبان و عمل را در یک چارچوب واحد ترکیب میکند، تا ربات بتواند مانند انسانها در محیط واقعی تصمیمگیری و عمل کند.
🔧 ویژگیهای جدید Figure 03:
♻️بدنه از مواد نرم و قابل شستوشو ساخته شده، بدون مکانیزمهای باز یا خطرناک
♻️وزن ۹٪ کمتر از نسل قبلی
♻️تغییر روش تولید از CNC به قالبگیری صنعتی (molding) برای سرعت بالاتر در مونتاژ
♻️هدف تولید: ۱۲,۰۰۰ دستگاه در سال و رسیدن به ۱۰۰,۰۰۰ دستگاه طی چهار سال آینده
🎯 بهبودهای فنی:
✳️میدان دید وسیعتر برای دوربینها
✳️دوربینهای تعبیهشده در کف دست برای تعامل دقیقتر
✳️حسگرهای فشار لمسی پیشرفته
✳️سیستم صوتی جدید برای تشخیص بهتر صداها
✳️شارژ بیسیم با قابلیت انتقال داده
✳️قابلیت «تغییر لباس» با یونیفرمهای مختلف برای محیطهای کاری متفاوت 👕
🎥 در ویدیوهای رسمی، Figure 03 با حرکاتی نرم و طبیعی با انسانها و اشیاء محیط تعامل میکند — اما هنوز باید دید در دنیای واقعی چهقدر قابل اعتماد خواهد بود.
💰 قیمت هنوز اعلام نشده است، اما این ربات گامی بزرگ بهسوی حضور انساننماها در زندگی روزمره محسوب میشود.
@rss_ai_ir
#Figure03 #FigureAI #هوش_مصنوعی #رباتیک #Humanoid #AI #Robotics #Helix
نخستین ربات انساننمای تجاری برای بازار انبوه
شرکت Figure AI از نسل سوم ربات انساننمای خود با نام Figure 03 رونمایی کرد — نخستین مدلی که بهطور ویژه برای تولید انبوه طراحی شده است.
این ربات با استفاده از تعامل مستقیم با انسانها آموزش میبیند و میتواند مجموعهای از وظایف خانگی و صنعتی را انجام دهد — از خانه و هتل گرفته تا انبارها و مراکز خدماتی.
🧠 سیستم هوش مصنوعی آن با نام Helix، بینایی، زبان و عمل را در یک چارچوب واحد ترکیب میکند، تا ربات بتواند مانند انسانها در محیط واقعی تصمیمگیری و عمل کند.
🔧 ویژگیهای جدید Figure 03:
♻️بدنه از مواد نرم و قابل شستوشو ساخته شده، بدون مکانیزمهای باز یا خطرناک
♻️وزن ۹٪ کمتر از نسل قبلی
♻️تغییر روش تولید از CNC به قالبگیری صنعتی (molding) برای سرعت بالاتر در مونتاژ
♻️هدف تولید: ۱۲,۰۰۰ دستگاه در سال و رسیدن به ۱۰۰,۰۰۰ دستگاه طی چهار سال آینده
🎯 بهبودهای فنی:
✳️میدان دید وسیعتر برای دوربینها
✳️دوربینهای تعبیهشده در کف دست برای تعامل دقیقتر
✳️حسگرهای فشار لمسی پیشرفته
✳️سیستم صوتی جدید برای تشخیص بهتر صداها
✳️شارژ بیسیم با قابلیت انتقال داده
✳️قابلیت «تغییر لباس» با یونیفرمهای مختلف برای محیطهای کاری متفاوت 👕
🎥 در ویدیوهای رسمی، Figure 03 با حرکاتی نرم و طبیعی با انسانها و اشیاء محیط تعامل میکند — اما هنوز باید دید در دنیای واقعی چهقدر قابل اعتماد خواهد بود.
💰 قیمت هنوز اعلام نشده است، اما این ربات گامی بزرگ بهسوی حضور انساننماها در زندگی روزمره محسوب میشود.
@rss_ai_ir
#Figure03 #FigureAI #هوش_مصنوعی #رباتیک #Humanoid #AI #Robotics #Helix
👍2🔥1👏1
💻 چرا دیگر خرید کارت گرافیک خانگی منطقی نیست؟ 😅
⛔️در یک نمودار جالب که اخیراً منتشر شده، بهخوبی نشان داده شده که چرا عصر "هوش مصنوعی خانگی" به پایان رسیده است.
📈 طبق دادهها:
✳️نیاز سختافزاری برای اجرای مدلهای هوش مصنوعی سالانه ۴.۵ برابر رشد میکند.
✳️در بهترین حالت، طبق قانون مور، کارایی چیپها تنها هر ۱.۵ سال دو برابر میشود.
✳️حتی این آمار به حافظهٔ محدود روی تراشهها اشارهای نمیکند — که همانقدر بحرانی است.
نتیجه واضح است:
⚠️ نیاز به توان محاسباتی سریعتر از رشد سختافزار افزایش مییابد، و کاربر معمولی دیگر نمیتواند همپای این رقابت باقی بماند.
📊 در تصویر دوم، مقایسهٔ جالبی آمده:
هزینهٔ ساخت دیتاسنترها در آمریکا در سال ۲۰۲۵ تقریباً با هزینهٔ ساخت برجهای اداری جدید برابر شده است!
🧠 دنیایی که زمانی با لپتاپ و کارت گرافیک شخصی قابل تجربه بود، حالا به قلمرو ابرکامپیوترها و دیتاسنترها تبدیل شده.
میتوان گفت عصر «یقهسفیدها و یقهآبیها» جای خود را به یقههای سیلیکونی داده است 😎
@rss_ai_ir
#هوش_مصنوعی #GPU #AIHardware #Datacenter #NVIDIA #ComputePower
⛔️در یک نمودار جالب که اخیراً منتشر شده، بهخوبی نشان داده شده که چرا عصر "هوش مصنوعی خانگی" به پایان رسیده است.
📈 طبق دادهها:
✳️نیاز سختافزاری برای اجرای مدلهای هوش مصنوعی سالانه ۴.۵ برابر رشد میکند.
✳️در بهترین حالت، طبق قانون مور، کارایی چیپها تنها هر ۱.۵ سال دو برابر میشود.
✳️حتی این آمار به حافظهٔ محدود روی تراشهها اشارهای نمیکند — که همانقدر بحرانی است.
نتیجه واضح است:
⚠️ نیاز به توان محاسباتی سریعتر از رشد سختافزار افزایش مییابد، و کاربر معمولی دیگر نمیتواند همپای این رقابت باقی بماند.
📊 در تصویر دوم، مقایسهٔ جالبی آمده:
هزینهٔ ساخت دیتاسنترها در آمریکا در سال ۲۰۲۵ تقریباً با هزینهٔ ساخت برجهای اداری جدید برابر شده است!
🧠 دنیایی که زمانی با لپتاپ و کارت گرافیک شخصی قابل تجربه بود، حالا به قلمرو ابرکامپیوترها و دیتاسنترها تبدیل شده.
میتوان گفت عصر «یقهسفیدها و یقهآبیها» جای خود را به یقههای سیلیکونی داده است 😎
@rss_ai_ir
#هوش_مصنوعی #GPU #AIHardware #Datacenter #NVIDIA #ComputePower
😢4❤1👌1💯1🍌1
This media is not supported in your browser
VIEW IN TELEGRAM
🎯 مدل جدید TrackVLA++ برای ردیابی بصری (Visual Tracking)
مدل TrackVLA++ نسل جدیدی از مدلهای Vision-Language-Action است که با ترکیب استدلال فضایی (Spatial Reasoning) و حافظه شناسایی هدف (Target Identification Memory)، عملکردی در سطح SOTA را در سناریوهای ردیابی طولانیمدت و محیطهای شلوغ ارائه میدهد. 💙
🚀 ویژگیهای کلیدی:
🔹 قابلیت تحلیل دقیق فضا و موقعیت اشیاء در ویدیوهای پیچیده
🔹 حفظ حافظه هدف حتی در حضور ازدحام و جابجایی اجسام
🔹 مناسب برای رباتها، سیستمهای نظارت تصویری و کاربردهای واقعیت افزوده
📚 منابع:
📄 مقاله: arxiv.org/pdf/2510.07134
🌐 پروژه:
pku-epic.github.io/TrackVLA-plus-plus-Web/
📦 ریپوی کد: بهزودی منتشر میشود
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #ردیابی_بصری #TrackVLA #AI #ComputerVision #DeepLearning
مدل TrackVLA++ نسل جدیدی از مدلهای Vision-Language-Action است که با ترکیب استدلال فضایی (Spatial Reasoning) و حافظه شناسایی هدف (Target Identification Memory)، عملکردی در سطح SOTA را در سناریوهای ردیابی طولانیمدت و محیطهای شلوغ ارائه میدهد. 💙
🚀 ویژگیهای کلیدی:
🔹 قابلیت تحلیل دقیق فضا و موقعیت اشیاء در ویدیوهای پیچیده
🔹 حفظ حافظه هدف حتی در حضور ازدحام و جابجایی اجسام
🔹 مناسب برای رباتها، سیستمهای نظارت تصویری و کاربردهای واقعیت افزوده
📚 منابع:
📄 مقاله: arxiv.org/pdf/2510.07134
🌐 پروژه:
pku-epic.github.io/TrackVLA-plus-plus-Web/
📦 ریپوی کد: بهزودی منتشر میشود
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #ردیابی_بصری #TrackVLA #AI #ComputerVision #DeepLearning
👍1
📊 طبق یک پست در ردیت، فهرستی از ۳۰ مشتری بزرگ OpenAI لو رفته که مجموعاً بیش از ۱ تریلیون توکن مصرف کردهاند 😳
یکی از کامنتهای زیر پست نوشته بود:
> «الان بیشتر اقتصاد ما شده شرکتهایی که از شرکتهای دیگر خدمات هوش مصنوعی میخرند تا برای شرکتهای دیگر خدمات هوش مصنوعی بسازند!» 😅
دنیای امروز یعنی: هوش مصنوعی، برای هوش مصنوعی، بهوسیلهی هوش مصنوعی 💸
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPT5 #اقتصاد_دیجیتال #AI
یکی از کامنتهای زیر پست نوشته بود:
> «الان بیشتر اقتصاد ما شده شرکتهایی که از شرکتهای دیگر خدمات هوش مصنوعی میخرند تا برای شرکتهای دیگر خدمات هوش مصنوعی بسازند!» 😅
دنیای امروز یعنی: هوش مصنوعی، برای هوش مصنوعی، بهوسیلهی هوش مصنوعی 💸
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPT5 #اقتصاد_دیجیتال #AI
👍2❤1
🚀 GPT-5 Pro
مرزهای جدید هوش مصنوعی را جابهجا کرد!
مدل GPT-5 Pro حالا بالاترین امتیاز تأییدشده را در بنچمارک ARC-AGI (نسخه نیمهخصوصی) کسب کرده است — نزدیکترین گام تا امروز به سمت هوش مصنوعی عمومی (AGI) 🤯
سؤال بزرگ اینجاست:
آیا وارد عصرِ پس از LLM ها شدهایم؟ 👀
@rss_ai_ir
#هوش_مصنوعی #GPT5 #AGI #OpenAI #AI
مرزهای جدید هوش مصنوعی را جابهجا کرد!
مدل GPT-5 Pro حالا بالاترین امتیاز تأییدشده را در بنچمارک ARC-AGI (نسخه نیمهخصوصی) کسب کرده است — نزدیکترین گام تا امروز به سمت هوش مصنوعی عمومی (AGI) 🤯
سؤال بزرگ اینجاست:
آیا وارد عصرِ پس از LLM ها شدهایم؟ 👀
@rss_ai_ir
#هوش_مصنوعی #GPT5 #AGI #OpenAI #AI
🔥1👏1
💰 هزینههای سرسامآور OpenAI در سال ۲۰۲۴ برای قدرت پردازشی (GPU Power)
طبق گزارش جدید Epoch.AI و دادههای رسانههایی چون The Information، تخمین زده میشود که OpenAI در سال ۲۰۲۴ حدود ۷ میلیارد دلار تنها برای توان محاسباتی خرج کرده است 😳
📊 جزئیات تخمینی هزینهها:
🔹 ۲ میلیارد دلار — برای اجرای مدلها در ChatGPT و API (یعنی هزینهٔ مستقیم سرویسدهی به کاربران).
🔹 ۴.۵ میلیارد دلار — صرف آزمایشها و توسعهٔ مدلهای جدید، از جمله پروژههای تحقیقاتی بزرگ.
🔹 ۴۰۰ میلیون دلار — هزینهٔ آموزش مدل GPT-4.5 (Orion)، که قرار بود همان GPT-5 باشد؛ آموزش آن بین ۹۰ تا ۱۶۵ روز طول کشید، با استفاده از ۴۰ تا ۱۰۰ هزار GPU.
📈 بازهٔ اطمینان ۹۰٪ برای هزینهٔ آموزش: بین ۱۷۰ تا ۸۹۰ میلیون دلار.
🔹 ۸۰ میلیون دلار — برای مدلهای سبکتر مانند GPT-4o / o1 / Mini و بهروزرسانی نسخههای چت.
📉 پیشبینی برای ۲۰۲۵:
دستهی آبی نمودار (توان موردنیاز برای inference) بهطور چشمگیری افزایش مییابد، چون کاربران ChatGPT بیشتر شدهاند و مدلهای «تفکری» (Thinking Models) توکنهای بیشتری تولید میکنند.
به بیان سادهتر، آیندهٔ هوش مصنوعی نه فقط در دادهها یا مدلها، بلکه در وات و دلار رقم میخورد ⚡💵
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPU #AICompute #ChatGPT #Orion #GPT5 #AIeconomy
طبق گزارش جدید Epoch.AI و دادههای رسانههایی چون The Information، تخمین زده میشود که OpenAI در سال ۲۰۲۴ حدود ۷ میلیارد دلار تنها برای توان محاسباتی خرج کرده است 😳
📊 جزئیات تخمینی هزینهها:
🔹 ۲ میلیارد دلار — برای اجرای مدلها در ChatGPT و API (یعنی هزینهٔ مستقیم سرویسدهی به کاربران).
🔹 ۴.۵ میلیارد دلار — صرف آزمایشها و توسعهٔ مدلهای جدید، از جمله پروژههای تحقیقاتی بزرگ.
🔹 ۴۰۰ میلیون دلار — هزینهٔ آموزش مدل GPT-4.5 (Orion)، که قرار بود همان GPT-5 باشد؛ آموزش آن بین ۹۰ تا ۱۶۵ روز طول کشید، با استفاده از ۴۰ تا ۱۰۰ هزار GPU.
📈 بازهٔ اطمینان ۹۰٪ برای هزینهٔ آموزش: بین ۱۷۰ تا ۸۹۰ میلیون دلار.
🔹 ۸۰ میلیون دلار — برای مدلهای سبکتر مانند GPT-4o / o1 / Mini و بهروزرسانی نسخههای چت.
📉 پیشبینی برای ۲۰۲۵:
دستهی آبی نمودار (توان موردنیاز برای inference) بهطور چشمگیری افزایش مییابد، چون کاربران ChatGPT بیشتر شدهاند و مدلهای «تفکری» (Thinking Models) توکنهای بیشتری تولید میکنند.
به بیان سادهتر، آیندهٔ هوش مصنوعی نه فقط در دادهها یا مدلها، بلکه در وات و دلار رقم میخورد ⚡💵
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPU #AICompute #ChatGPT #Orion #GPT5 #AIeconomy
This media is not supported in your browser
VIEW IN TELEGRAM
🧱 KIRI Engine نسخهٔ جدید
3DGS to Mesh 2.0 را منتشر کرد
— تبدیل هر شیء به مدل سهبعدی تنها با دوربین گوشی! 📱✨
شرکت KIRI Engine با معرفی مدل هوش مصنوعی 3DGS to Mesh 2.0 دنیای فتوگراممتری را متحول کرده است. این فناوری میتواند هر شیء واقعی را تنها با چند عکس به مدل سهبعدی دقیق و قابل ویرایش تبدیل کند.
🚀 ویژگیهای کلیدی:
🔹 تولید مدلهای سهبعدی با نورپردازی و بافت واقعگرایانه مستقیماً از دوربین موبایل
🔹 ترکیب روش 3D Gaussian Splatting (3DGS) با بازسازی بهینهٔ مش برای سطوح صافتر و طبیعیتر
🔹 قابلیت خروجیگیری و ویرایش در نرمافزارهای سهبعدی معروف — مناسب برای طراحان بازی، هنرمندان و مهندسان محصول
🔹 کاملاً رایگان برای کاربران Android و iOS
این یعنی: ساخت مدل سهبعدی حرفهای حالا بهسادگی گرفتن یک عکس است! 📸
@rss_ai_ir
#هوش_مصنوعی #3DModeling #KIRI #3DGS #AI #Photogrammetry #GameDev #Design
3DGS to Mesh 2.0 را منتشر کرد
— تبدیل هر شیء به مدل سهبعدی تنها با دوربین گوشی! 📱✨
شرکت KIRI Engine با معرفی مدل هوش مصنوعی 3DGS to Mesh 2.0 دنیای فتوگراممتری را متحول کرده است. این فناوری میتواند هر شیء واقعی را تنها با چند عکس به مدل سهبعدی دقیق و قابل ویرایش تبدیل کند.
🚀 ویژگیهای کلیدی:
🔹 تولید مدلهای سهبعدی با نورپردازی و بافت واقعگرایانه مستقیماً از دوربین موبایل
🔹 ترکیب روش 3D Gaussian Splatting (3DGS) با بازسازی بهینهٔ مش برای سطوح صافتر و طبیعیتر
🔹 قابلیت خروجیگیری و ویرایش در نرمافزارهای سهبعدی معروف — مناسب برای طراحان بازی، هنرمندان و مهندسان محصول
🔹 کاملاً رایگان برای کاربران Android و iOS
این یعنی: ساخت مدل سهبعدی حرفهای حالا بهسادگی گرفتن یک عکس است! 📸
@rss_ai_ir
#هوش_مصنوعی #3DModeling #KIRI #3DGS #AI #Photogrammetry #GameDev #Design
❤3
🧠 LIMIT —
پژوهشی از Google DeepMind دربارهٔ مرزهای بازیابی اطلاعات با بردارهای تع嶼های (Embeddings)
⛔️محققان DeepMind با معرفی مجموعهدادهی LIMIT نشان دادهاند که حتی پیشرفتهترین مدلهای embedding نیز در بازیابی برخی اسناد شکست میخورند. این پروژه به بررسی محدودیتهای ذاتی روشهای مبتنی بر یک بردار منفرد برای نمایش معنا میپردازد.
🚀 نکات کلیدی:
✳️مجموعهدادهای برای ارزیابی عملکرد مدلهای embedding
✳️شامل ۵۰٬۰۰۰ سند و ۱٬۰۰۰ پرسوجو واقعی
✳️افشاگر محدودیتهای نظری در بازیابی مبتنی بر شباهت برداری
✳️همراه با کد کامل برای تولید دادهها و انجام آزمایشها
📌 سورسکد و دادهها در گیتهاب:
github.com/google-deepmind/limit
@rss_ai_ir
#هوش_مصنوعی #DeepMind #Embedding #Limit #AIResearch #InformationRetrieval
پژوهشی از Google DeepMind دربارهٔ مرزهای بازیابی اطلاعات با بردارهای تع嶼های (Embeddings)
⛔️محققان DeepMind با معرفی مجموعهدادهی LIMIT نشان دادهاند که حتی پیشرفتهترین مدلهای embedding نیز در بازیابی برخی اسناد شکست میخورند. این پروژه به بررسی محدودیتهای ذاتی روشهای مبتنی بر یک بردار منفرد برای نمایش معنا میپردازد.
🚀 نکات کلیدی:
✳️مجموعهدادهای برای ارزیابی عملکرد مدلهای embedding
✳️شامل ۵۰٬۰۰۰ سند و ۱٬۰۰۰ پرسوجو واقعی
✳️افشاگر محدودیتهای نظری در بازیابی مبتنی بر شباهت برداری
✳️همراه با کد کامل برای تولید دادهها و انجام آزمایشها
📌 سورسکد و دادهها در گیتهاب:
github.com/google-deepmind/limit
@rss_ai_ir
#هوش_مصنوعی #DeepMind #Embedding #Limit #AIResearch #InformationRetrieval
❤1
🛠️ AI SDK Devtools —
ابزار قدرتمند برای دیباگ و مانیتورینگ برنامههای هوش مصنوعی 🤖
⛔️این ابزار به توسعهدهندگان اجازه میدهد تا در زمان واقعی (Real-time)، رخدادها، عملکرد مدل و فراخوانی ابزارها را بررسی و تحلیل کنند.
🚀 ویژگیهای کلیدی:
♻️مانیتورینگ رویدادهای هوش مصنوعی در لحظه
♻️دیباگ دقیق فراخوانی ابزارها همراه با ورودی و خروجی
♻️پایش عملکرد و سرعت پردازش جریانها
♻️فیلترکردن رویدادها بر اساس نوع یا نام ابزار
♻️نمایش گرافیکی میزان مصرف توکنها و حافظهٔ زمینه (Context)
📦 مناسب برای: توسعهدهندگان TypeScript و Node.js که با SDKهای هوش مصنوعی کار میکنند و نیاز به دید عمیق نسبت به رفتار مدلها دارند.
📌 سورسکد در گیتهاب:
github.com/midday-ai/ai-sdk-devtools
@rss_ai_ir
#هوش_مصنوعی #AI #Devtools #TypeScript #SDK #Debugging
ابزار قدرتمند برای دیباگ و مانیتورینگ برنامههای هوش مصنوعی 🤖
⛔️این ابزار به توسعهدهندگان اجازه میدهد تا در زمان واقعی (Real-time)، رخدادها، عملکرد مدل و فراخوانی ابزارها را بررسی و تحلیل کنند.
🚀 ویژگیهای کلیدی:
♻️مانیتورینگ رویدادهای هوش مصنوعی در لحظه
♻️دیباگ دقیق فراخوانی ابزارها همراه با ورودی و خروجی
♻️پایش عملکرد و سرعت پردازش جریانها
♻️فیلترکردن رویدادها بر اساس نوع یا نام ابزار
♻️نمایش گرافیکی میزان مصرف توکنها و حافظهٔ زمینه (Context)
📦 مناسب برای: توسعهدهندگان TypeScript و Node.js که با SDKهای هوش مصنوعی کار میکنند و نیاز به دید عمیق نسبت به رفتار مدلها دارند.
📌 سورسکد در گیتهاب:
github.com/midday-ai/ai-sdk-devtools
@rss_ai_ir
#هوش_مصنوعی #AI #Devtools #TypeScript #SDK #Debugging
✅🧠 ۸ پرامپت کاربردی برای یادگیری سریعتر و هوشمندانهتر با ChatGPT ⚡📚
۱️⃣ برنامهریزی شخصی یادگیری
💬 پرامپت: «یک برنامهی ۴ هفتهای برای یادگیری [موضوع] طراحی کن که شامل وظایف روزانه باشد.»
۲️⃣ یادگیری تصویری
💬 پرامپت: «میتونی مفهوم [موضوع] رو بهصورت نمودار یا تصویر ساده توضیح بدی؟»
۳️⃣ نمونههای واقعی از کاربردها
💬 پرامپت: «چند مثال واقعی از کاربرد [موضوع] در صنعت یا زندگی روزمره بده.»
۴️⃣ آزمون کوتاه برای خودارزیابی
💬 پرامپت: «۵ سؤال سطح مقدماتی دربارهی [موضوع] ازم بپرس تا میزان درکم رو بسنجی.»
۵️⃣ توضیح با قیاس یا داستان
💬 پرامپت: «[موضوع] رو با استفاده از یک مثال ساده یا داستان توضیح بده.»
۶️⃣ مقایسهی مفاهیم مشابه
💬 پرامپت: «تفاوت بین [مفهوم A] و [مفهوم B] چیه؟ ساده برام توضیح بده.»
۷️⃣ راهنمای گامبهگام
💬 پرامپت: «یک راهنمای مرحلهبهمرحله برای انجام [کار یا پروژه] بنویس.»
۸️⃣ چکلیست مرور پیش از آزمون
💬 پرامپت: «یک فهرست از نکات کلیدی برای مرور قبل از مصاحبه یا آزمون [موضوع] بنویس.»
❤️ برای پستهای آموزشی بیشتر لایک کنید!
@rss_ai_ir
#یادگیری #ChatGPT #پرامپت #هوش_مصنوعی #آموزش #مطالعه
۱️⃣ برنامهریزی شخصی یادگیری
💬 پرامپت: «یک برنامهی ۴ هفتهای برای یادگیری [موضوع] طراحی کن که شامل وظایف روزانه باشد.»
۲️⃣ یادگیری تصویری
💬 پرامپت: «میتونی مفهوم [موضوع] رو بهصورت نمودار یا تصویر ساده توضیح بدی؟»
۳️⃣ نمونههای واقعی از کاربردها
💬 پرامپت: «چند مثال واقعی از کاربرد [موضوع] در صنعت یا زندگی روزمره بده.»
۴️⃣ آزمون کوتاه برای خودارزیابی
💬 پرامپت: «۵ سؤال سطح مقدماتی دربارهی [موضوع] ازم بپرس تا میزان درکم رو بسنجی.»
۵️⃣ توضیح با قیاس یا داستان
💬 پرامپت: «[موضوع] رو با استفاده از یک مثال ساده یا داستان توضیح بده.»
۶️⃣ مقایسهی مفاهیم مشابه
💬 پرامپت: «تفاوت بین [مفهوم A] و [مفهوم B] چیه؟ ساده برام توضیح بده.»
۷️⃣ راهنمای گامبهگام
💬 پرامپت: «یک راهنمای مرحلهبهمرحله برای انجام [کار یا پروژه] بنویس.»
۸️⃣ چکلیست مرور پیش از آزمون
💬 پرامپت: «یک فهرست از نکات کلیدی برای مرور قبل از مصاحبه یا آزمون [موضوع] بنویس.»
❤️ برای پستهای آموزشی بیشتر لایک کنید!
@rss_ai_ir
#یادگیری #ChatGPT #پرامپت #هوش_مصنوعی #آموزش #مطالعه
🤖 گوگل مدل جدیدی معرفی کرد: SOTA Computer Use بر پایهی Gemini 2.5 🚀
مدل جدید گوگل توانسته در بسیاری از بنچمارکهای اصلی، عملکردی بهمراتب بهتر از ChatGPT (Agent Mode) و حتی Claude Sonnet 4 / 4.5 داشته باشد — با تأخیر (latency) بسیار پایینتر.
📱 این مدل برای کار با وب و اپلیکیشنهای موبایل بهینه شده و در سیستمعاملهای دسکتاپ معمولی عملکرد متوسطی دارد.
🔍 درونمایه فنی:
در واقع، این نسخه نوعی نسخهی پیشرفته از tool use مدل Gemini 2.5 است.
در هر گام مدل، یک اسکرینشات از صفحه دریافت میکند و سپس با توابعی مثل clicking() یا typing() تعامل انجام میدهد.
🧠 ویژگیهای امنیتی کلیدی:
1️⃣ در system prompt میتوان مشخص کرد که کدام اقدامات نیاز به تأیید کاربر دارند.
2️⃣ یک ارزیاب خارجی خودکار هر مرحله را بهصورت مستقل بررسی میکند تا اگر مدل کاری غیرمنتظره انجام داد، هشدار بدهد.
🔸 مدل اکنون در حالت Public Preview از طریق API در دسترس است.
🔸 و شایعه شده که گوگل تا پایان همین هفته نسخهی بعدی یعنی Gemini 3.0 را نیز منتشر خواهد کرد 👀
@rss_ai_ir
#Google #Gemini #AIagents #LLM #هوش_مصنوعی #ChatGPT #Claude #ComputerUse #Automation
مدل جدید گوگل توانسته در بسیاری از بنچمارکهای اصلی، عملکردی بهمراتب بهتر از ChatGPT (Agent Mode) و حتی Claude Sonnet 4 / 4.5 داشته باشد — با تأخیر (latency) بسیار پایینتر.
📱 این مدل برای کار با وب و اپلیکیشنهای موبایل بهینه شده و در سیستمعاملهای دسکتاپ معمولی عملکرد متوسطی دارد.
🔍 درونمایه فنی:
در واقع، این نسخه نوعی نسخهی پیشرفته از tool use مدل Gemini 2.5 است.
در هر گام مدل، یک اسکرینشات از صفحه دریافت میکند و سپس با توابعی مثل clicking() یا typing() تعامل انجام میدهد.
🧠 ویژگیهای امنیتی کلیدی:
1️⃣ در system prompt میتوان مشخص کرد که کدام اقدامات نیاز به تأیید کاربر دارند.
2️⃣ یک ارزیاب خارجی خودکار هر مرحله را بهصورت مستقل بررسی میکند تا اگر مدل کاری غیرمنتظره انجام داد، هشدار بدهد.
🔸 مدل اکنون در حالت Public Preview از طریق API در دسترس است.
🔸 و شایعه شده که گوگل تا پایان همین هفته نسخهی بعدی یعنی Gemini 3.0 را نیز منتشر خواهد کرد 👀
@rss_ai_ir
#Google #Gemini #AIagents #LLM #هوش_مصنوعی #ChatGPT #Claude #ComputerUse #Automation
🛠️📊 ابزار Dev3000 برای لاگگیری توسعه با پشتیبانی هوش مصنوعی
✅ابزار Dev3000 یک ابزار نوآورانه است که کل تاریخچهی توسعهی وباپ شما را ثبت میکند — از لاگهای سرور و رویدادهای مرورگر گرفته تا اسکرینشاتهای خودکار.
این ابزار فرآیند دیباگ (رفع خطا) را بهشدت ساده میکند، چون به دستیارهای هوش مصنوعی مانند Claude اجازه میدهد همه دادهها را در یک محیط واحد تحلیل کنند 🤖
🚀 ویژگیهای کلیدی:
♻️ثبت کامل لاگها با مهر زمانی (Timestamp) برای دسترسی سریعتر.
♻️ایجاد اسکرینشات خودکار هنگام پیمایش یا بروز خطا.
♻️ادغام مستقیم با AI برای تحلیل و رفع خطا در لحظه.
♻️امکان فیلتر و جستجو در میان لاگها.
♻️رابط کاربری بصری و تمیز برای مشاهده و مرور لاگها.
📌 سورسکد در گیتهاب:
https://github.com/vercel-labs/dev3000
@rss_ai_ir
#هوش_مصنوعی #AItools #برنامه_نویسی #DevOps #Claude #دیباگ #توسعه_وب #Vercel
✅ابزار Dev3000 یک ابزار نوآورانه است که کل تاریخچهی توسعهی وباپ شما را ثبت میکند — از لاگهای سرور و رویدادهای مرورگر گرفته تا اسکرینشاتهای خودکار.
این ابزار فرآیند دیباگ (رفع خطا) را بهشدت ساده میکند، چون به دستیارهای هوش مصنوعی مانند Claude اجازه میدهد همه دادهها را در یک محیط واحد تحلیل کنند 🤖
🚀 ویژگیهای کلیدی:
♻️ثبت کامل لاگها با مهر زمانی (Timestamp) برای دسترسی سریعتر.
♻️ایجاد اسکرینشات خودکار هنگام پیمایش یا بروز خطا.
♻️ادغام مستقیم با AI برای تحلیل و رفع خطا در لحظه.
♻️امکان فیلتر و جستجو در میان لاگها.
♻️رابط کاربری بصری و تمیز برای مشاهده و مرور لاگها.
📌 سورسکد در گیتهاب:
https://github.com/vercel-labs/dev3000
@rss_ai_ir
#هوش_مصنوعی #AItools #برنامه_نویسی #DevOps #Claude #دیباگ #توسعه_وب #Vercel
This media is not supported in your browser
VIEW IN TELEGRAM
⚙️ اپلیکیشنهای Booking.com، Spotify و Figma به ChatGPT اضافه شدند! 🎯
🔹 حالا این اپها بهصورت ادغام بومی (Native Integration) در چت کار میکنند — بدون نیاز به نصب یا تغییر حالت.
🔹همچنین OpenAI همچنین از SDK جدید برای توسعهی اپهای چتمحور رونمایی کرده است تا برنامهنویسها بتوانند اپهای اختصاصی خود را بسازند.
🔹 در واقع، این نسخه جدیدی از سیستم «پلاگینها» است — اما پایدارتر و عمیقتر یکپارچه شده با محیط ChatGPT.
🔹 هنوز امکان درآمدزایی مستقیم فعال نشده، اما سم آلتمن وعده داده که «راههای مختلفی برای کسب درآمد» در آینده ارائه خواهد شد.
🔹 هنوز مشخص نیست برندها میتوانند برای نمایش بهتر یا اولویت بالاتر در نتایج چت، هزینه پرداخت کنند یا خیر.
بهعبارتی ساده، OpenAI دوباره دارد رویای پلاگینها را زنده میکند — این بار با امید به اینکه اپلیکیشنهای درون ChatGPT موفقتر از نسل قبلی پلاگینها عمل کنند 💬
@rss_ai_ir
#ChatGPT #OpenAI #AIapps #Spotify #Figma #Booking #هوش_مصنوعی #پلاگین #SDK
🔹 حالا این اپها بهصورت ادغام بومی (Native Integration) در چت کار میکنند — بدون نیاز به نصب یا تغییر حالت.
🔹همچنین OpenAI همچنین از SDK جدید برای توسعهی اپهای چتمحور رونمایی کرده است تا برنامهنویسها بتوانند اپهای اختصاصی خود را بسازند.
🔹 در واقع، این نسخه جدیدی از سیستم «پلاگینها» است — اما پایدارتر و عمیقتر یکپارچه شده با محیط ChatGPT.
🔹 هنوز امکان درآمدزایی مستقیم فعال نشده، اما سم آلتمن وعده داده که «راههای مختلفی برای کسب درآمد» در آینده ارائه خواهد شد.
🔹 هنوز مشخص نیست برندها میتوانند برای نمایش بهتر یا اولویت بالاتر در نتایج چت، هزینه پرداخت کنند یا خیر.
بهعبارتی ساده، OpenAI دوباره دارد رویای پلاگینها را زنده میکند — این بار با امید به اینکه اپلیکیشنهای درون ChatGPT موفقتر از نسل قبلی پلاگینها عمل کنند 💬
@rss_ai_ir
#ChatGPT #OpenAI #AIapps #Spotify #Figma #Booking #هوش_مصنوعی #پلاگین #SDK
This media is not supported in your browser
VIEW IN TELEGRAM
این پرامپت یکی از حرفهایترین نمونههای پرامپتنویسی برای Sora یا هر مدل ویدیوژنراتور فوتورئالیستیک است 🎬
🎥 پرامپت برای تولید ویدیوی واقعی (Photoreal Live-Action)
🎬 نوع شات:
یک برداشت (single take)، بدون هیچ برش یا تغییر زاویه (NO CUTS).
سرعت: 24 فریم در ثانیه با motion blur طبیعی (شاتر 180 درجه).
دوربین روی گیمبال بهصورت dolly به عقب حرکت میکند با لرزش بسیار جزئی (کمتر از ۱٫۵٪).
📷 قاببندی:
مدیوم شات (از سینه به بالا)، شخصیت در مرکز قاب و اندازهاش در کل ویدیو ثابت میماند.
🎞️ لنز و فوکوس:
لنز کروی (spherical) معادل 28–35mm
عمق میدان کم (DOF کم) — چشمها شارپ، پسزمینه مات با بوکه طبیعی و وینیت ملایم.
💡 نورپردازی و رنگ:
نور طبیعی روز با نوری نرم از بالای برگها.
رنگ پوست گرم و طبیعی، grain سینمایی ملایم، بدون افکت کارتونی یا خطوط طراحی.
---
🌳 مفهوم (Concept):
مردی از در خانه تا سطل زباله راه میرود.
در طول یک برداشت، پسزمینه در حالیکه او حرکت میکند تغییر میکند — فصلها، آبوهوا و تزئینات خانهها عوض میشوند، طوری که انگار یک سال در یک ویدیو فشرده شده است، اما حرکت کاملاً واقعی باقی میماند.
👤 ویژگی شخصیت اصلی:
مردی در حدود ۳۰ ساله، موهای نارنجی کوتاه، ککومک، حلقهی کوچک در گوش، زنجیر طلایی، کت جین و تیشرت ساده. چهرهاش باید در کل ویدیو یکسان بماند.
👥 شخصیتهای فرعی (همسایهها):
زن ورزشکار با موهای تیره و تیشرت صورتی، متین و خوشبرخورد.
مدیر خودخواه با کت ارزان و کارت شناسایی دور گردن.
---
🧩 تغییرات پیوسته (Continuity Rules):
از ثانیه 2.6 تا 4.6 لباس آبی ورزشی Adidas بپوشد، سپس به لباس قبلی برگردد.
در ثانیه ~4.9 تغییر مو: یا رنگ آبی روشن یا تراشیده کامل. بعد مو بهتدریج رشد کند.
در ثانیه ~7.6 کبودی زیر چشم ظاهر شود و تا 8.6 کاملاً از بین برود.
---
🌦️ تحول پسزمینه (Background Evolution):
هر چند فریم یکبار پسزمینه کمی تغییر کند:
درختان برگدار → بدون برگ، آفتاب → باران → باد → برف سبک، چراغهای کریسمس، چترها، آبجمعشده روی زمین.
اما مسیر و زاویه دوربین ثابت بماند.
---
⏱️ طرح کلی زمان (Timeline):
0.0–2.4s :
معرفی صحنه با نور تابستانی و لرزش برگها
2.4–4.8s :
لباس آبی ورزشی، تغییر فصول در پسزمینه
4.8–7.2s :
تغییر ناگهانی مو، حس صبح بعد از مهمانی
7.2–9.6s :
کبودی چشم و برف/باران، حضور مدیر
9.6–12.0s :
رسیدن به سطل زباله و پرتاب اشتباه زباله (چند سانتیمتر خطا)، فریز روی چهرهی بیاحساس
---
🎧 صدا (Audio):
موسیقی تنشزا بدون ملودی که بهتدریج اوج میگیرد (Rising suspense bed).
صداهای محیطی واقعی مثل باران، باد و قدمها.
در انتها بدون افکت خاص یا موسیقی پایانی (خشک تمام شود).
---
🚫 قوانین سخت (Hard Constraints):
بدون برش، بدون تایملپس، بدون تغییر سرعت یا فریز.
هویت شخصیتها باید ثابت بماند.
هیچ سبک کارتونی، low-poly یا کمیکی مجاز نیست.
🎥 پرامپت برای تولید ویدیوی واقعی (Photoreal Live-Action)
🎬 نوع شات:
یک برداشت (single take)، بدون هیچ برش یا تغییر زاویه (NO CUTS).
سرعت: 24 فریم در ثانیه با motion blur طبیعی (شاتر 180 درجه).
دوربین روی گیمبال بهصورت dolly به عقب حرکت میکند با لرزش بسیار جزئی (کمتر از ۱٫۵٪).
📷 قاببندی:
مدیوم شات (از سینه به بالا)، شخصیت در مرکز قاب و اندازهاش در کل ویدیو ثابت میماند.
🎞️ لنز و فوکوس:
لنز کروی (spherical) معادل 28–35mm
عمق میدان کم (DOF کم) — چشمها شارپ، پسزمینه مات با بوکه طبیعی و وینیت ملایم.
💡 نورپردازی و رنگ:
نور طبیعی روز با نوری نرم از بالای برگها.
رنگ پوست گرم و طبیعی، grain سینمایی ملایم، بدون افکت کارتونی یا خطوط طراحی.
---
🌳 مفهوم (Concept):
مردی از در خانه تا سطل زباله راه میرود.
در طول یک برداشت، پسزمینه در حالیکه او حرکت میکند تغییر میکند — فصلها، آبوهوا و تزئینات خانهها عوض میشوند، طوری که انگار یک سال در یک ویدیو فشرده شده است، اما حرکت کاملاً واقعی باقی میماند.
👤 ویژگی شخصیت اصلی:
مردی در حدود ۳۰ ساله، موهای نارنجی کوتاه، ککومک، حلقهی کوچک در گوش، زنجیر طلایی، کت جین و تیشرت ساده. چهرهاش باید در کل ویدیو یکسان بماند.
👥 شخصیتهای فرعی (همسایهها):
زن ورزشکار با موهای تیره و تیشرت صورتی، متین و خوشبرخورد.
مدیر خودخواه با کت ارزان و کارت شناسایی دور گردن.
---
🧩 تغییرات پیوسته (Continuity Rules):
از ثانیه 2.6 تا 4.6 لباس آبی ورزشی Adidas بپوشد، سپس به لباس قبلی برگردد.
در ثانیه ~4.9 تغییر مو: یا رنگ آبی روشن یا تراشیده کامل. بعد مو بهتدریج رشد کند.
در ثانیه ~7.6 کبودی زیر چشم ظاهر شود و تا 8.6 کاملاً از بین برود.
---
🌦️ تحول پسزمینه (Background Evolution):
هر چند فریم یکبار پسزمینه کمی تغییر کند:
درختان برگدار → بدون برگ، آفتاب → باران → باد → برف سبک، چراغهای کریسمس، چترها، آبجمعشده روی زمین.
اما مسیر و زاویه دوربین ثابت بماند.
---
⏱️ طرح کلی زمان (Timeline):
0.0–2.4s :
معرفی صحنه با نور تابستانی و لرزش برگها
2.4–4.8s :
لباس آبی ورزشی، تغییر فصول در پسزمینه
4.8–7.2s :
تغییر ناگهانی مو، حس صبح بعد از مهمانی
7.2–9.6s :
کبودی چشم و برف/باران، حضور مدیر
9.6–12.0s :
رسیدن به سطل زباله و پرتاب اشتباه زباله (چند سانتیمتر خطا)، فریز روی چهرهی بیاحساس
---
🎧 صدا (Audio):
موسیقی تنشزا بدون ملودی که بهتدریج اوج میگیرد (Rising suspense bed).
صداهای محیطی واقعی مثل باران، باد و قدمها.
در انتها بدون افکت خاص یا موسیقی پایانی (خشک تمام شود).
---
🚫 قوانین سخت (Hard Constraints):
بدون برش، بدون تایملپس، بدون تغییر سرعت یا فریز.
هویت شخصیتها باید ثابت بماند.
هیچ سبک کارتونی، low-poly یا کمیکی مجاز نیست.
👍5🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتهای انساننما حالا میتوانند پشتک بزنند!
بله، درست خواندی — رباتهای انساننما حالا نهتنها راه میروند و حرف میزنند، بلکه حرکات آکروباتیک مثل والفلیپ (پشتک از دیوار) را هم انجام میدهند 😳
این یعنی کنترل تعادل، درک محیط و هماهنگی عضلانی مصنوعی به سطحی رسیده که از نظر فیزیکی با انسان رقابت میکند.
حرکت بعدی؟ شاید پارکور یا رقابتهای المپیکی مخصوص رباتها! 🏃♂️🤸♀️
@rss_ai_ir
#ربات #هوش_مصنوعی #Humanoid #AIrobots #پارکور #رباتیک #AI #Robotics #FigureAI #BostonDynamics #FutureTech #AIfuture
بله، درست خواندی — رباتهای انساننما حالا نهتنها راه میروند و حرف میزنند، بلکه حرکات آکروباتیک مثل والفلیپ (پشتک از دیوار) را هم انجام میدهند 😳
این یعنی کنترل تعادل، درک محیط و هماهنگی عضلانی مصنوعی به سطحی رسیده که از نظر فیزیکی با انسان رقابت میکند.
حرکت بعدی؟ شاید پارکور یا رقابتهای المپیکی مخصوص رباتها! 🏃♂️🤸♀️
@rss_ai_ir
#ربات #هوش_مصنوعی #Humanoid #AIrobots #پارکور #رباتیک #AI #Robotics #FigureAI #BostonDynamics #FutureTech #AIfuture
👏1🤯1😱1🙏1