AgentNexus
343 subscribers
72 photos
34 videos
15 files
177 links
اینجا در مورد ایجنت های هوش مصنوعی و موج پنج تکنولوژی مینویسیم .
Download Telegram
Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI

در این ویدئو Laurence Moroney دربارهٔ بازار کار و توصیه‌های شغلی صحبت می‌کند.

لارنس :
بنابراین مهم‌ترین توصیهٔ من این است: بسازید!
درس بخوانید، اما حتماً پروژه بسازید و آن‌ها را به دیگران نشان دهید.

امروز تصمیم‌گیری دربارهٔ این است که چه چیزی باید ساخته شود.

مهندسانی که بتوانند هم کدنویسی کنند و هم با کاربران صحبت کنند و نیازها را بفهمند، سریع‌ترین افراد در سیلیکون‌ولی هستند.
اگر مثل من حوصله ی دیدن این ویدیوی ۲ ساعته رو ندارید، پس متن زیر که خلاصه ش هست رو بخونید . 👇👇👇
این ویدیو مربوط به یکی از جلسات درس CS230 دانشگاه استنفورد (پاییز ۲۰۲۵) است که در آن اندرو ان‌جی (Andrew Ng) و لارنس مورونی (Lawrence Moroni) توصیه‌های بسیار مهم و کاربردی برای موفقیت در حوزه هوش مصنوعی (AI) ارائه می‌دهند.

🔰خلاصه ویدیو به گونه‌ای که انگار تمام آن را دیده‌اید، به شرح زیر است:

۱. عصر طلایی ساخت‌وساز (اندرو ان‌جی)
سرعت سرسام‌آور پیشرفت: اندرو معتقد است الان بهترین زمان برای ورود به حوزه AI است. او به تحقیقی اشاره می‌کند که نشان می‌دهد پیچیدگی کارهایی که AI می‌تواند انجام دهد، هر ۷ ماه دو برابر می‌شود [۰۰:۰۲:۰۳].

تغییر در برنامه‌نویسی: ابزارهای برنامه‌نویسی با هوش مصنوعی (مثل Cursor یا نسخه‌های جدید Gemini و GPT) باعث شده‌اند که سرعت توسعه نرم‌افزار به شدت بالا برود [۰۰:۰۴:۵۵].

گلوگاه جدید (مدیریت محصول): چون نوشتن کد آسان شده، حالا سخت‌ترین بخش کار این است که بدانیم چه چیزی بسازیم. اندرو توصیه می‌کند مهندسان باید مهارت‌های مدیریت محصول و همدلی با کاربر را یاد بگیرند تا بتوانند مستقیماً با بازخورد کاربران محصول را سریع‌تر پیش ببرند [۰۰:۰۷:۱۷].

۲. واقعیت‌های بازار کار (لارنس مورونی)
تغییر از "باحال بودن" به "کاربردی بودن": لارنس توضیح می‌دهد که دوره "استخدام هر کسی که کلمه AI در رزومه دارد" تمام شده است. شرکت‌ها حالا به دنبال خروجی تجاری (Business Value) و محصولاتی هستند که در محیط واقعی (Production) کار کنند [۰۰:۳۶:۱۱].

سه ستون موفقیت:

درک عمیق: دانش آکادمیک و توانایی خواندن مقالات علمی [۰۰:۳۰:۴۷].

تمرکز تجاری: درک اینکه هوش مصنوعی چگونه به سودآوری شرکت کمک می‌کند [۰۰:۳۱:۱۸].

تمایل به اجرا (Delivery): توانایی تبدیل ایده‌های انتزاعی به محصولات واقعی [۰۰:۳۵:۲۸].

۳. مفهوم "بدهی فنی" در عصر هوش مصنوعی
لارنس هشدار می‌دهد که تولید کد با AI رایگان است، اما نگهداری آن خیر. او از مفهوم بدهی فنی (Technical Debt) استفاده می‌کند و می‌گوید کدی که AI تولید می‌کند و کسی آن را نمی‌فهمد، مانند خرید با کارت اعتباری با بهره بالاست [۰۰:۵۱:۰۳].

توصیه او این است که از AI برای ساختن "رهن مسکن" (بدهی خوب که ارزش ایجاد می‌کند) استفاده کنید، نه "خریدهای بیهوده" [۰۰:۵۲:۰۸].

۴. آینده هوش مصنوعی: بزرگ در مقابل کوچک
دوشاخه شدن مسیر: لارنس پیش‌بینی می‌کند که صنعت به دو سمت می‌رود: مدل‌های غول‌آسا (مثل GPT-5) و مدل‌های کوچک و تخصصی که شرکت‌ها خودشان میزبان آن هستند (Self-hosted) [۰۱:۱۵:۰۲].

فرصت در مدل‌های کوچک: مهارت‌هایی مثل Fine-tuning (تنظیم دقیق) مدل‌های کوچک برای کارهای خاص (مثل تحلیل قراردادهای حقوقی یا تصاویر پزشکی) در آینده بسیار پرتقاضا خواهند بود [۰۱:۱۶:۱۸].

۵. توصیه‌های کلیدی برای مصاحبه و محیط کار
شبکه‌سازی: اندرو تاکید می‌کند که افراد اطراف شما (دوستان و همکاران) بیشترین تاثیر را روی سرعت یادگیری و موفقیت شما دارند [۰۰:۰۹:۲۷].

رفتار حرفه‌ای: لارنس داستانی از یک مهندس نابغه تعریف می‌کند که ۳۰۰ مصاحبه را به خاطر رفتار خشک و "تدافعی" رد شد. او تاکید می‌کند که شرکت‌ها به دنبال "کار تیمی" هستند، نه فقط هوش فنی [۰۰:۲۱:۰۲].

📍نکته نهایی: هر دو سخنران تاکید دارند که نباید فریب "هایپ" و جنجال‌های شبکه‌های اجتماعی را خورد. به جای دنبال کردن اخبار زرد AI، باید روی حل مسائل واقعی و ایجاد ارزش برای کسب‌وکارها تمرکز کرد [۰۱:۰۶:۵۸].
📍نظریه ی هزینه ی نهایی صفر با ایجنت های هوش مصنوعی به واقعیت تبدیل میشه. 🫡
🔥1
با ویژگی جدید chat gpt که امروز اضافه شده، میتونید هر نرم افزاری رو به هوش مصنوعی اضافه کنید، اهداف اینکار برای کاربر میتونه از خوندن داده های نرم افزار تا اقدام در نرم افزار از طریق هوش مصنوعی و.... باشه.
AgentNexus
با ویژگی جدید chat gpt که امروز اضافه شده، میتونید هر نرم افزاری رو به هوش مصنوعی اضافه کنید، اهداف اینکار برای کاربر میتونه از خوندن داده های نرم افزار تا اقدام در نرم افزار از طریق هوش مصنوعی و.... باشه.
‼️بسیاری از نرم‌افزارهای اشتراکی (SaaS) که کارهای ساده انجام می‌دهند (مثل ابزارهای تبدیل فرمت فایل یا تحلیل‌های ساده آماری)، احتمالاً حذف یا با هوش مصنوعی ادغام می‌شوند. وقتی هوش مصنوعی می‌تواند مستقیماً با دیتابیس صحبت کند (Direct Database Interaction)، دیگر نیازی به لایه‌های میانی نرم‌افزارهای سنتی نیست.
🔥1
دقایقی پیش، مدل ایجنت محور GPT‑5.2-Codex معرفی و در دسترس قرار گرفت.


https://openai.com/index/introducing-gpt-5-2-codex/
اکستنشن claude در مرورگر chrome که امروز‌ ریلیز شده رو اضافه کنید. به صورت sidebar باز میشه.

دسترسی read/write به همه تب‌ها به صورت همزمان داره و می تونه کد JavaScript در صفحات مرورگر تون اجرا کنه.

⚠️ و البته که صدها استارت آپ با همین اکستشن کشته شدن. خدا رحمتشون کنه ✋🏻


https://support.claude.com/en/articles/12012173-getting-started-with-claude-in-chrome
♾️دیروز ایجنتی متن باز معرفی شده که از انقلاب در ایجنت ها چیزی کم نداره، چندتا از مفاهیمی که آورده رو اینجا میزارم :

۱. معماری ماژولار «هسته استاندارد» (Standardized Core)
در اکثر فریم‌ورک‌ها (مثل AutoGPT)، ایجنت یک توده‌ی درهم‌تنیده از کد و پرامپت است. Shachi مفهوم جداسازی کاملِ توانایی‌های شناختی را معرفی می‌کند:

LLM به مثابه پردازنده: مدل زبانی فقط نقش موتور استدلال را دارد.

حافظه به مثابه دیتابیس: حافظه یک بخش کاملاً مستقل است که می‌تواند بین ایجنت‌های مختلف جابه‌جا شود.

پروفایل (Traits): ویژگی‌های شخصیتی ایجنت به صورت متغیرهای کمی (مثل میزان ریسک‌پذیری) تعریف می‌شوند که روی استدلال تاثیر می‌گذارند.

۲. مفهوم «تناسخ ایجنت» 😳(Agent Reincarnation)

این یکی از عجیب‌ترین و جدیدترین مفاهیم Shachi است. در شبیه‌سازی‌های معمولی، وقتی یک سناریو تمام می‌شود، ایجنت پاک می‌شود. اما در Shachi:

ایجنت می‌تواند در یک محیط (مثلاً قرون وسطی) زندگی کند، تجربیات کسب کند، و سپس با حفظ آن تجربه‌ها در محیط دیگری (مثلاً دنیای مدرن) «متولد» شود.

این مفهوم برای مطالعه انتقال دانش و تجربه در هوش مصنوعی استفاده می‌شود.

۳. شبیه‌سازی «اعتبار خارجی» (External Validity Simulation)

برخلاف ایجنت‌های چت که هدفشان راضی کردن کاربر است، Shachi مفهوم انطباق با واقعیت آماری را دنبال می‌کند.

هدف این نیست که ایجنت حرف‌های قشنگ بزند؛ هدف این است که اگر به ۱۰۰ ایجنت بگوییم «قیمت بنزین گران شد»، واکنش جمعی آن‌ها دقیقاً مشابه واکنش واقعی مردم در جامعه باشد.

این مفهوم ایجنت را از یک «دستیار» به یک «مدل آزمایشگاهی برای پیش‌بینی آینده» تبدیل می‌کند.

۴. حکمرانی و تعاملات چندلایه (Multi-layer Interaction)

در Shachi، مفهوم «محیط به مثابه داور» بسیار جدی است. ایجنت‌ها مستقیماً با هم حرف نمی‌زنند، بلکه از طریق یک محیط واسط (Environment) بر هم اثر می‌گذارند.

این کار باعث می‌شود پدیده‌های «ظهوریافته» (Emergent Behaviors) مثل تشکیل بازار سیاه، تورم یا شورش‌های اجتماعی که در سیستم‌های ساده قابل برنامه‌نویسی نیستند، به صورت خودبه‌خودی در سیستم ظاهر شوند.

۵. ارزیابی از طریق «تست‌های تورینگ جمعی»
به جای اینکه بپرسند «آیا این ایجنت هوشمند است؟»، Shachi مفهوم جدیدی را مطرح می‌کند: «آیا رفتار جمعی این ایجنت‌ها با داده‌های تاریخی همخوانی دارد؟»


آن‌ها سناریوهای واقعی (مثل جنگ‌های تجاری) را به ایجنت‌ها می‌دهند و خروجی را با واقعیت تاریخ مقایسه می‌کنند تا دقت «شخصیت‌پردازی» ایجنت را بسنجند.

۶. زندگی در جهان های موازی😳(Living in Multiple Worlds) :
بررسی اینکه یک ایجنت اگر همزمان در چندین سناریوی مختلف باشد، چگونه تصمیم می‌گیرد.


مخزن این ایجنت 👇👇👇

https://github.com/SakanaAI/shachi/
AgentNexus
♾️دیروز ایجنتی متن باز معرفی شده که از انقلاب در ایجنت ها چیزی کم نداره، چندتا از مفاهیمی که آورده رو اینجا میزارم : ۱. معماری ماژولار «هسته استاندارد» (Standardized Core) در اکثر فریم‌ورک‌ها (مثل AutoGPT)، ایجنت یک توده‌ی درهم‌تنیده از کد و پرامپت است.…
📝نظر ادمین : ایجنت های قبل از این رو فراموش کنید، مفاهیمی که اینجا معرفی شده پایه های ایجنت هایی هستند که پیچیده ترین سیستم ها رو با هزینه ی خیلی پایین و دقت بالا در سریعترین زمان ممکن پیشبینی میکنند و مرزهای علم رو جابجا میکنند.
📢شرکت Anthropic استاندارد Agent Skills را باز منتشر کرد.

شرکت Anthropic چارچوب Agent Skills را به صورت استاندارد باز (open standard) منتشر کرد که اجازه می‌ده ایجنت‌ها مهارت‌های تخصصی رو به اشتراک بذارن و در پلتفرم‌های مختلف (مثل Microsoft، OpenAI و Atlassian) استفاده بشن.

این حرکت رقابت رو شدیدتر می‌کنه و به سمت اکوسیستم باز ایجنت‌ها می‌ره.
مدل جدید ویرایش عکس شرکت علی بابا به اسم منتشر شد.
مدل جدید ویرایش عکس شرکت علی بابا به اسم Qwen-Image-Layered منتشر شد.


۱. قابلیت اصلی: تجزیه تصویر به لایه‌ها (Layered Decomposition)
مهم‌ترین ویژگی این مدل این است که می‌تواند یک تصویر تخت (مثل یک عکس معمولی JPG) را بگیرد و آن را به چندین لایه مجزا با فرمت RGBA (لایه همراه با شفافیت یا Transparency) تبدیل کند. چیزی شبیه به لایه‌هایی که در فتوشاپ می‌بینیم، اما به صورت کاملاً خودکار.

۲. ویرایش‌پذیری بالا (Inherent Editability)
وقتی یک تصویر به لایه‌های مختلف (مثلاً سوژه، پس‌زمینه، متن و اشیاء دیگر) تقسیم می‌شود، شما می‌توانید:


تغییر رنگ: بدون دست خوردن به بقیه تصویر، فقط رنگ لباس یک نفر یا رنگ یک شیء خاص را تغییر دهید.

تغییر مکان و اندازه: یک شیء را در تصویر جابجا کنید یا اندازه آن را بدون دفرمه شدن بقیه تصویر تغییر دهید.

حذف و جایگزینی:
یک لایه را کلاً حذف کنید (مدل جای خالی آن را در لایه پشتی پر می‌کند) یا آن را با چیز دیگری جایگزین کنید.

۳. ویژگی‌های فنی متمایز
تعداد لایه‌های متغیر:
برخلاف مدل‌های قبلی، این مدل محدود به تعداد لایه خاصی نیست و می‌تواند بسته به پیچیدگی تصویر، آن را به ۳ تا ۸ لایه یا بیشتر تقسیم کند.

تجزیه بازگشتی (Recursive Decomposition): شما می‌توانید یکی از لایه‌های تولید شده را دوباره به مدل بدهید تا آن را هم به قطعات ریزتر تقسیم کند (مثلاً یک لایه «انسان» را به لایه‌های «لباس»، «چهره» و غیره تقسیم کند).

حفظ ثبات: چون ویرایش فقط روی یک لایه فیزیکی انجام می‌شود، بقیه بخش‌های تصویر کاملاً ثابت می‌مانند و مشکلاتی مثل بهم ریختگی پس‌زمینه هنگام ویرایش سوژه پیش نمی‌آید.

۴. کاربردها
صنعت طراحی:
طراحان می‌توانند تصاویر ساخته شده توسط هوش مصنوعی را به راحتی به فایل‌های قابل ویرایش (مثل خروجی برای فتوشاپ یا حتی پاورپوینت) تبدیل کنند.

تولید محتوا: تغییر سریع المان‌های یک پوستر یا عکس تبلیغاتی بدون نیاز به بازطراحی کامل.
نمونه های کار با این مدل
This media is not supported in your browser
VIEW IN TELEGRAM
رباتیک Vibe Coding بخش ۳

یک شبیه‌سازی ساختم که در آن دو ربات برای انجام یک کار با هم همکاری می‌کنند.
طراحی با Nano Banana Pro، ساخته شده با Gemini 3