Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI
در این ویدئو Laurence Moroney دربارهٔ بازار کار و توصیههای شغلی صحبت میکند.
لارنس :
بنابراین مهمترین توصیهٔ من این است: بسازید!
درس بخوانید، اما حتماً پروژه بسازید و آنها را به دیگران نشان دهید.
امروز تصمیمگیری دربارهٔ این است که چه چیزی باید ساخته شود.
مهندسانی که بتوانند هم کدنویسی کنند و هم با کاربران صحبت کنند و نیازها را بفهمند، سریعترین افراد در سیلیکونولی هستند.
در این ویدئو Laurence Moroney دربارهٔ بازار کار و توصیههای شغلی صحبت میکند.
لارنس :
بنابراین مهمترین توصیهٔ من این است: بسازید!
درس بخوانید، اما حتماً پروژه بسازید و آنها را به دیگران نشان دهید.
امروز تصمیمگیری دربارهٔ این است که چه چیزی باید ساخته شود.
مهندسانی که بتوانند هم کدنویسی کنند و هم با کاربران صحبت کنند و نیازها را بفهمند، سریعترین افراد در سیلیکونولی هستند.
YouTube
Stanford CS230 | Autumn 2025 | Lecture 9: Career Advice in AI
For more information about Stanford’s Artificial Intelligence professional and graduate programs, visit: https://stanford.io/ai
November 18, 2025
This lecture covers career advice and a guest speaker.
To learn more about enrolling in this course, visit:…
November 18, 2025
This lecture covers career advice and a guest speaker.
To learn more about enrolling in this course, visit:…
اگر مثل من حوصله ی دیدن این ویدیوی ۲ ساعته رو ندارید، پس متن زیر که خلاصه ش هست رو بخونید . 👇👇👇
✅این ویدیو مربوط به یکی از جلسات درس CS230 دانشگاه استنفورد (پاییز ۲۰۲۵) است که در آن اندرو انجی (Andrew Ng) و لارنس مورونی (Lawrence Moroni) توصیههای بسیار مهم و کاربردی برای موفقیت در حوزه هوش مصنوعی (AI) ارائه میدهند.
🔰خلاصه ویدیو به گونهای که انگار تمام آن را دیدهاید، به شرح زیر است:
۱. عصر طلایی ساختوساز (اندرو انجی)
سرعت سرسامآور پیشرفت: اندرو معتقد است الان بهترین زمان برای ورود به حوزه AI است. او به تحقیقی اشاره میکند که نشان میدهد پیچیدگی کارهایی که AI میتواند انجام دهد، هر ۷ ماه دو برابر میشود [۰۰:۰۲:۰۳].
تغییر در برنامهنویسی: ابزارهای برنامهنویسی با هوش مصنوعی (مثل Cursor یا نسخههای جدید Gemini و GPT) باعث شدهاند که سرعت توسعه نرمافزار به شدت بالا برود [۰۰:۰۴:۵۵].
گلوگاه جدید (مدیریت محصول): چون نوشتن کد آسان شده، حالا سختترین بخش کار این است که بدانیم چه چیزی بسازیم. اندرو توصیه میکند مهندسان باید مهارتهای مدیریت محصول و همدلی با کاربر را یاد بگیرند تا بتوانند مستقیماً با بازخورد کاربران محصول را سریعتر پیش ببرند [۰۰:۰۷:۱۷].
۲. واقعیتهای بازار کار (لارنس مورونی)
تغییر از "باحال بودن" به "کاربردی بودن": لارنس توضیح میدهد که دوره "استخدام هر کسی که کلمه AI در رزومه دارد" تمام شده است. شرکتها حالا به دنبال خروجی تجاری (Business Value) و محصولاتی هستند که در محیط واقعی (Production) کار کنند [۰۰:۳۶:۱۱].
سه ستون موفقیت:
درک عمیق: دانش آکادمیک و توانایی خواندن مقالات علمی [۰۰:۳۰:۴۷].
تمرکز تجاری: درک اینکه هوش مصنوعی چگونه به سودآوری شرکت کمک میکند [۰۰:۳۱:۱۸].
تمایل به اجرا (Delivery): توانایی تبدیل ایدههای انتزاعی به محصولات واقعی [۰۰:۳۵:۲۸].
۳. مفهوم "بدهی فنی" در عصر هوش مصنوعی
لارنس هشدار میدهد که تولید کد با AI رایگان است، اما نگهداری آن خیر. او از مفهوم بدهی فنی (Technical Debt) استفاده میکند و میگوید کدی که AI تولید میکند و کسی آن را نمیفهمد، مانند خرید با کارت اعتباری با بهره بالاست [۰۰:۵۱:۰۳].
توصیه او این است که از AI برای ساختن "رهن مسکن" (بدهی خوب که ارزش ایجاد میکند) استفاده کنید، نه "خریدهای بیهوده" [۰۰:۵۲:۰۸].
۴. آینده هوش مصنوعی: بزرگ در مقابل کوچک
دوشاخه شدن مسیر: لارنس پیشبینی میکند که صنعت به دو سمت میرود: مدلهای غولآسا (مثل GPT-5) و مدلهای کوچک و تخصصی که شرکتها خودشان میزبان آن هستند (Self-hosted) [۰۱:۱۵:۰۲].
فرصت در مدلهای کوچک: مهارتهایی مثل Fine-tuning (تنظیم دقیق) مدلهای کوچک برای کارهای خاص (مثل تحلیل قراردادهای حقوقی یا تصاویر پزشکی) در آینده بسیار پرتقاضا خواهند بود [۰۱:۱۶:۱۸].
۵. توصیههای کلیدی برای مصاحبه و محیط کار
شبکهسازی: اندرو تاکید میکند که افراد اطراف شما (دوستان و همکاران) بیشترین تاثیر را روی سرعت یادگیری و موفقیت شما دارند [۰۰:۰۹:۲۷].
رفتار حرفهای: لارنس داستانی از یک مهندس نابغه تعریف میکند که ۳۰۰ مصاحبه را به خاطر رفتار خشک و "تدافعی" رد شد. او تاکید میکند که شرکتها به دنبال "کار تیمی" هستند، نه فقط هوش فنی [۰۰:۲۱:۰۲].
📍نکته نهایی: هر دو سخنران تاکید دارند که نباید فریب "هایپ" و جنجالهای شبکههای اجتماعی را خورد. به جای دنبال کردن اخبار زرد AI، باید روی حل مسائل واقعی و ایجاد ارزش برای کسبوکارها تمرکز کرد [۰۱:۰۶:۵۸].
🔰خلاصه ویدیو به گونهای که انگار تمام آن را دیدهاید، به شرح زیر است:
۱. عصر طلایی ساختوساز (اندرو انجی)
سرعت سرسامآور پیشرفت: اندرو معتقد است الان بهترین زمان برای ورود به حوزه AI است. او به تحقیقی اشاره میکند که نشان میدهد پیچیدگی کارهایی که AI میتواند انجام دهد، هر ۷ ماه دو برابر میشود [۰۰:۰۲:۰۳].
تغییر در برنامهنویسی: ابزارهای برنامهنویسی با هوش مصنوعی (مثل Cursor یا نسخههای جدید Gemini و GPT) باعث شدهاند که سرعت توسعه نرمافزار به شدت بالا برود [۰۰:۰۴:۵۵].
گلوگاه جدید (مدیریت محصول): چون نوشتن کد آسان شده، حالا سختترین بخش کار این است که بدانیم چه چیزی بسازیم. اندرو توصیه میکند مهندسان باید مهارتهای مدیریت محصول و همدلی با کاربر را یاد بگیرند تا بتوانند مستقیماً با بازخورد کاربران محصول را سریعتر پیش ببرند [۰۰:۰۷:۱۷].
۲. واقعیتهای بازار کار (لارنس مورونی)
تغییر از "باحال بودن" به "کاربردی بودن": لارنس توضیح میدهد که دوره "استخدام هر کسی که کلمه AI در رزومه دارد" تمام شده است. شرکتها حالا به دنبال خروجی تجاری (Business Value) و محصولاتی هستند که در محیط واقعی (Production) کار کنند [۰۰:۳۶:۱۱].
سه ستون موفقیت:
درک عمیق: دانش آکادمیک و توانایی خواندن مقالات علمی [۰۰:۳۰:۴۷].
تمرکز تجاری: درک اینکه هوش مصنوعی چگونه به سودآوری شرکت کمک میکند [۰۰:۳۱:۱۸].
تمایل به اجرا (Delivery): توانایی تبدیل ایدههای انتزاعی به محصولات واقعی [۰۰:۳۵:۲۸].
۳. مفهوم "بدهی فنی" در عصر هوش مصنوعی
لارنس هشدار میدهد که تولید کد با AI رایگان است، اما نگهداری آن خیر. او از مفهوم بدهی فنی (Technical Debt) استفاده میکند و میگوید کدی که AI تولید میکند و کسی آن را نمیفهمد، مانند خرید با کارت اعتباری با بهره بالاست [۰۰:۵۱:۰۳].
توصیه او این است که از AI برای ساختن "رهن مسکن" (بدهی خوب که ارزش ایجاد میکند) استفاده کنید، نه "خریدهای بیهوده" [۰۰:۵۲:۰۸].
۴. آینده هوش مصنوعی: بزرگ در مقابل کوچک
دوشاخه شدن مسیر: لارنس پیشبینی میکند که صنعت به دو سمت میرود: مدلهای غولآسا (مثل GPT-5) و مدلهای کوچک و تخصصی که شرکتها خودشان میزبان آن هستند (Self-hosted) [۰۱:۱۵:۰۲].
فرصت در مدلهای کوچک: مهارتهایی مثل Fine-tuning (تنظیم دقیق) مدلهای کوچک برای کارهای خاص (مثل تحلیل قراردادهای حقوقی یا تصاویر پزشکی) در آینده بسیار پرتقاضا خواهند بود [۰۱:۱۶:۱۸].
۵. توصیههای کلیدی برای مصاحبه و محیط کار
شبکهسازی: اندرو تاکید میکند که افراد اطراف شما (دوستان و همکاران) بیشترین تاثیر را روی سرعت یادگیری و موفقیت شما دارند [۰۰:۰۹:۲۷].
رفتار حرفهای: لارنس داستانی از یک مهندس نابغه تعریف میکند که ۳۰۰ مصاحبه را به خاطر رفتار خشک و "تدافعی" رد شد. او تاکید میکند که شرکتها به دنبال "کار تیمی" هستند، نه فقط هوش فنی [۰۰:۲۱:۰۲].
📍نکته نهایی: هر دو سخنران تاکید دارند که نباید فریب "هایپ" و جنجالهای شبکههای اجتماعی را خورد. به جای دنبال کردن اخبار زرد AI، باید روی حل مسائل واقعی و ایجاد ارزش برای کسبوکارها تمرکز کرد [۰۱:۰۶:۵۸].
AgentNexus
✅نکته ی قابل توجه هزینه ی استفاده از مدل Gemini3 Flash هست، که نسبت به مدلهای قبلی به ¼ کاهش پیدا کرده.
گزینه ی Fast در Gemini همون مدلی هست که دیشب معرفی شده یعنی Gemini3 Flash
👍1
AgentNexus
✅با ویژگی جدید chat gpt که امروز اضافه شده، میتونید هر نرم افزاری رو به هوش مصنوعی اضافه کنید، اهداف اینکار برای کاربر میتونه از خوندن داده های نرم افزار تا اقدام در نرم افزار از طریق هوش مصنوعی و.... باشه.
ما در حال گذار از عصر «اپلیکیشنمحوری» (App-Centric) به عصر «ایجنتمحوری» (Agent-Centric) هستیم.
AgentNexus
✅با ویژگی جدید chat gpt که امروز اضافه شده، میتونید هر نرم افزاری رو به هوش مصنوعی اضافه کنید، اهداف اینکار برای کاربر میتونه از خوندن داده های نرم افزار تا اقدام در نرم افزار از طریق هوش مصنوعی و.... باشه.
‼️بسیاری از نرمافزارهای اشتراکی (SaaS) که کارهای ساده انجام میدهند (مثل ابزارهای تبدیل فرمت فایل یا تحلیلهای ساده آماری)، احتمالاً حذف یا با هوش مصنوعی ادغام میشوند. وقتی هوش مصنوعی میتواند مستقیماً با دیتابیس صحبت کند (Direct Database Interaction)، دیگر نیازی به لایههای میانی نرمافزارهای سنتی نیست.
🔥1
دقایقی پیش، مدل ایجنت محور GPT‑5.2-Codex معرفی و در دسترس قرار گرفت.
https://openai.com/index/introducing-gpt-5-2-codex/
https://openai.com/index/introducing-gpt-5-2-codex/
نسخه ی جدید هوش مصنوعی Manus 1.6: Max هم چند ساعت پیش معرفی شد.
https://manus.im/blog/manus-max-release
https://manus.im/blog/manus-max-release
manus.im
Introducing Manus 1.6: Max Performance, Mobile Dev, and Design View
Introducing Manus 1.6! Discover our new flagship agent, Manus 1.6 Max, plus end-to-end mobile app development and an interactive Design View for image creation.
✅اکستنشن claude در مرورگر chrome که امروز ریلیز شده رو اضافه کنید. به صورت sidebar باز میشه.
دسترسی read/write به همه تبها به صورت همزمان داره و می تونه کد JavaScript در صفحات مرورگر تون اجرا کنه.
⚠️ و البته که صدها استارت آپ با همین اکستشن کشته شدن. خدا رحمتشون کنه ✋🏻
https://support.claude.com/en/articles/12012173-getting-started-with-claude-in-chrome
دسترسی read/write به همه تبها به صورت همزمان داره و می تونه کد JavaScript در صفحات مرورگر تون اجرا کنه.
⚠️ و البته که صدها استارت آپ با همین اکستشن کشته شدن. خدا رحمتشون کنه ✋🏻
https://support.claude.com/en/articles/12012173-getting-started-with-claude-in-chrome
Claude
Get started with Claude in Chrome | Claude Help Center
♾️دیروز ایجنتی متن باز معرفی شده که از انقلاب در ایجنت ها چیزی کم نداره، چندتا از مفاهیمی که آورده رو اینجا میزارم :
۱. معماری ماژولار «هسته استاندارد» (Standardized Core)
در اکثر فریمورکها (مثل AutoGPT)، ایجنت یک تودهی درهمتنیده از کد و پرامپت است. Shachi مفهوم جداسازی کاملِ تواناییهای شناختی را معرفی میکند:
LLM به مثابه پردازنده: مدل زبانی فقط نقش موتور استدلال را دارد.
حافظه به مثابه دیتابیس: حافظه یک بخش کاملاً مستقل است که میتواند بین ایجنتهای مختلف جابهجا شود.
پروفایل (Traits): ویژگیهای شخصیتی ایجنت به صورت متغیرهای کمی (مثل میزان ریسکپذیری) تعریف میشوند که روی استدلال تاثیر میگذارند.
۲. مفهوم «تناسخ ایجنت» 😳(Agent Reincarnation)
این یکی از عجیبترین و جدیدترین مفاهیم Shachi است. در شبیهسازیهای معمولی، وقتی یک سناریو تمام میشود، ایجنت پاک میشود. اما در Shachi:
ایجنت میتواند در یک محیط (مثلاً قرون وسطی) زندگی کند، تجربیات کسب کند، و سپس با حفظ آن تجربهها در محیط دیگری (مثلاً دنیای مدرن) «متولد» شود.
این مفهوم برای مطالعه انتقال دانش و تجربه در هوش مصنوعی استفاده میشود.
۳. شبیهسازی «اعتبار خارجی» (External Validity Simulation)
برخلاف ایجنتهای چت که هدفشان راضی کردن کاربر است، Shachi مفهوم انطباق با واقعیت آماری را دنبال میکند.
هدف این نیست که ایجنت حرفهای قشنگ بزند؛ هدف این است که اگر به ۱۰۰ ایجنت بگوییم «قیمت بنزین گران شد»، واکنش جمعی آنها دقیقاً مشابه واکنش واقعی مردم در جامعه باشد.
این مفهوم ایجنت را از یک «دستیار» به یک «مدل آزمایشگاهی برای پیشبینی آینده» تبدیل میکند.
۴. حکمرانی و تعاملات چندلایه (Multi-layer Interaction)
در Shachi، مفهوم «محیط به مثابه داور» بسیار جدی است. ایجنتها مستقیماً با هم حرف نمیزنند، بلکه از طریق یک محیط واسط (Environment) بر هم اثر میگذارند.
این کار باعث میشود پدیدههای «ظهوریافته» (Emergent Behaviors) مثل تشکیل بازار سیاه، تورم یا شورشهای اجتماعی که در سیستمهای ساده قابل برنامهنویسی نیستند، به صورت خودبهخودی در سیستم ظاهر شوند.
۵. ارزیابی از طریق «تستهای تورینگ جمعی»
به جای اینکه بپرسند «آیا این ایجنت هوشمند است؟»، Shachi مفهوم جدیدی را مطرح میکند: «آیا رفتار جمعی این ایجنتها با دادههای تاریخی همخوانی دارد؟»
آنها سناریوهای واقعی (مثل جنگهای تجاری) را به ایجنتها میدهند و خروجی را با واقعیت تاریخ مقایسه میکنند تا دقت «شخصیتپردازی» ایجنت را بسنجند.
۶. زندگی در جهان های موازی😳(Living in Multiple Worlds) : بررسی اینکه یک ایجنت اگر همزمان در چندین سناریوی مختلف باشد، چگونه تصمیم میگیرد.
مخزن این ایجنت 👇👇👇
https://github.com/SakanaAI/shachi/
۱. معماری ماژولار «هسته استاندارد» (Standardized Core)
در اکثر فریمورکها (مثل AutoGPT)، ایجنت یک تودهی درهمتنیده از کد و پرامپت است. Shachi مفهوم جداسازی کاملِ تواناییهای شناختی را معرفی میکند:
LLM به مثابه پردازنده: مدل زبانی فقط نقش موتور استدلال را دارد.
حافظه به مثابه دیتابیس: حافظه یک بخش کاملاً مستقل است که میتواند بین ایجنتهای مختلف جابهجا شود.
پروفایل (Traits): ویژگیهای شخصیتی ایجنت به صورت متغیرهای کمی (مثل میزان ریسکپذیری) تعریف میشوند که روی استدلال تاثیر میگذارند.
۲. مفهوم «تناسخ ایجنت» 😳(Agent Reincarnation)
این یکی از عجیبترین و جدیدترین مفاهیم Shachi است. در شبیهسازیهای معمولی، وقتی یک سناریو تمام میشود، ایجنت پاک میشود. اما در Shachi:
ایجنت میتواند در یک محیط (مثلاً قرون وسطی) زندگی کند، تجربیات کسب کند، و سپس با حفظ آن تجربهها در محیط دیگری (مثلاً دنیای مدرن) «متولد» شود.
این مفهوم برای مطالعه انتقال دانش و تجربه در هوش مصنوعی استفاده میشود.
۳. شبیهسازی «اعتبار خارجی» (External Validity Simulation)
برخلاف ایجنتهای چت که هدفشان راضی کردن کاربر است، Shachi مفهوم انطباق با واقعیت آماری را دنبال میکند.
هدف این نیست که ایجنت حرفهای قشنگ بزند؛ هدف این است که اگر به ۱۰۰ ایجنت بگوییم «قیمت بنزین گران شد»، واکنش جمعی آنها دقیقاً مشابه واکنش واقعی مردم در جامعه باشد.
این مفهوم ایجنت را از یک «دستیار» به یک «مدل آزمایشگاهی برای پیشبینی آینده» تبدیل میکند.
۴. حکمرانی و تعاملات چندلایه (Multi-layer Interaction)
در Shachi، مفهوم «محیط به مثابه داور» بسیار جدی است. ایجنتها مستقیماً با هم حرف نمیزنند، بلکه از طریق یک محیط واسط (Environment) بر هم اثر میگذارند.
این کار باعث میشود پدیدههای «ظهوریافته» (Emergent Behaviors) مثل تشکیل بازار سیاه، تورم یا شورشهای اجتماعی که در سیستمهای ساده قابل برنامهنویسی نیستند، به صورت خودبهخودی در سیستم ظاهر شوند.
۵. ارزیابی از طریق «تستهای تورینگ جمعی»
به جای اینکه بپرسند «آیا این ایجنت هوشمند است؟»، Shachi مفهوم جدیدی را مطرح میکند: «آیا رفتار جمعی این ایجنتها با دادههای تاریخی همخوانی دارد؟»
آنها سناریوهای واقعی (مثل جنگهای تجاری) را به ایجنتها میدهند و خروجی را با واقعیت تاریخ مقایسه میکنند تا دقت «شخصیتپردازی» ایجنت را بسنجند.
۶. زندگی در جهان های موازی😳(Living in Multiple Worlds) : بررسی اینکه یک ایجنت اگر همزمان در چندین سناریوی مختلف باشد، چگونه تصمیم میگیرد.
مخزن این ایجنت 👇👇👇
https://github.com/SakanaAI/shachi/
GitHub
GitHub - SakanaAI/shachi: Reimagining Agent-based Modeling with Large Language Model Agents via Shachi
Reimagining Agent-based Modeling with Large Language Model Agents via Shachi - SakanaAI/shachi
AgentNexus
♾️دیروز ایجنتی متن باز معرفی شده که از انقلاب در ایجنت ها چیزی کم نداره، چندتا از مفاهیمی که آورده رو اینجا میزارم : ۱. معماری ماژولار «هسته استاندارد» (Standardized Core) در اکثر فریمورکها (مثل AutoGPT)، ایجنت یک تودهی درهمتنیده از کد و پرامپت است.…
📝نظر ادمین : ایجنت های قبل از این رو فراموش کنید، مفاهیمی که اینجا معرفی شده پایه های ایجنت هایی هستند که پیچیده ترین سیستم ها رو با هزینه ی خیلی پایین و دقت بالا در سریعترین زمان ممکن پیشبینی میکنند و مرزهای علم رو جابجا میکنند.
📢شرکت Anthropic استاندارد Agent Skills را باز منتشر کرد.
شرکت Anthropic چارچوب Agent Skills را به صورت استاندارد باز (open standard) منتشر کرد که اجازه میده ایجنتها مهارتهای تخصصی رو به اشتراک بذارن و در پلتفرمهای مختلف (مثل Microsoft، OpenAI و Atlassian) استفاده بشن.
این حرکت رقابت رو شدیدتر میکنه و به سمت اکوسیستم باز ایجنتها میره.
شرکت Anthropic چارچوب Agent Skills را به صورت استاندارد باز (open standard) منتشر کرد که اجازه میده ایجنتها مهارتهای تخصصی رو به اشتراک بذارن و در پلتفرمهای مختلف (مثل Microsoft، OpenAI و Atlassian) استفاده بشن.
این حرکت رقابت رو شدیدتر میکنه و به سمت اکوسیستم باز ایجنتها میره.
مدل جدید ویرایش عکس شرکت علی بابا به اسم Qwen-Image-Layered منتشر شد.
۱. قابلیت اصلی: تجزیه تصویر به لایهها (Layered Decomposition)
مهمترین ویژگی این مدل این است که میتواند یک تصویر تخت (مثل یک عکس معمولی JPG) را بگیرد و آن را به چندین لایه مجزا با فرمت RGBA (لایه همراه با شفافیت یا Transparency) تبدیل کند. چیزی شبیه به لایههایی که در فتوشاپ میبینیم، اما به صورت کاملاً خودکار.
۲. ویرایشپذیری بالا (Inherent Editability)
وقتی یک تصویر به لایههای مختلف (مثلاً سوژه، پسزمینه، متن و اشیاء دیگر) تقسیم میشود، شما میتوانید:
تغییر رنگ: بدون دست خوردن به بقیه تصویر، فقط رنگ لباس یک نفر یا رنگ یک شیء خاص را تغییر دهید.
تغییر مکان و اندازه: یک شیء را در تصویر جابجا کنید یا اندازه آن را بدون دفرمه شدن بقیه تصویر تغییر دهید.
حذف و جایگزینی: یک لایه را کلاً حذف کنید (مدل جای خالی آن را در لایه پشتی پر میکند) یا آن را با چیز دیگری جایگزین کنید.
۳. ویژگیهای فنی متمایز
تعداد لایههای متغیر: برخلاف مدلهای قبلی، این مدل محدود به تعداد لایه خاصی نیست و میتواند بسته به پیچیدگی تصویر، آن را به ۳ تا ۸ لایه یا بیشتر تقسیم کند.
تجزیه بازگشتی (Recursive Decomposition): شما میتوانید یکی از لایههای تولید شده را دوباره به مدل بدهید تا آن را هم به قطعات ریزتر تقسیم کند (مثلاً یک لایه «انسان» را به لایههای «لباس»، «چهره» و غیره تقسیم کند).
حفظ ثبات: چون ویرایش فقط روی یک لایه فیزیکی انجام میشود، بقیه بخشهای تصویر کاملاً ثابت میمانند و مشکلاتی مثل بهم ریختگی پسزمینه هنگام ویرایش سوژه پیش نمیآید.
۴. کاربردها
صنعت طراحی: طراحان میتوانند تصاویر ساخته شده توسط هوش مصنوعی را به راحتی به فایلهای قابل ویرایش (مثل خروجی برای فتوشاپ یا حتی پاورپوینت) تبدیل کنند.
تولید محتوا: تغییر سریع المانهای یک پوستر یا عکس تبلیغاتی بدون نیاز به بازطراحی کامل.
۱. قابلیت اصلی: تجزیه تصویر به لایهها (Layered Decomposition)
مهمترین ویژگی این مدل این است که میتواند یک تصویر تخت (مثل یک عکس معمولی JPG) را بگیرد و آن را به چندین لایه مجزا با فرمت RGBA (لایه همراه با شفافیت یا Transparency) تبدیل کند. چیزی شبیه به لایههایی که در فتوشاپ میبینیم، اما به صورت کاملاً خودکار.
۲. ویرایشپذیری بالا (Inherent Editability)
وقتی یک تصویر به لایههای مختلف (مثلاً سوژه، پسزمینه، متن و اشیاء دیگر) تقسیم میشود، شما میتوانید:
تغییر رنگ: بدون دست خوردن به بقیه تصویر، فقط رنگ لباس یک نفر یا رنگ یک شیء خاص را تغییر دهید.
تغییر مکان و اندازه: یک شیء را در تصویر جابجا کنید یا اندازه آن را بدون دفرمه شدن بقیه تصویر تغییر دهید.
حذف و جایگزینی: یک لایه را کلاً حذف کنید (مدل جای خالی آن را در لایه پشتی پر میکند) یا آن را با چیز دیگری جایگزین کنید.
۳. ویژگیهای فنی متمایز
تعداد لایههای متغیر: برخلاف مدلهای قبلی، این مدل محدود به تعداد لایه خاصی نیست و میتواند بسته به پیچیدگی تصویر، آن را به ۳ تا ۸ لایه یا بیشتر تقسیم کند.
تجزیه بازگشتی (Recursive Decomposition): شما میتوانید یکی از لایههای تولید شده را دوباره به مدل بدهید تا آن را هم به قطعات ریزتر تقسیم کند (مثلاً یک لایه «انسان» را به لایههای «لباس»، «چهره» و غیره تقسیم کند).
حفظ ثبات: چون ویرایش فقط روی یک لایه فیزیکی انجام میشود، بقیه بخشهای تصویر کاملاً ثابت میمانند و مشکلاتی مثل بهم ریختگی پسزمینه هنگام ویرایش سوژه پیش نمیآید.
۴. کاربردها
صنعت طراحی: طراحان میتوانند تصاویر ساخته شده توسط هوش مصنوعی را به راحتی به فایلهای قابل ویرایش (مثل خروجی برای فتوشاپ یا حتی پاورپوینت) تبدیل کنند.
تولید محتوا: تغییر سریع المانهای یک پوستر یا عکس تبلیغاتی بدون نیاز به بازطراحی کامل.
This media is not supported in your browser
VIEW IN TELEGRAM
✅رباتیک Vibe Coding بخش ۳
یک شبیهسازی ساختم که در آن دو ربات برای انجام یک کار با هم همکاری میکنند.
طراحی با Nano Banana Pro، ساخته شده با Gemini 3
یک شبیهسازی ساختم که در آن دو ربات برای انجام یک کار با هم همکاری میکنند.
طراحی با Nano Banana Pro، ساخته شده با Gemini 3