تکنولوژی | برنامه نویسی | هوش مصنوعی
Photo
یادگیری عمیق تولیدی (Generative Deep Learning) 🎨✨
یادگیری عمیق تولیدی شاخهای پیشرفته از یادگیری عمیق است که بر تولید دادههای جدید و واقعگرایانه تمرکز دارد. هدف اصلی مدلهای تولیدی این است که توزیع احتمال دادههای آموزشی را یاد بگیرند و سپس نمونههای جدیدی را از این توزیع تولید کنند که از دادههای واقعی غیرقابل تمایز باشند. این رویکرد در تضاد با مدلهای متمایز کننده (Discriminative Models) است که وظیفه آنها طبقهبندی یا پیشبینی بر اساس دادههای ورودی است.
دو دسته از برجستهترین مدلهای تولیدی در سالهای اخیر عبارتند از:
* شبکههای مولد تخاصمی (Generative Adversarial Networks - GANs): GANs یک چارچوب یادگیری عمیق هستند که توسط Ian Goodfellow در سال ۲۰۱۴ معرفی شد و شامل دو شبکه عصبی است که در یک بازی با مجموع صفر (zero-sum game) با یکدیگر رقابت میکنند:
* مولد (Generator): وظیفه این شبکه تولید دادههای مصنوعی (مانند تصاویر) است که تا حد امکان شبیه دادههای واقعی باشند.
* متمایز کننده (Discriminator): این شبکه یک طبقهبندیکننده دودویی است که تلاش میکند تشخیص دهد ورودی ارائهشده به آن واقعی است یا توسط مولد تولید شده است.
هدف مولد فریب دادن متمایز کننده است، در حالی که هدف متمایز کننده، تشخیص صحیح است. در نتیجه این رقابت، هر دو شبکه بهبود مییابند و در نهایت مولد قادر به تولید دادههای بسیار واقعگرایانه میشود. GANs در تولید تصاویر چهره، مناظر، سبکدهی به تصاویر (Style Transfer) و حتی تولید ویدئوهای کوتاه موفقیتهای چشمگیری داشتهاند.
* مدلهای انتشار (Diffusion Models): این مدلها رویکردی متفاوت برای تولید دادهها دارند و اخیراً محبوبیت زیادی پیدا کردهاند. ایده اصلی مدلهای انتشار این است که یک فرآیند را برای "پخش" تدریجی نویز به دادههای واقعی (forward diffusion process) تعریف میکنند تا دادهها کاملاً به نویز تبدیل شوند. سپس یک شبکه عصبی (معمولاً یک U-Net) را آموزش میدهند تا این فرآیند را معکوس کند (reverse diffusion process) و به تدریج نویز را حذف کرده و دادههای واقعی را بازسازی کند.
مدلهای انتشار به دلیل تواناییشان در تولید تصاویر با کیفیت بالا و تنوع زیاد، به شهرت رسیدهاند. آنها میتوانند جزئیات دقیق را به خوبی مدلسازی کنند و در تولید تصاویر از متن (Text-to-Image Generation) بسیار قدرتمند هستند، مانند مدلهای DALL-E 2، Midjourney و Stable Diffusion.
سایر مدلهای تولیدی شامل خودرمزگذارها (Autoencoders - AE) و خودرمزگذارهای تغییرپذیر (Variational Autoencoders - VAEs) هستند که برای یادگیری نمایشهای فشرده (Latent Representations) از دادهها و سپس بازسازی آنها استفاده میشوند. VAEها به خصوص برای تولید نمونههای جدید با دستکاری در فضای نهفته مفید هستند.
کاربردهای یادگیری عمیق تولیدی فراتر از تولید تصویر و متن است و شامل موارد زیر میشود:
* تولید محتوای خلاقانه: خلق آثار هنری، موسیقی، داستان و شعر.
* افزایش داده (Data Augmentation): تولید دادههای مصنوعی برای افزایش حجم مجموعه دادههای آموزشی، به ویژه در مواردی که دادههای واقعی کمیاب هستند (مثلاً در تصاویر پزشکی).
* طراحی محصولات: تولید طرحهای جدید برای محصولات یا مواد.
* شبیهسازی و بازی: ایجاد محیطها، شخصیتها و اشیاء واقعگرایانه برای بازیها و شبیهسازیها.
* حفظ حریم خصوصی: تولید دادههای مصنوعی که خواص آماری مشابه دادههای واقعی دارند اما حاوی اطلاعات حساس نیستند.
یادگیری عمیق تولیدی هنوز در مراحل اولیه خود است، اما پتانسیل عظیمی برای دگرگونی صنایع مختلف از هنر و سرگرمی گرفته تا پزشکی و مهندسی دارد.
از ChatGPT درخواست کن تا اینجوزی عکستو ادیت کنه
• واسه ساخت همچین تصاویر بینظیر و جذابی کافیه عکس خودتون به همراه #پرامپت زیر رو بدید به ChatGPT :
• واسه ساخت همچین تصاویر بینظیر و جذابی کافیه عکس خودتون به همراه #پرامپت زیر رو بدید به ChatGPT :
Create a modern magazine cover-style design, ultra-detailed and vibrant, featuring a striking frontal portrait of my photo ,that biting my lip slightly, wearing a black leather jacket with "REBORN" patch, gold earrings, and disheveled textured hair.
Background is white with red paint streaks and sticker graphics. Magazine title
"UNLEASH" in bold stencil font sits on top center.
Cover lines on left and right:
"THE FACE OF NEXT GEN"
"STYLE. POWER. MIND."
Bottom left: A barcode, hashtag #REBELMINDSET
Bottom right: Small text: "Vol. 8 - RAW • REAL • RELENTLESS"
Hyper-photorealism, 8K, focused on skin texture, outfit creases, streetwear editorial finish. Slight vignette.
فتوگرافی خیابونی به سبک chatgpt با #پرامپت زیر:
A photorealistic [سوژه یا عکس آپلود شده شما] seen through raindrop-covered glass. Misty atmosphere, cold cinematic lighting, streaks of blue and tungsten glow, with bokeh distortions. Moody and emotional, with film still aesthetics.
اینم یه #پرامپت خوشگل دیگه واسه کاپلای چنل!
• کافیه دوتا عکس از چشم خودتون + چشم پارتنر یا کسی که دوستش دارید رو به ChatGPT بدید تا همچین نتیجه بینظیری رو بهتون تحویل بده!
• کافیه دوتا عکس از چشم خودتون + چشم پارتنر یا کسی که دوستش دارید رو به ChatGPT بدید تا همچین نتیجه بینظیری رو بهتون تحویل بده!
two irises, one on the left and one on the right, at the center of the composition on a black background.
Add a star dust particle diffusion effect that simulates a gradual transition or an explosion. This highlights the detailed texture of the iris fibers and the color contrast. The atmosphere should be artistic, sharp, and with a touch of spatial depth.
🔖 ۸ ریپوی برتر گیتهاب برای یادگیری «ماشین لرنینگ»
🖥 ریپوی ML System Design Pattern
پترنهای تستشده برای ساخت سیستمهای ML مقیاسپذیر.
🖥 ریپوی ML Projects
پروژههای کاربردی تو حوزه ML که با ابزارهای شناختهشدهای مثل scikit-learn ,TensorFlow ,PyTorch و OpenCV ساخته شدن.
🖥 ریپوی MLOps Basics
برنامه مطالعاتی ۹ هفتهای برای تسلط بر مفاهیم MLOps با پیادهسازی عملی.
🖥 ریپوی MLE & MLOps
یادگیری MLE و MLOps در 7 مرحله با طراحی، ساخت و استقرار یک سیستم دستهای ML.
🖥 ریپوی ML Project
صفر تا صد ساخت و دیپلوی یه پروژه ML.
🖥 ریپوی Made With ML
چطور یه اپلیکیشن ML رو طراحی، توسعه، دیپلوی و بعدش ارتقا بدی.
🖥 ریپوی MLOps Zoomcamp
یادگیری مفاهیم تولید، دیپلوی و اجرای مدلهای ML.
🖥 ریپوی Applied ML
تجربه واقعی کار با یادگیری ماشین؛ از تست مدل تا اجرا و زیرنظر گرفتنش.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3👎2🤨1
This media is not supported in your browser
VIEW IN TELEGRAM
تهیهٔ کانتکست برایِ AI خیلی زمانبر و خستهکننده است.
نشستم با Rust یک ابزارِ خطِ فرمانیِ ساده ساختم که با گرفتنِ یک لینک، محتوایِ اون لینک به همراهِ تمامِ صفحاتِ داخلیش رو به صورتِ یک تکفایلِ مارکداون به شما تحویل میده.
https://github.com/sir-kokabi/llmtext
نشستم با Rust یک ابزارِ خطِ فرمانیِ ساده ساختم که با گرفتنِ یک لینک، محتوایِ اون لینک به همراهِ تمامِ صفحاتِ داخلیش رو به صورتِ یک تکفایلِ مارکداون به شما تحویل میده.
https://github.com/sir-kokabi/llmtext
❤🔥1
▪️میدونستید وقتی توی گوگل عبارت bad ux یا حتی terrible ux رو سرچ میکنی، گوگل خودش یه شوخی جالب باهات میکنه :
▪️بخشی از متنهایی که نشون میده (مثلاً عنوان صفحه یا بخشهایی از توضیحات)، با فونت بدنام و بدریخت Comic Sans نمایش داده میشه!
👎 این فونت تو دنیای طراحی، نماد طراحی بد و غیرحرفهایه. گوگل با این کار، خودش عملاً داره یه تجربه کاربری بد رو شبیهسازی میکنه تا مفهوم UX بد رو حس کنی، نه فقط بخونی!
▪️بخشی از متنهایی که نشون میده (مثلاً عنوان صفحه یا بخشهایی از توضیحات)، با فونت بدنام و بدریخت Comic Sans نمایش داده میشه!
👎 این فونت تو دنیای طراحی، نماد طراحی بد و غیرحرفهایه. گوگل با این کار، خودش عملاً داره یه تجربه کاربری بد رو شبیهسازی میکنه تا مفهوم UX بد رو حس کنی، نه فقط بخونی!
میخوام زبان نام زبان رو یاد بگیرم نقش معلم زبان من رو بازی کن و یک برنامه ۳۰ روزه طراحی کن که هر روز شامل واژگان جدید تمرینهای مکالمه، نکات فرهنگی دستور زبان و تمرینهای تعاملی باشه
تو پارتنر مکالمه روزانه من به زبان نام زبان هستی یک گفت و گوی پنج دقیقه ای غیر رسمی رو شروع کن در طول مکالمه اشتباهات گرامری منو اصلاح کن واژه های بهتری پیشنهاد بده و وقتی دیدی توی یک موضوع مسلط شدم موضوع رو عوض کن
من جملاتی رو به زبان نام زبان مینویسم. لطفا اون ها رو به انگلیسی ترجمه کن اشتباهات گرامری رو اصلاح کن توضیح بده چه اشتباهی داشتم و جایگزین هایی پیشنهاد بده که جمله هام طبیعی تر و روان تر به نظر بیان
بیاین یک سناریوی واقعی رو به زبان نام زبان] شبیه سازی کنیم مثل سفارش غذا، پرسیدن آدرس یا مصاحبه کاری نقش آفرینی رو شروع کن و منو توی موقعیت قرار بده تا تمرین کنم
من توی صحبت کردن به زبان نام زبان اعتماد به نفس ندارم نقش مربی و کوچ من رو بازی کن کمکم کن که ترس رو کنار بذارم اعتماد به نفس پیدا کنم و هر روز بدون خجالت تمرین کنم
@Sourcepg
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1