@ai_python
مبحث Alignment یا همان Post Training در خصوص مدل های زبانی بزرگ، در بسیاری از موارد، تکمیل کننده Pre Training خواهد بود و بسیار ضروری است.
@ai_python
پای تورچ در این پست وبلاگش سعی کرده مباحثی مانند SFT ، RLHF و DPO و ... را در خصوص Post Training مدل های زبانی بزرگ، باز کنه:
https://pytorch.org/blog/a-primer-on-llm-post-training/
مبحث Alignment یا همان Post Training در خصوص مدل های زبانی بزرگ، در بسیاری از موارد، تکمیل کننده Pre Training خواهد بود و بسیار ضروری است.
@ai_python
پای تورچ در این پست وبلاگش سعی کرده مباحثی مانند SFT ، RLHF و DPO و ... را در خصوص Post Training مدل های زبانی بزرگ، باز کنه:
https://pytorch.org/blog/a-primer-on-llm-post-training/
@ai_python
مدل جدید تولید و ویرایش تصویر به نام Gemini 2.5 Flash Image (که با نام مستعار nano-banana هم شناخته میشود) را دیگه کسی نیست که نشناسه.🍌
@ai_python
با این وجود هنوز بسیار مهمه که قابلیت های کامل مدل های مختلف را بشناسیم. پس مروری خواهیم داشت بر قابلیت های این مدل :
🍌 حفظ ظاهر شخصیتها: میتونی ظاهر یک سوژه رو در چند تصویر مختلف حفظ کنی.
🍌 ویرایش هوشمند: امکان تغییر یا اضافه کردن اشیاء به تصویر (inpainting)، گسترش تصویر (outpainting)، و تغییرات هدفمند.
🍌 ترکیب تصاویر: میتونی عناصر چند تصویر رو بهصورت هوشمند در یک تصویر واقعی ترکیب کنی.
🍌 استدلال چندرسانهای: مثلاً میتونه دستورالعملهای پیچیده روی یک دیاگرام رو دنبال کنه.
@ai_python
👩💻 برخی از اپلیکیشنهای ساختهشده با این مدل:
برنامه Past Forward: سفر در زمان با تصاویر.
برنامه Home Canvas: امتحان کردن چیدمان مبلمان.
برنامه Pixshop: ویرایشگر تصویر با هوش مصنوعی.
برنامه GemBooth: تبدیل عکس به سبک کمیک یا نقاشیهای دوره رنسانس.
مدل جدید تولید و ویرایش تصویر به نام Gemini 2.5 Flash Image (که با نام مستعار nano-banana هم شناخته میشود) را دیگه کسی نیست که نشناسه.
@ai_python
با این وجود هنوز بسیار مهمه که قابلیت های کامل مدل های مختلف را بشناسیم. پس مروری خواهیم داشت بر قابلیت های این مدل :
@ai_python
برنامه Past Forward: سفر در زمان با تصاویر.
برنامه Home Canvas: امتحان کردن چیدمان مبلمان.
برنامه Pixshop: ویرایشگر تصویر با هوش مصنوعی.
برنامه GemBooth: تبدیل عکس به سبک کمیک یا نقاشیهای دوره رنسانس.
Please open Telegram to view this post
VIEW IN TELEGRAM
با پیشرفت هوش مصنوعی، برادر ناتنی این صنعت نیز، پیشرفت خواهد کرد. (صنعت رباتیک)
👉 @ai_python 🤖
ولی آیا ما برای این پیشرفت آماده ایم؟
برای پاسخ به این سوال با سه موضوع اصلی رو به رو هستیم :
شفافیت یعنی بتوانیم بفهمیم و توضیح دهیم که چرا یک ربات تصمیم خاصی گرفته است.
👉 @ai_python 🤖
قابلیت ردیابی خطاها: وقتی ربات اشتباه میکند، باید بتوانیم بفهمیم کدام بخش سیستم باعث آن شده: دوربین، بازوی رباتیک یا مدل تصمیمگیری.
👉 @ai_python 🤖
پاسخ گویی : باید مشخص باشد چه کسی مسئول عملکرد ربات است؟! توسعهدهنده، سازنده یا کاربر ... ؟🤖 🤖
در این مقاله در لینکداین هر سه این مفاهیم بررسی شده اند :
https://www.linkedin.com/pulse/transparency-accountability-generative-ai-robotics-torqueagi-v9iic/
ولی آیا ما برای این پیشرفت آماده ایم؟
برای پاسخ به این سوال با سه موضوع اصلی رو به رو هستیم :
شفافیت یعنی بتوانیم بفهمیم و توضیح دهیم که چرا یک ربات تصمیم خاصی گرفته است.
قابلیت ردیابی خطاها: وقتی ربات اشتباه میکند، باید بتوانیم بفهمیم کدام بخش سیستم باعث آن شده: دوربین، بازوی رباتیک یا مدل تصمیمگیری.
پاسخ گویی : باید مشخص باشد چه کسی مسئول عملکرد ربات است؟! توسعهدهنده، سازنده یا کاربر ... ؟
در این مقاله در لینکداین هر سه این مفاهیم بررسی شده اند :
https://www.linkedin.com/pulse/transparency-accountability-generative-ai-robotics-torqueagi-v9iic/
Please open Telegram to view this post
VIEW IN TELEGRAM
3
Please open Telegram to view this post
VIEW IN TELEGRAM
این جدول برای اینکه یک ویو بسیار خوب از امکانات Microsoft Azure در Region های مختلف به دست بیاریم بسیار کاربردی هست و همیشه هم به روز نگه داشته می شه. این طوری دیگه با اعتماد به نفس بیشتری می تونیم در قراردادها Region سرویس رو درج کنیم :
@ai_python
https://azure.microsoft.com/de-de/explore/global-infrastructure/products-by-region/table
@ai_python
https://azure.microsoft.com/de-de/explore/global-infrastructure/products-by-region/table
این مقاله محدودیتهای بنیادی مدلهای بازیابی مبتنی بر وکتور امبدینگ را بررسی میکند، بهویژه زمانی که این مدلها با وظایف پیچیدهتر، مانند استدلال یا پیروی از دستورالعملها، روبرو میشوند.
نویسندگان نشان میدهند که تعداد زیرمجموعههای اسناد که یک وکتور امبدینگ میتواند با توجه به ابعاد Embedding بازگرداند، محدود است.
برای اثبات این موضوع، آنها یک مجموعه داده واقعگرایانه و در عین حال ساده به نام LIMIT ایجاد میکنند که مدلهای پیشرفته فعلی نیز در آن شکست میخورند، و تأکید میکنند که این محدودیتهای نظری حتی در تنظیمات عملی نیز وجود دارند.
نتیجهگیری این است که جامعه تحقیقاتی باید به این محدودیتها توجه داشته باشد و روشهای بازیابی جایگزین، مانند مدلهای چند برداری، را برای وظایف پیچیدهتر توسعه دهد.
لینک ویدیو فارسی توضیحات این مقاله : https://youtu.be/rNEl_tBJ5aE?si=Wg5LUPloe6s3noz2
لینک مقاله در آرشیو :
https://arxiv.org/pdf/2508.21038
Please open Telegram to view this post
VIEW IN TELEGRAM
بررسی بهبود مدل های زبانی بزرگ در صورت پیش بینی ترتیب توکن ها:
https://www.alphaxiv.org/pdf/2508.19228
لینک ویدیو فارسی خلاصه تولید شده توسط هوش مصنوعی از این مقاله :
https://youtu.be/YhB21n0aDrg?si=KWcMLkxrNh57Sn5W
پادکست مصنوعی فارسی مفصل تر در کانال @navidcasts در خصوص این مقاله موجود است.
Please open Telegram to view this post
VIEW IN TELEGRAM
4
این دوره مربوط به مدرک Microsoft Certified: Azure Data Scientist Associate است و برای افرادی طراحی شده که میخواهند مهارتهای علمی داده و یادگیری ماشین را در محیط Azure بهکار بگیرند. من این دوره رو به همه کسانی که قصد دارن در آینده بازار Cloud باقی بمونن توصیه می کنم :
🎯 هدف دوره :
✍️ طراحی و ایجاد محیط کاری مناسب برای پروژههای علم داده
✍️ کاوش و آمادهسازی دادهها
✍️ آموزش مدلهای یادگیری ماشین و اجرای آزمایشها
✍️ پیادهسازی پایپلاینها و آمادهسازی برای محیط عملیاتی
✍️ استقرار و پایش راهکارهای یادگیری ماشین در مقیاس بزرگ
✍️ بهینهسازی مدلهای زبانی برای ساخت اپلیکیشنهای هوش مصنوعی با Azure AI
⚡️ در واقع اون بخش مهم این دوره از نظر من اینه : ⚡️
سرویسهای Azure AI (مثل Azure AI Search و Azure AI Foundry)
توسعه اپلیکیشنهای (Generative AI) در محیط آژور
و Azure ML Studio
✍️ آزمون و گواهینامه مرتبط :
آزمون DP-100 با مدت زمان ۱۰۰ دقیقه
اعتبار مدرک: ۱۲ ماه، با امکان تمدید رایگان از طریق ارزیابی آنلاین
https://learn.microsoft.com/en-us/credentials/certifications/azure-data-scientist/?practice-assessment-type=certification
سرویسهای Azure AI (مثل Azure AI Search و Azure AI Foundry)
توسعه اپلیکیشنهای (Generative AI) در محیط آژور
و Azure ML Studio
آزمون DP-100 با مدت زمان ۱۰۰ دقیقه
اعتبار مدرک: ۱۲ ماه، با امکان تمدید رایگان از طریق ارزیابی آنلاین
https://learn.microsoft.com/en-us/credentials/certifications/azure-data-scientist/?practice-assessment-type=certification
Please open Telegram to view this post
VIEW IN TELEGRAM
Docs
Microsoft Certified: Azure Data Scientist Associate - Certifications
Manage data ingestion and preparation, model training and deployment, and machine learning solution monitoring with Python, Azure Machine Learning and MLflow.
2
مسابقه برنامهنویسی در کوئرا، فرصت همکاری با ترب
Torob Turbo: The LLM Rush
💥 تُرب توربو < Torob Turbo > چیه:
هکاتونی مسئلهمحوره که با تمرکز بر حل مسائل واقعی صنعت و بهرهگیری از مدلهای زبانی بزرگ (LLM) طراحی شده.
چرا باید توی این مسابقه شرکت کنی:
⚡️ وبینارهای تخصصی و آموزشی رایگان
🎁 ۲۵۰ میلیون تومان جوایز نقدی و جوایز غیر نقدی
🚀 فرصت همکاری با تیم ترب
✨ گواهی رسمی کوئرا و ترب
🔗 https://quera.org/r/gebvy
Torob Turbo: The LLM Rush
💥 تُرب توربو < Torob Turbo > چیه:
هکاتونی مسئلهمحوره که با تمرکز بر حل مسائل واقعی صنعت و بهرهگیری از مدلهای زبانی بزرگ (LLM) طراحی شده.
چرا باید توی این مسابقه شرکت کنی:
⚡️ وبینارهای تخصصی و آموزشی رایگان
🎁 ۲۵۰ میلیون تومان جوایز نقدی و جوایز غیر نقدی
🚀 فرصت همکاری با تیم ترب
✨ گواهی رسمی کوئرا و ترب
🔗 https://quera.org/r/gebvy
لینک مقاله در آرشیو :
https://arxiv.org/html/2509.01187v1
The paper introduces StoxLSTM, a novel stochastic extension of the xLSTM architecture for time series forecasting. By integrating stochastic latent variables into a state space modeling framework, StoxLSTM captures complex temporal patterns and uncertainties more effectively than traditional models. Extensive experiments across diverse datasets show that it consistently outperforms state-of-the-art baselines in both accuracy and robustness.
پادکست مصنوعی توضیحات به فارسی :
https://t.iss.one/navidcasts/26
ویدیو با زمان کوتاه تر از پادکست صوتی به صورت خلاصه تر و به فارسی :
https://youtu.be/xN6nFUGeXrk?si=aUGPUomtp_6yMFg1
Please open Telegram to view this post
VIEW IN TELEGRAM
2
این پست از Peter W. J. Staar درباره قابلیت جدیدی در پروژه Docling هست که توسط تیم IBM Research توسعه داده شده:
کلمه Docling را در کانال اگر سرچ کنید پست های زیادی دربارش داریم.
کتابخانه Docling حالا میتونه دادههای ساختیافته رو مستقیم از اسناد استخراج کنه
به جای تبدیل سند به متن یا JSON، داکلینگ میتونه مستقیماً فیلدهای موردنظر رو از سند بیرون بکشه!
کاربر میتونه با استفاده از اسکیمای آزاد (free-form schema) مشخص کنه چه اطلاعاتی باید استخراج بشه. این یعنی میتونی خروجی رو مستقیم با ساختار پایگاهدادهات هماهنگ کنی.
این قابلیت برای پایپلاینهای دادهای که نیاز به استخراج اطلاعات از اسناد نامرتب دارن (مثل فاکتورها، رزومهها، قراردادها و...) بسیار مفیده.
همون طور که گفتیم : بدون نیاز به API یا ارسال داده به سرور !!!
برای رسیدن به این مقصود از مدلهای پیشرفته شرکت NuMind استفاده میکنه.
فعلاً روی فایلهای PDF و تصویر (PNG) تمرکز داره؛ پشتیبانی از متن ساده بهزودی اضافه میشه.
Please open Telegram to view this post
VIEW IN TELEGRAM
5