عصر مدلهای DiffusionLM 👨💻 🙄
@ai_python
مدلهای DiffusionLM (مدلهای زبانی مبتنی بر انتشار) ممکن است جایگزین مدلهای Autoregressive (AR) شوند، بهویژه در شرایطی که دادهها محدود هستند.
🔍 نکات کلیدی:
کارایی بهتر در شرایط کمداده: اگر محدودیت اصلی شما داده باشد (نه قدرت پردازش یا FLOPs)، مدلهای Diffusion عملکرد بهتری دارند.
@ai_python
استفاده مجدد از دادهها:
دادههای یکسان میتوانند تا ۱۰۰ بار (epoch) برای آموزش مدلهای Diffusion استفاده شوند، در حالی که مدلهای AR فقط حدود ۴ بار از همان دادهها استفاده میکنند.
یادگیری عمیقتر:
مدلهای DiffusionLM توانایی یادگیری بسیار بیشتری از دادههای محدود دارند.
📊 نتیجهگیری:
این یافتهها نشان میدهند که در سناریوهایی با دادههای محدود، مدلهای DiffusionLM میتوانند بسیار مؤثرتر باشند و شاید آیندهی مدلهای زبانی را تغییر دهند.
@ai_python
لینک آلفاشیو : https://www.alphaxiv.org/abs/2507.15857
@ai_python
مدلهای DiffusionLM (مدلهای زبانی مبتنی بر انتشار) ممکن است جایگزین مدلهای Autoregressive (AR) شوند، بهویژه در شرایطی که دادهها محدود هستند.
کارایی بهتر در شرایط کمداده: اگر محدودیت اصلی شما داده باشد (نه قدرت پردازش یا FLOPs)، مدلهای Diffusion عملکرد بهتری دارند.
@ai_python
استفاده مجدد از دادهها:
دادههای یکسان میتوانند تا ۱۰۰ بار (epoch) برای آموزش مدلهای Diffusion استفاده شوند، در حالی که مدلهای AR فقط حدود ۴ بار از همان دادهها استفاده میکنند.
یادگیری عمیقتر:
مدلهای DiffusionLM توانایی یادگیری بسیار بیشتری از دادههای محدود دارند.
این یافتهها نشان میدهند که در سناریوهایی با دادههای محدود، مدلهای DiffusionLM میتوانند بسیار مؤثرتر باشند و شاید آیندهی مدلهای زبانی را تغییر دهند.
@ai_python
لینک آلفاشیو : https://www.alphaxiv.org/abs/2507.15857
Please open Telegram to view this post
VIEW IN TELEGRAM
2
Audio
@ai_python
چند روز پیش در این جا درباره برنامه اقدام ملی هوش مصنوعی آمریکا صحبت کردیم و این که چرا Palantir این قدر هیجان زده شده و از این طرح دفاع کرده.
@ai_python
قرار شد پادکست فارسیِ مصنوعی هم درباره جزئیات این طرح براتون Generate کنیم که نیاز نباشه کل داکیومنت رو بخونید. 📻
@ai_python
بنابراین این پادکست خدمت مخاطبان عزیز کانال
چند روز پیش در این جا درباره برنامه اقدام ملی هوش مصنوعی آمریکا صحبت کردیم و این که چرا Palantir این قدر هیجان زده شده و از این طرح دفاع کرده.
@ai_python
قرار شد پادکست فارسیِ مصنوعی هم درباره جزئیات این طرح براتون Generate کنیم که نیاز نباشه کل داکیومنت رو بخونید. 📻
@ai_python
بنابراین این پادکست خدمت مخاطبان عزیز کانال
1
This media is not supported in your browser
VIEW IN TELEGRAM
@ai_python
ایلان ماسک در پستی در شبکه اجتماعی X توضیح داده که به دلیل قوانین مربوط به ممنوعیت صادرات دادهها، تسلا در چین بدون استفاده از دادههای محلی آموزشی موفق شده عملکرد بسیار خوبی در سیستمهای کمکراننده (ADAS) داشته باشد.
@ai_python
ممنوعیت صادرات دادهها:
در چین، دادههای جمعآوریشده از خودروها (مثل تصاویر دوربینها، موقعیت مکانی، و اطلاعات رانندگی) اجازه خروج از کشور را ندارند. این یعنی تسلا نمیتواند از دادههای واقعی چینی برای آموزش مدلهای هوش مصنوعیاش استفاده کند.
@ai_python
موفقیت بدون داده محلی: با وجود این محدودیت، تسلا توانسته در تستهای رسانههای چینی عملکرد بهتری نسبت به برندهای داخلی مثل هواوی و شیائومی داشته باشد.
@ai_python
تسلا برای جبران نبود دادههای واقعی، از شبیهسازهای پیشرفته و مسیرهای تست اختصاصی استفاده میکند تا دادههای مصنوعی تولید کند و مدلهایش را آموزش دهد.
ایلان ماسک در پستش به دستیابی کامل به شش سناریوی کلیدی در تستهای ADAS اشاره کرده است. و گفته ما به دنبال 6 از 6 هستیم و نه کم تر از آن. این 6 سناریو عبارتند از : رانندگی در شب، در بزرگراه، در شهر، در شرایط بارانی و دوتای دیگه که الان حضور ذهن ندارم.😅 شما اگر می دونید کامنت بذارید که پست کامل بشه.
🚗 🚘 چرا این موضوع مهم است؟
نشان میدهد تسلا در توسعه هوش مصنوعی رانندگی خودکار به سطحی رسیده که حتی بدون دادههای محلی، میتواند عملکردی بهتر از رقبا داشته باشد.
استفاده از شبیهسازها به عنوان منبع داده، روشی نوآورانه برای عبور از محدودیتهای قانونی است.
@ai_python
رقابت در بازار چین برای خودروهای برقی و هوشمند بسیار شدید است، و این موفقیت برای تسلا یک دستاورد بزرگ محسوب میشود.
ایلان ماسک در پستی در شبکه اجتماعی X توضیح داده که به دلیل قوانین مربوط به ممنوعیت صادرات دادهها، تسلا در چین بدون استفاده از دادههای محلی آموزشی موفق شده عملکرد بسیار خوبی در سیستمهای کمکراننده (ADAS) داشته باشد.
@ai_python
ممنوعیت صادرات دادهها:
در چین، دادههای جمعآوریشده از خودروها (مثل تصاویر دوربینها، موقعیت مکانی، و اطلاعات رانندگی) اجازه خروج از کشور را ندارند. این یعنی تسلا نمیتواند از دادههای واقعی چینی برای آموزش مدلهای هوش مصنوعیاش استفاده کند.
@ai_python
موفقیت بدون داده محلی: با وجود این محدودیت، تسلا توانسته در تستهای رسانههای چینی عملکرد بهتری نسبت به برندهای داخلی مثل هواوی و شیائومی داشته باشد.
@ai_python
تسلا برای جبران نبود دادههای واقعی، از شبیهسازهای پیشرفته و مسیرهای تست اختصاصی استفاده میکند تا دادههای مصنوعی تولید کند و مدلهایش را آموزش دهد.
ایلان ماسک در پستش به دستیابی کامل به شش سناریوی کلیدی در تستهای ADAS اشاره کرده است. و گفته ما به دنبال 6 از 6 هستیم و نه کم تر از آن. این 6 سناریو عبارتند از : رانندگی در شب، در بزرگراه، در شهر، در شرایط بارانی و دوتای دیگه که الان حضور ذهن ندارم.
نشان میدهد تسلا در توسعه هوش مصنوعی رانندگی خودکار به سطحی رسیده که حتی بدون دادههای محلی، میتواند عملکردی بهتر از رقبا داشته باشد.
استفاده از شبیهسازها به عنوان منبع داده، روشی نوآورانه برای عبور از محدودیتهای قانونی است.
@ai_python
رقابت در بازار چین برای خودروهای برقی و هوشمند بسیار شدید است، و این موفقیت برای تسلا یک دستاورد بزرگ محسوب میشود.
Please open Telegram to view this post
VIEW IN TELEGRAM
1
@ai_python
مدل امبدینگ gemini-embedding-001 گوگل اکنون به صورت پایدار قابل استفاده از Gemini API هست.
@ai_python
این مدل که نتایج بسیار خوبی در MTEB کسب کرد، بیش از 100 زبان زنده دنیا را پشتیبانی می کنه و همین طور برای ساخت RAG می توانید از task_type های متفاوت استفاده کنید.
مدل امبدینگ gemini-embedding-001 گوگل اکنون به صورت پایدار قابل استفاده از Gemini API هست.
@ai_python
این مدل که نتایج بسیار خوبی در MTEB کسب کرد، بیش از 100 زبان زنده دنیا را پشتیبانی می کنه و همین طور برای ساخت RAG می توانید از task_type های متفاوت استفاده کنید.
1
DLeX: AI Python
@ai_python مدل امبدینگ gemini-embedding-001 گوگل اکنون به صورت پایدار قابل استفاده از Gemini API هست. @ai_python این مدل که نتایج بسیار خوبی در MTEB کسب کرد، بیش از 100 زبان زنده دنیا را پشتیبانی می کنه و همین طور برای ساخت RAG می توانید از task_type های…
در پست بالا گفتیم که مدل gemini embedding 001 به صورت پایدار عرضه عمومی شد.
@ai_python
در این رشته توییت بعضی از use case های دنیای واقعی را می بینید :
https://x.com/googleaidevs/status/1950632489967395236
@ai_python
در این رشته توییت بعضی از use case های دنیای واقعی را می بینید :
https://x.com/googleaidevs/status/1950632489967395236
X (formerly Twitter)
Google AI Developers (@googleaidevs) on X
See how developers are building with Gemini Embedding 🧵
چند روز قبل یک پادکست مصنوعی فارسی درباره برنامه اقدام ملی هوش مصنوعی آمریکا درست کردیم و در کانال قرار دادیم.
@ai_python
امروز هم اندرو ان جی درباره رقابت هوش مصنوعیِ آمریکا در برابر چین یک توییت بلند بالا نوشته : X
@ai_python
آندرو انجی، متخصص برجسته هوش مصنوعی، در تحلیل اخیر خود توضیح میدهد که چگونه چین در حال حاضر مسیری روشن برای پیشی گرفتن از ایالات متحده در هوش مصنوعی دارد. با وجود پیشتازی فعلی آمریکا، شتاب فزاینده چین ناشی از اکوسیستم پر جنب و جوش مدلهای با وزن باز و اقدامات جسورانه در طراحی و ساخت نیمههادیها است. انجی خاطرنشان میکند که رقابت شدید کسبوکارها در چین و انتشار سریع دانش، پویایی فوقالعادهای به این کشور بخشیده است.
با این حال، او تاکید میکند که هوش مصنوعی یک فناوری یکپارچه نیست و کشورها در حوزههای مختلف آن برتری دارند، و این برتریها به مزایای متفاوتی در رشد اقتصادی و قدرت ملی منجر میشوند. در نهایت، انجی اظهار امیدواری میکند که همه کشورها، به ویژه دموکراسیها، موانع پیشرفت هوش مصنوعی را بردارند و در علم و فناوری آزاد سرمایهگذاری کنند تا اطمینان حاصل شود که این فناوری به نفع بشریت و دموکراسی خواهد بود.
@ai_python
گزارش کامل را در این جا بخوانید :
https://www.deeplearning.ai/the-batch/issue-312/
@ai_python
امروز هم اندرو ان جی درباره رقابت هوش مصنوعیِ آمریکا در برابر چین یک توییت بلند بالا نوشته : X
@ai_python
آندرو انجی، متخصص برجسته هوش مصنوعی، در تحلیل اخیر خود توضیح میدهد که چگونه چین در حال حاضر مسیری روشن برای پیشی گرفتن از ایالات متحده در هوش مصنوعی دارد. با وجود پیشتازی فعلی آمریکا، شتاب فزاینده چین ناشی از اکوسیستم پر جنب و جوش مدلهای با وزن باز و اقدامات جسورانه در طراحی و ساخت نیمههادیها است. انجی خاطرنشان میکند که رقابت شدید کسبوکارها در چین و انتشار سریع دانش، پویایی فوقالعادهای به این کشور بخشیده است.
با این حال، او تاکید میکند که هوش مصنوعی یک فناوری یکپارچه نیست و کشورها در حوزههای مختلف آن برتری دارند، و این برتریها به مزایای متفاوتی در رشد اقتصادی و قدرت ملی منجر میشوند. در نهایت، انجی اظهار امیدواری میکند که همه کشورها، به ویژه دموکراسیها، موانع پیشرفت هوش مصنوعی را بردارند و در علم و فناوری آزاد سرمایهگذاری کنند تا اطمینان حاصل شود که این فناوری به نفع بشریت و دموکراسی خواهد بود.
@ai_python
گزارش کامل را در این جا بخوانید :
https://www.deeplearning.ai/the-batch/issue-312/
2
This media is not supported in your browser
VIEW IN TELEGRAM
@ai_python
در این ویدئو، مدل هوش مصنوعی جدید گوگل، Alpha Earth Foundations، معرفی شده است. این مدل سطح کره زمین🌎 را بر اساس شباهت شرایط سطحی نقشه برداری می کند و به سرعت الگوهای منحصر به فرد اکوسیستم ها را شناسایی می کند.
@ai_python
در نتیجه، نقشه برداری جهانی که قبلاً ماهها تا سالها طول میکشید، اکنون در عرض چند دقیقه انجام میشود. این فناوری از طریق Google Earth Engine برای سالهای ۲۰۱۷ تا ۲۰۲۴ در دسترس است و به دانشمندان و محققان کمک میکند تا به سوالاتی درباره پراکندگی حیوانات و ردپای🐾 توسعه انسانی پاسخ دهند.
@ai_python
این پیشرفت میتواند ابزارهای بهتری برای مقابله با چالشهای بزرگی مانند پیشبینی آتشسوزی، مدیریت منابع آب و حفاظت از اکوسیستمهای در معرض خطر فراهم کند و همه اینها را بسیار سریعتر و ارزانتر انجام دهد.
X
در این ویدئو، مدل هوش مصنوعی جدید گوگل، Alpha Earth Foundations، معرفی شده است. این مدل سطح کره زمین
@ai_python
در نتیجه، نقشه برداری جهانی که قبلاً ماهها تا سالها طول میکشید، اکنون در عرض چند دقیقه انجام میشود. این فناوری از طریق Google Earth Engine برای سالهای ۲۰۱۷ تا ۲۰۲۴ در دسترس است و به دانشمندان و محققان کمک میکند تا به سوالاتی درباره پراکندگی حیوانات و ردپای
@ai_python
این پیشرفت میتواند ابزارهای بهتری برای مقابله با چالشهای بزرگی مانند پیشبینی آتشسوزی، مدیریت منابع آب و حفاظت از اکوسیستمهای در معرض خطر فراهم کند و همه اینها را بسیار سریعتر و ارزانتر انجام دهد.
X
Please open Telegram to view this post
VIEW IN TELEGRAM
1
Audio
@ai_python
پادکست مصنوعی فارسی در خصوص شبیه سازی سیستم های عظیم با Regression Language Models
@ai_python
برگرفته از این نوشتار در Google Research :
https://research.google/blog/simulating-large-systems-with-regression
پیپر مرتبط در آرشیو : https://arxiv.org/abs/2506.21718
پادکست مصنوعی فارسی در خصوص شبیه سازی سیستم های عظیم با Regression Language Models
@ai_python
برگرفته از این نوشتار در Google Research :
https://research.google/blog/simulating-large-systems-with-regression
پیپر مرتبط در آرشیو : https://arxiv.org/abs/2506.21718
1
@ai_python
🗺 نقشهراه IBM برای رایانش کوانتومی
سال 2025 : معرفی پردازنده کوانتومی IBM Quantum Nighthawk که 120 کیوبیتی هستند و توانایی اجرای مدارهایی تا 5000 گیت را دارند!
سال 2028 : افزایش توان پردازنده Nighthawk به اجرای مدارهایی با ۱۵٬۰۰۰ گیت!
@ai_python
سال 2029 : عرضه IBM Quantum Starling با ۲۰۰ کیوبیت منطقی و توان اجرای مدارهایی با ۱۰۰ میلیون گیت.😮
سال 2033 : عرضه IBM Quantum Blue Jay با ۲٬۰۰۰ کیوبیت منطقی و بیش از یک میلیارد گیت.
@ai_python
آی بی ام تأکید میکند که سختافزار تنها نیمی از داستان است. نقشهراه نرمافزاری آنها شامل:
🖥 استفاده از الگوریتمها در کاربردهای واقعی
🖥 کشف الگوریتمهای جدید برای دستیابی به برتری کوانتومی
🖥 هماهنگسازی بارهای کاری بین رایانش کوانتومی و رایانش با عملکرد بالا (HPC)
🖥 اجرای دقیق و کارآمد الگوریتمها
X
سال 2025 : معرفی پردازنده کوانتومی IBM Quantum Nighthawk که 120 کیوبیتی هستند و توانایی اجرای مدارهایی تا 5000 گیت را دارند!
سال 2028 : افزایش توان پردازنده Nighthawk به اجرای مدارهایی با ۱۵٬۰۰۰ گیت!
@ai_python
سال 2029 : عرضه IBM Quantum Starling با ۲۰۰ کیوبیت منطقی و توان اجرای مدارهایی با ۱۰۰ میلیون گیت.
سال 2033 : عرضه IBM Quantum Blue Jay با ۲٬۰۰۰ کیوبیت منطقی و بیش از یک میلیارد گیت.
@ai_python
آی بی ام تأکید میکند که سختافزار تنها نیمی از داستان است. نقشهراه نرمافزاری آنها شامل:
X
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1