📄 PaddleOCR-VL (0.9B) —
مدل فشرده Vision-Language نسل جدید از Baidu AI
تیم تحقیقاتی Baidu AI نسخهی جدیدی از مدلهای چندوجهی خود را معرفی کرده است:
🔹 PaddleOCR-VL (0.9B) —
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:
♻️شناسایی و تشخیص متنها
♻️جدولها و دادههای ساختاریافته
♻️فرمولهای ریاضی
♻️نمودارها و گرافه
ا
💡 درون :
NaViT —
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE —
نسخه سبکشدهی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاههای لبهای (edge).
🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR
🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:
paddleocr.ai/latest/en/index.html
@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
مدل فشرده Vision-Language نسل جدید از Baidu AI
تیم تحقیقاتی Baidu AI نسخهی جدیدی از مدلهای چندوجهی خود را معرفی کرده است:
🔹 PaddleOCR-VL (0.9B) —
مدلی بسیار سبک که با وجود اندازه کوچک، به دقت SOTA در وظایف بینایی-زبانی دست یافته است:
♻️شناسایی و تشخیص متنها
♻️جدولها و دادههای ساختاریافته
♻️فرمولهای ریاضی
♻️نمودارها و گرافه
ا
💡 درون :
NaViT —
انکودر تصویری پویا (Dynamic Vision Encoder)
ERNIE —
نسخه سبکشدهی مدل زبانی بایدو برای درک متن
⚡️ پشتیبانی از ۱۰۹ زبان مختلف، با تمرکز بر کارایی بالا در دستگاههای لبهای (edge).
🟠 GitHub:
github.com/PaddlePaddle/PaddleOCR
🟠 HuggingFace:
PaddleOCR-VL
🟠 اسناد رسمی:
paddleocr.ai/latest/en/index.html
@rss_ai_ir
#BaiduAI #PaddlePaddle #Ernie #PaddleOCR #VisionLanguage #AI #OCR
🔥 سم آلتمن در حال انجام یکی از بزرگترین «تغییرات مالکیتی» تاریخ است!
شرکت OpenAI که در ابتدا ۱۰۰٪ غیرانتفاعی بود،
اکنون تنها حدود ۲۰٪ از مالکیت خود را در اختیار بنیاد اصلی دارد.
📉 یعنی چه؟
> آلتمن عملاً ۸۰٪ از کنترل و سهم مالی را از ساختار غیرانتفاعی جدا کرده
و حالا بهصورت غیرمستقیم میخواهد OpenAI را به خودش بفروشد — آنهم با قیمتی پایینتر از ارزش واقعی.
⚖️ در همین حال، ایلان ماسک علیه این اقدام در دادگاه در حال پیگیری است.
به نظر میرسد نبرد بر سر آیندهی OpenAI تازه آغاز شده...
@rss_ai_ir
#OpenAI #SamAltman #ElonMusk #AI #TechEthics
شرکت OpenAI که در ابتدا ۱۰۰٪ غیرانتفاعی بود،
اکنون تنها حدود ۲۰٪ از مالکیت خود را در اختیار بنیاد اصلی دارد.
📉 یعنی چه؟
> آلتمن عملاً ۸۰٪ از کنترل و سهم مالی را از ساختار غیرانتفاعی جدا کرده
و حالا بهصورت غیرمستقیم میخواهد OpenAI را به خودش بفروشد — آنهم با قیمتی پایینتر از ارزش واقعی.
⚖️ در همین حال، ایلان ماسک علیه این اقدام در دادگاه در حال پیگیری است.
به نظر میرسد نبرد بر سر آیندهی OpenAI تازه آغاز شده...
@rss_ai_ir
#OpenAI #SamAltman #ElonMusk #AI #TechEthics
🧬 مدل Gemma C2S-Scale 27B راهی تازه برای مبارزه با سرطان گشود
پژوهشگران Google Research و Calico از این مدل برای تحلیل فعالیت ژنها در سلولها و یافتن ترکیباتی استفاده کردند که بتوانند واکنش ایمنی بدن علیه تومورها را تقویت کنند.
🔍 چالش اصلی این است که بسیاری از تومورها «سرد» باقی میمانند — سیستم ایمنی آنها را تشخیص نمیدهد. برای فعالسازی پاسخ ایمنی باید بیان آنتیژنها (Antigen Presentation) را افزایش داد، آن هم فقط در سلولهایی که نشانهای از پاسخ ایمنی ضعیف دارند.
🧠 مدل Gemma پیشبینی کرد که ترکیب داروی silmitasertib (مهارکنندهی CK2) با دوز پایین اینترفرون باعث افزایش بیان MHC-I میشود — در نتیجه تومورهای «سرد» برای سیستم ایمنی قابلتشخیصتر میشوند.
🔬 نتایج آزمایشگاهی این پیشبینی را تأیید کردند:
ترکیب دو دارو، فعالیت آنتیژنها را حدود ۵۰٪ افزایش داد.
این دستاورد میتواند پایهای برای نسل جدیدی از ایمونوتراپی (درمانهای ایمنی ضد سرطان) باشد.
✨ نکتهی مهم:
هوش مصنوعی فقط دادهها را تحلیل نکرد — بلکه فرضیهای علمی ارائه داد که در عمل نیز تأیید شد.
نمونهای از گذار بزرگ: از مدلهای زبانی به کاشفان دارو و سازوکارهای زیستی نوین.
🟢 بیشتر بخوانید
🧾 مقالهی علمی
💻 GitHub
@rss_ai_ir
#GoogleAI #Gemma #Calico #BioTech #CancerResearch #AI
پژوهشگران Google Research و Calico از این مدل برای تحلیل فعالیت ژنها در سلولها و یافتن ترکیباتی استفاده کردند که بتوانند واکنش ایمنی بدن علیه تومورها را تقویت کنند.
🔍 چالش اصلی این است که بسیاری از تومورها «سرد» باقی میمانند — سیستم ایمنی آنها را تشخیص نمیدهد. برای فعالسازی پاسخ ایمنی باید بیان آنتیژنها (Antigen Presentation) را افزایش داد، آن هم فقط در سلولهایی که نشانهای از پاسخ ایمنی ضعیف دارند.
🧠 مدل Gemma پیشبینی کرد که ترکیب داروی silmitasertib (مهارکنندهی CK2) با دوز پایین اینترفرون باعث افزایش بیان MHC-I میشود — در نتیجه تومورهای «سرد» برای سیستم ایمنی قابلتشخیصتر میشوند.
🔬 نتایج آزمایشگاهی این پیشبینی را تأیید کردند:
ترکیب دو دارو، فعالیت آنتیژنها را حدود ۵۰٪ افزایش داد.
این دستاورد میتواند پایهای برای نسل جدیدی از ایمونوتراپی (درمانهای ایمنی ضد سرطان) باشد.
✨ نکتهی مهم:
هوش مصنوعی فقط دادهها را تحلیل نکرد — بلکه فرضیهای علمی ارائه داد که در عمل نیز تأیید شد.
نمونهای از گذار بزرگ: از مدلهای زبانی به کاشفان دارو و سازوکارهای زیستی نوین.
🟢 بیشتر بخوانید
🧾 مقالهی علمی
💻 GitHub
@rss_ai_ir
#GoogleAI #Gemma #Calico #BioTech #CancerResearch #AI
📊 هوش مصنوعی و بازار کار آمریکا؛ هنوز خبری از آخرالزمان نیست، اما نشانههایی نگرانکننده دیده میشود
پژوهشگران بازار کار آمریکا همچنان در حال بررسی تأثیر هوش مصنوعی بر اشتغال هستند — و تا این لحظه، هیچ فاجعهای که برخی رسانهها و بدبینان وعده میدادند، دیده نمیشود.
اما با نگاهی دقیقتر، روندهایی در حال شکلگیری است که تا حدی نتایج پژوهش اخیر دانشگاه استنفورد را تأیید میکند.
💼 نکات کلیدی:
✅اجرای واقعی فناوریهای هوش مصنوعی تازه آغاز شده است.
✅از سال گذشته، تعداد موقعیتهای شغلی مرتبط با ادغام هوش مصنوعی در فرآیندهای تجاری بهطور پیوسته در حال افزایش است.
پژوهشگران شرکتها را به دو گروه تقسیم کردند:
♻️شرکتهای AI-adopters (پذیرفته و بهکارگیرندهی هوش مصنوعی) و سایر شرکتها.
♻️نتیجه: در گروه نخست، روند استخدام تغییر کرده — کاهش استخدام نیروهای تازهکار (Junior) و افزایش جذب متخصصان ارشد (Senior).
♻️هرچند این شرکتها هنوز تنها حدود ۱۷٪ از بازار کار را تشکیل میدهند و تأثیر فعلاً ملایم است.
📘 نام پژوهش نیز جالب است:
Generative AI as Seniority-Biased Technological Change —
«هوش مصنوعی مولد بهعنوان تغییری فناورانه با سوگیری به نفع نیروهای باتجربه».
🎓 بررسیها نشان میدهد که تأثیر این روند به سطح دانشگاه محل تحصیل نیروهای تازهکار نیز بستگی دارد:
✳️فارغالتحصیلان دانشگاههای برتر کمترین آسیب را دیدهاند.
✳️به شکل جالبی، فارغالتحصیلان دانشگاههای ضعیفتر هم وضعیت نسبتاً بهتری دارند — چون ارزانترند.
✳️اما آسیبدیدهترین گروه، دانشآموختگان دانشگاههای متوسط هستند که در رقابت بازار کار عقب افتادهاند.
📈 نتیجه:
فعلاً خبری از «آخرالزمان شغلی با هوش مصنوعی» نیست،
اما ساختار بازار کار آرامآرام تغییر میکند —
به نفع نیروهای باتجربه و به زیان تازهکارها.
🔗 منبع: The Economist
#هوش_مصنوعی #بازارکار #اقتصاد #آینده_شغل #AI #Economist #GenerativeAI
پژوهشگران بازار کار آمریکا همچنان در حال بررسی تأثیر هوش مصنوعی بر اشتغال هستند — و تا این لحظه، هیچ فاجعهای که برخی رسانهها و بدبینان وعده میدادند، دیده نمیشود.
اما با نگاهی دقیقتر، روندهایی در حال شکلگیری است که تا حدی نتایج پژوهش اخیر دانشگاه استنفورد را تأیید میکند.
💼 نکات کلیدی:
✅اجرای واقعی فناوریهای هوش مصنوعی تازه آغاز شده است.
✅از سال گذشته، تعداد موقعیتهای شغلی مرتبط با ادغام هوش مصنوعی در فرآیندهای تجاری بهطور پیوسته در حال افزایش است.
پژوهشگران شرکتها را به دو گروه تقسیم کردند:
♻️شرکتهای AI-adopters (پذیرفته و بهکارگیرندهی هوش مصنوعی) و سایر شرکتها.
♻️نتیجه: در گروه نخست، روند استخدام تغییر کرده — کاهش استخدام نیروهای تازهکار (Junior) و افزایش جذب متخصصان ارشد (Senior).
♻️هرچند این شرکتها هنوز تنها حدود ۱۷٪ از بازار کار را تشکیل میدهند و تأثیر فعلاً ملایم است.
📘 نام پژوهش نیز جالب است:
Generative AI as Seniority-Biased Technological Change —
«هوش مصنوعی مولد بهعنوان تغییری فناورانه با سوگیری به نفع نیروهای باتجربه».
🎓 بررسیها نشان میدهد که تأثیر این روند به سطح دانشگاه محل تحصیل نیروهای تازهکار نیز بستگی دارد:
✳️فارغالتحصیلان دانشگاههای برتر کمترین آسیب را دیدهاند.
✳️به شکل جالبی، فارغالتحصیلان دانشگاههای ضعیفتر هم وضعیت نسبتاً بهتری دارند — چون ارزانترند.
✳️اما آسیبدیدهترین گروه، دانشآموختگان دانشگاههای متوسط هستند که در رقابت بازار کار عقب افتادهاند.
📈 نتیجه:
فعلاً خبری از «آخرالزمان شغلی با هوش مصنوعی» نیست،
اما ساختار بازار کار آرامآرام تغییر میکند —
به نفع نیروهای باتجربه و به زیان تازهکارها.
🔗 منبع: The Economist
#هوش_مصنوعی #بازارکار #اقتصاد #آینده_شغل #AI #Economist #GenerativeAI
👍1😁1💔1
😨 دانشمندان مؤسسهی فناوری کارلسروهه (KIT) کشف کردهاند که امواج وایفای پس از بازتاب از بدن انسان میتوانند برای شناسایی هویت افراد استفاده شوند — درست مثل سیستم سونار در فیلم The Dark Knight.
🔍 این امواج رمزگذاریشده نیستند، و پژوهشگران نشان دادهاند که با تحلیل بازتاب آنها میتوان تصاویر دقیقی از انسانها ایجاد کرد — تقریباً مانند تصویری که از یک دوربین معمولی بهدست میآید.
🤖 با استفاده از این دادهها، هوش مصنوعی قادر است با دقت ۱۰۰٪ شخص را شناسایی کند، موقعیت او در فضا، حالت بدنش و حتی کاری که انجام میدهد را تشخیص دهد. این آزمایش با حضور ۱۹۷ شرکتکننده با موفقیت انجام شده است.
⚠️ بخش ترسناک ماجرا اینجاست:
برای اجرای چنین فناوریای هیچ تجهیزات خاصی لازم نیست — پژوهشگران معتقدند که از طریق هر مودم خانگی وایفای میتوان افراد را ردیابی و حتی نظارت کرد.
📡 حتی وایفای هم به ما خیانت کرد.
@rss_ai_ir
#هوش_مصنوعی #وای_فای #نظارت #حریم_خصوصی #KIT #AI
🔍 این امواج رمزگذاریشده نیستند، و پژوهشگران نشان دادهاند که با تحلیل بازتاب آنها میتوان تصاویر دقیقی از انسانها ایجاد کرد — تقریباً مانند تصویری که از یک دوربین معمولی بهدست میآید.
🤖 با استفاده از این دادهها، هوش مصنوعی قادر است با دقت ۱۰۰٪ شخص را شناسایی کند، موقعیت او در فضا، حالت بدنش و حتی کاری که انجام میدهد را تشخیص دهد. این آزمایش با حضور ۱۹۷ شرکتکننده با موفقیت انجام شده است.
⚠️ بخش ترسناک ماجرا اینجاست:
برای اجرای چنین فناوریای هیچ تجهیزات خاصی لازم نیست — پژوهشگران معتقدند که از طریق هر مودم خانگی وایفای میتوان افراد را ردیابی و حتی نظارت کرد.
📡 حتی وایفای هم به ما خیانت کرد.
@rss_ai_ir
#هوش_مصنوعی #وای_فای #نظارت #حریم_خصوصی #KIT #AI
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت DeepRobotics نسل دوم ربات انساننمای خود با نام DR02 را معرفی کرد
✅این نسخه جدید با طراحی بسیار انسانمحورتر و تواناییهای فنی چشمگیر، گامی مهم در جهت استفادهی عملی از رباتها در محیطهای واقعی محسوب میشود.
🔥 ویژگیهای برجسته DR02:
✳️مقاومت حرارتی از منفی ۲۰ تا ۵۵ درجه سانتیگراد
✳️کاملاً ضد آب و ضد گرد و غبار
✳️عملکرد پایدار در شرایط سخت مانند باران، رطوبت بالا، شن و ماسه
✳️این ربات برای فعالیت در محیطهای دشوار طراحی شده است —
از مناطق بیابانی و جنگلی گرفته تا معدنها و نیروگاهها.
🦾 همچنین DR02 میتواند با رباتهای X30 و LYNX M20 همکاری کند تا مأموریتهایی مانند:
♻️بازرسی صنعتی
♻️عملیات نجات
♻️شناسایی و نقشهبرداری
♻️عبور از موانع پیچیده
را انجام دهد — بدون نیاز به حضور انسان در شرایط خطرناک.
این پیشرفت نشان میدهد که رباتهای انساننما بهسرعت از نمایشگاهها به میدان عمل وارد میشوند.
#هوش_مصنوعی #رباتیک #DeepRobotics #Humanoid #ربات_انسان_نما #ربات_صنعتی #AI
✅این نسخه جدید با طراحی بسیار انسانمحورتر و تواناییهای فنی چشمگیر، گامی مهم در جهت استفادهی عملی از رباتها در محیطهای واقعی محسوب میشود.
🔥 ویژگیهای برجسته DR02:
✳️مقاومت حرارتی از منفی ۲۰ تا ۵۵ درجه سانتیگراد
✳️کاملاً ضد آب و ضد گرد و غبار
✳️عملکرد پایدار در شرایط سخت مانند باران، رطوبت بالا، شن و ماسه
✳️این ربات برای فعالیت در محیطهای دشوار طراحی شده است —
از مناطق بیابانی و جنگلی گرفته تا معدنها و نیروگاهها.
🦾 همچنین DR02 میتواند با رباتهای X30 و LYNX M20 همکاری کند تا مأموریتهایی مانند:
♻️بازرسی صنعتی
♻️عملیات نجات
♻️شناسایی و نقشهبرداری
♻️عبور از موانع پیچیده
را انجام دهد — بدون نیاز به حضور انسان در شرایط خطرناک.
این پیشرفت نشان میدهد که رباتهای انساننما بهسرعت از نمایشگاهها به میدان عمل وارد میشوند.
#هوش_مصنوعی #رباتیک #DeepRobotics #Humanoid #ربات_انسان_نما #ربات_صنعتی #AI
❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتهای انساننمای چینی شرکت Unitree با سرعتی شگفتانگیز در حال پیشرفت هستند!
این نسل جدید از رباتها اکنون قادرند حرکات پیچیده و دشوار را با دقت و تعادل بالا انجام دهند — از پرش و چرخش گرفته تا حرکات ترکیبی مشابه تمرینات ورزشی انسان.
📈 سرعت پیشرفت این سیستمها در یادگیری و کنترل حرکتی نشان میدهد که چین در مسیر تبدیل شدن به یکی از رهبران جهانی در حوزهی رباتیک هوشمند قرار دارد.
🎯 در آیندهای نهچندان دور، این رباتها میتوانند در صنایع، امداد و نجات، و حتی کارهای روزمره کنار انسانها فعالیت کنند.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #Unitree #ربات_انسان_نما #AI #China
این نسل جدید از رباتها اکنون قادرند حرکات پیچیده و دشوار را با دقت و تعادل بالا انجام دهند — از پرش و چرخش گرفته تا حرکات ترکیبی مشابه تمرینات ورزشی انسان.
📈 سرعت پیشرفت این سیستمها در یادگیری و کنترل حرکتی نشان میدهد که چین در مسیر تبدیل شدن به یکی از رهبران جهانی در حوزهی رباتیک هوشمند قرار دارد.
🎯 در آیندهای نهچندان دور، این رباتها میتوانند در صنایع، امداد و نجات، و حتی کارهای روزمره کنار انسانها فعالیت کنند.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #Unitree #ربات_انسان_نما #AI #China
This media is not supported in your browser
VIEW IN TELEGRAM
🫙 AnyUp:
افزایش جهانی ویژگیها در بینایی ماشین 🫙
❌پژوهشگران روش جدیدی با نام AnyUp ارائه کردهاند که میتواند برای افزایش وضوح ویژگیها (Feature Up-Sampling) در هر مدل بینایی ماشین و در هر رزولوشنی استفاده شود — بدون نیاز به آموزش مجدد شبکهی رمزگذار (Encoder).
💡 ویژگی اصلی:
معماری AnyUp یک معماری feature-agnostic است که تنها در زمان استنتاج (inference) عمل میکند و کیفیت بازسازی ویژگیها را در تصاویر به شکل چشمگیری بهبود میدهد.
🔹 قابل استفاده برای تمام معماریهای بینایی (CNN، ViT و غیره)
🔹 بدون نیاز به دادهی اضافی یا تنظیم مجدد مدل
🔹 بهبود کیفیت جزئیات و مرزهای دقیق در تصاویر بازسازیشده
📘 منابع:
👉 مقاله: arxiv.org/pdf/2510.12764
👉 پروژه: wimmerth.github.io/anyup
👉 کد: github.com/wimmerth/anyup
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #DeepLearning #AnyUp #ComputerVision #AI
افزایش جهانی ویژگیها در بینایی ماشین 🫙
❌پژوهشگران روش جدیدی با نام AnyUp ارائه کردهاند که میتواند برای افزایش وضوح ویژگیها (Feature Up-Sampling) در هر مدل بینایی ماشین و در هر رزولوشنی استفاده شود — بدون نیاز به آموزش مجدد شبکهی رمزگذار (Encoder).
💡 ویژگی اصلی:
معماری AnyUp یک معماری feature-agnostic است که تنها در زمان استنتاج (inference) عمل میکند و کیفیت بازسازی ویژگیها را در تصاویر به شکل چشمگیری بهبود میدهد.
🔹 قابل استفاده برای تمام معماریهای بینایی (CNN، ViT و غیره)
🔹 بدون نیاز به دادهی اضافی یا تنظیم مجدد مدل
🔹 بهبود کیفیت جزئیات و مرزهای دقیق در تصاویر بازسازیشده
📘 منابع:
👉 مقاله: arxiv.org/pdf/2510.12764
👉 پروژه: wimmerth.github.io/anyup
👉 کد: github.com/wimmerth/anyup
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #DeepLearning #AnyUp #ComputerVision #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 Anthropic معرفی کرد:
Claude Haiku 4.5
نسخهی جدید مدل Claude Haiku 4.5 منتشر شد — مدلی در سطح Sonnet 4، اما با سرعتی بیش از دو برابر و هزینهای سهبرابر کمتر! ⚡
📊 نتایج عملکرد:
♻️در آزمون SWE-Bench Verified برای تولید کد: ۷۳٪
♻️در آزمون Terminal-Bench برای مهارتهای خط فرمان: ۴۱٪
🔸 این نتایج کمی پایینتر از Sonnet 4.5 هستند، اما مدل جدید Haiku 4.5 توانسته از Sonnet 4 و Gemini 2.5 پیشی بگیرد.
💰 هزینه استفاده:
♻️ورودی (input): ۱ دلار
♻️خروجی (output): ۵ دلار
🧠 همچنین Haiku 4.5 اکنون در Claude Code در دسترس است — طراحیشده برای سرعت بالا در برنامهنویسی، تحلیل و تعامل زبانی در محیطهای فنی.
🔗 جزئیات رسمی
https://www.anthropic.com/news/claude-haiku-4-5
#هوش_مصنوعی #Claude #Anthropic #Haiku #LLM #AI
Claude Haiku 4.5
نسخهی جدید مدل Claude Haiku 4.5 منتشر شد — مدلی در سطح Sonnet 4، اما با سرعتی بیش از دو برابر و هزینهای سهبرابر کمتر! ⚡
📊 نتایج عملکرد:
♻️در آزمون SWE-Bench Verified برای تولید کد: ۷۳٪
♻️در آزمون Terminal-Bench برای مهارتهای خط فرمان: ۴۱٪
🔸 این نتایج کمی پایینتر از Sonnet 4.5 هستند، اما مدل جدید Haiku 4.5 توانسته از Sonnet 4 و Gemini 2.5 پیشی بگیرد.
💰 هزینه استفاده:
♻️ورودی (input): ۱ دلار
♻️خروجی (output): ۵ دلار
🧠 همچنین Haiku 4.5 اکنون در Claude Code در دسترس است — طراحیشده برای سرعت بالا در برنامهنویسی، تحلیل و تعامل زبانی در محیطهای فنی.
🔗 جزئیات رسمی
https://www.anthropic.com/news/claude-haiku-4-5
#هوش_مصنوعی #Claude #Anthropic #Haiku #LLM #AI
🤖 مینی-ChatGPT آماده از آندری کارپاتی!
آندری کارپاتی، نابغهی یادگیری عمیق و خالق پروژهی معروف nanoGPT، حالا نسخهی جدیدی از آن را معرفی کرده است — nanochat ✨
این پروژه یک کلون کوچک ChatGPT است که میتواند از صفر تا مرحلهی نهایی استنتاج (Inference) آموزش ببیند.
📊 جزئیات نسخه جدید – nanochat d32:
آموزش کامل در ۳۳ ساعت
هزینهی آموزش فقط حدود ۱۰۰۰ دلار 💸
دارای ۳۲ لایه ترنسفورمر
شامل تمام مراحل آموزش از پایه تا تقویتی:
Pretrain → Midtrain → SFT → RL
حتی از Tool Use هم پشتیبانی میکند 🔧
💡 نتایج عملکرد:
امتیاز CORE score = 0.31 (بهتر از GPT-2 با امتیاز ≈ 0.26)
در آزمون GSM8K (ریاضی) دقت از ۸٪ به ۲۰٪ افزایش یافته است 📈
کارپاتی با شوخطبعی میگوید:
> «مدل هنوز مثل یک کودک پیشدبستانی است، ولی یاد گرفته همهچیز را از صفر تا ابزارمحور شدن انجام دهد!» 😄
💰 جالبتر اینکه کوچکترین نسخههای این مدل را میتوان فقط با ۱۰۰ دلار آموزش داد.
به گفتهی آندری، بهزودی نسخهی وبی این مدل هم منتشر خواهد شد.
🔗 مشاهده در GitHub
#هوش_مصنوعی #nanochat #Karpathy #ChatGPT #LLM #DeepLearning
آندری کارپاتی، نابغهی یادگیری عمیق و خالق پروژهی معروف nanoGPT، حالا نسخهی جدیدی از آن را معرفی کرده است — nanochat ✨
این پروژه یک کلون کوچک ChatGPT است که میتواند از صفر تا مرحلهی نهایی استنتاج (Inference) آموزش ببیند.
📊 جزئیات نسخه جدید – nanochat d32:
آموزش کامل در ۳۳ ساعت
هزینهی آموزش فقط حدود ۱۰۰۰ دلار 💸
دارای ۳۲ لایه ترنسفورمر
شامل تمام مراحل آموزش از پایه تا تقویتی:
Pretrain → Midtrain → SFT → RL
حتی از Tool Use هم پشتیبانی میکند 🔧
💡 نتایج عملکرد:
امتیاز CORE score = 0.31 (بهتر از GPT-2 با امتیاز ≈ 0.26)
در آزمون GSM8K (ریاضی) دقت از ۸٪ به ۲۰٪ افزایش یافته است 📈
کارپاتی با شوخطبعی میگوید:
> «مدل هنوز مثل یک کودک پیشدبستانی است، ولی یاد گرفته همهچیز را از صفر تا ابزارمحور شدن انجام دهد!» 😄
💰 جالبتر اینکه کوچکترین نسخههای این مدل را میتوان فقط با ۱۰۰ دلار آموزش داد.
به گفتهی آندری، بهزودی نسخهی وبی این مدل هم منتشر خواهد شد.
🔗 مشاهده در GitHub
#هوش_مصنوعی #nanochat #Karpathy #ChatGPT #LLM #DeepLearning
❤1
⚡️ رسماً تأیید شد: همکاری OpenAI و Broadcom برای تولید تراشههای اختصاصی هوش مصنوعی
شب گذشته، OpenAI اعلام کرد که با شرکت Broadcom قراردادی امضا کرده است تا بهطور مشترک تراشههای اختصاصی خود را توسعه دهد.
🔋 جزئیات پروژه:
✳️ظرفیت کل زیرساخت: ۱۰ گیگاوات (معادل برق مصرفی حدود ۸ میلیون خانه)
✳️نخستین راهاندازیها: نیمه دوم سال ۲۰۲۶
✳️تکمیل کامل زیرساخت: تا سال ۲۰۲۹
این تراشهها عمدتاً برای مرحلهی استنتاج (Inference) طراحی میشوند، نه آموزش مدلها.
این یعنی OpenAI میتواند تراشهها را دقیقاً متناسب با نیازهای خود بهینه کند — کاهش چشمگیر هزینهها، افزایش کارایی، و مهمتر از همه، کاهش وابستگی به Nvidia 🟢
بهنظر میرسد OpenAI در حال آمادهسازی زیرساختی است که در آینده بتواند بهصورت مستقل اکوسیستم سختافزاری و نرمافزاری خود را کنترل کند.
🧠 دنیای تراشههای هوش مصنوعی وارد مرحلهی جدیدی شد...
https://openai.com/index/openai-and-broadcom-announce-strategic-collaboration/
#OpenAI #Broadcom #AIChip #Nvidia #هوش_مصنوعی #تراشه #DeepLearning
شب گذشته، OpenAI اعلام کرد که با شرکت Broadcom قراردادی امضا کرده است تا بهطور مشترک تراشههای اختصاصی خود را توسعه دهد.
🔋 جزئیات پروژه:
✳️ظرفیت کل زیرساخت: ۱۰ گیگاوات (معادل برق مصرفی حدود ۸ میلیون خانه)
✳️نخستین راهاندازیها: نیمه دوم سال ۲۰۲۶
✳️تکمیل کامل زیرساخت: تا سال ۲۰۲۹
این تراشهها عمدتاً برای مرحلهی استنتاج (Inference) طراحی میشوند، نه آموزش مدلها.
این یعنی OpenAI میتواند تراشهها را دقیقاً متناسب با نیازهای خود بهینه کند — کاهش چشمگیر هزینهها، افزایش کارایی، و مهمتر از همه، کاهش وابستگی به Nvidia 🟢
بهنظر میرسد OpenAI در حال آمادهسازی زیرساختی است که در آینده بتواند بهصورت مستقل اکوسیستم سختافزاری و نرمافزاری خود را کنترل کند.
🧠 دنیای تراشههای هوش مصنوعی وارد مرحلهی جدیدی شد...
https://openai.com/index/openai-and-broadcom-announce-strategic-collaboration/
#OpenAI #Broadcom #AIChip #Nvidia #هوش_مصنوعی #تراشه #DeepLearning
This media is not supported in your browser
VIEW IN TELEGRAM
🫧 تشخیص هرچیز با مدل چندوجهی Rex-Omni 🫧
مدل Rex-Omni با ۳ میلیارد پارامتر، یک مدل چندوجهی (Multimodal) جدید است که طیف گستردهای از وظایف بینایی را در یک چارچوب واحد ادغام میکند:
🔹 تشخیص اشیا (Object Detection)
🔹 تشخیص متن (OCR)
🔹 همچنین Pointing و Key-pointing
🔹 و Visual Prompting
همهی این وظایف در قالب یک چارچوب واحد مبتنی بر پیشبینی نقطه بعدی (Next-Point Prediction) انجام میشوند — رویکردی که باعث شده مدل نتایج چشمگیری در دقت و سرعت به دست آورد ⚡️
📘 ویژگیها:
پارامترها: ۳B
یکپارچهسازی تمام وظایف ادراکی در یک معماری ساده
مجوز: IDEA License 1.0 💙
🔗 لینکها:
📄 Review
📘 Paper
🌐 Project Page
💻 GitHub Repo
@rss_ai_ir
#AI #RexOmni #Multimodal #MLLM #ComputerVision #OCR #Detection #هوش_مصنوعی
مدل Rex-Omni با ۳ میلیارد پارامتر، یک مدل چندوجهی (Multimodal) جدید است که طیف گستردهای از وظایف بینایی را در یک چارچوب واحد ادغام میکند:
🔹 تشخیص اشیا (Object Detection)
🔹 تشخیص متن (OCR)
🔹 همچنین Pointing و Key-pointing
🔹 و Visual Prompting
همهی این وظایف در قالب یک چارچوب واحد مبتنی بر پیشبینی نقطه بعدی (Next-Point Prediction) انجام میشوند — رویکردی که باعث شده مدل نتایج چشمگیری در دقت و سرعت به دست آورد ⚡️
📘 ویژگیها:
پارامترها: ۳B
یکپارچهسازی تمام وظایف ادراکی در یک معماری ساده
مجوز: IDEA License 1.0 💙
🔗 لینکها:
📄 Review
📘 Paper
🌐 Project Page
💻 GitHub Repo
@rss_ai_ir
#AI #RexOmni #Multimodal #MLLM #ComputerVision #OCR #Detection #هوش_مصنوعی
🎬 استوریبرد Sora 2 Pro منتشر شد!
نسخهی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگیای که اجازه میدهد سکانسهای ویدیو را بهصورت دقیق و سینمایی برنامهریزی کنید.
🎞 با این قابلیت میتوانید:
طرح صحنهها را فریمبهفریم بچینید
زاویه، ترکیببندی و حرکت دوربین را از قبل تعریف کنید
ویدیوهای ۲۵ ثانیهای با جزئیات فوقالعاده بسازید
بهنوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»
@rss_ai_ir
#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI
نسخهی PRO برای کاربران ویژه، حالا با قابلیت Storyboard عرضه شده است — ویژگیای که اجازه میدهد سکانسهای ویدیو را بهصورت دقیق و سینمایی برنامهریزی کنید.
🎞 با این قابلیت میتوانید:
طرح صحنهها را فریمبهفریم بچینید
زاویه، ترکیببندی و حرکت دوربین را از قبل تعریف کنید
ویدیوهای ۲۵ ثانیهای با جزئیات فوقالعاده بسازید
بهنوعی این یعنی:
🎥 «چیزی شبیه Veo 3.1، اما با کنترل کارگردانی واقعی!»
@rss_ai_ir
#Sora #Storyboard #AIvideo #هوش_مصنوعی #OpenAI
❤1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 FlashWorld —
تولید صحنههای سهبعدی در ۵ ثانیه با یک GPU ⚡️
سیستم جدید FlashWorld معرفی شد — مدلی که میتواند از یک تصویر یا فقط یک توضیح متنی، صحنههای سهبعدی واقعی و با جزئیات بالا تولید کند.
🚀 ویژگیها:
♻️تا ۱۰۰ برابر سریعتر از روشهای قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU
به زبان ساده، FlashWorld کاری میکند که با یک کلیک، جهان سهبعدیات ساخته شود — مثل فشردن دکمه «render reality».
🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page
#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین
تولید صحنههای سهبعدی در ۵ ثانیه با یک GPU ⚡️
سیستم جدید FlashWorld معرفی شد — مدلی که میتواند از یک تصویر یا فقط یک توضیح متنی، صحنههای سهبعدی واقعی و با جزئیات بالا تولید کند.
🚀 ویژگیها:
♻️تا ۱۰۰ برابر سریعتر از روشهای قبلی
♻️کیفیت بالا و فوتورئالیستی
♻️تولید کامل صحنه در ۵ ثانیه فقط با یک GPU
به زبان ساده، FlashWorld کاری میکند که با یک کلیک، جهان سهبعدیات ساخته شود — مثل فشردن دکمه «render reality».
🔗 کد:
github.com/imlixinyang/FlashWorld
🌐 صفحه پروژه:
imlixinyang.github.io/FlashWorld-Project-Page
#AI #3D #FlashWorld #GenerativeAI #هوش_مصنوعی #گرافیک #یادگیری_ماشین
🧬 ShinkaEvolve —
تکامل کدهای علمی با کمک هوش مصنوعی
پروژهی ShinkaEvolve یک فریمورک نوآورانه است که مدلهای زبانی بزرگ (LLM) را با الگوریتمهای تکاملی (Evolutionary Algorithms) ترکیب میکند تا فرآیند کشف علمی و بهینهسازی کد را خودکار کند.
💡 ویژگیهای کلیدی:
✳️ترکیب هوش مصنوعی خلاق با بهینهسازی تکاملی.
✳️پشتیبانی از ارزیابی موازی در رایانههای محلی یا خوشههای محاسباتی.
✳️ذخیرهی راهحلهای موفق برای انتقال دانش و تجربه به نسلهای بعدی مدل.
✳️بهینهسازی عملکرد کد در حالی که درستی آن حفظ میشود.
✳️مناسب برای پژوهشهای علمی که تست یا validator مشخص دارند.
این سیستم بهنوعی «زیستشناسی تکاملی برای کد» است — هر نسل از نسخهها بهینهتر و خلاقتر از قبل میشود.
📌 GitHub:
github.com/SakanaAI/ShinkaEvolve
#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی
تکامل کدهای علمی با کمک هوش مصنوعی
پروژهی ShinkaEvolve یک فریمورک نوآورانه است که مدلهای زبانی بزرگ (LLM) را با الگوریتمهای تکاملی (Evolutionary Algorithms) ترکیب میکند تا فرآیند کشف علمی و بهینهسازی کد را خودکار کند.
💡 ویژگیهای کلیدی:
✳️ترکیب هوش مصنوعی خلاق با بهینهسازی تکاملی.
✳️پشتیبانی از ارزیابی موازی در رایانههای محلی یا خوشههای محاسباتی.
✳️ذخیرهی راهحلهای موفق برای انتقال دانش و تجربه به نسلهای بعدی مدل.
✳️بهینهسازی عملکرد کد در حالی که درستی آن حفظ میشود.
✳️مناسب برای پژوهشهای علمی که تست یا validator مشخص دارند.
این سیستم بهنوعی «زیستشناسی تکاملی برای کد» است — هر نسل از نسخهها بهینهتر و خلاقتر از قبل میشود.
📌 GitHub:
github.com/SakanaAI/ShinkaEvolve
#AI #Python #EvolutionaryAlgorithms #LLM #هوش_مصنوعی #یادگیری_ماشین #تکاملی
⚡️ Omni-Embed-Nemotron —
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند
مدل چندوجهی جدید انویدیا برای جستجو در متن، تصویر، صدا و ویدیو
انویدیا از مدل Omni-Embed-Nemotron رونمایی کرد — سامانهای یکپارچه برای تبدیل انواع دادهها به نمایش برداری مشترک (Unified Embedding).
🎯 ویژگیهای کلیدی:
پشتیبانی از همه نوع داده: 📝 متن، 🖼 تصویر، 🔊 صدا، 🎥 ویدیو
مبتنی بر معماری Qwen Omni (ماژول Thinker، بدون تولید متن)
طول زمینه تا ۳۲٬۷۶۸ توکن
اندازهی بردار نهائی (Embedding) برابر ۲۰۴۸
بهینهشده برای GPU و پشتیبانی از FlashAttention 2
🚀 کاربردها:
♻️جستجوی متقاطع بین مدیاها (مثلاً پیدا کردن ویدیو بر اساس متن یا تصویر)
♻️بهبود پروژههای RAG (Retrieval-Augmented Generation)
♻️توسعه سیستمهای درک چندوجهی محتوا
♻️مدلی ساده، سریع و باز که مرز میان دادههای متنی و دیداری را از میان برمیدارد.
🌐 مدل متنباز:
huggingface.co/nvidia/omni-embed-nemotron-3b
#NVIDIA #OmniEmbed #CrossModal #RAG #AI #OpenSource #Multimodal #هوش_مصنوعی #یادگیری_عمیق #جستجوی_هوشمند