✍️ جدیدترین مدل زبانی بزرگ توسط چین معرفی شد

DeepSeek، یک شرکت هوش مصنوعی چینی، جدیدترین مدل زبان بزرگ خود را به نام DeepSeek-V3
منتشر کرده است که در تست های بنچمارک از Llama 3.1 متا و GPT-4o OpenAI پیشی می گیرد.

این مدل دارای 671 میلیارد پارامتر است و بیش از 2.8 میلیون ساعت پردازنده گرافیکی روی مجموعه ای از 2048 پردازنده گرافیکی Nvidia H800 با هزینه 5.58 میلیون دلار آموزش دیده است.
قابل توجه است که DeepSeek-V3 به منابع کمتری نسبت به رقبای خود نیاز دارد و راه حلی مقرون به صرفه در چشم انداز هوش مصنوعی ارائه می دهد.

این شرکت DeepSeek-V3 را منبع باز ساخته است و به توسعه دهندگان این امکان را می دهد که مدل را برای برنامه های مختلف تنظیم کنند.

#ai #deepsheek #chineseai #openai
#هوش_مصنوعی 
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
👍11
Media is too big
VIEW IN TELEGRAM
✍️ معرفی غول هوش مصنوعی چین (DeepSeek)


#DeepSeekR1 #deepsheek
#علم_داده #هوش_مصنوعی 
🌑 آقای هوش مصنوعی🌑
🎥رسانه هوش مصنوعی دانشگاه تهران

@MrArtificialintelligence
🔥12👍6👎51