Подобно o1, DeepSeek-R1-Lite-Preview планирует заранее и выполняет ряд действий перед выдачей ответа. На это в некоторых случаях уходят десятки секунд.
Подробнее: https://forklog.com/?p=245820
#DeepSeek
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9🤔3👍2❤1
Китайский ИИ-стартап DeepSeek представил собственную большую языковую модель, которая превзошла по тестам конкурентов от Meta и OpenAI.
DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.
Подробнее: https://forklog.com/?p=248784
#DeepSeek
DeepSeek V3 имеет 671 млрд параметров. Для сравнения, у Llama 3.1 405B показатель 405 млрд. Число отражает способность ИИ адаптироваться к более сложным вариантам применения и давать ответы точнее.
Подробнее: https://forklog.com/?p=248784
#DeepSeek
👍7🌚4