🐼 Какой нейросеткой больше пользуешься сейчас?
Anonymous Poll
38%
DeepSeek
14%
GigaChat
11%
YandexGPT 4
61%
ChatGPT
👍3🔥3❤1🤓1
Андрей Карпатый, учёный в области ML и бывший директора по ИИ в Tesla, считает, что в основе успеха R1 – «правильное» обучение с подкреплением, то есть не подражание размеченным данным, а именно самообучение и самоисправление.
Как обучается и работает модель R1 от DeepSeek, схематично показано на картинке 6 этого поста. R1 не зависит полностью от обучения с подкреплением, а использует его только в двух местах:
Понятное и нескучное визуальное объяснение работы новой модельки от автора хрестоматийной статьи о трансформерах Jay Alammar (если знаешь английский, поймёшь все детали).
У бесплатной R1 (уже доступна в чате – 50 сообщений в день) полностью открытый исходный код, то есть любой желающий может взять кодовую базу, адаптировать ее и даже доработать под свои нужды.
Веса ребята опубликовали и на HuggingFace.
Для настоящих энтузиастов стартап опубликовал целую линейку дистиллированых из R1 моделей на базе Llama и Qwen.
Дистилированные модели обладают меньшим количеством весов, пользователи могут запускать их на меньшем количестве видеокарт, у кого они есть дома.
1.5B моделька показывает себя лучше Sonnet и оригинальной 4o на математических бенчмарках, 14B уверенно обходит QwQ, а 32B - o1-mini (правда отстаёт на Codeforces).
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍17❤6🔥3
Спешим исправиться с помощью годной подборки подкастов на заданную тему от команды Kaspersky с крутыми экспертами.
В крупных компаниях, часто лидерах рынка, за тобой следят. Совершенно законно. Всё время, пока ты находишься в офисе.
Предлагаем узнать побольше о DLP-системах (Для Любителей Подглядывать). Шутим
Гости компании Kaspersky рассказывают, как далеко могут зайти DLP-системы, и где заканчивается рабочий день, а начинается личная жизнь. Можно ли от такой «слежки» увернуться?
Мошенникам непременно нужны твои паспортные данные? Как в 2024 году утекло рекордное количество персданных россиян – больше 500 000 записей? Что делать сразу после взлома? Как компаниям реагировать на утечки данных? И как говорить борду директоров об утечке?
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4❤3🔥2
Это круче, чем «Оскар» 🙌 для ML-людей точно. Одна из команд-победителей сложных задач трека «Искусственный интеллект» RuCode.Final собрала овации, выиграла игровые приставки Sony PlayStation 5 и комплект мерча генерального партнёра 🥚 . И поделилась инсайдами, как им это удалось.
Как им это удалось😦
Как им это удалось
Please open Telegram to view this post
VIEW IN TELEGRAM
👏4🎉4🏆3❤2