RuCode Festival

RuCode Festival pinned a photo

17:22

RuCode Festival

🐼 Какой нейросеткой больше пользуешься сейчас?

Anonymous Poll

👍3🔥3❤1🤓1

210 voters905 views10:51

RuCode Festival

⭐️ Всё, что нужно сейчас знать об убийце ChatGPT, — LLM-модели R1 от DeepSeek (и полезности, и хайп).

🟣На прошлой неделе стартап представил бесплатную ИИ-модель R1, аналогичную ChatGPT, но работающую с гораздо меньшими затратами. В AI-тестах по математике, работе с кодом и логических рассуждениях новая модель, как утверждают разработчики, показывает такие же результаты, как o1 от OpenAI

🟣Разрабы обучили мощную LLM в 20 раз дешевле и написали об этом подробную статью

🟣Приложение DeepSeek сейчас в топе американского стора

🟣Акции американских технологических компаний резко упали в премаркете. Только Nvidia потеряла 12%. Общие потери американских бигтехов громадны

🟣Основные игроки ИИ-индустрии тратили состояния и анонсировали Stargate Project на 500 млрд $. Оказалось, можно сделать то же самое на порядок дешевле

🟣DeepSeek сообщила о временном ограничении регистрации новых пользователей: уже второй день чат-бот работает со сбоями из-за большого ажиотажа

🥰 ML-пипл, давайте скорее разбираться в феномене!

Андрей Карпатый, учёный в области ML и бывший директора по ИИ в Tesla, считает, что в основе успеха R1 – «правильное» обучение с подкреплением, то есть не подражание размеченным данным, а именно самообучение и самоисправление.

Как обучается и работает модель R1 от DeepSeek, схематично показано на картинке 6 этого поста. R1 не зависит полностью от обучения с подкреплением, а использует его только в двух местах:
1️⃣создание промежуточной модели рассуждений для генерации SFT-данных
2️⃣обучение модели R1 на задачах рассуждения и других типах заданий (с применением различных методов валидации).

Понятное и нескучное визуальное объяснение работы новой модельки от автора хрестоматийной статьи о трансформерах Jay Alammar (если знаешь английский, поймёшь все детали).

У бесплатной R1 (уже доступна в чате – 50 сообщений в день) полностью открытый исходный код, то есть любой желающий может взять кодовую базу, адаптировать ее и даже доработать под свои нужды.

Веса ребята опубликовали и на HuggingFace.

Для настоящих энтузиастов стартап опубликовал целую линейку дистиллированых из R1 моделей на базе Llama и Qwen.
Дистилированные модели обладают меньшим количеством весов, пользователи могут запускать их на меньшем количестве видеокарт, у кого они есть дома.

1.5B моделька показывает себя лучше Sonnet и оригинальной 4o на математических бенчмарках, 14B уверенно обходит QwQ, а 32B - o1-mini (правда отстаёт на Codeforces).

💜 Лайк нашему старшему методисту трека «Искусственный интеллект» Александре Дунаевой за кропотливый сбор такой важной информации, чтобы мы могли поделиться ей с тобой 🤗

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

👍17❤6🔥3

1.3K views15:14

RuCode Festival

😈 Дорешка региона ВсОШ по информатике:

Первый тур
Второй тур

Please open Telegram to view this post

VIEW IN TELEGRAM

👍3🔥2❤1

2.05K views11:08

RuCode Festival

💥 Страсти вокруг DeepSeek так захватили нас, что мы пропустили очень важную дату – День защиты персональных данных.
Спешим исправиться с помощью годной подборки подкастов на заданную тему от команды Kaspersky с крутыми экспертами.

🎙

DLP — это легальная слежка?
В крупных компаниях, часто лидерах рынка, за тобой следят. Совершенно законно. Всё время, пока ты находишься в офисе.
Предлагаем узнать побольше о DLP-системах (Для Любителей Подглядывать). Шутим 🙂 правильная расшифровка — Data Leak Prevention.
Гости компании Kaspersky рассказывают, как далеко могут зайти DLP-системы, и где заканчивается рабочий день, а начинается личная жизнь. Можно ли от такой «слежки» увернуться?

🎙

Упс, у нас утечка

💧

Мошенникам непременно нужны твои паспортные данные? Как в 2024 году утекло рекордное количество персданных россиян – больше 500 000 записей? Что делать сразу после взлома? Как компаниям реагировать на утечки данных? И как говорить борду директоров об утечке?

🎙

Цифровой сталкинг и цифровой след: этика, польза и будущее цифровой слежки за человеком на предприятии и дома.

Please open Telegram to view this post

VIEW IN TELEGRAM

👍4❤3🔥2

1.1K viewsedited 17:05

RuCode Festival

Это круче, чем «Оскар» 🙌 для ML-людей точно. Одна из команд-победителей сложных задач трека «Искусственный интеллект» RuCode.Final собрала овации, выиграла игровые приставки Sony PlayStation 5 и комплект мерча генерального партнёра 🥚. И поделилась инсайдами, как им это удалось.
Как им это удалось 😦

Please open Telegram to view this post

VIEW IN TELEGRAM

👏4🎉4🏆3❤2

1.15K views16:19

About

Blog

Apps

Platform