Forwarded from НГУ|NSU
Для участия необходимо зарегистрироваться на сайте, пройти отборочный контест и собеседование.
Что ждёт участников?
- Командные проекты и общение со специалистами из индустрии.
- Работа с моделями Яндекса вроде YandexGPT и актуальными opensource-решениями, такими как Qwen.
- Лекции и семинары от разработчиков NLP-систем и академических исследователей.
- Этическая составляющая как анализ галлюцинаций, защита от jailbreak-атак и т.п.
- Разбор трансформеров от базовой архитектуры до робастного обучения IRM и комбинации с внешними источниками знаний RAG.
- Акцент на многоязычность и устойчивость NLP-моделей.
Подать заявку на участие в студкемпе можно здесь.
Важно отметить, что студенты НГУ не могут быть участниками проекта, но могут быть приглашены в роли вольных слушателей в случае успешного прохождения отбора.
Доступ к первому этапу отбора (соревнованию в контесте) уже открыт. Его можно пройти до 23:59 мск 18 мая. Советуем не откладывать решение задач.
❗️ Если вы планируете поступать в магистратуру ММФ НГУ, то сертификат участия в любом студкемпе добавит вам 10 баллов в конкурсе индивидуальных достижений.
❗️Кроме того, участникам и вольным слушателям студкемпа в НГУ предоставится возможность пройти собеседование на программу «Прикладное машинное обучение и большие данные», которая реализуется при поддержке Школы анализа данных. Студенты 3 и 4 курсов, успешно прошедшие собеседование, смогут поступить на программу без экзаменов.
@nsuniversity
Please open Telegram to view this post
VIEW IN TELEGRAM
👍2🔥2
Forwarded from AINL Conference
Roman Derunets - Knowledge as Recollection: Advancing Multimodal Retrieval-Augmented Generation
VK Video
YouTube
VK Video
YouTube
🔥8👍3👏1
Погода в Нижнем Новгороде прекрасная.
На этой неделе мы среди участников ЦИПР, как и большинство представителей нашего сообщества.
Если кто-то хочет встретиться лично — напишите в ТГ, что хотите обсудить, и я передам ваш контакт нашему коммерческому директору Дмитрию для личной встречи✍️
На этой неделе мы среди участников ЦИПР, как и большинство представителей нашего сообщества.
Если кто-то хочет встретиться лично — напишите в ТГ, что хотите обсудить, и я передам ваш контакт нашему коммерческому директору Дмитрию для личной встречи
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4🔥2
Друзья, сегодня в 12.20 МСК на https://truetechday.ru/ (секция AI&ML) наш Технический директор Иван Бондаренко расскажет про обучение трансформеров и безопасный ИИ. Приходите послушать и пообщаться или подключайтесь онлайн ✍️
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7
Forwarded from AINL Conference
Dear colleagues, we are glad to present you recording of panel discussion with invited speakers Sergey Markov and Natalia Loukashevitch, a researcher from Siberian Neuronets Ivan Bondarenko and AINL Chair Valentin Malykh. The discussion is devoted to AI development in recent years, its place in educational system and the future of AI conferences. The discussion is in Russian.
VK Video
YouTube
VK Video
YouTube
🔥4
This media is not supported in the widget
VIEW IN TELEGRAM
🔥7
Forwarded from Elena Bruches
Всем привет!
Сегодня в 20:00 по Новосибирску / 16:00 по Иван @Bond_005 расскажет про статью Exploring the Latent Capacity of LLMs for One-Step Text Generation (https://arxiv.org/pdf/2505.21189)👨💻
Ждём всех по ссылке: https://jazz.sber.ru/6hlguh?psw=OBYMChwQAgUGBgscQwQVFgkMFg
Сегодня в 20:00 по Новосибирску / 16:00 по Иван @Bond_005 расскажет про статью Exploring the Latent Capacity of LLMs for One-Step Text Generation (https://arxiv.org/pdf/2505.21189)
Ждём всех по ссылке: https://jazz.sber.ru/6hlguh?psw=OBYMChwQAgUGBgscQwQVFgkMFg
Please open Telegram to view this post
VIEW IN TELEGRAM
web.telegram.org
Telegram Web
Telegram is a cloud-based mobile and desktop messaging app with a focus on security and speed.
🔥5
Выступление Ивана Бондаренко на True Tech Day 2025 от МТС.
https://vkvideo.ru/video-226874221_456239460
https://vkvideo.ru/video-226874221_456239460
VK Видео
Между грамматикой и семантикой: чему на самом деле предобучаются трансформеры. Доклад Ивана Бондаренко | True Tech Day 2025
Иван Бондаренко — старший преподаватель и научный сотрудник НГУ, сооснователь стартапа «Сибирские нейросети», ex. Huawei
🔥4❤1
Материалы встречи 1.07.25:
🎙 Докладчик: Иван @Bond_005
📄 Статья: Exploring the Latent Capacity of LLMs for One-Step Text Generation (https://arxiv.org/pdf/2505.21189)
🎥 Запись на YouTube: https://youtu.be/Ep1x2V0ZlII
🎙 Докладчик: Иван @Bond_005
📄 Статья: Exploring the Latent Capacity of LLMs for One-Step Text Generation (https://arxiv.org/pdf/2505.21189)
🎥 Запись на YouTube: https://youtu.be/Ep1x2V0ZlII
🔥3❤1
Forwarded from Sber AI
Наши коллеги из AGI NLP SberAI и GigaCode SberAI вместе с другими участниками команды MERA из МТС AI, Т-банка, Ростелекома и Сибирских нейросетей выпустили новый бенчмарк MERA Code. Он позволяет более точно оценивать результаты LLM в задачах программирования, в том числе с учётом требований, сформулированных на русском языке.
Современные языковые модели для программирования (GigaChat, ChatGPT, Claude, Qwen, DeepSeek Coder и др.) сложно сравнивать между собой из-за отсутствия единого подхода к оценке. Они имеют разные наборы тестовых задач и условия замеров: разные датасеты, промптинговые стратегии и метрики. MERA Code стал первым шагом к решению этой проблемы.
Что внутри
Авторы также предложили таксономию навыков, которая описывает ключевые способности LLM, необходимых для решения конкретных задач. В основе подхода — представление о модели как о системе из трёх компонентов:
Исходя из этого, выделяются четыре базовых навыка:
Такую таксономию можно воспринимать как «карту навыков». Она показывает, что требуется от модели для успешного прохождения теста и какие области карты ещё не покрыты в бенчмарке.
➡️ Видеогайд, как замерить модель
MERA Code — шаг к честной, точной и воспроизводимой оценке LLM на русском языке. Присоединяйтесь к проекту, тестируйте свои модели и развивайте бенчмарк вместе с нами!
Подписывайтесь на наш канал👈
Современные языковые модели для программирования (GigaChat, ChatGPT, Claude, Qwen, DeepSeek Coder и др.) сложно сравнивать между собой из-за отсутствия единого подхода к оценке. Они имеют разные наборы тестовых задач и условия замеров: разные датасеты, промптинговые стратегии и метрики. MERA Code стал первым шагом к решению этой проблемы.
Что внутри
🔘 11 задач в форматах text2code, code2text, code2code на 8 языках: Python, Java, C#, JavaScript, Go, C, C++ и Scala.🔘 Открытая платформа с единой системой оценки, рейтингом и удобным фреймворком для тестирования🔘 Анализ как открытых моделей, так и проприетарных API для генерации кода🔘 Кодовая база, разработанная на основе LM Evaluation Harness
Авторы также предложили таксономию навыков, которая описывает ключевые способности LLM, необходимых для решения конкретных задач. В основе подхода — представление о модели как о системе из трёх компонентов:
вход → внутреннее состояние → выход
Исходя из этого, выделяются четыре базовых навыка:
🔘 восприятие (отвечает за входные данные)🔘 логика и знания (внутренние характеристики модели)🔘 генерация (отвечает за выходные данные)
Такую таксономию можно воспринимать как «карту навыков». Она показывает, что требуется от модели для успешного прохождения теста и какие области карты ещё не покрыты в бенчмарке.
MERA Code — шаг к честной, точной и воспроизводимой оценке LLM на русском языке. Присоединяйтесь к проекту, тестируйте свои модели и развивайте бенчмарк вместе с нами!
Подписывайтесь на наш канал
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥9❤1
Всем привет!
Сегодня в 20:00 по Новосибирску / 16:00 по Москве Иван @Bond_005 расскажет про статью UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis (https://arxiv.org/pdf/2406.15187)👨💻
Ждём всех по ссылке: https://jazz.sber.ru/6hlguh?psw=OBYMChwQAgUGBgscQwQVFgkMFg
Сегодня в 20:00 по Новосибирску / 16:00 по Москве Иван @Bond_005 расскажет про статью UDA: A Benchmark Suite for Retrieval Augmented Generation in Real-world Document Analysis (https://arxiv.org/pdf/2406.15187)
Ждём всех по ссылке: https://jazz.sber.ru/6hlguh?psw=OBYMChwQAgUGBgscQwQVFgkMFg
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥7❤3