Forwarded from Sber AI
Наши коллеги из AGI NLP SberAI и GigaCode SberAI вместе с другими участниками команды MERA из МТС AI, Т-банка, Ростелекома и Сибирских нейросетей выпустили новый бенчмарк MERA Code. Он позволяет более точно оценивать результаты LLM в задачах программирования, в том числе с учётом требований, сформулированных на русском языке.
Современные языковые модели для программирования (GigaChat, ChatGPT, Claude, Qwen, DeepSeek Coder и др.) сложно сравнивать между собой из-за отсутствия единого подхода к оценке. Они имеют разные наборы тестовых задач и условия замеров: разные датасеты, промптинговые стратегии и метрики. MERA Code стал первым шагом к решению этой проблемы.
Что внутри
Авторы также предложили таксономию навыков, которая описывает ключевые способности LLM, необходимых для решения конкретных задач. В основе подхода — представление о модели как о системе из трёх компонентов:
Исходя из этого, выделяются четыре базовых навыка:
Такую таксономию можно воспринимать как «карту навыков». Она показывает, что требуется от модели для успешного прохождения теста и какие области карты ещё не покрыты в бенчмарке.
➡️ Видеогайд, как замерить модель
MERA Code — шаг к честной, точной и воспроизводимой оценке LLM на русском языке. Присоединяйтесь к проекту, тестируйте свои модели и развивайте бенчмарк вместе с нами!
Подписывайтесь на наш канал👈
Современные языковые модели для программирования (GigaChat, ChatGPT, Claude, Qwen, DeepSeek Coder и др.) сложно сравнивать между собой из-за отсутствия единого подхода к оценке. Они имеют разные наборы тестовых задач и условия замеров: разные датасеты, промптинговые стратегии и метрики. MERA Code стал первым шагом к решению этой проблемы.
Что внутри
🔘 11 задач в форматах text2code, code2text, code2code на 8 языках: Python, Java, C#, JavaScript, Go, C, C++ и Scala.🔘 Открытая платформа с единой системой оценки, рейтингом и удобным фреймворком для тестирования🔘 Анализ как открытых моделей, так и проприетарных API для генерации кода🔘 Кодовая база, разработанная на основе LM Evaluation Harness
Авторы также предложили таксономию навыков, которая описывает ключевые способности LLM, необходимых для решения конкретных задач. В основе подхода — представление о модели как о системе из трёх компонентов:
вход → внутреннее состояние → выход
Исходя из этого, выделяются четыре базовых навыка:
🔘 восприятие (отвечает за входные данные)🔘 логика и знания (внутренние характеристики модели)🔘 генерация (отвечает за выходные данные)
Такую таксономию можно воспринимать как «карту навыков». Она показывает, что требуется от модели для успешного прохождения теста и какие области карты ещё не покрыты в бенчмарке.
MERA Code — шаг к честной, точной и воспроизводимой оценке LLM на русском языке. Присоединяйтесь к проекту, тестируйте свои модели и развивайте бенчмарк вместе с нами!
Подписывайтесь на наш канал
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4
Forwarded from ИИМПЕРИЯ
⚡ИИ-ГОНКА: НОВАЯ ЛУНА
Америка сбросила тормоза. Мир входит в горячую фазу войны за разум.
Империи не строят сомневающиеся. Их строят те, кто нажимает «Пуск».
ФАКТЫ:
23 июля 2025 годаДональд Трамп подписал серию указов, снимающих все тормоза с американского ИИ.
— Убраны экологические и экспортные ограничения
— Стерты этические рамки, установленные при Байдене
— Объявлен стратегический приоритет: "ИИ — это наша новая атомная бомба"
Пока Европа шепчет об угрозах, Америка строит цифровую луну.
ИИ — не просто технология. Это власть, скорость, рынок, контроль.
ИНСАЙД:
Илон Маск строит датацентр-монстра в Мемфисе — 200,000 GPU. Цель: миллионы чипов, чтобы накормить Grok, ИИ-модель xAI, «ищущую истину, а не политкорректность».
xAI уже слился с Twitter (теперь X), слился с медиа, скоро — со всем.
OpenAI не отстаёт. Проект Stargate вырос с $100 млрд до $500 млрд.
Первая локация в Техасе: 64,000 ускорителей GB200, мощность — 5 ГВт.
Цели — создать ИИ-инфраструктуру уровня Манхэттенского проекта.
ДЕЙСТВИЕ:
⚠️ Ставки выше, чем во время космической гонки.
Это не про Луну. Это про контроль над человечеством.
Кто первый — тот пишет алгоритмы.
Кто опоздал — станет клиентом.
США ускоряются. Китай догоняет. Европа застряла в бумажках.
💥 Вывод:
ИИ-гонка стала ядерной. Маск vs Альтман. США vs весь остальной мир.
Рынок жмёт «вход» на триллионы, но это вход в неизвестность.
Экология, этика, монополии — всё подождёт.
Победа достанется тому, кто рискнёт первым.
👑 Репостни, если понимаешь, что ИИ — это уже не код, а оружие.
Ты знаешь, кто выигрывает войны.
Америка сбросила тормоза. Мир входит в горячую фазу войны за разум.
Империи не строят сомневающиеся. Их строят те, кто нажимает «Пуск».
ФАКТЫ:
23 июля 2025 года
— Убраны экологические и экспортные ограничения
— Стерты этические рамки, установленные при Байдене
— Объявлен стратегический приоритет: "ИИ — это наша новая атомная бомба"
Пока Европа шепчет об угрозах, Америка строит цифровую луну.
ИИ — не просто технология. Это власть, скорость, рынок, контроль.
ИНСАЙД:
Илон Маск строит датацентр-монстра в Мемфисе — 200,000 GPU. Цель: миллионы чипов, чтобы накормить Grok, ИИ-модель xAI, «ищущую истину, а не политкорректность».
xAI уже слился с Twitter (теперь X), слился с медиа, скоро — со всем.
OpenAI не отстаёт. Проект Stargate вырос с $100 млрд до $500 млрд.
Первая локация в Техасе: 64,000 ускорителей GB200, мощность — 5 ГВт.
Цели — создать ИИ-инфраструктуру уровня Манхэттенского проекта.
ДЕЙСТВИЕ:
⚠️ Ставки выше, чем во время космической гонки.
Это не про Луну. Это про контроль над человечеством.
Кто первый — тот пишет алгоритмы.
Кто опоздал — станет клиентом.
США ускоряются. Китай догоняет. Европа застряла в бумажках.
💥 Вывод:
ИИ-гонка стала ядерной. Маск vs Альтман. США vs весь остальной мир.
Рынок жмёт «вход» на триллионы, но это вход в неизвестность.
Экология, этика, монополии — всё подождёт.
Победа достанется тому, кто рискнёт первым.
👑 Репостни, если понимаешь, что ИИ — это уже не код, а оружие.
Ты знаешь, кто выигрывает войны.
🤔3👍2
Forwarded from Ассоциация SMM-специалистов АСМИР
Тема:
«3 пути России: Космос, AI & IT — кто выйдет на новую орбиту?»
У России есть три вектора движения:
1️⃣ Космос — масштаб, технологии и новая геополитика
2️⃣ AI — интеллект систем, управление, безопасность
3️⃣ IT — экосистемы, продукты и цифровой суверенитет
📅 5 августа / Город влияния
🎫 Регистрация на мероприятие по ссылке, бронируйте места заранее!
#АСМИР
#РКС #космос #AI #space #ИскуственныйИнтеллект #IT #стартапы #маркетинг #информация #влияние
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥6👍4👏4
Forwarded from Космонавт Александр Мисуркин
Сегодня — запуск корабля Crew Dragon с международным экипажем:
▪ Зена Кардман — командир-дебютант
▪ Майкл Финк — опытный астронавт NASA
▪ Олег Платонов — космонавт Роскосмоса в рамках
перекрёстных полетов
▪ Кимия Юи — астронавт JAXA, чьё имя означает «морская черепаха» 🐢
Время старта: 31 июля, 19:09 мск
Стыковка: 2 августа, 10:00 мск
Экипаж проведёт на орбите полгода и будет выполнять научную программу, следить за состоянием станции и участвовать в разгрузке грузовиков. Они сменят часть экипажа 73-й экспедиции — Энн МакКлейн, Николь Айерс, Такуя Ониси и Кирилла Пескова, которые вернутся на Землю в начале августа.
Кстати, на этот запуск прилетел глава Роскосмоса Дмитрий Баканов. Вчера он пообщался с экипажем Crew-11, а сегодня встретится с руководством NASA. Это первая очная встреча глав космических агентств России и США практически за семь лет (предыдущая состоялась в октябре 2018 года).
Пожелаем экипажу успешного старта и реализации всех намеченных планов 🤝
▪ Зена Кардман — командир-дебютант
▪ Майкл Финк — опытный астронавт NASA
▪ Олег Платонов — космонавт Роскосмоса в рамках
перекрёстных полетов
▪ Кимия Юи — астронавт JAXA, чьё имя означает «морская черепаха» 🐢
Время старта: 31 июля, 19:09 мск
Стыковка: 2 августа, 10:00 мск
Экипаж проведёт на орбите полгода и будет выполнять научную программу, следить за состоянием станции и участвовать в разгрузке грузовиков. Они сменят часть экипажа 73-й экспедиции — Энн МакКлейн, Николь Айерс, Такуя Ониси и Кирилла Пескова, которые вернутся на Землю в начале августа.
Кстати, на этот запуск прилетел глава Роскосмоса Дмитрий Баканов. Вчера он пообщался с экипажем Crew-11, а сегодня встретится с руководством NASA. Это первая очная встреча глав космических агентств России и США практически за семь лет (предыдущая состоялась в октябре 2018 года).
Пожелаем экипажу успешного старта и реализации всех намеченных планов 🤝
👍3👏1
Forwarded from Космическая Изолента
«Терра Тех» (входит в РКС) и Федеральный научный центр Агроэкологии РАН стали лауреатами V Национальной премии в области экологических технологий «ЭКОТЕХ-ЛИДЕР 2025» за совместный проект по созданию информационно-аналитической системы «Опустынивание и его мониторинг» в номинации «Мониторинг окружающей среды». Совместный проект выдержал конкуренцию среди более 200 поступивших заявок.
Геокомпонент системы «Опустынивание и его мониторинг» оцифровывает и позволяет сотрудникам ФНЦ Агроэкологии РАН прогнозировать динамику изменений деградированных территорий, пострадавших от опустынивания, автоматизирует с помощью нейросетевых технологий процессы моделирования состояния почв, а также дает инструментарий для управления изменениями на территориях, столкнувшихся с таким опасным явлением, как опустынивание.
В 2022 году «Терра Тех» уже становился лауреатом премии «ЭКОТЕХ-ЛИДЕР» в номинации «Экомониторинг» за отраслевой информационный сервис «Экомониторинг» в составе комплекса «Цифровая Земля – Сервисы».
#холдинг
«Определять победителей с каждым годом становится все труднее, потому что все участники конкурса представляют передовые разработки, ориентированные на технологическую модернизацию производства и повышение экологической безопасности, – отмечает председатель экспертного совета премии, заслуженный эколог РФ, заместитель председателя Общественного совета Минприроды России Сергей Алексеев. – При определении лауреатов экспертное жюри учитывало такие критерии, как инновационность, а также социальная и экономическая значимость проекта».
Геокомпонент системы «Опустынивание и его мониторинг» оцифровывает и позволяет сотрудникам ФНЦ Агроэкологии РАН прогнозировать динамику изменений деградированных территорий, пострадавших от опустынивания, автоматизирует с помощью нейросетевых технологий процессы моделирования состояния почв, а также дает инструментарий для управления изменениями на территориях, столкнувшихся с таким опасным явлением, как опустынивание.
«Нам отрадно знать, что разработанные нашим коллективом решения не только становятся технологическим прорывом, но и вносят вклад в сохранение планеты, что созвучно с миссией нашей компании и привносит новые смыслы в деятельность нашего коллектива», – говорит первый заместитель генерального директора АО «Терра Тех» Максим Болтачев.
В 2022 году «Терра Тех» уже становился лауреатом премии «ЭКОТЕХ-ЛИДЕР» в номинации «Экомониторинг» за отраслевой информационный сервис «Экомониторинг» в составе комплекса «Цифровая Земля – Сервисы».
#холдинг
👍2👏1
Forwarded from Роскосмос
Космонавт Роскосмоса отправляется в свой первый полёт — старт Crew Dragon с Олегом Платоновым на борту сегодня в 19:09 мск
Коллеги Олега по экипажу — астронавты NASA Зина Кардман и Майкл Финк, а также астронавт JAXA Кимия Юи.
Полёт пройдёт по программе перекрёстных полётов Роскосмоса и NASA.
🎥 Присоединяйтесь к нашей трансляции в 18:00 мск
На снимке спутника Роскосмоса «Ресурс-П» — космодром на мысе Канаверал
Что такое перекрёстные полёты
Коллеги Олега по экипажу — астронавты NASA Зина Кардман и Майкл Финк, а также астронавт JAXA Кимия Юи.
Полёт пройдёт по программе перекрёстных полётов Роскосмоса и NASA.
На снимке спутника Роскосмоса «Ресурс-П» — космодром на мысе Канаверал
Что такое перекрёстные полёты
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👏1
Попытки внедрения аналитического программного обеспечения в американские правоохранительные органы неизменно вызывали скептицизм. В 2012 году компания Palantir начала сотрудничество с полицией Нового Орлеана, предложив систему, использовавшуюся спецназом и разведкой США в Афганистане для предотвращения атак. Проблема, с которой столкнулась полиция, была схожа: избыток информации и отсутствие эффективных инструментов её анализа. Программа Gotham позволила объединить разрозненные данные о преступных сетях и выявлять связи между подозреваемыми, жертвами и свидетелями.
Критика, однако, была немедленной и яростной. Почему технологии, предназначенные для войны, должны применяться на улицах американских городов? Американский союз гражданских свобод заявил, что использование таких данных представляет угрозу правам граждан. Однако возмущение касалось не неспособности властей защитить людей от преступности, а самого факта внедрения технологий.
Александр С. Карп, Николас В. Замиска Технологическая республика
Критика, однако, была немедленной и яростной. Почему технологии, предназначенные для войны, должны применяться на улицах американских городов? Американский союз гражданских свобод заявил, что использование таких данных представляет угрозу правам граждан. Однако возмущение касалось не неспособности властей защитить людей от преступности, а самого факта внедрения технологий.
Александр С. Карп, Николас В. Замиска Технологическая республика
1😱3👍2
Forwarded from Роскосмос
Media is too big
VIEW IN TELEGRAM
Дмитрий Баканов и министр транспорта США - исполняющий обязанности директора NASA Шон Даффи провели переговоры. Это первая очная встреча руководителей космических агентств с 2018 года.
Стороны обсудили
Я приложу усилия, чтобы сохранить канал сотрудничества между Россией и США, и жду того же от NASA,
— заявил Дмитрий Баканов по итогам встречи.
Ранее Дмитрий Баканов посетил Космический центр имени Джонсона
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👏1
Пренебрежение финансовыми стимулами в сферах, критически важных для общества, – одна из причин, сдерживающих развитие государственных институтов. Почему принципы стимулирования, активно используемые в финансах и технологиях, не могут применяться в государственном управлении? Аскетичность как культурная черта достойна уважения, но представление о государственной службе как о добровольном призвании создаёт неравные условия. Государственная служба, образование и медицина становятся уделом наследственной элиты, способной позволить себе жертвовать временем и ресурсами. Это ограничивает конкуренцию, снижает эффективность и исключает талантливых кандидатов, не обладающих финансовой независимостью. Мы должны платить больше врачам, учителям и чиновникам. Их труд имеет огромную общественную ценность, но ожидать, что они будут довольствоваться лишь моральным удовлетворением, – значит игнорировать реальность.
Александр С. Карп, Николас В. Замиска Технологическая республика
Александр С. Карп, Николас В. Замиска Технологическая республика
👍4👏1
Forwarded from RT на русском
В России появился новый класс воздушного пространства — H — для БПЛА, сообщили в правительстве.
🟩 Подписаться | Зеркало
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍4👏1
#space
«Дракон» на орбите…
Экипаж совместный…
Все молодцы 👏 (это правда)!
Только не надо обманываться, StarShip не для Марса…
«Дракон» на орбите…
Экипаж совместный…
Все молодцы 👏 (это правда)!
Только не надо обманываться, StarShip не для Марса…
2🔥4👍1
Forwarded from Роскосмос
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥4👍1