Forwarded from Machinelearning
В журнале Nature опубликована работа о новой модели DeepSeek-R1, которая показывает, что LLM можно научить рассуждать без заранее подготовленных человеческих подсказок. Обычно для обучения таким системам используют «цепочки мыслей» — примеры пошагового рассуждения, составленные людьми. В DeepSeek-R1 от этого отказались: модель получает единственную награду — правильный конечный ответ.
Для обучения применили алгоритм Group Relative Policy Optimization (GRPO). С его помощью базовая версия, названная DeepSeek-R1-Zero, постепенно сама научилась стратегиям проверки своих решений, рефлексии и смены подхода в зависимости от задачи. Иными словами, система начала вырабатывать собственные приёмы мышления, а не копировать человеческие.
Результаты впечатляют. На математическом бенчмарке AIME точность выросла с 15% на старте до 78% после обучения, а с использованием механизма самопроверки — до 87%. Это выше среднего результата реальных участников. В задачах программирования и тестах по STEM-дисциплинам DeepSeek-R1 также обогнал сопоставимые по размеру модели и даже приблизился к гораздо более крупным системам. Более компактные версии, созданные методом дистилляции, сохраняют большую часть этих возможностей.
Есть и недостатки: модель иногда пишет менее читаемые ответы, смешивает языки и пока что хуже работает в областях за пределами логики и математики. Но сам подход доказывает: ИИ способен учиться рассуждать без дорогой и трудоёмкой разметки данных.
Этот прорыв открывает новый этап развития искусственного интеллекта. В будущем такие модели смогут самостоятельно находить эффективные пути решения задач, что особенно важно для науки, инженерии и образования. DeepSeek-R1 показывает, что «чистое подкрепление» может стать реальной альтернативой традиционному обучению с человеческими примерами.
nature
Сразу две компании — OpenAI и Google — сообщили о победах на престижном международном соревновании по программированию ICPC. По данным инсайдов, их модели впервые показали уровень, сопоставимый с лучшими командами из людей, и даже превзошли их.
Команда OpenAI заявила, что их модель решила 12 из 12 задач. Из них GPT-5 с первой попытки справился с 11 заданиями, а самое сложное было закрыто с помощью ещё не представленной reasoning-модели, которая также направляла решения по другим задачам. Это фактически идеальный результат, который ранее был недостижим даже для лучших университетских команд.
Google выступил с собственным достижением: продвинутая версия Gemini 2.5 Deep Think решила 10 из 12 задач и, по заявлениям компании, справилась хотя бы с одной задачей, которую не смогла решить ни одна из команд людей. Это указывает на то, что новые архитектуры начинают находить нестандартные ходы, которые выходят за пределы привычного человеческого опыта.
Если данные подтвердятся, ICPC 2025 войдёт в историю как момент, когда модели искусственного интеллекта впервые официально обошли лучшие команды программистов-людей в соревновании мирового уровня. Это событие может стать переломным: теперь ИИ рассматривается не просто как ассистент, а как полноценный участник и даже лидер в задачах, требующих абстрактного мышления, алгоритмического анализа и математической строгости.
Такие достижения поднимают новые вопросы: стоит ли ИИ допускать к соревнованиям наравне с людьми, как использовать его для обучения программистов и где пройдёт граница между «человеческой» и «машинной» интеллектуальной работой. Одно ясно — в мире алгоритмов начинается новая эра, и ICPC стал её яркой отправной точкой.
IBM представила granite-docling-258M — компактную модель, которая совмещает несколько функций: это не только конвертер документов, но и система для вопросно-ответных задач по содержимому файлов. Модель поддерживает несколько языков и распространяется под лицензией Apache 2.0.
HF
@ai_machinelearning_big_data
#news #ai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
1⚡3👍2🔥1
Forwarded from ИИ и роботы в стройке
This media is not supported in your browser
VIEW IN TELEGRAM
Unitree представила первую открытую архитектуру UnifoLM-WMA-0, в основе которой «модель мира». Она работает как интерактивный симулятор, генерирующий синтетические данные для обучения робота, а также умеет прогнозировать его последующие действия
Зачем это нужно
Архитектура UnifoLM-WMA-0 нужна, чтобы безопасно и дешевле обучать роботов в симуляции вместо реальной площадки и точно предсказывать их поведение в динамичной среде — без риска поломок, простоев и конфликтов с людьми и техникой.
Зачем это нужно
Архитектура UnifoLM-WMA-0 нужна, чтобы безопасно и дешевле обучать роботов в симуляции вместо реальной площадки и точно предсказывать их поведение в динамичной среде — без риска поломок, простоев и конфликтов с людьми и техникой.
❤3👍1🔥1🥰1
Forwarded from Институт AIRI
Провели «ИИ–ЗАМАН» в Казани, делимся впечатлениями ⤵️
Научная конференция стала частью форума Kazan Digital Week, деловая программа которого включает в себя более 160 секций, структурированных по 10 тематическим направлениям. В форуме приняли участие 1,2 тысячи спикеров из более, чем 70 стран. На «ИИ–ЗАМАН» были представлены участники практически из всех регионов России, где ведутся исследования в области ИИ. Есть и иностранные участники, среди которых представители США, Китая и Индии.
17 сентября на конференции «ИИ–ЗАМАН», которую мы организовали совместно с Академией наук Республики Татарстан при поддержке Ассоциации содействия цифровому развитию Республики Татарстан и Авито, выступили директор лаборатории FusionBrain Андрей Кузнецов, руководитель группы «Прикладное NLP» Елена Тутубалина, руководитель лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов, генеральный директор AIRI Иван Оселедец, научный сотрудник группы «Воплощённые агенты» Татьяна Земскова и директор лаборатории когнитивных систем ИИ Института AIRI Александр Панов. Также инженер-исследователь группы «Прикладное NLP» AIRI Михаил Чайчук представил проект «The Benefits of Query-Based KGQA Systems for Complex and Temporal Questions in LLM Era» на постерной сессии.
📎 Подробнее про конференцию «ИИ–ЗАМАН» читайте в материале по итогам пресс-конференции.
Делимся фотографиями из Казани!
Научная конференция стала частью форума Kazan Digital Week, деловая программа которого включает в себя более 160 секций, структурированных по 10 тематическим направлениям. В форуме приняли участие 1,2 тысячи спикеров из более, чем 70 стран. На «ИИ–ЗАМАН» были представлены участники практически из всех регионов России, где ведутся исследования в области ИИ. Есть и иностранные участники, среди которых представители США, Китая и Индии.
17 сентября на конференции «ИИ–ЗАМАН», которую мы организовали совместно с Академией наук Республики Татарстан при поддержке Ассоциации содействия цифровому развитию Республики Татарстан и Авито, выступили директор лаборатории FusionBrain Андрей Кузнецов, руководитель группы «Прикладное NLP» Елена Тутубалина, руководитель лаборатории Safe AI Lab AIRI-МТУСИ Олег Рогов, генеральный директор AIRI Иван Оселедец, научный сотрудник группы «Воплощённые агенты» Татьяна Земскова и директор лаборатории когнитивных систем ИИ Института AIRI Александр Панов. Также инженер-исследователь группы «Прикладное NLP» AIRI Михаил Чайчук представил проект «The Benefits of Query-Based KGQA Systems for Complex and Temporal Questions in LLM Era» на постерной сессии.
Делимся фотографиями из Казани!
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3👍1
Forwarded from vc.ru
This media is not supported in your browser
VIEW IN TELEGRAM
Запрещённая в России Meta провела демонстрацию функций «умных» очков Ray-Ban, но не всё прошло гладко: не получилось созвониться по видео, а голосовой помощник не смог подсказать рецепт соуса. В комментариях шутили над грядущими увольнениями.
Однако некоторых зрителей впечатлил набор сообщений с помощью «нейробраслета» и субтитры в реальном времени, которые показать всё-таки удалось
vc.ru/tech/2222622
Однако некоторых зрителей впечатлил набор сообщений с помощью «нейробраслета» и субтитры в реальном времени, которые показать всё-таки удалось
vc.ru/tech/2222622
🔥4👍1
#unrealneural
SGS-1 от Spectral Labs
Генератор CAD 3D-геометрии
https://www.spectrallabs.ai/research/SGS-1
SGS-1 от Spectral Labs
Генератор CAD 3D-геометрии
https://www.spectrallabs.ai/research/SGS-1
👍2⚡1
#unrealneural
Autodesk представляет новую категорию технологий - нейронные САПР (fundamental CAD models), которые используют генеративный ИИ для понимания и создания геометрии. Это следующий шаг после параметрических САПР, почти не менявшихся 40 лет, и альтернатива простому объединению LLM с классическими инструментами.
Autodesk утверждает: будущее проектирования - это нейронные САПР, которые соединяют язык, эскиз, данные и производство в единую систему.
https://adsknews.autodesk.com/en/news/upcoming-3d-generative-ai-foundation-models/
Autodesk представляет новую категорию технологий - нейронные САПР (fundamental CAD models), которые используют генеративный ИИ для понимания и создания геометрии. Это следующий шаг после параметрических САПР, почти не менявшихся 40 лет, и альтернатива простому объединению LLM с классическими инструментами.
Autodesk утверждает: будущее проектирования - это нейронные САПР, которые соединяют язык, эскиз, данные и производство в единую систему.
https://adsknews.autodesk.com/en/news/upcoming-3d-generative-ai-foundation-models/
👍8⚡2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
#Эксперименты #unrealneural #ЛабораторияИИ #AILAB
Генерация CAD геометрии по изометрическому изображению
Генерация CAD геометрии по изометрическому изображению
🔥9❤4⚡1😱1🤣1
Forwarded from AM Live
ИИ уже в системе. И он пришёл не спрашивать
Он не требует зарплату. Не уходит в отпуск. Не просит инструкций. Но всё равно делает ошибки. И иногда — масштабные.
В прямом эфире AM Live обсудили, как именно искусственный интеллект уже встроен в ИТ-процессы российских компаний, какие задачи выполняет, где действительно помогает, а где пока создаёт больше проблем, чем пользы.
Говорили про:
⚡️ Реальные сценарии применения ML и GenAI в автоматизации инфраструктуры, аналитике, управлении облачными платформами и генерации кода
⚡️ То, что работает уже сейчас, а не просто звучит модно
⚡️ Как ИИ влияет на рынок труда: кого уже можно заменить, а какие роли трансформируются
⚡️ Этические и юридические риски, которые пока не регулируются, но уже сказываются на бизнесе
⚡️ Будущее технологий ИИ в ИТ — что будет происходить в ближайшие 2–3 года и как к этому готовиться
Обсуждали примеры из российских компаний, влияние ИИ на кадровый дефицит и новые подходы к управлению ИТ-командами. Эксперты честно говорили о барьерах: от технических ограничений до пробелов в законодательстве.
📺 Смотрите запись. Потому что ИИ уже рядом. И вы должны понимать, что он умеет — и что пока только обещает.
📺 VK Видео
📺 YouTube
📺 RuTube
Он не требует зарплату. Не уходит в отпуск. Не просит инструкций. Но всё равно делает ошибки. И иногда — масштабные.
В прямом эфире AM Live обсудили, как именно искусственный интеллект уже встроен в ИТ-процессы российских компаний, какие задачи выполняет, где действительно помогает, а где пока создаёт больше проблем, чем пользы.
Говорили про:
Обсуждали примеры из российских компаний, влияние ИИ на кадровый дефицит и новые подходы к управлению ИТ-командами. Эксперты честно говорили о барьерах: от технических ограничений до пробелов в законодательстве.
📺 Смотрите запись. Потому что ИИ уже рядом. И вы должны понимать, что он умеет — и что пока только обещает.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤1🔥1
Forwarded from Наука, Техника и нейровайб
Компания Илона Маска Neuralink в октябре начнёт испытывать имплант, который переводит мысли в текст. Технология, считают создатели, откроет новые возможности для людей с нарушением речи. Устройство планируется тестировать на людях с тяжёлыми заболеваниями, а к 2030 году внедрять в организм здоровых людей. Конечной целью в компании называют «создание потребительских технологий».
⚡6👍5😁1
#unrealneural
А вот и Autocad + MCP + Claude
Процесс черчения с помощью Claude кода и создание спецификации с помощью ChatGPT5. Наверняка скоро у всех автодеск продуктов появится официальные тулзы со связками LLM. Но что вот интересно: какую именно модель они там будут использовать? Предполагаю это будет что-то свое на базе Qwen 🤷🏻♂️🤷🏻♂️🤷🏻♂️ или нет 😃
А вот и Autocad + MCP + Claude
Процесс черчения с помощью Claude кода и создание спецификации с помощью ChatGPT5. Наверняка скоро у всех автодеск продуктов появится официальные тулзы со связками LLM. Но что вот интересно: какую именно модель они там будут использовать? Предполагаю это будет что-то свое на базе Qwen 🤷🏻♂️🤷🏻♂️🤷🏻♂️ или нет 😃
🔥6👍2