🧠Логическое мышление: как большие языковые модели научились логическим рассуждениям без больших финансовых и временных затрат.
Исследователи из T-Bank AI Research и лаборатории Центрального университета Omut AI представили метод, который позволяет развивать сложные reasoning-навыки без полного переобучения — своего рода «точной настройке» логических цепочек в уже обученной сети.
В основе подхода лежит не “переписывание мозга”, а steering vectors — компактные векторы-регуляторы, которые усиливают корректные логические шаги модели. На шести математических бенчмарках метод показал сохранение 100% эффективности полного дообучения при изменении всего 0.0016% параметров 14-миллиардной модели. Требования к памяти сократились с гигабайтов до сотен килобайт. Скорость одного из этапов обучения увеличилась с десятков минут до секунд.
Logit-анализ показывает усиление ключевых маркеров логических рассуждений — таких как “потому что”, “следовательно”, “правильно”. В связи с этим поведение LLM становится легче интерпретировать исследователям, которые получают прозрачный инструмент для изучения того, как именно модель рассуждает.
Результаты исследования протестировали на моделях Qwen и LLaMA и представили на EMNLP 2025.
📕Steering LLM Reasoning Through Bias-Only Adaptation
#наука #math #science #программирование #разработка #IT
💡 Physics.Math.Code // @physics_lib
Исследователи из T-Bank AI Research и лаборатории Центрального университета Omut AI представили метод, который позволяет развивать сложные reasoning-навыки без полного переобучения — своего рода «точной настройке» логических цепочек в уже обученной сети.
В основе подхода лежит не “переписывание мозга”, а steering vectors — компактные векторы-регуляторы, которые усиливают корректные логические шаги модели. На шести математических бенчмарках метод показал сохранение 100% эффективности полного дообучения при изменении всего 0.0016% параметров 14-миллиардной модели. Требования к памяти сократились с гигабайтов до сотен килобайт. Скорость одного из этапов обучения увеличилась с десятков минут до секунд.
Logit-анализ показывает усиление ключевых маркеров логических рассуждений — таких как “потому что”, “следовательно”, “правильно”. В связи с этим поведение LLM становится легче интерпретировать исследователям, которые получают прозрачный инструмент для изучения того, как именно модель рассуждает.
Результаты исследования протестировали на моделях Qwen и LLaMA и представили на EMNLP 2025.
📕Steering LLM Reasoning Through Bias-Only Adaptation
#наука #math #science #программирование #разработка #IT
💡 Physics.Math.Code // @physics_lib
❤32👍15🔥10🤯4🗿2❤🔥1👨💻1
📗 Основы теории вероятностей. Что следует знать студенту-математику [2023] Теймс Х
💾 Скачать книгу
▪️ Для абсолютного новичка, только открывающего для себя мир случайности, книга может показаться несколько «крутой». Она действительно написана для студента-математика, предполагая у него определенную математическую зрелость.
▪️ Некоторым читателям может не хватать большего количества прикладных, «житейских» примеров, хотя их отсутствие с лихвой компенсируется фундаментальностью подхода.
▪️ Строгость и глубина: Идеальный баланс между математической корректностью и доступностью изложения.
▪️ Современность: Учет современных тенденций и приложений теории вероятностей.
▪️ Практическая ориентированность: Подбор упражнений, который действительно учит решать задачи, а не просто применять формулы.
▪️ Хорошая структура: Логичное и последовательное изложение, позволяющее систематизировать знания.
☕️ Для тех, кто захочет задонать на кофе: ВТБ:
📖 Кому стоит читать?
▪️В первую очередь, студентам бакалавриата математических и физических специальностей.
▪️Будущим data scientist'ам, аналитикам и исследователям, желающим понять математические основы своих инструментов.
▪️Преподавателям, которые ищут качественный и современный материал для своих курсов.
💡 Что почитать по статистике, чтобы начать её понимать?
#теория_вероятностей #математика #math #алгебра #наука #data_science #анализ_данных
💡 Physics.Math.Code // @physics_lib
💾 Скачать книгу
▪️ Для абсолютного новичка, только открывающего для себя мир случайности, книга может показаться несколько «крутой». Она действительно написана для студента-математика, предполагая у него определенную математическую зрелость.
▪️ Некоторым читателям может не хватать большего количества прикладных, «житейских» примеров, хотя их отсутствие с лихвой компенсируется фундаментальностью подхода.
▪️ Строгость и глубина: Идеальный баланс между математической корректностью и доступностью изложения.
▪️ Современность: Учет современных тенденций и приложений теории вероятностей.
▪️ Практическая ориентированность: Подбор упражнений, который действительно учит решать задачи, а не просто применять формулы.
▪️ Хорошая структура: Логичное и последовательное изложение, позволяющее систематизировать знания.
☕️ Для тех, кто захочет задонать на кофе: ВТБ:
+79616572047 (СБП) 📖 Кому стоит читать?
▪️В первую очередь, студентам бакалавриата математических и физических специальностей.
▪️Будущим data scientist'ам, аналитикам и исследователям, желающим понять математические основы своих инструментов.
▪️Преподавателям, которые ищут качественный и современный материал для своих курсов.
💡 Что почитать по статистике, чтобы начать её понимать?
#теория_вероятностей #математика #math #алгебра #наука #data_science #анализ_данных
💡 Physics.Math.Code // @physics_lib
🔥31❤17👍11🤩3🤔2
Основы_теории_вероятностей_Что_следует_знать_студенту_математику.pdf
27.2 MB
📗 Основы теории вероятностей. Что следует знать студенту-математику [2023] Теймс Х
Теория вероятностей — краеугольный камень современного математического образования, мост между чистой математикой и миром случайности, данных и неопределенности. Появление нового учебника, претендующего на то, чтобы дать студенту-математику именно те основы, которые «следует знать», всегда вызывает повышенный интерес. Книга Теймса Х. 2023 года издания — смелая и своевременная попытка ответить на этот вызов. Книга выгодно отличается своей продуманной структурой. Она не просто следует каноническому пути от комбинаторики к закону больших чисел, а выстраивает повествование вокруг ключевых идей.
1. Аксиоматика Колмогорова как фундамент. Автор начинает с четкого и доступного изложения аксиоматики, не забегая вперед, но и не упрощая. Это важный шаг, который сразу настраивает студента на серьезный, формальный лад, показывая, что теория вероятностей — это полноценный раздел математики со своей строгой структурой.
2. Глубина проработки ключевых тем. Главы, посвященные случайным величинам (дискретным, непрерывным, многомерным), их числовым характеристикам (математическому ожиданию, дисперсии, ковариации) и предельным теоремам (ЗБЧ, ЦПТ), являются сильнейшими в книге. Теоремы доказаны строго, но с интуитивными пояснениями «на полях», что помогает понять не только «как» доказывается, но и «почему» это работает.
3. Акцент на понимание, а не на заучивание. Теймс Х. постоянно обращает внимание на типичные ошибки и заблуждения (например, парадокс Монти Холла или вопросы, связанные с условной вероятностью), что бесценно для формирования правильной вероятностной интуиции.
4. Связь с смежными областями. Что делает книгу особенно современной, так это наличие глав или разделов, посвященных введению в марковские цепи и случайные процессы, а также краткому обзору приложений в машинном обучении и статистике. Это показывает студенту, что фундамент, который он закладывает, является стартовой площадкой для дальнейших исследований.
Стиль изложения можно охарактеризовать как строгий, но не сухой. Автор говорит со студентом на одном языке, избегая излишнего сленга, но и не уходя в академическую замшелость. Формулы и теоремы сопровождаются качественными графиками и диаграммами, что визуально облегчает восприятие сложного материала. Особого упоминания заслуживают примеры и упражнения. Примеры подобраны не только как иллюстрация к теореме, но и как маленькие исследовательские задачи. Упражнения в конце каждой главы четко разделены по уровню сложности: от простых задач на закрепление определения до сложных, проблемных заданий, требующих глубокого осмысления материала.
«Основы теории вероятностей» Теймса Х. — это не просто еще один учебник в длинной череде. Это качественная, глубокая и продуманная работа, которая с высокой вероятностью может стать для студента-математика той самой основной книгой на полке, к которой он будет возвращаться на протяжении всего обучения. #теория_вероятностей #математика #math #алгебра #наука #data_science #анализ_данных
💡 Physics.Math.Code // @physics_lib
Теория вероятностей — краеугольный камень современного математического образования, мост между чистой математикой и миром случайности, данных и неопределенности. Появление нового учебника, претендующего на то, чтобы дать студенту-математику именно те основы, которые «следует знать», всегда вызывает повышенный интерес. Книга Теймса Х. 2023 года издания — смелая и своевременная попытка ответить на этот вызов. Книга выгодно отличается своей продуманной структурой. Она не просто следует каноническому пути от комбинаторики к закону больших чисел, а выстраивает повествование вокруг ключевых идей.
1. Аксиоматика Колмогорова как фундамент. Автор начинает с четкого и доступного изложения аксиоматики, не забегая вперед, но и не упрощая. Это важный шаг, который сразу настраивает студента на серьезный, формальный лад, показывая, что теория вероятностей — это полноценный раздел математики со своей строгой структурой.
2. Глубина проработки ключевых тем. Главы, посвященные случайным величинам (дискретным, непрерывным, многомерным), их числовым характеристикам (математическому ожиданию, дисперсии, ковариации) и предельным теоремам (ЗБЧ, ЦПТ), являются сильнейшими в книге. Теоремы доказаны строго, но с интуитивными пояснениями «на полях», что помогает понять не только «как» доказывается, но и «почему» это работает.
3. Акцент на понимание, а не на заучивание. Теймс Х. постоянно обращает внимание на типичные ошибки и заблуждения (например, парадокс Монти Холла или вопросы, связанные с условной вероятностью), что бесценно для формирования правильной вероятностной интуиции.
4. Связь с смежными областями. Что делает книгу особенно современной, так это наличие глав или разделов, посвященных введению в марковские цепи и случайные процессы, а также краткому обзору приложений в машинном обучении и статистике. Это показывает студенту, что фундамент, который он закладывает, является стартовой площадкой для дальнейших исследований.
Стиль изложения можно охарактеризовать как строгий, но не сухой. Автор говорит со студентом на одном языке, избегая излишнего сленга, но и не уходя в академическую замшелость. Формулы и теоремы сопровождаются качественными графиками и диаграммами, что визуально облегчает восприятие сложного материала. Особого упоминания заслуживают примеры и упражнения. Примеры подобраны не только как иллюстрация к теореме, но и как маленькие исследовательские задачи. Упражнения в конце каждой главы четко разделены по уровню сложности: от простых задач на закрепление определения до сложных, проблемных заданий, требующих глубокого осмысления материала.
«Основы теории вероятностей» Теймса Х. — это не просто еще один учебник в длинной череде. Это качественная, глубокая и продуманная работа, которая с высокой вероятностью может стать для студента-математика той самой основной книгой на полке, к которой он будет возвращаться на протяжении всего обучения. #теория_вероятностей #математика #math #алгебра #наука #data_science #анализ_данных
💡 Physics.Math.Code // @physics_lib
👍39🔥22😍13❤12