🌟 Lumina-DiMOO
Lumina-DiMOO — это передовая модель, использующая дискретную диффузию для обработки мультимодальных задач, таких как генерация изображений и их редактирование.
Она демонстрирует высокую эффективность и превосходит существующие решения по множеству показателей.
🚀Основные моменты:
- Унифицированная архитектура для различных модальностей.
- Поддержка текстово-изображенческой генерации и понимания.
- Увеличенная скорость выборки с помощью кэширования.
- Достижение состояния искусства в нескольких бенчмарках.
📌 GitHub: https://github.com/Alpha-VLLM/Lumina-DiMOO
#python
Lumina-DiMOO — это передовая модель, использующая дискретную диффузию для обработки мультимодальных задач, таких как генерация изображений и их редактирование.
Она демонстрирует высокую эффективность и превосходит существующие решения по множеству показателей.
🚀Основные моменты:
- Унифицированная архитектура для различных модальностей.
- Поддержка текстово-изображенческой генерации и понимания.
- Увеличенная скорость выборки с помощью кэширования.
- Достижение состояния искусства в нескольких бенчмарках.
📌 GitHub: https://github.com/Alpha-VLLM/Lumina-DiMOO
#python
GitHub
GitHub - Alpha-VLLM/Lumina-DiMOO: Lumina-DiMOO - An Open-Sourced Multi-Modal Large Diffusion Language Model
Lumina-DiMOO - An Open-Sourced Multi-Modal Large Diffusion Language Model - Alpha-VLLM/Lumina-DiMOO
💩1
Как выучить вышмат за 1 вечер? 😨
Никак. Ведь в первую очередь важно научиться понимать математику. Это позволит не только быстро восстанавливать известные факты, но и адаптировать их под свои задачи и цели!
И поможет вам в этом единственный канал в телеграме о высшей математике. Его автор - выпускник СПБГУ, а ныне — аспирант РАН, преподаватель теории вероятностей и математического анализа.
На простом языке разбирает сложные вещи, даёт шпаргалки и проводит регулярные консультации по высшей математике 📈
Находка для студентов и тех, кому нужен вышмат по работе. От полезных материалов и книг до ответов на вопросы и уроков по подготовке к олимпиадам, собеседованиям, вступительным испытаниям.
Посмотрите сами 👉 @lav_math
Никак. Ведь в первую очередь важно научиться понимать математику. Это позволит не только быстро восстанавливать известные факты, но и адаптировать их под свои задачи и цели!
И поможет вам в этом единственный канал в телеграме о высшей математике. Его автор - выпускник СПБГУ, а ныне — аспирант РАН, преподаватель теории вероятностей и математического анализа.
На простом языке разбирает сложные вещи, даёт шпаргалки и проводит регулярные консультации по высшей математике 📈
Находка для студентов и тех, кому нужен вышмат по работе. От полезных материалов и книг до ответов на вопросы и уроков по подготовке к олимпиадам, собеседованиям, вступительным испытаниям.
Посмотрите сами 👉 @lav_math
🤡15❤6🔥2🎉1
Forwarded from DevOps
This media is not supported in your browser
VIEW IN TELEGRAM
🎮 DOOMscrolling: The Game
Думскроллинг превратился в игру! Энтузиаст сделал пародию на DOOM, где вместо стрелялки — бесконечная лента новостей.
⚡ Как играть:
- листаешь вниз/вверх → так двигается персонаж
- на пути — монстры, оружие с апгрейдами, ловушки и даже стена огня, которая подгоняет вперёд
- сверху накладываются реальные заголовки из RSS
В итоге получается безумный микс: привычный думскроллинг, но теперь он реально «убивает».
👉 Попробовать: https://gisnep.com/doomscroll/?ref=ironicsans.ghost.io
Думскроллинг превратился в игру! Энтузиаст сделал пародию на DOOM, где вместо стрелялки — бесконечная лента новостей.
⚡ Как играть:
- листаешь вниз/вверх → так двигается персонаж
- на пути — монстры, оружие с апгрейдами, ловушки и даже стена огня, которая подгоняет вперёд
- сверху накладываются реальные заголовки из RSS
В итоге получается безумный микс: привычный думскроллинг, но теперь он реально «убивает».
👉 Попробовать: https://gisnep.com/doomscroll/?ref=ironicsans.ghost.io
❤🔥4
This media is not supported in your browser
VIEW IN TELEGRAM
🔍 Интерактивный визуальный гид по математике и алгоритмам через концепты геймдева
Это отличный ресурс, где сложные идеи показываются через визуализацию и примеры из геймдева.
💡 Особое внимание главам про теорию графов
- визуализация узлов, рёбер, путей
- алгоритмы поиска: DFS, BFS, A*
- минимальные остовные деревья и прочие структурные концепты
Если хочешь, могу собрать подборку самых полезных страниц/статей с Red Blob Games про графы, которые стоит сохранить.
https://redblobgames.com
Это отличный ресурс, где сложные идеи показываются через визуализацию и примеры из геймдева.
💡 Особое внимание главам про теорию графов
- визуализация узлов, рёбер, путей
- алгоритмы поиска: DFS, BFS, A*
- минимальные остовные деревья и прочие структурные концепты
Если хочешь, могу собрать подборку самых полезных страниц/статей с Red Blob Games про графы, которые стоит сохранить.
https://redblobgames.com
❤11😁9👍5
📐 Генерируйте пошаговую LaTeX-документацию прямо из Python-кода с помощью handcalcs
Показывать промежуточные шаги расчёта — критично для отчётов и верификации: так стейкхолдеры видят логику, а не только итоговое число. Писать LaTeX вручную для каждого шага — долго и рутинно. handcalcs снимает эту боль: он автоматически превращает ваш Python-код в понятные математические выкладки (с формулами и подстановками), готовые для вставки в отчёт, ноутбук или публикацию.
Зачем это нужно
• инженерные записки и техотчёты с проверяемыми шагами
• документация к моделям данных и расчётам в DS/ML
• учебные материалы и туториалы с «развёрнутыми» формулами
Как это выглядит на практике
Подсказки к использованию
• держите формулы в чистом виде: переменные и выражения — внутри функций, без «магических» чисел
• для отчётов экспортируйте LaTeX-строки в файл и подключайте в шаблон (или вставляйте в Markdown с MathJax)
• фиксируйте входные параметры: handcalcs красиво покажет подстановку значений и все промежуточные шаги
Итог: вы пишете расчёты один раз на Python, а читатели получают понятные формулы со всеми шагами — быстро, прозрачно и без ручного набора LaTeX.
Показывать промежуточные шаги расчёта — критично для отчётов и верификации: так стейкхолдеры видят логику, а не только итоговое число. Писать LaTeX вручную для каждого шага — долго и рутинно. handcalcs снимает эту боль: он автоматически превращает ваш Python-код в понятные математические выкладки (с формулами и подстановками), готовые для вставки в отчёт, ноутбук или публикацию.
Зачем это нужно
• инженерные записки и техотчёты с проверяемыми шагами
• документация к моделям данных и расчётам в DS/ML
• учебные материалы и туториалы с «развёрнутыми» формулами
Как это выглядит на практике
# pip install handcalcs
from math import pi
from handcalcs.decorator import handcalc
# handcalcs возьмёт выражения внутри функции и сгенерирует пошаговые формулы
@handcalc()
def circle_area(r):
A = pi * r**2
return A
latex_output = circle_area(3) # возвращает LaTeX со всеми шагами: A = π·r^2 → подстановка → результат
print(latex_output)
# Пример для инженерной механики
@handcalc()
def bending_stress(F, L, b, h):
I = b * h**3 / 12
M = F * L
y = h / 2
sigma = M * y / I
return sigma
print(bending_stress(F=1500, L=2.0, b=0.05, h=0.02))
Подсказки к использованию
• держите формулы в чистом виде: переменные и выражения — внутри функций, без «магических» чисел
• для отчётов экспортируйте LaTeX-строки в файл и подключайте в шаблон (или вставляйте в Markdown с MathJax)
• фиксируйте входные параметры: handcalcs красиво покажет подстановку значений и все промежуточные шаги
Итог: вы пишете расчёты один раз на Python, а читатели получают понятные формулы со всеми шагами — быстро, прозрачно и без ручного набора LaTeX.
❤12👍7🔥4🤝3
Выбираешь вуз? Давай разберёмся!
Если завис на последнем варианте – тебе в ЦЭ-500 👈
Рассказываем, как выбрать перспективную специальность и сразу после выпуска попасть на крутое предприятие.
#реклама
О рекламодателе
Если завис на последнем варианте – тебе в ЦЭ-500 👈
Рассказываем, как выбрать перспективную специальность и сразу после выпуска попасть на крутое предприятие.
#реклама
О рекламодателе
🏆1
This media is not supported in your browser
VIEW IN TELEGRAM
Ряд Тейлора - это мощный инструмент в математическом анализе, который позволяет представить гладкую функцию в виде бесконечной суммы её производных в одной точке.
По сути, он даёт способ приближать сложные функции с помощью многочленов. Каждый член ряда включает производную более высокого порядка, вычисленную в выбранной точке, и умноженную на соответствующую степень переменной.
Вблизи этой точки многочлен Тейлора точно повторяет поведение исходной функции, и чем больше членов ряда учитывать, тем точнее становится приближение. Эта концепция является фундаментальной как в теоретической, так и в прикладной математике - от решения дифференциальных уравнений до работы алгоритмов в численном анализе и физике.
По сути, он даёт способ приближать сложные функции с помощью многочленов. Каждый член ряда включает производную более высокого порядка, вычисленную в выбранной точке, и умноженную на соответствующую степень переменной.
Вблизи этой точки многочлен Тейлора точно повторяет поведение исходной функции, и чем больше членов ряда учитывать, тем точнее становится приближение. Эта концепция является фундаментальной как в теоретической, так и в прикладной математике - от решения дифференциальных уравнений до работы алгоритмов в численном анализе и физике.
❤🔥34❤5
Этот курс охватывает ключевые математические концепции, лежащие в основе современных алгоритмов машинного обучения, таких как линейная алгебра, теория вероятностей, статистика и оптимизация.
Курс
Please open Telegram to view this post
VIEW IN TELEGRAM
❤16👍6🔥3
Один из величайших математиков современности, Теренс Тао, использовал искусственный интеллект, чтобы решить задачу на MathOverflow о последовательности наименьших общих кратных.
У него было теоретическое подозрение, что ответ отрицательный, но требовались конкретные числовые параметры для построения контрпримера. Сначала Тао просил ИИ сгенерировать Python-код для поиска, но из-за неверных параметров и долгого времени выполнения этот путь оказался неэффективным.
Затем он перешёл к пошаговому алгоритму: ИИ выполнял эвристические расчёты, помогая сузить диапазон параметров. В итоге удалось получить рабочие значения, которые Тао проверил самостоятельно с помощью короткого Python-скрипта, также созданного ИИ.
Такая стратегия позволила сэкономить часы ручного кодирования и отладки: ИИ не только ускорил поиск, но и выявил несколько ошибок в начальных рассуждениях. Этот случай показывает, как современные системы могут становиться реальными ассистентами даже в фундаментальной математике.
mathstodon
Please open Telegram to view this post
VIEW IN TELEGRAM
👍27❤16🔥6😐4👎2
🔥 Успех в IT = скорость + знания + окружение
Здесь ты найдёшь всё это — коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!
AI: https://t.iss.one/+EPEFXp67QfIyMjMy
Python: https://t.iss.one/+cq7O4sOHldY1ZTIy
Linux: t.iss.one/linuxacademiya
Собеседования DS: t.iss.one/machinelearning_interview
C++ t.iss.one/cpluspluc
Docker: t.iss.one/DevopsDocker
Хакинг: t.iss.one/linuxkalii
Devops: t.iss.one/DevOPSitsec
Data Science: t.iss.one/data_analysis_ml
Javascript: t.iss.one/javascriptv
C#: t.iss.one/csharp_1001_notes
Java: t.iss.one/java_library
Базы данных: t.iss.one/sqlhub
Python собеседования: t.iss.one/python_job_interview
Мобильная разработка: t.iss.one/mobdevelop
Golang: t.iss.one/Golang_google
React: t.iss.one/react_tg
Rust: t.iss.one/rust_code
ИИ: t.iss.one/vistehno
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Frontend: t.iss.one/front
Big Data: t.iss.one/bigdatai
МАТЕМАТИКА: t.iss.one/data_math
Kubernets: t.iss.one/kubernetc
Разработка игр: https://t.iss.one/gamedev
Haskell: t.iss.one/haskell_tg
Физика: t.iss.one/fizmat
💼 Папка с вакансиями: t.iss.one/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.iss.one/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.iss.one/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.iss.one/memes_prog
🇬🇧Английский: t.iss.one/english_forprogrammers
🧠ИИ: t.iss.one/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.iss.one/addlist/BkskQciUW_FhNjEy
Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!
Здесь ты найдёшь всё это — коротко, по делу и без воды.
Пока другие ищут, где “подглядеть решение”, ты уже используешь самые свежие инструменты!
AI: https://t.iss.one/+EPEFXp67QfIyMjMy
Python: https://t.iss.one/+cq7O4sOHldY1ZTIy
Linux: t.iss.one/linuxacademiya
Собеседования DS: t.iss.one/machinelearning_interview
C++ t.iss.one/cpluspluc
Docker: t.iss.one/DevopsDocker
Хакинг: t.iss.one/linuxkalii
Devops: t.iss.one/DevOPSitsec
Data Science: t.iss.one/data_analysis_ml
Javascript: t.iss.one/javascriptv
C#: t.iss.one/csharp_1001_notes
Java: t.iss.one/java_library
Базы данных: t.iss.one/sqlhub
Python собеседования: t.iss.one/python_job_interview
Мобильная разработка: t.iss.one/mobdevelop
Golang: t.iss.one/Golang_google
React: t.iss.one/react_tg
Rust: t.iss.one/rust_code
ИИ: t.iss.one/vistehno
PHP: t.iss.one/phpshka
Android: t.iss.one/android_its
Frontend: t.iss.one/front
Big Data: t.iss.one/bigdatai
МАТЕМАТИКА: t.iss.one/data_math
Kubernets: t.iss.one/kubernetc
Разработка игр: https://t.iss.one/gamedev
Haskell: t.iss.one/haskell_tg
Физика: t.iss.one/fizmat
💼 Папка с вакансиями: t.iss.one/addlist/_zyy_jQ_QUsyM2Vi
Папка Go разработчика: t.iss.one/addlist/MUtJEeJSxeY2YTFi
Папка Python разработчика: t.iss.one/addlist/eEPya-HF6mkxMGIy
Папка ML: https://t.iss.one/addlist/2Ls-snqEeytkMDgy
Папка FRONTEND: https://t.iss.one/addlist/mzMMG3RPZhY2M2Iy
😆ИТ-Мемы: t.iss.one/memes_prog
🇬🇧Английский: t.iss.one/english_forprogrammers
🧠ИИ: t.iss.one/vistehno
🎓954ГБ ОПЕНСОРС КУРСОВ: @courses
📕Ит-книги бесплатно: https://t.iss.one/addlist/BkskQciUW_FhNjEy
Подпишись, если хочешь быть в числе тех, кого зовут в топовые проекты!
❤2
Учёные из MIT создали прорывную гибридную модель - сочетание искусственного интеллекта + физики, которая прогнозирует поведение плазмы в термоядерных реакторах и делает будущие функционирующие установки более надёжными.
🔥 Особо важный момент: модель умеет предсказывать, как ведёт себя сверхгорячая плазма во время остановки (выключения/снижения мощности), это один из самых опасных моментов работы реактора, когда могут происходить разрушительные возмущения.
В отличие от обычных ИИ-моделей, эта требует гораздо меньше тренировочных данных, но остаётся очень точной.
Учёные также разработали алгоритм, который превращает прогнозы модели в конкретные инструкции по управлению плазмой: например, как менять силу магнитов или температуру, чтобы плазма оставалась стабильной и безопасно “загасла”.
@data_math
Please open Telegram to view this post
VIEW IN TELEGRAM
❤9👍7🔥3👎2
LLM берет золото на олимпиаде по астрофизике
Исследователи проверили, как современные большие языковые модели (LLM) справятся с задачами Международной олимпиады по астрономии и астрофизике (IOAA) за 2022–2025 годы.
Результаты впечатляют.
🧠 Тестировались модели:
GPT-5, OpenAI o3, Gemini 2.5 Pro, Claude 4.1 Opus и Claude 4 Sonnet.
📊 Что показали:
- GPT-5 и Gemini 2.5 Pro набрали 85–88 % - это уровень золотой медали .
- Остальные модели показали результат в диапазоне 48–76 %.
- Особенно сильны GPT-5 в анализе данных и Gemini в теории.
💡 Почему это важно:
- LLM впервые достигли уровня лучших олимпиадников по астрофизике.
- Это демонстрирует, что модели уже решают не только текстовые, но и научные, количественные и логические задачи.
- Потенциал таких систем — помощь в научных исследованиях, автоматическом анализе данных и обучении.
⚠️ Ограничения:
- Олимпиадные задачи не охватывают весь спектр реальной астрофизики.
- Возможны «угадывания» и шаблонные решения.
- Неясно, насколько стабильно поведение моделей при реальных данных с шумом и погрешностями.
🟢 Подробности: arxiv.org/abs/2510.05016
Исследователи проверили, как современные большие языковые модели (LLM) справятся с задачами Международной олимпиады по астрономии и астрофизике (IOAA) за 2022–2025 годы.
Результаты впечатляют.
🧠 Тестировались модели:
GPT-5, OpenAI o3, Gemini 2.5 Pro, Claude 4.1 Opus и Claude 4 Sonnet.
📊 Что показали:
- GPT-5 и Gemini 2.5 Pro набрали 85–88 % - это уровень золотой медали .
- Остальные модели показали результат в диапазоне 48–76 %.
- Особенно сильны GPT-5 в анализе данных и Gemini в теории.
💡 Почему это важно:
- LLM впервые достигли уровня лучших олимпиадников по астрофизике.
- Это демонстрирует, что модели уже решают не только текстовые, но и научные, количественные и логические задачи.
- Потенциал таких систем — помощь в научных исследованиях, автоматическом анализе данных и обучении.
⚠️ Ограничения:
- Олимпиадные задачи не охватывают весь спектр реальной астрофизики.
- Возможны «угадывания» и шаблонные решения.
- Неясно, насколько стабильно поведение моделей при реальных данных с шумом и погрешностями.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
❤4👍4
This media is not supported in your browser
VIEW IN TELEGRAM
Классические LLM ограничены собственным контекстом: они выдают только то, что успели "запомнить" при обучении.
RAG (Retrieval-Augmented Generation) ломает эту границу — модель получает доступ к внешним данным и способна подгружать нужные факты *в момент запроса*.
Механика проста, но мощна:
LLM → делает эмбеддинг запроса → ищет близкие документы в векторном хранилище → получает top-k контексты → формирует ответ на их основе.
В итоге модель не "вспоминает", а всегда рассуждает на свежих данных.
Где это реально работает:
- в Copilot для кода, когда модель тянет сниппеты из корпоративных репозиториев;
- в внутренних чатах компаний - поиск по Confluence, Notion, Jira и документации;
- в R&D и науке - динамическая генерация отчётов с ссылками на реальные статьи;
- в юридических и медтех-системах, где каждый ответ должен быть подтверждён источником.
RAG - это уже не просто “надстройка над GPT”.
Это новая архитектура, где память отделена от рассуждения, и ИИ получает навык работы с контекстом, как человек с поисковиком.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤2👏2🔥1😁1
Elementary.Linear.Algebra.pdf
12.4 MB
Elementary Linear Algebra (Eng ver)
Авторы: Howard Anton, Anton Kaul (2019)
Авторы предоставляют простое изложение линейной алгебры, которое подходит для студентов первого курса бакалавриата. Цель учебника состоит в том, чтобы как можно более подробно объяснить основы линейной алгебры. Знания матанализа не являются обязательным условием для начала чтения, но есть четко обозначенные упражнения и примеры для студентов, изучавших математический анализ.
Авторы: Howard Anton, Anton Kaul (2019)
Авторы предоставляют простое изложение линейной алгебры, которое подходит для студентов первого курса бакалавриата. Цель учебника состоит в том, чтобы как можно более подробно объяснить основы линейной алгебры. Знания матанализа не являются обязательным условием для начала чтения, но есть четко обозначенные упражнения и примеры для студентов, изучавших математический анализ.
🔥12❤6🥰2
📄 Nanonets-OCR2-3B - новая модель для интеллектуального OCR
Модель от Nanonets на базе Qwen2.5-VL-3B умеет не просто распознавать текст, а превращать изображение документа в структурированный Markdown: с таблицами, формулами, подписями и даже схемами.
🔍 Что умеет
- Распознаёт формулы и преобразует их в LaTeX
- Понимает таблицы и сохраняет структуру в Markdown или HTML
- Выделяет чекбоксы и радиокнопки (☐ / ☑ / ☒)
- Распознаёт подписи, водяные знаки, изображения
- Может описать картинки внутри документа с помощью <img>
-Поддерживает рукописные тексты и разные языки
- Для схем и блок-схем генерирует Mermaid-код
- Умеет отвечать на вопросы по документу (Visual QA)
👉 huggingface.co/nanonets/Nanonets-OCR2-3B
Модель от Nanonets на базе Qwen2.5-VL-3B умеет не просто распознавать текст, а превращать изображение документа в структурированный Markdown: с таблицами, формулами, подписями и даже схемами.
🔍 Что умеет
- Распознаёт формулы и преобразует их в LaTeX
- Понимает таблицы и сохраняет структуру в Markdown или HTML
- Выделяет чекбоксы и радиокнопки (☐ / ☑ / ☒)
- Распознаёт подписи, водяные знаки, изображения
- Может описать картинки внутри документа с помощью <img>
-Поддерживает рукописные тексты и разные языки
- Для схем и блок-схем генерирует Mermaid-код
- Умеет отвечать на вопросы по документу (Visual QA)
👉 huggingface.co/nanonets/Nanonets-OCR2-3B
👍7❤5
🧠 Могут ли мультимодальные модели действительно понимать инструменты?
Новая работа проверяет, способны ли модели действительно понимать физические инструменты, а не просто узнавать их по картинке.
📷 В задаче модели показывают фото и просят выбрать нужный инструмент с номером.
Датасет включает 1 000 пар изображение + текст и три уровня сложности:
1. Базовое распознавание инструмента;
2. Понимание ограничений (например, работает ли он, цел ли);
3. Конструирование инструмента из других предметов.
🧩 Условия:
- Можно использовать только предметы на фото;
- Ответ - номер инструмента или None.
👨🔬 Результаты:
- Люди: ~90 %
- Топ-модели: ~63 %
- Внутренние бэкенды Vision-Language-Action моделей — < 15 %.
Типичные ошибки:
- Считают сломанный инструмент рабочим;
- Путают похожие кабели и порты.
🔧 Немного помогает масштаб — примерно с 10 B параметров появляется базовое “чувство инструмента”.
Метод chain-of-thought даёт небольшой прирост,
а vision-centric пайплайн (распознавание объектов + рассуждение по вырезкам) улучшает самые трудные случаи.
💡 Главное открытие: современные мультимодальные модели знают названия предметов,
но не понимают, как инструменты работают.
Этот бенчмарк даёт чёткий ориентир, где они пока “проваливаются”.
📘 Cтатья: https://arxiv.org/abs/2510.09507
Новая работа проверяет, способны ли модели действительно понимать физические инструменты, а не просто узнавать их по картинке.
📷 В задаче модели показывают фото и просят выбрать нужный инструмент с номером.
Датасет включает 1 000 пар изображение + текст и три уровня сложности:
1. Базовое распознавание инструмента;
2. Понимание ограничений (например, работает ли он, цел ли);
3. Конструирование инструмента из других предметов.
🧩 Условия:
- Можно использовать только предметы на фото;
- Ответ - номер инструмента или None.
👨🔬 Результаты:
- Люди: ~90 %
- Топ-модели: ~63 %
- Внутренние бэкенды Vision-Language-Action моделей — < 15 %.
Типичные ошибки:
- Считают сломанный инструмент рабочим;
- Путают похожие кабели и порты.
🔧 Немного помогает масштаб — примерно с 10 B параметров появляется базовое “чувство инструмента”.
Метод chain-of-thought даёт небольшой прирост,
а vision-centric пайплайн (распознавание объектов + рассуждение по вырезкам) улучшает самые трудные случаи.
💡 Главное открытие: современные мультимодальные модели знают названия предметов,
но не понимают, как инструменты работают.
Этот бенчмарк даёт чёткий ориентир, где они пока “проваливаются”.
📘 Cтатья: https://arxiv.org/abs/2510.09507
❤5🔥5👏3
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
Media is too big
VIEW IN TELEGRAM
❤12🔥7👍4🥰1