GPT-4 способен автономно эксплуатировать уязвимости
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular
Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.
ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.
#Pentesting #GPT4 #CyberSecurity
-------
@tsingular
XBOW: ИИ-пентестер на уровне лучших профи
XBOW продемонстрировал впечатляющие результаты в сравнении с человеческими пентестерами.
В серии из 104 тестов, охватывающих OWASP Top 10, ИИ-система показала 85% успеха, сравнявшись по эффективности с ведущим экспертом.
При этом, скорость XBOW оказалась в 85 раз выше: 28 минут против 40 часов работы людей.
ИИ превзошёл специалистов на лёгких и средних задачах, но пока, предсказуемо, уступил топ-эксперту в сложных сценариях.
Непрерывная работа XBOW позволяет выявлять уязвимости на ранних этапах разработки ПО.
Технология не заменит профессию, но трансформирует подход к кибербезопасности, делая её более интегрированной в процесс создания софта.
Автоматизация пентеста с обеих сторон перейдёт на новый уровень. х10 0day в месяц.
Оно пока в закрытой бете, но как выйдет, - интересно будет посмотреть.
#XBOW #pentesting #cybersecurity
-------
@tsingular
XBOW продемонстрировал впечатляющие результаты в сравнении с человеческими пентестерами.
В серии из 104 тестов, охватывающих OWASP Top 10, ИИ-система показала 85% успеха, сравнявшись по эффективности с ведущим экспертом.
При этом, скорость XBOW оказалась в 85 раз выше: 28 минут против 40 часов работы людей.
ИИ превзошёл специалистов на лёгких и средних задачах, но пока, предсказуемо, уступил топ-эксперту в сложных сценариях.
Непрерывная работа XBOW позволяет выявлять уязвимости на ранних этапах разработки ПО.
Технология не заменит профессию, но трансформирует подход к кибербезопасности, делая её более интегрированной в процесс создания софта.
Автоматизация пентеста с обеих сторон перейдёт на новый уровень. х10 0day в месяц.
Оно пока в закрытой бете, но как выйдет, - интересно будет посмотреть.
#XBOW #pentesting #cybersecurity
-------
@tsingular
🔥1
🏆 XBOW: ИИ-пентестер возглавил рейтинг HackerOne, обогнав людей
Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.
Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.
Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.
Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.
Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.
Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.
Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.
Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.
Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".
Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.
Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?
#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular
Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.
Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.
Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.
Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.
Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.
Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.
Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.
Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.
Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".
Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.
Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?
#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular
⚡11🔥6❤3👍2🤔1