Технозаметки Малышева

GPT-4 способен автономно эксплуатировать уязвимости

Исследователи из Университета Иллинойса Урбана-Шампейн утверждают, что GPT-4 может автономно эксплуатировать уязвимости в реальных системах, просто читая их описания (CVE).
Из набора 15 «однодневных» уязвимостей GPT-4 сумел эксплуатировать 87%, в то время как другие ИИ и сканеры уязвимостей не смогли использовать ни одну.
Ограничение доступа GPT-4 к CVE снизило успешность эксплуатации до 7%.
Стоимость использования GPT-4 для эксплуатации уязвимости оценивается в $8.80, что в 2,8 раза дешевле, чем нанять пентестера на 30 минут.
Код для создания ИИ-агента, эксплуатирующего уязвимости, состоит всего из 91 строки кода и 1056 токенов для запроса.
Исследователи ожидают, что будущие ИИ, такие как GPT-5, будут еще более способны к автоэксплуатации уязвимостей.

ИИ сканеры эволюционируют в ИИ пентестеров.
Специалисты по безопасности в опасности.

#Pentesting #GPT4 #CyberSecurity
-------
@tsingular

403 viewsedited 12:05

XBOW: ИИ-пентестер на уровне лучших профи

XBOW продемонстрировал впечатляющие результаты в сравнении с человеческими пентестерами.
В серии из 104 тестов, охватывающих OWASP Top 10, ИИ-система показала 85% успеха, сравнявшись по эффективности с ведущим экспертом.
При этом, скорость XBOW оказалась в 85 раз выше: 28 минут против 40 часов работы людей.

ИИ превзошёл специалистов на лёгких и средних задачах, но пока, предсказуемо, уступил топ-эксперту в сложных сценариях.

Непрерывная работа XBOW позволяет выявлять уязвимости на ранних этапах разработки ПО.

Технология не заменит профессию, но трансформирует подход к кибербезопасности, делая её более интегрированной в процесс создания софта.

Автоматизация пентеста с обеих сторон перейдёт на новый уровень. х10 0day в месяц.
Оно пока в закрытой бете, но как выйдет, - интересно будет посмотреть.

#XBOW #pentesting #cybersecurity
-------
@tsingular

🔥1

321 viewsedited 06:53

Технозаметки Малышева

🏆 XBOW: ИИ-пентестер возглавил рейтинг HackerOne, обогнав людей

Год назад мы обсуждали, как ИИ-пентестер XBOW сравнялся с лучшими специалистами в тестовой среде.

Теперь новое достижение: XBOW занял 1-е место в США и 6-е в мире в общем рейтинге HackerOne за второй квартал 2025 года, доказав свою эффективность в реальных black-box сценариях.

Технические аспекты:
Полная автономия: XBOW перешел от white-box симуляций к полностью автономной работе в black-box окружении.
Система самостоятельно находит уязвимости и генерирует отчеты без вмешательства человека.

Скорость и масштаб: Там, где команда людей тратит недели и десятки тысяч долларов, XBOW выполняет комплексный тест за несколько часов.

Это позволяет интегрировать непрерывный пентест (continuous pentesting) непосредственно в CI/CD пайплайн.

Подтвержденное качество: Лидерство в рейтинге HackerOne — это не просто метрики, а признание сообщества и подтверждение низкого уровня ложных срабатываний, что было главной проблемой автоматизированных сканеров.

Прогресс за год: Если в 2024 году XBOW демонстрировал 85% успеха в контролируемых тестах OWASP Top 10, то в 2025 он побеждает в живой, конкурентной среде, где ставки и сложность на порядок выше.

Проект, основанный профессором Оксфорда Ухером Дермором, за 1 год прошёл путь от концепта до лидера индустрии.

Рынок и перспективы: Нат Фридман, экс-CEO GitHub и инвестор, метко заметил: "Это круто, но в то же время пугает. Настала эра, когда машины взламывают машины".

Похоже, профессия пентестера действительно трансформируется: фокус смещается со стандартных проверок на сложные, творческие атаки и стратегическую защиту, оставляя рутину машинам.

Минус в том, что ровно такие же возможности появляются и у хакеров.
Как будем актуализировать защиту?

#XBOW #Pentesting #Cybersecurity #HackerOne
———
@tsingular

⚡11🔥6❤3👍2🤔1

2.32K views06:46

About

Blog

Apps

Platform