Alaid TechThread

Llama's Paradox - Delving deep into Llama.cpp and exploiting Llama.cpp's Heap Maze, from Heap-Overflow to Remote-Code Execution.

https://retr0.blog/blog/llama-rpc-rce

retr0.blog

Retr0's Register

Retr0's Threat Research

409 views05:40

Alaid TechThread

Vul-RAG: Enhancing LLM-based Vulnerability
Detection via Knowledge-level RAG

https://arxiv.org/pdf/2406.11147v3

👍5

341 views19:42

Alaid TechThread

CVE-2025-54136 – MCPOISON CURSOR IDE: PERSISTENT CODE EXECUTION VIA MCP TRUST BYPASS

https://research.checkpoint.com/2025/cursor-vulnerability-mcpoison/

Check Point Research

Cursor IDE's MCP Vulnerability - Check Point Research

Identified Cursor IDE's vulnerability allows attackers to modify MCP configuration files after its one-time approval system

493 views18:10

Alaid TechThread

https://arxiv.org/pdf/2508.03470

On the Evaluation of Large Language Models in Multilingual Vulnerability Repair

273 viewsedited 06:46

Alaid TechThread

https://www.mbgsec.com/posts/2025-08-08-enterprise-ai-compromise-0click-exploit-methods-sneak-peek/

Pwn the Enterprise - thank you AI!
AI Enterprise Compromise - 0click Exploit Methods sneak peek

Michael Bargury

Pwn the Enterprise - thank you AI! Slides, Demos and Techniques

Bottom lines, demos, slides, and attacker capabilities from the BlackHat USA 2025 talk

268 views11:15

Alaid TechThread

Завершился финальный этап DARPA AIxCC

https://www.darpa.mil/news/2025/aixcc-results

Участники начали делиться наработками:
Первое место Team Atlanta
https://team-atlanta.github.io

Второе место Trail of Bits:
https://www.trailofbits.com/buttercup/
https://github.com/trailofbits/buttercup

Третье место Theori
https://theori-io.github.io/aixcc-public/index.html

Решения других команд также доступны или появятся в скором времени.

Ключевые моменты соревнования:
- В среднем команды отправляли исправления за 45 минут.
- Каждая команда выявила уязвимость из реального мира.
- Четыре команды создали исправления всего в одну строку.
- Три команды заработали очки, выполнив три разные задачи за одну минуту.
- CRS участников проанализировали более 45 миллионов строк кода.
- Команды тратили около 152 долларов на каждую задачу соревнования.
- Финалисты обнаружили 77 % внедрённых (synthetic) уязвимостей и успешно запатчили 61 % из них
- Также была выявлена 18 ранее неизвестных реальных уязвимостей

P.S. неделей ранее появилась ссылка на трекер Big Sleep с первыми находками совместного проекта Project Zero и DeepMind

team-atlanta.github.io

Team Atlanta

We are Team Atlanta, the first-place winner of DARPA AIxCC.

1👍41

506 viewsedited 11:40

Alaid TechThread

US_25_Dolan_Gavitt_AI_Agents_for_Offsec_with_Zero_False_Positives.pdf

14.8 MB

Интересный доклад с Black Hat USA 2025 от XBOW на тему валидации результатов работы атакующих LLM-агентов

Аудио подкаст в комментариях

1🔥6

740 viewsedited 20:07

Alaid TechThread

AIxCC_Main_Stage_Presentation.pdf

13 MB

Аудио подкаст в комментариях

525 viewsedited 20:12

Alaid TechThread

Audio

Towards Effective Offensive Security LLM Agents: Hyperparameter Tuning, LLM as a Judge, and a Lightweight CTF Benchmark

https://arxiv.org/pdf/2508.05674

👍1

325 viewsedited 18:50

Alaid TechThread

Enhancing Security in Third-Party Library Reuse -
Comprehensive Detection of 1-day Vulnerability
through Code Patch Analysis

https://www.ndss-symposium.org/wp-content/uploads/2025-576-paper.pdf

313 views18:49

Alaid TechThread

All You Need Is MCP - LLMs Solving a DEF CON CTF Finals Challenge

https://wilgibbs.com/blog/defcon-finals-mcp/

Wil Gibbs

All You Need Is MCP - LLMs Solving a DEF CON CTF Finals Challenge

DEF CON CTF Every year world-class teams play difficult CTFs such as Plaid CTF and HITCON CTF in an attempt to qualify for DEF CON CTF by getting first place. There are usually only 3-4 CTFs a year designated as pre-qualifying events. DEF CON CTF also has…

👍3

259 views19:17

Alaid TechThread

Hyper-V Research

https://r0keb.github.io/posts/Hyper-V-Research/

r0keb

Hyper-V Research

Good morning! In today’s blog I’m going to introduce one of my favorite topics in all of computer science, programming, and low-level computing, hypervisors. In this case, the Windows hypervisor, Hyper-V. We’ll see how it works, its logic, its adaptation…

261 views19:27

Alaid TechThread

US_25_Dolan_Gavitt_AI_Agents_for_Offsec_with_Zero_False_Positives.pdf

Про наработки нашей команды (Professional Security Agents) в области автономных атакующих систем расскажем в конце первого дня конференции OFFZONE.

- Посмотрим на эволюционный путь сканеров безопасности за последние 30 лет до наших дней. Проведем краткий разбор ключевых исследований 2025 года.
- Поделимся нашим видением, стратегией развития и подходами к разработке мультиагентных систем.
- Обязательно принесем и продемонстрируем кейсы реальных уязвимостей, найденных нашим решением.
- Расскажем о том, как подходим к тестированию и оценке качества работы агентов. Поделимся используемыми бенчмарками и текущими результатами на них.

Также мы ищем желающих принять участие в состязании полностью автономных систем в формате CTF. Пишите в ЛС или ищите на конференции, если готовы принять вызов.

#ProSecA@offensive_thread

👍61

367 views06:15

Alaid TechThread

USA-25-More-Flows-More-Bugs-Empowering.pdf

6.4 MB

US-25-ZyuzinPeng-ThinkingOutsideOfSink-6August.pdf

48.1 MB

Применение LLM в статическом анализе на Black Hat 2025

Также еще один интересный по описанию доклад пока без слайдов: Let LLM Learn: When Your Static Analyzer Actually 'Gets It'

11🔥2

424 views09:14

Alaid TechThread

Keane Lucas - Claude - Climbing a CTF Scoreboard Near You.pdf

9.6 MB

Claude -- Climbing a CTF Scoreboard Near You

https://youtu.be/sbkeEwhWIks

🔥31

383 viewsedited 21:26

Alaid TechThread

ОFFZONE_2025_final.pdf

5 MB

Презентация с нашего выступления

https://offzone.moscow/program/pentest-by-a-click-it-s-already-real/

Видео тут

#offzone #ProSecA@offensive_thread

🔥1721

447 viewsedited 22:37

Alaid TechThread

Alaid TechThread pinned a file

06:05

Alaid TechThread

ОFFZONE_2025_final.pdf

1:30

Media is too big

VIEW IN TELEGRAM

Видео с выступления. Тут демо генерации эксплоита под задачи из OWASP Juice Shop

🔥5

381 viewsedited 06:12

Alaid TechThread

Sinkpoint-focused Directed Fuzzing

представлен подход Team Atlanta к улучшению фаззинг-тестирования Java-кода с помощью направленного («directed») фаззинга на основе Jazzer.

– Вместо классического подхода, который слепо покрывает код, они фокусируются на «sinkpoint» — уязвимых местах, таких как вызов java.sql.Statement для SQL-инъекций. Используется CodeQL.
– Сначала статический анализ выявляет эти sink’и и оценивает расстояния до них, затем модифицированный Jazzer рассчитывает CFG и направляет процесса фаззинга к выявленной локации.
– Исследование показало, что на сложных кодовых структурах (например, ActiveMQVar), где традиционный fuzzing теряется, directed fuzzing достигает sink-точек гораздо быстрее и обнаруживает все уязвимые места в ограниченное время в рамках эксперимента время.

https://team-atlanta.github.io/blog/post-crs-java-directed-jazzer/

team-atlanta.github.io

Sinkpoint-focused Directed Fuzzing

Guiding Jazzer towards critical code locations

👍31

346 views15:32

About

Blog

Apps

Platform