¿Hasta qué punto pueden los LLMs detectar secretos e IoCs (Indicators of Compromise) escondidos dentro del propio código que analizan?

En los últimos meses he estado trabajando en un proyecto de investigación sobre el uso de modelos de lenguaje (LLM) para detectar secretos e indicadores de compromiso (IoCs) embebidos en código: https://github.com/jaimemorales52/llm-ioc-detection.
Como parte de ese trabajo he desarrollado y publicado en abierto un backend en Spring Boot que sirve de base para los experimentos del artículo “Can LLMs Identify Secrets Embedded in Code?”. El objetivo del código no es “poner en producción” nada, sino ofrecer una plataforma de pruebas que permita estudiar cómo distintos LLMs se comportan cuando el IoC está escondido dentro de archivos JavaScript mediante técnicas de ofuscación y cifrado.
El backend se encarga de:
Insertar un IoC (por ejemplo, una IP) como “secreto” en código JavaScript.
Aplicar una cadena configurable de transformaciones (ofuscación, cifrado, etc.).
Enviar el código transformado a varios proveedores de LLM y normalizar la respuesta: ¿detecta o no que hay un IoC? ¿afirma poder recuperar el valor?
Todo el proyecto está publicado en GitHub, con el código, los endpoints REST y ejemplos de uso, para que cualquier persona interesada pueda revisarlo, reproducirlo o adaptarlo a sus propios experimentos, siempre con fines de investigación y formación.
De momento, no puedo compartir resultados ni conclusiones del estudio porque el artículo está en proceso de revisión por una revista científica. Cuando el proceso editorial haya terminado, publicaré los detalles y enlazaré desde aquí al paper final. Hasta entonces, el repositorio queda disponible como recurso técnico para quienes quieran explorar este tipo de escenarios con LLMs.

Deja un comentario Cancelar respuesta

Información

RECURSOS

Legal