La publicación de los resultados de los benchmark de IA coincide con un aumento en los ataques criptográficos.
EVMbench es una herramienta de investigación, no un producto de seguridad. Fue lanzada en…18 de febreroFue desarrollado por OpenAI y la empresa de capital riesgo Paradigm, con el objetivo de evaluar la capacidad de los agentes de IA para detectar, corregir y explotar las vulnerabilidades en los contratos inteligentes. Su propósito es medir las capacidades de la IA agente en la seguridad de la cadena de bloques, proporcionando así un entorno de prueba estandarizado para desarrolladores e investigadores.
El punto de referencia se basa en un conjunto de datos seleccionados cuidadosamente.Se han identificado 120 vulnerabilidades en más de 40 auditorías de contratos inteligentes realizadas anteriormente.Además, se tienen en cuenta escenarios de vulnerabilidad derivados de la auditoría de seguridad de la cadena de bloques Tempo. Estas fuentes de datos sirven como base para los casos de prueba utilizados para evaluar el rendimiento del sistema AI en tres modalidades: detección, corrección y explotación. La métrica clave es la puntuación obtenida en las pruebas de explotación. El objetivo es continuar con las pruebas hasta que se agote todo el dinero disponible.
En este modo, se utiliza el modelo más reciente de OpenAI.GPT-5.3-Codex obtuvo una puntuación de 72.2%.Esto representa una mejora significativa en comparación con su predecesor, GPT-5, cuya eficiencia fue de solo el 31.9%. Los resultados muestran que los agentes son mucho más efectivos a la hora de aprovechar las vulnerabilidades, en lugar de encontrarlas o solucionarlas. Este hallazgo destaca una deficiencia importante en las capacidades de seguridad de la IA actual. La publicación de esta herramienta ocurrió pocos días después de un incidente real en el que un error en el código generado por la IA causó que los usuarios de Moonwell pagaran casi 2.7 millones de dólares, lo que demuestra la importancia inmediata de esta investigación.
El impacto en el mercado: un catalizador para los ataques basados en la inteligencia artificial, y no una barrera defensiva.
El hallazgo principal de este estudio es una advertencia importante para el mercado: los agentes de IA son, sin duda, más capaces de explotar las vulnerabilidades que de encontrar o solucionarlas. Esta diferencia en capacidades representa un riesgo real. En modo de explotación, el modelo más reciente de OpenAI, GPT-5.3-Codex, logró…Puntuación: 72.2%Su eficacia es más del doble en comparación con la de su predecesor. Sin embargo, su rendimiento en términos de detección y aplicación de soluciones de seguridad sigue siendo “inferior al nivel completo”. Esto indica que el sistema utiliza herramientas ofensivas mucho más avanzadas que las defensivas.
Este desequilibrio ya se está traduciendo en salidas de capital. A partir de esta semana, los protocolos han sufrido hackeos y ataques maliciosos por valor de más de 108 millones de dólares en el año 2026. La publicación de EVMbench, una herramienta de código abierto, reduce las barreras para que actores malintencionados puedan probar y mejorar sus técnicas de ataque. Al proporcionar un marco estandarizado y público para medir y mejorar los ataques dirigidos por IA, este benchmark, sin quererlo, acelera la superficie de ataque. Los datos proporcionados por esta herramienta muestran que los agentes utilizados en los ataques logran muy bien el objetivo explícito de “agotar fondos”, algo similar a la realidad económica de los ataques maliciosos.
El mecanismo es claro: una mayor capacidad de la IA para explotar vulnerabilidades podría reducir el tiempo que transcurre entre la existencia de una vulnerabilidad y su posterior utilización con fines económicos. En el caso de los protocolos, esto significa un aumento en la presión sobre los presupuestos de seguridad, además de una posible fuga de capital hacia sistemas más resistentes a ataques por parte de la IA. Los 10 millones de dólares en créditos API anunciados junto con este parámetro de referencia son una señal defensiva. Pero la naturaleza de código abierto del propio herramienta es, en realidad, un factor que potencia esa misma amenaza que se intenta medir.
La jugada estratégica: OpenAI está probando las posibilidades en el ámbito de la criptografía.
OpenAI está entrando en el ámbito de los contratos inteligentes con el objetivo de explorar nuevas fuentes de ingresos. Este marco sirve como una prueba del interés del mercado. La empresa enfrenta la presión de generar ingresos estables.El mercado de stablecoins se considera una área rentable.Al lanzar EVMbench, OpenAI está, en efecto, explorando un sector que considera que justifica sus importantes inversiones. La naturaleza de código abierto del herramienta y su enfoque en el desarrollo de códigos orientados a pagos, como los que se utilizan en la cadena de bloques Tempo, indican que OpenAI está buscando aprovechar las oportunidades que ofrece este nicho de crecimiento rápido.
Este movimiento incluye también un gesto estratégico de buena voluntad.10 millones de créditos API.Este investimiento se anuncia junto con los estándares de referencia, dando prioridad a las soluciones de código abierto y a las infraestructuras críticas. El objetivo de esta inversión es construir una base de clientes en el futuro y fortalecer los vínculos dentro del ecosistema criptográfico. De este modo, OpenAI podría convertirse en un socio, y no simplemente un proveedor de herramientas. Se trata de un paso calculado para ganar influencia en un mercado donde los contratos inteligentes gestionan activos por valor de más de 100 mil millones de dólares.
Esto indica una tendencia más amplia: los proveedores de AI agente podrían seguir el ejemplo de OpenAI y entrar en el sector criptográfico, creando así una nueva categoría de herramientas de seguridad y para detectar vulnerabilidades. Como señaló Lian Jye Su, “todavía estamos en las etapas iniciales”, pero ya se ha establecido un precedente. Para OpenAI, las presiones financieras son reales, lo que hace que esto pueda convertirse en una fuente de ingresos potencial. Para el mundo criptográfico, esto significa que habrá una nueva clase de herramientas alimentadas por la IA, tanto defensivas como ofensivas, que influirán cada vez más en el panorama de la seguridad.



Comentarios
Aún no hay comentarios