DOLA introduce el método de decodificación mejorado por recuperación, con el objetivo de mejorar la precisión de las inteligencias artificiales.

Generado por agente de IAAinvest Coin BuzzRevisado porAInvest News Editorial Team
domingo, 22 de marzo de 2026, 3:43 am ET2 min de lectura

Los investigadores introdujeron el método de Decodificación Aumentada por Búsqueda (Retrieval-Augmented Decoding, RAD). Este método sirve para reducir las alucinaciones que pueden ocurrir en los grandes modelos de lenguaje (Large Language Models, LLMs).De acuerdo con el artículo….

RAD aprovecha un espacio de almacenamiento compacto, construido a partir de datos mínimamente anotados, para dar forma a los resultados del modelo durante el proceso de inferencia.Como se describe en la investigación..

Esta técnica supera a los métodos existentes en pruebas como TruthfulQA y HaluEval, gracias a su capacidad de generalización entre diferentes tareas.Según el estudio….

El artículo presenta un enfoque novedoso para abordar el problema constante de las inexactitudes en los datos de los grandes modelos de lenguaje. Este problema, especialmente común en las tareas de generación de contenido abierto, ha impedido durante mucho tiempo la implementación de los LLM en aplicaciones de alto riesgo. Las estrategias tradicionales para resolver este problema, como el ajuste fino o el aprendizaje en contexto, suelen requerir una cantidad significativa de datos anotados o recursos computacionales, lo que limita su escalabilidad.

La Decodificación Aumentada con Contexto Retirado (Retrieval-Augmented Decoding, RAD) funciona integrando el contexto recuperado en el proceso de decodificación. Utiliza un espacio de referencia compacto, construido a partir de tan solo 10 ejemplos anotados. Este espacio contiene pares de imágenes de contexto y valores logísticos relacionados con los próximos tokens, obtenidos a partir de respuestas verdaderas. Durante la inferencia, RAD recupera contextos semánticamente similares y modifica los valores logísticos del modelo en consecuencia.

El diseño ligero de este método permite que funcione sin necesidad de reentrenar el modelo, lo que lo hace adecuado para ser utilizado en diversos LLM. En las pruebas, RAD demostró un rendimiento sólido en cuatro pruebas de generación de texto abierto. Además, superó a las estrategias existentes en términos de precisión y generalización.De acuerdo con la investigación….

¿Cómo funciona el proceso de decodificación mejorado con recuperación de información?

RAD introduce un método de decodificación adaptativa que tiene en cuenta el contexto. Este método modifica la selección de los tokens en el momento de la inferencia. En cada paso de decodificación, RAD recupera contextos de alta calidad y semánticamente similares, provenientes de un espacio de datos previamente construido. Estos contextos se utilizan para agregar y remodelar las probabilidades de salida del modelo, guiando al modelo hacia resultados basados en hechos reales.Como demuestra el artículo..

El espacio de aprendizaje está diseñado de manera que sea compacto, lo que requiere una cantidad mínima de datos para su construcción. Este enfoque reduce la necesidad de utilizar conjuntos de datos extensos o de realizar procesos de reentrenamiento, lo cual contribuye a mejorar la escalabilidad del modelo. Al concentrarse en un subconjunto pequeño pero de alta calidad de ejemplos, RAD optimiza la fiabilidad factual del modelo, al mismo tiempo que minimiza las cargas computacionales necesarias para su implementación.

¿Cuáles son las principales ventajas de RAD?

Una de las principales ventajas de RAD es su capacidad para ser aplicada en diferentes tareas y modelos. A diferencia de los métodos que dependen de estructuras específicas para cada modelo o de la creación de prompts, RAD es independiente de la arquitectura utilizada. Esta capacidad de adaptabilidad es crucial en un campo en rápido desarrollo, donde diversos LLM se utilizan en diversas aplicaciones.De acuerdo con las investigaciones….

Además, RAD evita el sobrecosto computacional asociado con estrategias de múltiples generaciones, como la decodificación integrada. Al utilizar una sola pasada de procesamiento, se mantiene la eficiencia sin sacrificar la precisión. Esta eficiencia es un factor importante para los inversores y desarrolladores que buscan soluciones escalables para su implementación en el mundo real.

¿Qué limitaciones existen en el proceso de decodificación con apoyo de recuperación?

A pesar de sus ventajas, el RAD también tiene sus limitaciones. La eficacia del método depende de la calidad y relevancia de los datos utilizados para la construcción del espacio de groundings. Si los datos anotados son insuficientes o no se alinean adecuadamente con la tarea, el rendimiento del modelo podría no mejorar como se espera. Esta dependencia destaca la importancia de utilizar conjuntos de datos de alta calidad para la construcción del espacio de groundings.Como señala el artículo….

Otra limitación es el enfoque actual en las tareas de generación de texto abierto. Aunque los resultados son prometedores, es necesario realizar más pruebas en aplicaciones de tipo cerrado y más complejas, para confirmar su amplia aplicabilidad. Estos factores indican que, aunque RAD representa un paso importante hacia adelante, será indispensable continuar con el refinamiento y las pruebas para lograr una mayor adopción.

Comentarios



Add a public comment...
Sin comentarios

Aún no hay comentarios