Meta lanza herramienta de IA que evalúa otros modelos sin intervención humana
Meta, la empresa matriz de Facebook, anunció el lanzamiento de una serie de nuevos modelos de inteligencia artificial, destacando un “evaluador autodidacta”. Esta herramienta promete reducir la intervención humana en el desarrollo de la IA y vislumbrar un futuro con agentes autónomos capaces de aprender de sus errores.
Innovación en la evaluación de IA
El lanzamiento sigue a la presentación de esta herramienta en un artículo de agosto, donde se explicó que se basa en la técnica de “cadena de pensamiento”, similar a la utilizada por los modelos de OpenAI. Esta técnica descompone problemas complejos en pasos lógicos más simples, mejorando la precisión en campos como ciencias, codificación y matemáticas.
Los investigadores de Meta entrenaron el modelo evaluador utilizando datos generados exclusivamente por IA, eliminando la necesidad de intervención humana en esa fase. Esto sugiere un camino hacia la creación de agentes de inteligencia artificial que puedan operar de manera autónoma.
Ventajas de la autoevaluación
La capacidad de la IA para evaluar su propio rendimiento sin intervención humana podría transformar el desarrollo de sistemas inteligentes. Este enfoque elimina la dependencia del costoso y a menudo ineficaz proceso de aprendizaje por refuerzo con retroalimentación humana, que requiere expertos para etiquetar datos y verificar la precisión de respuestas a consultas complejas.
“Esperamos que, a medida que la IA se vuelva más avanzada, sea capaz de evaluar su propio trabajo, superando la capacidad del ser humano promedio”, afirma Jason Weston, uno de los investigadores involucrados en el proyecto.
Competencia en el campo de la IA
Otras empresas, como Google y Anthropic, también están explorando el concepto de RLAIF (Reinforcement Learning from AI Feedback). Sin embargo, a diferencia de Meta, estas compañías suelen mantener sus modelos en secreto.
Nuevas herramientas de Meta
Además de la herramienta evaluadora, Meta también lanzó una actualización del modelo de identificación de imágenes llamado Segment Anything, así como una herramienta que acelera los tiempos de generación de respuestas LLM. También presentaron conjuntos de datos para ayudar en el descubrimiento de nuevos materiales inorgánicos.