Meta lanza un modelo de IA que puede verificar el trabajo de otros modelos de IA
Meta, propietario de Facebook, dijo el viernes que estaba lanzando un lote de nuevos modelos de IA de su división de investigación, incluido un «evaluador autodidacta» que puede ofrecer un camino hacia una menor participación humana en el proceso de desarrollo de IA.
El lanzamiento sigue a la presentación de la herramienta por parte de Meta en un artículo de agosto, que detallaba cómo se basa en la misma técnica de «cadena de pensamiento» utilizada por los modelos o1 recientemente lanzados de OpenAI para lograr que realice juicios confiables sobre las respuestas de los modelos.
Esta técnica implica dividir problemas complejos en pasos lógicos más pequeños y parece mejorar la precisión de las respuestas a problemas desafiantes en materias como ciencias, codificación y matemáticas.
Los investigadores de Meta utilizaron datos generados íntegramente por IA para entrenar el modelo evaluador, eliminando también la intervención humana en esa etapa.
La capacidad de usar IA para evaluarla de manera confiable ofrece una visión de un posible camino hacia la construcción de agentes de IA autónomos que puedan aprender de sus propios errores.
Muchos en el campo de la IA imaginan a estos agentes como asistentes digitales lo suficientemente inteligentes como para llevar a cabo una amplia gama de tareas sin intervención humana.
Los modelos de automejora podrían eliminar la necesidad de un proceso a menudo costoso e ineficiente que se utiliza hoy en día, llamado aprendizaje de refuerzo a partir de la retroalimentación humana, que requiere el aporte de anotadores humanos que deben tener experiencia especializada para etiquetar los datos con precisión y verificar que las respuestas a consultas complejas de matemáticas y escritura sean correctas.
«Esperamos que, a medida que la IA se vuelva cada vez más superhumana, pueda comprobar cada vez mejor su trabajo, hasta llegar a ser incluso mejor que el ser humano medio», afirmó Jason Weston, uno de los investigadores.
Otras empresas, entre ellas Google y Anthropic, también han publicado investigaciones sobre el concepto de aprendizaje reforzado a partir de la retroalimentación de la IA (RLAIF, por sus siglas en inglés). Sin embargo, a diferencia de Meta, esas empresas tienden a no publicar sus modelos para uso público.
Otras herramientas de inteligencia artificial lanzadas por Meta el viernes incluyeron una actualización del modelo de identificación de imágenes Segment Anything de la compañía, una herramienta que acelera los tiempos de generación de respuestas LLM y conjuntos de datos que pueden usarse para ayudar al descubrimiento de nuevos materiales inorgánicos.
Fuente: reuters
El agradecimiento a AI Revolution por las imágenes difundidas en este noticiero