Tencología

Meta aumenta el interés con nueva herramienta para entrenar sistemas de IA

Bloomberg

Meta presentó a LLaMA, una herramienta de investigación para facilitar la creación de chatbots y otros productos con IA

Bloomberg

Meta Platforms Inc. presentó una herramienta de investigación para crear chatbots y otros productos basados en inteligencia artificial, con la que pretende dar a conocer su propia tecnología en un campo últimamente centrado en sus rivales de Internet, Google y Microsoft Corp.

La herramienta, LLaMA, es la última entrada de Meta en el ámbito de los grandes modelos lingüísticos, que "han demostrado ser muy prometedores para generar texto, mantener conversaciones, resumir material escrito y realizar tareas más complicadas, como resolver teoremas matemáticos o predecir estructuras de proteínas", dijo el presidente ejecutivo, Mark Zuckerberg, en un post de Instagram el viernes.

Por ahora LLaMA no se utiliza en los productos de Meta, que incluyen las redes sociales Facebook e Instagram, según un portavoz. La empresa planea poner la tecnología a disposición de los investigadores de IA.

"Meta está comprometida con este modelo abierto de investigación", escribió Zuckerberg.

Los grandes modelos lingüísticos son sistemas masivos de IA que absorben enormes volúmenes de texto digital -de artículos de noticias, publicaciones en redes sociales u otras fuentes de Internet- y utilizan ese material escrito para entrenar software que predice y genera contenido por sí mismo cuando se le da una indicación o consulta. Los modelos pueden utilizarse para tareas como escribir ensayos, redactar tuits, generar conversaciones de chatbot y sugerir códigos de programación informática.

La tecnología se ha hecho popular, y controvertida, en los últimos meses a medida que más empresas han empezado a construirlos e introducir pruebas de productos basados en los modelos, poniendo de relieve una nueva área de competencia entre los gigantes tecnológicos. Microsoft está invirtiendo miles de millones en OpenAI, el fabricante de GPT-3, el gran modelo lingüístico con el que funciona el chatbot ChatGPT. El fabricante de software presentó este mes una versión de prueba de su motor de búsqueda Bing basada en la tecnología de chat de OpenAI, que suscitó una preocupación inmediata por sus respuestas, a veces inapropiadas.

Google, de Alphabet Inc., tiene un modelo llamado LaMDA, o Modelo Lingüístico para Aplicaciones de Diálogo. El líder en búsquedas y publicidad en Internet está probando un producto de búsqueda basado en chat y potenciado por IA llamado Bard, que también tiene aún algunos fallos.

Meta lanzó anteriormente un gran modelo lingüístico llamado OPT-175B, pero LLaMA es un sistema más nuevo y avanzado. Otro modelo que Meta lanzó a finales del año pasado, Galactica, fue retirado rápidamente después de que los investigadores descubrieran que compartía habitualmente información sesgada o inexacta con las personas que lo utilizaban.

Zuckerberg ha hecho de la IA una prioridad dentro de la empresa, hablando a menudo de su importancia para mejorar los productos de Meta en conferencias telefónicas sobre beneficios y en entrevistas. Aunque ahora no se utiliza LLaMA en los productos de Meta, es posible que se haga en el futuro. Por ahora, Meta confía en la IA para todo tipo de funciones, como la moderación de contenidos y la clasificación del material que aparece en los feeds de los usuarios.

Hacer que el modelo LLaMA sea de código abierto permite a los forasteros ver con más claridad cómo funciona el sistema, ajustarlo a sus necesidades y colaborar en proyectos relacionados. El año pasado, Big Science y Hugging Face lanzaron BLOOM, un LLM de código abierto que pretendía hacer más accesible este tipo de tecnología.

TEMAS


Metaverso - Facebook - Chatbots - chatGPT