Tecnología

Latam GPT, IA que refleja la cultura, lenguaje e historia de la región

Gráfico LR

La base informativa ha permitido desarrollar un modelo de lenguaje de 50.000 millones de parámetros, comparable a GPT-3.5

Juan Camilo Colorado

En medio del boom que se ha generado en torno a la apariciones de nuevos modelos de lenguaje y del avance de la inteligencia artificial como una extensión, cada vez más evidente, de la cotidianidad de las personas, investigadores y expertos crearon el modelo 'autóctono' de IA para América Latina

Se trata de Latam GPT, un modelo de lenguaje de gran escala, que no busca imitar a las grandes potencias de la IA como Deepseek, Chat GPT o Gemini, sino "reflejar la cultura, el lenguaje y la historia de la región, ofreciendo información más precisa y representativa de los contextos locales". Funciona como una base de datos regional

El proyecto es colaborativo entre las naciones de la región y el corpus de datos recolectados alcanza 8 Teras. Esta base informativa ha permitido desarrollar un modelo de lenguaje de 50.000 millones de parámetros, una escala que lo hace comparable a GPT-3.5

En cuanto a los mayores aportantes de información, Brasil se ubica en el primer puesto con 685.000 documentos aportados; le sigue México con 385.000, España con 325.000, Colombia con 230.000 y Argentina con 210.000.

El proyecto fue anunciado en el marco de la Cumbre para la Acción sobre Inteligencia Artificial. Sin embargo, es una iniciativa que ya venía trabajando el Centro Nacional de IA de Chile en colaboración con la cartera de Ciencia, Tecnología, Conocimiento e Innovación chilena.

El proyecto regional se ha financiado con fondos del Cenia de Chile, quienes ya han desembolsado alrededor de US$300.000, un convenio con el Banco de Desarrollo de América Latina y el Caribe (CAF) y el Ministerio de Ciencia de Chile inyectará otros US$250.000 durante 2025. Así mismo, en la infraestructura que facilitará la Universidad de Tarapacá para el potenciamiento de la IA, se invirtieron alrededor de US$4,5 millones.

“Inicialmente, lanzaremos un modelo de lenguaje. Esperamos que su rendimiento en tareas generales sea cercano al de los grandes modelos comerciales, pero que tenga un rendimiento superior en temáticas específicas de Latinoamérica. La idea es que, si le preguntamos sobre temas relevantes para nuestra región, su conocimiento sea mucho más profundo”, explicó Álvaro Soto, director del Cenia, a Wired.

La iniciativa se puso en marcha desde junio de este año y detrás de esta están 30 instituciones y 60 expertos de la región. Entre las instituciones colombianas, figuran la Universidad de los Andes, la Universidad Javeriana, la Universidad Externado y la Universidad La Salle

TEMAS


chatGPT - Inteligencia artificial - América Latina - Universidad de los Andes