Grok y Chat Gpt, IAs de mayor 'coeficiente intelectual': TrackingAI
domingo, 3 de mayo de 2026
La prueba integra un conjunto de 35 rompecabezas de patrones visuales, que para los modelos sin visión, las preguntas se verbalizan
La irrupción de la inteligencia artificial apunta a romper nuevos récords y llegar a nuevos picos de inversión durante este año. Según la consultora especializada Gartner, el gasto mundial en tecnologías de la información alcanzará US$6,31 billones en 2026, 3,5% más que en 2025, cuando el importe total rondó US$5,56 billones.
Lo anterior es otra de las muchas razones por las que las compañías y consultoras invierten en medir la eficacia de los sistemas de inteligencia artificial, como es el caso de TrackingAi, que comparó los modelos con el test de CI de Mensa Noruega a partir de abril de 2026, para clasificar a las principales IA del mercado con respecto a su coeficiente intelectual estimado.
Los resultados muestran quién lidera actualmente y lo poco que separa ahora a los principales contendientes, con múltiples modelos de vanguardia agrupados cerca de la parte superior de la clasificación, pues TrackingAI utiliza el test público de Mensa Noruega, la rama en el país nórdico de Mensa, la asociación internacional de personas con alto cociente intelectual más antigua y grande del mundo, fundada en 1946 en Inglaterra.
La prueba integra un conjunto de 35 rompecabezas de patrones visuales, que para los modelos sin visión, las preguntas se verbalizan, mientras que los modelos con visión reciben las imágenes originales directamente.
En la clasificación, Grok-4.20 Expert Mode y OpenAI GPT 5.4 Pro (Vision) están empatados en el primer lugar con una calificación de 145, mientras que Gemini 3.1 Pro Preview les sigue de cerca en el puesto 141 .
Esa escasa diferencia sugiere que los modelos de IA de vanguardia están convergiendo cada vez más en la parte superior, donde una diferencia de tan solo unos pocos puntos puede cambiar la clasificación.
Sin embargo, cabe recalcar que esta prueba de rendimiento al estilo del coeficiente intelectual solo abarca una parte de la capacidad. No mide todo lo que importa en el uso real de la IA, como la capacidad de programación, la fiabilidad de los datos, el uso de herramientas o el desempeño en ámbitos profesionales