
Grok 3 es mejor que GPT-4o
Es indeterminado si Grok 3 es mejor que GPT-4o

Respuesta
Según datos divulgados en el evento de lanzamiento de Grok 3, este superó a GPT-4o de OpenAI, Claude 3.5, DeepSeek V3 y Gemini 2 Pro en pruebas de matemáticas, ciencia y programación . Elon Musk aseguró que esta nueva iteración se beneficia de un entrenamiento diez veces más potente que su predecesor y supera en diversas categorías a GPT-4o . xAI ha mostrado datos que sitúan a Grok 3 por delante de GPT-4o en benchmarks matemáticos y científicos . Andrej Karpathy probó Deep Search, una de las funciones más llamativas de Grok 3, y parece comportarse bien . Expertos señalan que, si se hace caso a esas primeras demos y pruebas internas, Grok 3 es un modelo de IA tan bueno o mejor que sus competidores actuales . El entrenamiento de Grok 3 se ha hecho con "10 veces" más computación que Grok 2, lo que se traduce en un centro de datos con 200.000 GPUs .
Sin embargo, las primeras reacciones de los expertos sugieren que, a pesar de las mejoras evidentes, Grok 3 aún no ha logrado destronar el reinado de OpenAI . Ethan Mollick, profesor de la Universidad de Pensilvania, menciona que es un modelo de frontera muy sólido, pero no uno que te haga dejar de usar tu modelo actual . Gary Marcus, fundador de Geometric Intelligence, fue aún más tajante, afirmando que Elon Musk prometió que Grok 3 sería la IA más inteligente de la historia, pero que no lo es . Una de las grandes críticas hacia xAI es la falta de comparaciones directas con o3, el modelo más avanzado de OpenAI . Un usuario en X encontró que Grok 3 tuvo problemas con codificación algo compleja, al menos comparado con GPT-4o y Claude . Andrej Karpathy encontró que Grok 3 alucinaba citas e incluso inventaba URLs falsas . Grok 3 carece de habilidades avanzadas para el humor . Además, Grok 3 no ofrece la capacidad de conversar mediante la voz como competidores como los modelos de OpenAI o Google, aunque Musk indicó que están trabajando en ello .
En conclusión, la afirmación de que "Grok 3 es mejor que GPT-4o" es indeterminada basándose en la información proporcionada. Si bien hay evidencia que apoya la superioridad de Grok 3 en ciertas métricas y tareas específicas , también hay críticas y limitaciones conocidas que impiden una afirmación definitiva . La falta de comparaciones directas con el modelo más avanzado de OpenAI (o3) y las opiniones de expertos que minimizan la supuesta superioridad de Grok 3 dificultan una conclusión clara . La disponibilidad limitada y el modelo de precios de Grok 3 también complican su adopción generalizada en comparación con GPT-4o .
1
2
2
3
3
4
2
2
2
2
5
5
5
3
5
2
4
1
5
2
3
2
3
3