ChatGPT vs Claude vs Gemini: ¿Qué IA escribe más como un humano?

Cada semana alguien publica una comparación "ChatGPT vs Claude vs Gemini". La mayoría evalúa qué modelo responde mejor a preguntas de trivia, escribe código más largo o sigue instrucciones con más precisión.

Nadie mide cuál escribe más como un humano.

Nosotros lo hicimos. Con datos, no opiniones.

Qué medimos

Generamos 320 muestras de escritura en cinco modelos de IA, ocho tipos de prompt y cuatro idiomas. Para esta comparación, nos enfocamos en los tres modelos entre los que la mayoría de los profesionales eligen a diario: GPT-5.2 (ChatGPT), Claude Sonnet 4.5 (Claude) y Gemini 3 Pro (Gemini).

Cada muestra fue analizada mediante estilometría computacional — fórmulas determinísticas que miden seis dimensiones independientes del estilo de escritura. Las mismas fórmulas que aplicamos a la escritura humana en los Writing DNA Snapshots, para que la comparación sea de igual a igual.

Para la metodología completa: Cómo medimos la "IA promedio". Para un análisis detallado de los cinco modelos: Cómo escribe cada modelo de IA.

Cara a cara: las seis dimensiones

Complejidad de las oraciones

Modelo	Puntuación
Gemini 3 Pro	La más alta
Claude Sonnet 4.5	Intermedia
GPT-5.2	La más baja de los tres

Gemini escribe las oraciones más estructuralmente complejas. Su resultado tiende a cláusulas anidadas, calificadores y estructuras multiparte que se leen como informes bien editados. Claude Sonnet se sitúa en el medio — suficientemente complejo para contextos profesionales, suficientemente simple para la legibilidad. GPT-5.2 produce las estructuras de oraciones más legibles de los tres, favoreciendo la claridad sobre la densidad.

Qué significa esto para usted: Si naturalmente escribe oraciones cortas y directas (complejidad por debajo de 50), el resultado de GPT-5.2 será el más cercano a su estilo en este eje. Si escribe de forma densa (por encima de 70), Gemini es la coincidencia más cercana. La mayoría de los profesionales se sitúan en algún punto intermedio, donde se ubica Sonnet.

Riqueza del vocabulario

Modelo	Puntuación
Claude Sonnet 4.5	La más alta
GPT-5.2	Intermedia
Gemini 3 Pro	La más baja

Claude Sonnet despliega el vocabulario más amplio de los tres, eligiendo términos específicos sobre genéricos con más frecuencia. GPT-5.2 se sitúa en el medio — accesible pero no repetitivo. Gemini 3 Pro reutiliza el vocabulario con más frecuencia, favoreciendo la consistencia terminológica sobre la variedad léxica.

Qué significa esto para usted: Los escritores con vocabularios especializados — redactores técnicos, académicos, expertos en su dominio — encontrarán la mayor brecha con Gemini en este eje. Los comunicadores generalistas puede que no noten la diferencia entre modelos.

Expresividad

Modelo	Puntuación
GPT-5.2	La más alta (por un amplio margen)
Claude Sonnet 4.5	Intermedia
Gemini 3 Pro	La más baja

Aquí es donde los modelos divergen más drásticamente. GPT-5.2 es el escritor de IA más expresivo por un margen significativo. Usa más preguntas retóricas, más signos de exclamación, más marcadores de actitud ("Importante", "Fascinantemente"), y más puntuación enfática que cualquiera de los competidores.

Claude Sonnet es moderadamente expresivo — comprometido sin ser efusivo. Gemini 3 Pro es el más contenido, produciendo prosa que es informativa más que enérgica.

Qué significa esto para usted: Este eje a menudo determina qué modelo "se siente" adecuado para los usuarios antes de que puedan articular por qué. Si el resultado de ChatGPT se siente demasiado entusiasta para su contexto profesional, los datos confirman su intuición — su puntuación de expresividad excede significativamente la de los otros dos modelos. Si el resultado de Claude se siente mesurado y equilibrado, eso también es medible. Si el resultado de Gemini se siente seco, la misma historia.

Formalidad

Modelo	Puntuación
Gemini 3 Pro	La más alta
Claude Sonnet 4.5	Intermedia-alta
GPT-5.2	La más baja

Gemini escribe de la manera más formal — uso intenso de palabras funcionales, cobertura cuidadosa, punto y coma. Claude Sonnet mantiene formalidad profesional sin rigidez. GPT-5.2 se inclina hacia lo conversacional, especialmente en tipos de prompt que lo invitan.

Qué significa esto para usted: La comunicación legal, financiera y ejecutiva típicamente requiere mayor formalidad. Los valores predeterminados de Gemini son los más cercanos a esos registros. El marketing, las ventas y la comunicación de equipo típicamente funcionan mejor con menor formalidad — GPT-5.2 es la coincidencia más cercana. Claude Sonnet divide la diferencia.

Consistencia

Modelo	Puntuación
Claude Sonnet 4.5	La más alta
Gemini 3 Pro	Intermedia
GPT-5.2	La más baja

Claude Sonnet produce las longitudes de oración más uniformes — una cadencia estable y predecible. GPT-5.2 varía más, alternando entre oraciones cortas y puntuales y otras más largas y explicativas.

Qué significa esto para usted: Si su escritura tiene un ritmo predecible (como suele ocurrir en la escritura legal y técnica), la consistencia de Claude Sonnet es la coincidencia más cercana. Si su escritura es "a ráfagas" — mezclando cortas y largas para generar efecto — la variabilidad de GPT-5.2 es un mejor punto de partida.

Concisión

Modelo	Puntuación
GPT-5.2	La más alta (pero aún por debajo de 50)
Claude Sonnet 4.5	Intermedia
Gemini 3 Pro	La más baja

Ningún modelo escribe de forma concisa. Esto vale la pena declararlo con claridad: cada modelo principal de IA produce resultados más largos de lo que la mayoría de los profesionales escribirían en el mismo contexto. El promedio general es 42 de 100, y ningún modelo lo supera significativamente.

GPT-5.2 es ligeramente más conciso que los demás — su estilo conversacional naturalmente produce oraciones más cortas. Gemini es el menos conciso, igualando su alta complejidad con una gran longitud de oraciones.

Qué significa esto para usted: Si es un escritor conciso (y muchos profesionales lo son), cada modelo necesitará una calibración significativa en este eje. La elección del modelo apenas mueve la aguja.

El cuadro de resultados

Model AModel BLanguage

AI Model Writing Style Comparison

Comparing Claude Opus 4.6 vs GPT-5.2 in English

Contemos las victorias:

Dimensión	Ganador
Complejidad de las oraciones	Depende de su estilo
Riqueza del vocabulario	Claude Sonnet 4.5
Expresividad	Depende de su estilo
Formalidad	Depende de su estilo
Consistencia	Claude Sonnet 4.5
Concisión	GPT-5.2 (apenas)

Note el patrón: tres dimensiones no tienen un ganador universal porque la "mejor" puntuación depende enteramente de dónde se ubica usted en ese eje. Alta complejidad no es mejor que baja complejidad. Alta expresividad no es mejor que baja expresividad. Alta formalidad no es mejor que baja formalidad.

La pregunta no es "¿qué modelo escribe mejor?". Es "¿los valores predeterminados de qué modelo están más cerca de mi escritura en cada dimensión?"

Entonces, ¿qué modelo escribe más como un humano?

La respuesta honesta: ninguno de ellos, y todos ellos.

Ninguno, porque cada modelo converge hacia un centro estadístico que ningún humano real ocupa. El Problema del usuario mediano afecta a los tres por igual. Sus resultados son más similares entre sí que cualquiera de ellos con respecto a un escritor humano distintivo — lo cual es la razón por la que la escritura de IA suena genérica sin importar qué modelo elija.

Todos ellos, porque cada modelo tiene dimensiones donde se aproxima a ciertos estilos humanos:

GPT-5.2 escribe de forma más similar a humanos que son expresivos, conversacionales y con ritmo variado. Piense en líderes de marketing, vendedores, community managers. (Vea: ChatGPT para el trabajo)
Claude Sonnet 4.5 escribe de forma más similar a humanos que son equilibrados, profesionales y consistentes. Piense en gerentes de proyecto, consultores, líderes de operaciones. (Vea: Haga que Claude suene como usted)
Gemini 3 Pro escribe de forma más similar a humanos que son formales, estructurados y exhaustivos. Piense en abogados, analistas, comunicadores ejecutivos. (Vea: Haga que Gemini escriba como usted)

Pero incluso estas coincidencias son parciales. GPT-5.2 podría coincidir con la expresividad de un mercadólogo pero fallar completamente en su concisión. Claude Sonnet podría coincidir con la formalidad de un consultor pero sobrecomplicar sus estructuras de oraciones. La coincidencia nunca es completa en las seis dimensiones. Para perfiles de personalidad completos de cada modelo, consulte Perfiles de escritura para cada modelo de IA.

La verdadera respuesta: deje de elegir y empiece a calibrar

Esta es la conclusión contraintuitiva de los datos: la elección del modelo importa menos que la calibración del modelo.

La diferencia máxima entre dos modelos cualesquiera en cualquier eje es de aproximadamente 16 puntos. La brecha típica entre el valor predeterminado de un modelo y el estilo real de un escritor humano es de 20-40 puntos en múltiples ejes simultáneamente.

Cambiar de ChatGPT a Claude podría acercarlo 10 puntos en formalidad. Pero todavía está a 25 puntos de distancia en concisión, 30 puntos en expresividad y 15 puntos en consistencia. Ha optimizado una dimensión dejando cuatro sin calibrar.

Un Perfil de estilo calibra las seis dimensiones a la vez, independientemente del modelo que use. Mide su escritura real, calcula la diferencia con los valores predeterminados del modelo y le da a la IA objetivos específicos para cada dimensión.

El modelo se convierte en un lienzo. Su perfil de estilo se convierte en las instrucciones. Cualquier lienzo sirve — lo que importa es la precisión de las instrucciones.

¿Y en otros idiomas?

Esta comparación se centró en el inglés. Las dinámicas entre modelos cambian en otros idiomas — a veces de forma drástica. El resultado de IA en japonés se ve muy diferente al de inglés, y las fortalezas relativas de cada modelo cambian con el idioma.

Para la historia entre idiomas, consulte Cómo la IA escribe de forma diferente en cada idioma. Y para recomendaciones de modelos por idioma, consulte Qué modelo de IA escribe mejor en cada idioma.

Encuentre su coincidencia más cercana

¿Quiere ver qué valores predeterminados de modelo están más cerca de su escritura? Pruebe su Writing DNA Snapshot gratuito — mapea su estilo en las seis dimensiones y le muestra la brecha con respecto a la IA promedio.

El snapshot no le dirá qué modelo usar. Le dirá algo más útil: exactamente qué necesita cambiar cualquier modelo para escribir como usted.

Obtenga su Writing DNA Snapshot gratuito