NewsTuesday, June 30, 20264 min read

Por qué tu IA empeora cuanto más la usas en serie

Un profesor descubrió por qué su IA empeora al corregir examen tras examen en el mismo chat. No es el prompt: es el orden con que la usas.

Por qué tu IA empeora: un embudo limpio y otro atascado de hojas

Quizá te ha pasado: empiezas a usar ChatGPT para una tarea repetitiva, las primeras respuestas son buenas, y hacia la décima algo se tuerce. Las respuestas pierden filo. La pregunta que casi nadie se hace es por qué tu IA empeora justo cuando más la estás usando. La respuesta corta: no es que la herramienta se gaste. Es el orden con que la usas.

David Roca es profesor de inglés en España y escribe sobre cómo meter la IA en el aula sin que el aula se note rara. Le tocaba corregir "writings", redacciones de nivel B1, una pila de ellas. Su método era el más obvio del mundo: abría un chat de ChatGPT y pegaba un examen, luego otro, luego otro, todos en la misma conversación.

El día que sintió que la IA "se había cansado"

Al principio el feedback era afinado. Después empezó a aflojar. Los comentarios entre alumnos se parecían demasiado, como si todos hubieran cometido el mismo error. Se colaban criterios de correcciones anteriores. El primer examen y el último ya no se evaluaban igual. Roca lo describe con una frase que cualquiera entendería: parecía que "la IA se había cansado".

No se había cansado. Las máquinas no se cansan. Lo que pasó es más simple y más incómodo: el chat se había llenado de basura. Cada examen que pegaba seguía ahí, presente, influyendo en cómo la IA leía el siguiente. Roca le puso nombre: context rot, la pudredumbre del contexto. La ventana de la conversación se va ensuciando con todo lo anterior, y ese ruido empieza a mandar más que tu instrucción.

Por qué tu IA empeora aunque el prompt sea perfecto

Aquí está el giro que casi nadie ve. Puedes tener el prompt mejor escrito del planeta. Si lo metes en una conversación contaminada, da igual.

Roca hace una distinción que vale oro. Una corrección consistente aplica el mismo criterio a los 30 exámenes. Una corrección contaminada deja que la respuesta del alumno anterior cambie cómo se lee la del siguiente. Por fuera se parecen. Por dentro, una es justa y la otra es un teléfono descompuesto donde el examen número 18 arrastra ecos del 3, del 7 y del 11.

La gente intenta arreglar esto reescribiendo el prompt. Le añaden frases, lo pulen, le ruegan a la máquina que sea coherente. Y el problema nunca estuvo en el prompt. Estuvo en el flujo.

La solución no fue un prompt mejor, fue cambiar el orden

Roca no buscó las palabras mágicas. Cambió la mecánica. Separó dos cosas que estaban revueltas: lo que no cambia nunca y lo que cambia en cada caso.

Los criterios permanentes (la rúbrica, el nivel B1, qué se evalúa) los metió en un espacio estable: un "Proyecto" de ChatGPT o de Claude, un "Gem" de Gemini. Eso vive ahí, fijo, y no se ensucia. Después, para cada alumno, abre un chat limpio, pega solo su texto, revisa la propuesta de corrección antes de entregarla, y cierra ese chat. Siguiente alumno, chat nuevo. Su lema cabe en una línea: "Misma rúbrica, mismo criterio, contexto limpio".

El resultado no es que corrija más despacio con más cuidado. Es lo contrario. Como él lo dice, el objetivo es poder dar mejor feedback y más rápido. La rúbrica deja de repetirse a mano, cada examen entra virgen, y la calidad deja de depender de cuántos llevas corregidos. Puedes leer la guía original de David Roca con el paso a paso.

Esto no va de profesores

Cambia "examen" por lo que tú haces. Revisar 20 currículums para una vacante. Mirar 30 contratos parecidos. Despachar los tickets de soporte del día. Cuadrar las facturas del mes. Si los amontonas en una sola conversación, la calidad cae sin avisar y tú lo notas tarde, cuando ya entregaste el currículum número 19 con el sesgo del número 4 pegado encima.

El patrón es siempre el mismo. Lo fijo va a un sitio fijo. Lo variable entra en un espacio limpio, se revisa, se cierra. Es la misma lógica de quien deja de improvisar y se arma una manera de trabajar que aguanta volumen, como el arquitecto que se construyó el sistema de su estudio. Y es también la razón por la que el trabajo de filtrar y revisar no se evapora con la IA, solo cambia de forma, como pasa con el peldaño junior que cambia de forma, no desaparece.

Lo que puedes hacer hoy

Antes de tu próxima tanda de tareas repetidas con IA, párate 30 segundos y separa. Pregúntate qué es lo que se repite igual en todos los casos: eso va a un Proyecto o un Gem, escrito una sola vez. Y qué cambia en cada caso: eso entra en un chat nuevo, solo, y se cierra al terminar.

No necesitas una herramienta nueva ni un prompt de 400 palabras. Necesitas dejar de mezclar. Un chat sucio te devuelve trabajo sucio, y lo peor es que ni te das cuenta hasta que revisas con calma.

iaproductividadmetodoeducacion

Every Tuesday I break down a real operating decision, with the full reasoning. Read it if you run your own practice. Subscribe to Exoesqueleto Cerebral.

El día que sintió que la IA "se había cansado"

Por qué tu IA empeora aunque el prompt sea perfecto

Aquí está el giro que casi nadie ve. Puedes tener el prompt mejor escrito del planeta. Si lo metes en una conversación contaminada, da igual.

La gente intenta arreglar esto reescribiendo el prompt. Le añaden frases, lo pulen, le ruegan a la máquina que sea coherente. Y el problema nunca estuvo en el prompt. Estuvo en el flujo.

La solución no fue un prompt mejor, fue cambiar el orden

Roca no buscó las palabras mágicas. Cambió la mecánica. Separó dos cosas que estaban revueltas: lo que no cambia nunca y lo que cambia en cada caso.

Esto no va de profesores

Lo que puedes hacer hoy

No necesitas una herramienta nueva ni un prompt de 400 palabras. Necesitas dejar de mezclar. Un chat sucio te devuelve trabajo sucio, y lo peor es que ni te das cuenta hasta que revisas con calma.