Hace apenas unos meses, quince directivos de una gran consultora se reunían en secreto para hablar de un problema que nadie quería airear: la factura de inteligencia artificial se les había ido de las manos. No por grandes proyectos de ingeniería, sino porque empleados sin perfil técnico convertían documentos en diapositivas sin saber que cada clic tenía un precio. Marc Vidal revela en su último análisis cómo la cultura del derroche en tokens —las unidades de texto que procesan los modelos de IA— pasó de ser un orgullo corporativo a una pesadilla de costes que está obligando a Silicon Valley a replanteárselo todo.
La fiebre del ‘token maxing’ y sus insignias corporativas
En un primer momento, gastar sin medida era motivo de prestigio. En Meta, un empleado creó un ranking interno bautizado ‘Cloud Dominics’ que medía el consumo de más de 85.000 trabajadores y premiaba a los 250 más pródigos con insignias de bronce, plata o esmeralda, e incluso títulos como ‘Token Legend. En solo 30 días la plantilla de Meta consumió 60,2 billones de tokens, una cifra que al precio público de la competencia hubiese costado unos 900 millones de dólares, según los datos que maneja el analista. En Databricks, su consejero delegado aplaudía a un ingeniero que quemó más de 7.000 dólares en dos semanas; en Salesforce, un widget mostraba un ranking con un emoji señalando a quien no había alcanzado su insignia.
La competición era tan absurda que, según Vidal, empleados de Amazon pedían a sus agentes de IA que hicieran tareas inútiles solo para inflar su puntuación en los marcadores. El objetivo se había convertido en la competición, no en el resultado.
El espejismo de la tarifa plana: cuando la factura apareció
El verdadero detonante de este cambio no fue un ataque de cordura, sino una simple modificación en la forma de cobrar. GitHub (propiedad de Microsoft) abandonó la tarifa plana de su herramienta Copilot el pasado 1 de junio y empezó a facturar por consumo real de tokens. Algunos modelos se encarecieron hasta 60 veces respecto a otros. Los recibos pasaron, de la noche a la mañana, de 29 a 750 dólares o de 50 a 3.000. Microsoft reaccionó retirando las licencias internas a buena parte de su plantilla y forzando la migración a su propia herramienta antes de que terminara el mes.
Uber vivió en sus propias carnes la misma lección. Había fijado un presupuesto anual para herramientas de IA como Cloud y Cursor que agotó entero en los primeros cuatro meses. Su director de tecnología, que en enero animaba a usarlas sin límites, en mayo firmaba un correo imponiendo un tope de 1.500 dólares mensuales por ingeniero. El viejo mecanismo que John Kenneth Galbraith describió —en toda euforia financiera el precio no importa hasta que un día el precio es lo único que importa— se repetía ahora con los tokens.
El problema nunca fue el token barato, fue confundir gasto con impacto.
— Marc Vidal
De cabernícolas y métricas útiles: el giro hacia la eficiencia
La respuesta de la industria a este susto ha sido a veces tragicómica. Varias grandes tecnológicas han empezado a utilizar una pequeña herramienta llamada Keberman que convierte las respuestas normalmente educadas y larguísimas de la IA en frases telegráficas de cavernícola, recortando entre un 65% y un 75% de los tokens por respuesta. Un ingeniero senior de OpenAI ha contribuido con código al proyecto. «La misma industria que vendió durante año y medio una máquina capaz de conversar como una persona, ahora paga para que conteste como un cavernícola», ironiza Vidal.
Mientras, algunas empresas empiezan a medir lo que importa. Salesforce adoptó una métrica interna llamada Agic Work Unit, pensada para valorar tareas completadas en vez de palabras generadas y que, según el analista, resulta algo más lógica. La consigna que se extiende por Silicon Valley, en palabras del CEO de HP Sport, es simple: «Mejor maximizar resultados que maximizar tokens».
La automatización mediocre y la trampa del gasto fácil
Vidal recuerda la distinción del economista Daron Acemoglu entre la automatización que aumenta la productividad y la «automatización mediocre»: aquella que solo sustituye una forma de trabajar por otra más cara sin ganar eficiencia. Convertir un PDF en diapositivas con un modelo entrenado para razonar problemas complejos caería, precisamente, en el segundo grupo. Lo mismo que ejecutar tareas inútiles para ascender en un ranking interno.
Las cifras de fondo ayudan a dimensionar la crisis. Mantener ChatGPT en marcha le costaba a OpenAI unos 700.000 dólares al día en 2023; a principios de este año esa factura anual rondará los 17 millones de dólares según estimaciones que maneja el analista, una cifra mareante. Y la consultora Reynolds Brick and Views proyecta que el gasto conjunto en software e infraestructura de IA llegará a los 680.000 millones de dólares en 2027. Para tapar ese agujero, los proveedores suben precios y emergen alternativas baratas como DeepSeek, la herramienta china que se ha colado entre las más contratadas en plataformas corporativas por su precio de derribo.
Lo que la tokenomics revela sobre nosotros mismos
Pero el análisis de Marc Vidal va más allá de las anécdotas. «El ranking de Meta no fabricó empleados que confunden actividad con resultado —apunta—, simplemente mostró a quienes ya lo hacían». Lo mismo que la tarifa plana no creó directivos que dejaran de vigilar el gasto, los evidenció. La IA no ha corrompido nada esencial, dice, sino que ha sido un espejo de hábitos antiguos: llevamos décadas entrenándonos en sistemas que premian parecer productivo en lugar de serlo.
Para el creador del canal, la lección es triple: medir resultados, no actividad; tratar cualquier recurso caro con intención; y aceptar que la ventaja competitiva en la próxima década no será de quien más tokens queme, sino de quién mejor sepa qué preguntar y cuándo parar.
La pregunta final que Vidal lanza a los directivos —y en breve, a cualquier usuario— es tan incómoda como necesaria: «Si esto empezar a costarle a otros y a ti lo que cuesta de verdad, ¿lo seguirías usando igualmente?».
Puedes ver el análisis completo de Marc Vidal en el vídeo a continuación:





