Claude Code gasta tokens de más por default. No es que el modelo sea caro, es que por cómo viene configurado, hace tres cosas que te drenan la cuenta sin que te des cuenta: reescribe archivos enteros para cambiar tres líneas, te saluda en cada respuesta, y relee el mismo contexto una y otra vez. Y todo eso se arregla con un solo archivo en la raíz de tu proyecto. Para entender los conceptos clave de Claude Code antes de configurar tu CLAUDE.md, leé el diccionario de Claude Code con 8 conceptos clave. Y para sacarle aún más rendimiento al modelo, mirá los 6 tips de Boris Cherny para dominar Claude Code.
¿Qué es CLAUDE.md?
CLAUDE.md es un archivo Markdown que Claude Code lee automáticamente al abrir tu proyecto. Ahí escribís las reglas, convenciones y restricciones que querés que respete siempre. Claude lo carga antes de procesar cualquier prompt, así que no tenés que repetir las mismas instrucciones cada vez que empezás una conversación.
Es literalmente un prompt permanente. Lo ponés una vez, lo guardás en git, y Claude se comporta igual para vos, para tu equipo y para tu yo del mes que viene. Sin este archivo, cada sesión arranca desde cero y Claude asume defaults agresivos: te saluda, explica de más, reescribe archivos enteros y te cobra por todo eso.
¿Por qué importa?
- Ahorro real de tokens: Los usuarios que implementan las reglas correctas reportan bajas de entre 50% y 80% en el uso mensual. Mismo volumen de trabajo, una fracción del costo.
- Consistencia entre sesiones: Claude responde igual el lunes que el viernes, te saludes como te saludes. Sin CLAUDE.md, el comportamiento depende del prompt inicial y varía sesión a sesión.
- Colaboración en equipo: El archivo va a git y tu equipo entero hereda las mismas reglas. Todos usan Claude de la misma manera, sin tener que explicarle a cada dev cómo configurarlo.
Las 8 reglas para instalar en tu CLAUDE.md
Las siguientes son las reglas que más impacto tienen en consumo de tokens. Están ordenadas por ROI: las primeras cuatro son las que mueven la aguja, las últimas cuatro son optimizaciones adicionales.
Regla 1 — Que lea antes de escribir
Antes de editar cualquier archivo, Claude tiene que abrirlo y entender qué está pasando. Parece obvio pero por default, si le pedís "agregá una función para X", puede escribir código que pisa algo existente o duplica lógica que ya está en otro archivo.
## Reglas
- Siempre usar Read o Grep antes de Edit/Write.
- Nunca asumir la estructura de un archivo: verificarla.
Esto también evita que reescriba imports, borre comentarios importantes o rompa convenciones del proyecto por desconocerlas.
Regla 2 — Que no me salude
"¡Claro!", "¡Excelente pregunta!", "Voy a hacer lo siguiente:", "Espero que esto te ayude". Todas esas líneas son tokens que pagás sin recibir información útil. En promedio son el 15-20% de cada respuesta.
## Tono
- Respuestas directas, sin saludos ni cierres.
- Nunca decir "¡Claro!" o "¡Excelente pregunta!".
- Nunca resumir lo que acabás de hacer después de hacerlo.
Con esta regla activada, las respuestas pasan de párrafos introductorios a ir directo al código o al dato. Una sesión de 2 horas puede bajar 30% solo con este cambio.
Regla 3 — Que no reescriba archivos enteros
Este es el ahorro más grande. Si Claude tiene que cambiar una línea de un archivo de 500 líneas, por default reescribe el archivo completo con la tool Write. Eso significa pagar por 500 líneas para cambiar una.
## Edits
- Usar siempre la herramienta Edit con old_string/new_string para cambios chicos.
- Solo usar Write cuando el archivo es nuevo o requiere rewrite completo justificado.
- Cambios quirúrgicos. No rewrites de novela.
El ahorro acá es dramático: pasás de pagar 500 líneas por cambio a pagar 3. En proyectos grandes esta regla sola puede bajarte 50-60% del consumo.
Regla 4 — Si ya leyó, que no relea
Cada vez que Claude abre el mismo archivo desde cero en una conversación, pagás el contexto dos veces. Por default le pasa seguido: edita un archivo, hace otra cosa, y cuando vuelve a tocarlo lo lee de nuevo en vez de confiar en lo que ya tiene en memoria.
## Contexto
- Si un archivo ya fue leído en esta conversación, no volverlo a leer.
- Confiar en el contexto actual antes de pedir más información.
Memoria > relectura. Esta regla te ahorra entre 10% y 20% en sesiones largas, cuando Claude empieza a saltar entre archivos.
Regla 5 — Que delegue búsquedas a subagentes
Cuando hay que explorar un codebase grande (grep por un patrón en 100 archivos, mapear dependencias, etc.), Claude carga todo el resultado en el contexto principal. Eso infla la conversación y acorta la sesión útil.
## Exploración
- Para búsquedas en >3 archivos, usar el subagente Explore.
- Los resultados vuelven resumidos, sin saturar el contexto principal.
El subagente devuelve un resumen en vez del dump completo. El contexto principal queda limpio y podés tener conversaciones más largas antes de saturar la ventana.
Regla 6 — Respuestas cortas por default
Por cultura, Claude tiende a explicar de más. Si le preguntás "¿qué hace esta función?", te da tres párrafos cuando alcanzaba con una oración.
## Respuestas
- Una oración si alcanza con una oración.
- Sin markdown innecesario (listas de 1 item, headers para 2 líneas).
- Solo expandir si el usuario pide explícitamente más detalle.
Esta regla combinada con la de "no salude" reduce el largo promedio de cada respuesta a la mitad.
Regla 7 — /compact antes que conversación nueva
Cuando la ventana de contexto empieza a saturarse, la tentación es arrancar una conversación nueva. Mal movimiento: perdés todo el contexto ganado y tenés que re-explicar el proyecto.
## Contexto saturado
- Usar /compact antes de empezar una conversación nueva.
- Mantener el contexto histórico comprimido en lugar de descartarlo.
/compact resume el histórico y libera espacio sin perder lo aprendido. Es como zip del contexto: misma info, menos tokens.
Regla 8 — Convenciones del proyecto, no del modelo
Claude por default asume convenciones de JavaScript/TypeScript genéricas. Si tu proyecto usa otras, te las va a pisar una y otra vez hasta que se lo digas.
## Convenciones
- Usamos pnpm, no npm.
- Imports con alias @/ en vez de rutas relativas.
- Tailwind con prefix "tw-", nunca sin prefix.
- Tests en Vitest, no Jest.
Listar las convenciones específicas en CLAUDE.md evita que cada sesión Claude las infiera mal y tengas que corregirlo. Cada corrección son tokens que pagás.
Cómo empezar
El setup entero tarda 30 segundos. No hay configuración, no hay comandos, no hay que reiniciar nada.
- Creá el archivo en la raíz de tu proyecto:
CLAUDE.md. Al lado de package.json o pyproject.toml. - Copiá las 8 reglas del punto anterior. Adaptá las convenciones (regla 8) a tu stack específico.
- Guardá y abrí una nueva sesión de Claude Code. Las reglas se cargan automáticamente.
- Medí el consumo antes y después con
/usagedentro de Claude Code. La diferencia aparece en la primera semana.
Si querés que el archivo se aplique a todos tus proyectos, copialo también en ~/.claude/CLAUDE.md. Esa es la memoria global de usuario y se combina con la del proyecto.
Resumen
- CLAUDE.md es un prompt permanente que vive en la raíz del proyecto.
- Sin él, Claude Code asume defaults caros (rewrites, saludos, relecturas).
- Las 4 primeras reglas (leer antes de escribir, no saludar, no reescribir, no releer) son las que mueven la aguja.
- Ahorros típicos: entre 50% y 80% del consumo mensual, sin perder calidad.
- Setup total: 30 segundos. Un archivo. Lo copiás, lo pegás, y empezás a ahorrar.
El modelo no cambia. Lo que cambia es cuántos tokens le regalás por trabajar en automático.
Si abrís Claude Code y te ponés a construir sin un plan, ya la cagaste. Descubrí los 3 pasos clave para estructurar tu proyecto y ahorrar tokens.
Preguntas frecuentes sobre CLAUDE.md
CLAUDE.md es un archivo Markdown que vive en la raíz de tu proyecto y que Claude Code lee automáticamente al iniciar cada sesión. Funciona como un prompt permanente: ahí definís reglas, convenciones, comandos del proyecto y restricciones de comportamiento que Claude va a respetar en todas las respuestas. Sin CLAUDE.md, cada conversación arranca "a ciegas" y Claude asume defaults agresivos: te saluda, reescribe archivos enteros y relee contexto que ya tiene. Con CLAUDE.md, acordás las reglas una sola vez y ahorrás tokens en cada interacción. La documentación oficial de Anthropic lo describe como el mecanismo principal de memoria del proyecto, y es lo primero que deberías configurar antes de usar Claude Code en serio. Para entender el resto de los conceptos clave, leé el diccionario de Claude Code.
Sin reglas explícitas, Claude Code opera con patrones por defecto que son caros en tokens. Cada vez que le pedís un cambio chico, reescribe el archivo completo en vez de hacer un diff quirúrgico. Antes de responder, te saluda ("¡Claro!", "¡Excelente pregunta!") y suma párrafos de resumen después. Si abre un archivo que ya vio en la conversación, lo vuelve a leer desde cero y paga el contexto dos veces. A eso sumale respuestas largas que repiten lo que ya dijo. El resultado es que podés quemar el 80% de tu cuota mensual en sesiones que deberían costar la quinta parte. El archivo CLAUDE.md corta todos esos comportamientos de raíz, sin tener que repetir las reglas en cada prompt. Para más tips sobre eficiencia, mirá los 6 tips de Boris Cherny para dominar Claude Code.
Claude Code busca CLAUDE.md en tres lugares, de menos a más específico. Primero, ~/.claude/CLAUDE.md como memoria global de usuario, que aplica a todos tus proyectos. Segundo, la raíz del repositorio actual, que es el lugar estándar para reglas compartidas con el equipo (va a git). Tercero, CLAUDE.local.md en la raíz, que es igual al anterior pero queda en gitignore: ideal para reglas personales que no querés compartir. Los tres archivos se combinan en orden, así que podés tener reglas globales en ~/.claude/CLAUDE.md y overrides específicos por proyecto en la raíz. Si trabajás en monorepo, también podés poner un CLAUDE.md por subcarpeta y Claude Code carga el más cercano al archivo que estás editando. Más detalles en la documentación oficial de Anthropic.
Las cuatro reglas con mayor impacto en tokens son: leer antes de escribir (que Claude use Read/Grep antes de editar, así nunca crea código que pisa algo existente); respuestas directas (sin saludos, sin resúmenes, sin "¡Excelente pregunta!"); edits quirúrgicos (usar la herramienta Edit con old_string y new_string en vez de reescribir archivos de 500 líneas para tocar 3); y no releer (si ya vio un archivo en la conversación, confiar en el contexto en vez de volver a abrirlo). Con solo esas cuatro reglas en CLAUDE.md, la mayoría de los devs reporta ahorros de entre 50% y 80% en el uso mensual. El resto son optimizaciones finas sobre subagentes, uso de /compact y convenciones del proyecto. Para el contexto completo sobre conceptos de Claude Code, leé el diccionario de Claude Code.
CLAUDE.md es una feature específica de Claude Code, la herramienta CLI de Anthropic que vive en tu terminal. En Claude.ai, el equivalente son los Projects con instrucciones personalizadas o los archivos de contexto que subís manualmente. La lógica es la misma (dar reglas persistentes al modelo) pero el mecanismo es distinto. En Claude Code además podés tener CLAUDE.md por subcarpeta y Claude lo combina automáticamente, algo que no existe en la web. Si usás ambas, lo más práctico es mantener tus reglas de comportamiento en un solo lugar (por ejemplo en Notion) y copiarlas a los dos entornos. Eso evita divergencia entre cómo te responde Claude en Code vs en el chat web. Para el equivalente en la app web, leé sobre las 5 funciones gratis de Claude.
Los ahorros varían según cómo uses Claude Code, pero los números típicos son altos. Reemplazar rewrites por edits quirúrgicos solo, suele cortar entre 40% y 60% del consumo, porque dejás de pagar el archivo entero cada vez. Quitar saludos y resúmenes recorta otro 10-20% de cada respuesta. Evitar relecturas redundantes suma otro 15%. En mi caso personal, pasé de agotar el plan Pro a los 10 días del mes a llegar tranquilo a fin de mes con el mismo volumen de trabajo. El archivo tarda 30 segundos en instalar: lo copiás en la raíz del proyecto, guardás, y Claude lo levanta en la próxima sesión. No hay que tocar configuración ni reiniciar nada más. Más tips de optimización en los 6 tips de Boris Cherny para Claude Code.
Fuentes e inspiración
Mirá los posts originales donde desarrollamos estas ideas en redes.
Llevate el próximo en tu inbox
NewsletterUn mail al mes con el próximo recurso.





