Mi metodologia para usar Agentes de IA (sin ser desarrollador)

No soy desarrollador, ni pretendo serlo. Tampoco soy "vibecoder". Hago lo mismo que hacia antes: tengo una idea, busco quien la implemente. Solo que ahora puedo probar ideas que antes no podia porque requerian una inversion que no me podia permitir, para un resultado economicamente incierto.

Este articulo explica como uso agentes de IA para operar una plataforma SaaS en produccion, con clientes reales y cero empleados de ingenieria.

1. Automatizacion primero, IA donde sea necesario

Este es el principio mas importante y el error mas comun que veo.

La gente esta metiendo IA en todo. Y por lo menos el 90% de las tareas se resuelve con scripts. Menos gasto, mas consistencia, mas velocidad.

Tu meta no es usar un agente para hacer las tareas. Tu meta es usar agentes para que automatice las tareas, y solo incluir IA donde sea necesario.

La diferencia es sutil pero critica:

Hacer la tarea = el agente ejecuta todo el proceso por ti, cada vez. Consume tokens, es lento, y puede fallar de formas diferentes cada vez.
Automatizar la tarea = el agente crea los scripts, timers y configuraciones una vez. Despues eso corre solo, sin IA, sin tokens, sin variabilidad.

En mi caso, tengo 12 timers automaticos corriendo en mi servidor: backups, recordatorios a clientes, monitoreo de emails, sincronizacion de datos, limpieza de sesiones. Ninguno usa IA. Son scripts de Python y Bash que un agente me ayudo a crear, pero que corren solos.

La IA solo entra en los puntos del proceso donde se requiere un criterio mas que una decision predeterminada. Por ejemplo: generar copy para un post, decidir si una consulta del chatbot necesita escalar a un humano, o analizar si una herramienta nueva le conviene a mi stack. Para todo lo demas: scripts.

Ejemplo real

Yo usaba n8n hasta que comence a usar Claude Code. Le pedi ayuda con una autorizacion y su respuesta fue que era mas eficiente un script. Lo probe: fue mas eficiente. Yo no tuve que hacer nada y tomo 5 minutos. Algo que antes me habia tomado 8 horas de trabajo con otras herramientas y yo en el loop.

Despues use Codex (otro agente) para auditar el resultado, y su respuesta fue que era "una solucion elegante y robusta".

2. El agente es un empleado nuevo, no un dios

Es lo mismo que si contratas a un desarrollador por primera vez: no le das autorizacion y acceso a todo sin confiar.

Mi framework mental:

Claude Code (Opus) = el ingeniero senior. Arquitectura, backend, decisiones criticas, emergencias.
Codex CLI = el diseñador/asistente. UI, CSS, contenido, tareas operativas delegadas.
Claude headless = el QA automatico. Revisa lo que hizo Codex, aprueba o rechaza.

Cada agente tiene permisos diferentes. Codex, por ejemplo, tiene prohibido tocar archivos .env, migraciones de base de datos, scripts de deploy, Docker, o systemd. Si necesita algo de eso, debe detenerse y dejarlo documentado. Exactamente como harias con un freelancer nuevo.

3. El proceso: planificar, entender, ejecutar

Cuando necesito implementar algo, sigo estos pasos:

Paso 1: Pide un plan

No le digas "hazlo". Dile: "hazme un plan considerando los aspectos de seguridad".

El agente te va a generar un plan detallado con pasos, riesgos, y consideraciones. Muchas veces, va a generar automaticamente un subagente de seguridad que revisa el plan antes de ejecutarlo.

Paso 2: Lee el plan

Lee. Investiga las dudas que tengas. Esto te sirve para aprender. No tienes que saber hacerlo, pero tienes que entenderlo y saber los riesgos e implicaciones.

Si no entiendes un comando, preguntale que hace. Si no entiendes la respuesta, buscalo en YouTube. Toma cursos de fundamentos — no para ser ingeniero, sino para tener las bases. Platzi, YouTube, lo que sea.

Paso 3: Define el entorno

Dile que lo vas a ejecutar en un entorno seguro y que considere una posterior migracion a produccion. Esto hace que el agente sea mas cuidadoso y genere codigo mas portable.

Paso 4: Ejecuta con permiso humano

Dale autorizacion para ejecutar, pero con aprobacion humana en cada paso. Siempre quedate viendo que este haciendo lo que debe, y no des permisos hasta que no entiendas lo que esta haciendo.

4. Politica de seguridad para agentes

Si tienes miedo de que un agente pueda destruir algo, define una politica basica:

Ningun agente puede ejecutar comandos destructivos o irreversibles. En caso de ser necesario, se lo debe pedir a un humano.
Nada se borra, se guarda y se registra. Toda accion queda en logs.
Todas las decisiones se toman evaluando los aspectos de seguridad. El agente debe considerar seguridad en cada paso.
Snapshot automatico antes de cada cambio peligroso. Un git tag que te permite volver atras.

En mi caso, estas reglas estan escritas en archivos de configuracion que los agentes leen automaticamente al iniciar cada sesion. No dependen de que yo me acuerde de decirlo.

El boton del panico

Le dije a mi agente que tenia miedo de perder todo, que hiciera un plan. Me creo un boton del panico: un solo comando que detecta automaticamente que proyecto tiene el cambio mas reciente, lo revierte con un commit inverso (no destructivo), y si es la plataforma principal, la redespliega automaticamente.

Ademas me creo:

estado — salud del servidor en español
que-paso — que cambio desde la ultima vez
que-sigue — pendientes y recomendaciones
snapshot — foto manual antes de algo riesgoso

Todo funciona sin IA. Son scripts de Bash que cualquiera puede ejecutar. Si Claude Code falla, el boton del panico sigue funcionando.

5. Respaldos: la red de seguridad no negociable

Hagan respaldo. Diganle a su agente que tienen miedo de perder todo, que haga un plan. El les va a crear un plan acorde a su stack.

En mi caso tengo tres capas:

Backups automaticos a la nube (OneDrive, 9am todos los dias, 7 dias de retencion)
Backups locales (tar.gz, 14 dias de retencion)
Snapshots de git (tags automaticos antes de cada cambio de agente)

Si todo falla, puedo volver a cualquier punto de los ultimos 14 dias.

6. Skills: la pieza que lo hace eficiente

Un skill suena rimbombante, pero solo es un prompt que explica el proceso, sus herramientas, y como y cuando activarlas. El agente no hace casi nada y reduce el consumo de tokens.

Tengo 13 skills definidos para operaciones recurrentes: deploy, publicar sitio web, clonar un sitio existente, configurar dominio, crear modulo nuevo, migrar base de datos, diagnosticar el servidor, auditar mobile, y mas.

Cuando digo /deploy, el agente no "piensa" que hacer. Lee las instrucciones del skill, ejecuta los pasos definidos, y solo usa IA si algo sale mal y necesita criterio. Es la diferencia entre un agente que improvisa cada vez (caro, lento, impredecible) y uno que sigue un proceso probado (barato, rapido, consistente).

7. El laboratorio: evaluar antes de implementar

Tengo un espacio en mi servidor que se llama "laboratorio". Todo lo que los gurus comparten — herramientas, frameworks, tecnicas — yo se lo paso a Claude Code y le pregunto si nos puede servir para nuestros objetivos.

Esta configurado para:

Analizar la capacidad disponible del servidor
Evaluar que no afecte nada clave en produccion
Revisar todos los aspectos de seguridad
Y en caso de que tengamos buenas razones para implementarlo, hacer un plan de despliegue

Asi he sacado muchas de las cosas que mas me han acelerado. No implemento nada porque un guru lo recomendo. Lo implemento porque mi agente evaluo que tiene sentido en mi contexto.

Sobre recomendaciones de otros

No les pido recomendacion a los expertos. Leo sus experiencias y las evaluo en mi contexto. Cuando alguien de nivel avanzado recomienda herramientas "esotericas", es porque ellos ya estan en otro nivel y lo esoterico es lo que les resuelve.

Mi regla: el que no sabe, que no intente crear la rueda. Usa las herramientas mas populares, que suelen tener una comunidad mas grande, mas informacion disponible, y los agentes las conocen bien. Ya despues que tengas confianza y leas a los profesionales hablando de su experiencia con otras tecnologias, la investigas, la pruebas, y si te conviene, cambias.

8. Ejemplo practico: conectar una API de Meta

Alguien me pregunto como conectar algo con Meta sin saber programar. Mi respuesta:

Dile a Code que te haga un plan con lo que quieres.
Despues dile que te genere las instrucciones para configurar del lado de Meta.
Ve con esas instrucciones a la extension de Claude para Chrome y dile que lo haga.
Te va a decir que no puede porque requiere autorizacion humana. Dile que estaras en la sesion y que te avise cuando lo necesite.
Si tienes miedo de que vea tus APIs y contraseñas, abre una pestaña separada y trabaja en paralelo.

Siempre quedate viendo. No des permisos hasta que entiendas.

9. El resumen: mis reglas de oro

Automatiza primero, IA solo donde haga falta. El 90% son scripts.
Trata al agente como un empleado nuevo. Permisos graduales, revision constante.
Siempre pide un plan antes de ejecutar. Lee el plan. Investiga lo que no entiendas.
Define una politica de seguridad. Escrita, no verbal. Que el agente la lea automaticamente.
Haz respaldos fuera del entorno. Multiples capas. Automaticos.
Usa skills para tareas recurrentes. No dejes que el agente improvise lo que ya sabes como se hace.
Ten un laboratorio. No implementes en produccion lo que no has probado.
Lee, investiga, aprende los fundamentos. No tienes que saber hacerlo, pero tienes que entender lo que esta pasando.
Cada quien la usa segun su realidad. Por eso cada quien tiene resultados diferentes. No copies metodologias; adapta principios.

Disclaimer: esta explicacion no pretende ser tecnica. Es mi experiencia operando un SaaS real con agentes de IA, sin ser ingeniero.