El tablero Kanban para supervisar y gobernar agentes de IA en tiempo real. Ves qué hace cada agente y las acciones irreversibles se detienen en tu puerta hasta que tú apruebas — sin depender de que el modelo se porte bien.
Hay una vía propia ⚡ Sin presupuesto: el agente caro (opus) cae ahí porque el presupuesto fundacional está al tope (⚡€1.4/€1.5) — se ve por qué está parado; el local entró sin coste. Vuelve a Working al liberarse la ventana.
Q · Agent Board no orquesta agentes: los observa y los gobierna. Cada agente es una tarjeta en un tablero Kanban; cada acción con efectos —escribir, desplegar, borrar, llamar a una API— cruza una puerta que decide allow · ask · deny y, cuando toca, espera tu aprobación. Todo queda en una auditoría verificable.
Workflows dinámicos con decenas de agentes en paralelo que necesitan visibilidad y frenos, no solo logs.
Cualquier stack donde los agentes actúan a través de herramientas: la puerta vive en la tool, da igual el LLM.
Auditoría tamper-evident y presupuestos en € que separan lo local (~gratis) de lo fundacional (caro).
Los workflows dinámicos disparan decenas de agentes en paralelo. Hacen mucho trabajo, pero no ves qué tocan, y una acción irreversible —borrar datos, desplegar, rotar claves— puede tirar producción.
El reflejo habitual es pedirle al modelo, en el prompt, que "tenga cuidado" o "pida permiso antes de borrar". Eso es una convención: el modelo puede saltársela, equivocarse o ser manipulado por inyección de prompt. No es control.
El control no se pone en el cerebro del agente (el LLM, infinito e imprevisible), sino en la herramienta por la que pasa toda acción con efectos. Si la puerta vive dentro de la tool, el efecto es físicamente inalcanzable sin cruzarla — da igual qué modelo la haya invocado.
No intentes certificar a cada conductor. Pon un control en el peaje de la única carretera que lleva a las operaciones peligrosas. Quien quiera actuar, cruza el peaje.
Toda acción con efectos recorre cuatro pasos deterministas antes de tocar nada. Solo lo marcado ask
te interrumpe; el resto fluye o se bloquea sin molestarte.
¿Este rol puede siquiera intentarlo?
Reglas deterministas: allow · ask · deny.
Solo lo marcado ask espera tu visto bueno.
Cadena verificable: cada decisión queda registrada con su origen.
Todo es HTML autónomo: el demo simulado se abre solo en el navegador, sin instalar nada.
| ▶ demo simulado | Demo simulado. Agentes ficticios que avanzan por las columnas. Sin backend — ideal para enseñarlo. |
?feed=/api/state |
En vivo contra el broker. Aprobaciones reales (doble vía). Requiere python3 hooks/broker.py. |
?feed=board-state.json |
Observabilidad offline (solo lectura) desde el estado que escriben los hooks. |
| ▶ demo · Claude Science | Perfiles y unidades. El tablero se adapta a los agentes concretos de tu proyecto y se reparte por departamentos: este abre Claude Science (Analista de Genómica, Motor Biofísico, Diseñador de mRNA…). Cada unidad ve lo suyo con ?profile=claude-science&unit=Terapéutica. Fuente de verdad: config.json. |
| ◆ tablero de capital | Segunda vista, mismo sustrato. Lee la auditoría, el coste y las aprobaciones como capital que se acumula (concepto Capital de Tokens): juicio humano capturado, datos para evals y el moat. Un sistema, dos lentes. |
Cada agente es una tarjeta que avanza por columnas. Ves en vivo qué hace, su coste y tiempo, y los resultados. WIP multidimensional medido en coste: el límite de Working es nº de agentes, € total y € en modelos fundacionales — un token local es ~gratis, uno de Opus/GPT-4o no.
Las operaciones con efectos se paran y esperan tu Aprobar/Denegar. Aprobar exige un token de operador: un agente no puede auto-aprobarse.
La decisión la toman reglas en código (policy.json): allow / ask / deny por tool y dominio. Reproducible y auditada — no negociable por el modelo.
Un LLM distinto por rol: explorer, auditor, implementer, verifier, documenter. El verifier de otra familia mata el sesgo de autoaprobación.
Como la puerta está en la tool (vía MCP) y no en el cliente, el mismo control sirve para cualquier agente — los de hoy y los que salgan mañana. Cada uno se enchufa por su superficie:
audit.py verify); cada decisión, por regla o humana, ligada al hash del payload.La puerta gobierna las acciones que pasan por la tool, no lo que el modelo dice o razona. Documentar el límite es parte de cerrarlo bien: evita la falsa sensación de seguridad.