supervisión y gobernanza de agentes · independiente del LLM

Q · Agent Board

El tablero Kanban para supervisar y gobernar agentes de IA en tiempo real. Ves qué hace cada agente y las acciones irreversibles se detienen en tu puerta hasta que tú apruebas — sin depender de que el modelo se porte bien.

▶ Ver el demo del tablero Cómo funciona ◆ Capital

Cero dependenciasPython stdlibAuditoría verificableOpen source · MIT

⚡ Sin presup.

Auditar deps

opus · frenado: presupuesto €

Working2/5⚡€1.4/€1.5

Mapear el repo

mistral-local · €0.00

Refactor cliente

gpt-4o · €1.40

Needs input

Eliminar recursos

esperando aprobación

Review

Verificar fix

opus

Done

Docs escritas

sonnet ✓

Hay una vía propia ⚡ Sin presupuesto: el agente caro (opus) cae ahí porque el presupuesto fundacional está al tope (⚡€1.4/€1.5) — se ve por qué está parado; el local entró sin coste. Vuelve a Working al liberarse la ventana.

01 · qué es

Una capa de control entre tus agentes y lo que pueden tocar

Q · Agent Board no orquesta agentes: los observa y los gobierna. Cada agente es una tarjeta en un tablero Kanban; cada acción con efectos —escribir, desplegar, borrar, llamar a una API— cruza una puerta que decide allow · ask · deny y, cuando toca, espera tu aprobación. Todo queda en una auditoría verificable.

para quién

Equipos que lanzan flotas de agentes

Workflows dinámicos con decenas de agentes en paralelo que necesitan visibilidad y frenos, no solo logs.

para quién

Plataformas con tools / MCP

Cualquier stack donde los agentes actúan a través de herramientas: la puerta vive en la tool, da igual el LLM.

para quién

Quien necesita rastro y coste bajo control

Auditoría tamper-evident y presupuestos en € que separan lo local (~gratis) de lo fundacional (caro).

02 · el problema

Lanzar muchos agentes es potente. Y opaco. Y peligroso.

Los workflows dinámicos disparan decenas de agentes en paralelo. Hacen mucho trabajo, pero no ves qué tocan, y una acción irreversible —borrar datos, desplegar, rotar claves— puede tirar producción.

El reflejo habitual es pedirle al modelo, en el prompt, que "tenga cuidado" o "pida permiso antes de borrar". Eso es una convención: el modelo puede saltársela, equivocarse o ser manipulado por inyección de prompt. No es control.

03 · el enfoque

Controla donde el agente actúa, no donde piensa

El control no se pone en el cerebro del agente (el LLM, infinito e imprevisible), sino en la herramienta por la que pasa toda acción con efectos. Si la puerta vive dentro de la tool, el efecto es físicamente inalcanzable sin cruzarla — da igual qué modelo la haya invocado.

No intentes certificar a cada conductor. Pon un control en el peaje de la única carretera que lleva a las operaciones peligrosas. Quien quiera actuar, cruza el peaje.

04 · cómo funciona

De la intención del agente al efecto real

Toda acción con efectos recorre cuatro pasos deterministas antes de tocar nada. Solo lo marcado ask te interrumpe; el resto fluye o se bloquea sin molestarte.

RBAC

¿Este rol puede siquiera intentarlo?

→

Política

Reglas deterministas: allow · ask · deny.

→

Tablero

Solo lo marcado ask espera tu visto bueno.

→

Auditoría

Cadena verificable: cada decisión queda registrada con su origen.

allow → ejecuta ask → espera al humano deny → nunca

Ver el recorrido de adopción paso a paso →

05 · pruébalo

El mismo tablero, tres modos

Todo es HTML autónomo: el demo simulado se abre solo en el navegador, sin instalar nada.

▶ demo simulado	Demo simulado. Agentes ficticios que avanzan por las columnas. Sin backend — ideal para enseñarlo.
`?feed=/api/state`	En vivo contra el broker. Aprobaciones reales (doble vía). Requiere `python3 hooks/broker.py`.
`?feed=board-state.json`	Observabilidad offline (solo lectura) desde el estado que escriben los hooks.
▶ demo · Claude Science	Perfiles y unidades. El tablero se adapta a los agentes concretos de tu proyecto y se reparte por departamentos: este abre Claude Science (Analista de Genómica, Motor Biofísico, Diseñador de mRNA…). Cada unidad ve lo suyo con `?profile=claude-science&unit=Terapéutica`. Fuente de verdad: `config.json`.
◆ tablero de capital	Segunda vista, mismo sustrato. Lee la auditoría, el coste y las aprobaciones como capital que se acumula (concepto Capital de Tokens): juicio humano capturado, datos para evals y el moat. Un sistema, dos lentes.

06 · qué lo compone

Los cuatro pilares

Tablero Kanban de agentes

Cada agente es una tarjeta que avanza por columnas. Ves en vivo qué hace, su coste y tiempo, y los resultados. WIP multidimensional medido en coste: el límite de Working es nº de agentes, € total y € en modelos fundacionales — un token local es ~gratis, uno de Opus/GPT-4o no.

Aprobación de doble vía

Las operaciones con efectos se paran y esperan tu Aprobar/Denegar. Aprobar exige un token de operador: un agente no puede auto-aprobarse.

Puerta determinista por política

La decisión la toman reglas en código (policy.json): allow / ask / deny por tool y dominio. Reproducible y auditada — no negociable por el modelo.

Roles multi-modelo

Un LLM distinto por rol: explorer, auditor, implementer, verifier, documenter. El verifier de otra familia mata el sesgo de autoaprobación.

07 · por qué puedes fiarte

Independiente del LLM, y consciente de sus límites

Como la puerta está en la tool (vía MCP) y no en el cliente, el mismo control sirve para cualquier agente — los de hoy y los que salgan mañana. Cada uno se enchufa por su superficie:

Claude Code · plugin nativo

ChatGPT · MCP

Antigravity · MCP

Grok · orquestador

LLM locales · orquestador

Determinista: misma tool + mismos argumentos → siempre la misma decisión. La toma el código, no el modelo.
Auditable: cadena con hash encadenado, verificable (audit.py verify); cada decisión, por regla o humana, ligada al hash del payload.
Con límites de recurso y coste: cuotas agregadas por ventana (cierran el troceo) y presupuestos en € que distinguen modelos locales (~gratis) de fundacionales (caros).
Fail-closed: sin aprobación, no se ejecuta. El sistema no se relaja cuando algo falla.
Con un modelo de amenazas que enumera por dónde podría colarse una acción y cómo cerrarlo — incluido lo que aún no cubre.

La puerta gobierna las acciones que pasan por la tool, no lo que el modelo dice o razona. Documentar el límite es parte de cerrarlo bien: evita la falsa sensación de seguridad.