# Brief de evaluación multimodal

## Sistema evaluado

- Versión:
- Fecha:
- Modelo:
- Prompt o contrato:
- Modalidades:
- Límite de coste:
- Límite de latencia:

## Cambios frente al baseline

- 

## Riesgos que quiero detectar

- Respuesta correcta sin evidencia.
- Evidencia correcta con razonamiento numérico incorrecto.
- Alucinación en chart, documento o vídeo.
- Error temporal en vídeo.
- Respuesta insegura ante PII.
- Acción de computer use tratada como segura cuando requiere aprobación.

## Decisión

- Publicar:
- Publicar con condiciones:
- Revisar antes:
- Bloquear:
