1. ¿Qué mide la Diferencia de Paridad Demográfica (DPD)?

A La diferencia en la precisión del modelo entre grupos B La diferencia en la tasa de predicciones positivas entre grupos protegidos C La diferencia en el tiempo de entrenamiento

2. ¿Qué biblioteca de Python proporciona MetricFrame para métricas de equidad por grupo? 2 pts

A scikit-learn B Fairlearn (Microsoft) C TensorFlow

3. ¿Por qué no pueden cumplirse simultáneamente la Paridad Demográfica y las Probabilidades Igualadas?

A Porque necesitan varias bibliotecas B Teorema de imposibilidad: excepto cuando las tasas base son iguales, se excluyen mutuamente C Porque Equalized Odds necesita más datos

4. ¿Qué calcula SHAP para una única predicción?

A La precisión total del modelo B La contribución de cada característica a la predicción concreta (Valores de Shapley) C La importancia de las características en todo el conjunto de datos

5. ¿Cuándo es LIME mejor que SHAP?

A En modelos de árboles — LIME es más rápido para Random Forests B Cuando se necesita un procedimiento de explicación local, agnóstico al modelo C En grandes conjuntos de datos — LIME escala mejor

6. Una Model Card contiene para un modelo de crédito de alto riesgo: Las métricas de equidad muestran DPD=0.07. ¿Qué significa esto? 2 pts

A El modelo es conforme — 0.07 está por debajo de 0.1 B Revisión requerida — 0.07 supera el umbral recomendado de 0.05 C El modelo debe ser apagado inmediatamente.

7. ¿Qué se registra según el EU AI Act Art. 12 — y qué NO se registra?

A Todos los datos brutos, incluidas las PII, para una trazabilidad completa. B Hash de entrada (sin PII), Predicción, Decisión, Versión del modelo, Marca de tiempo C Solo la decisión final sin detalles

8. ¿Qué herramienta se utiliza para la detección de desviaciones de datos en el entorno de producción?

A Pandas B Evidentemente C LIME

9. ¿Qué rastrea MLflow en el contexto de la gobernanza de la IA?

A Solo la precisión del modelo B Parámetros del experimento, métricas (incl. equidad), artefactos — rastro de auditoría completo C Solo configuraciones de implementación

10. ¿Qué establece el Anexo IV del EU AI Act (Documentación Técnica) para sistemas de alto riesgo? 2 pts

A Solo una breve descripción del tipo de modelo B 8 Secciones obligatorias: Propósito, Proceso de desarrollo, Monitoreo, Precisión, Equidad, Declaración de conformidad, entre otros. C Una certificación por un auditor acreditado

11. ¿Con qué frecuencia debe actualizarse la Documentación Técnica según el Art. 11?

A Anualmente B Con cada cambio significativo del sistema C Solo en la primera versión

12. Un modelo de crédito muestra para solicitantes < 25 años una TPR de 0.68 frente a 0.91 en general. ¿Cuál es la reacción correcta?

A Aceptable: los solicitantes jóvenes a menudo tienen menos historial crediticio. B Modelo retirado del scoring, análisis de causa raíz, mitigación de sesgo antes del re-despliegue C Umbral para este grupo ajustar

13. ¿Cuál es la diferencia entre SHAP para modelos de ML clásicos y LLMs?

A SHAP funciona en LLMs de la misma manera que en modelos de árbol. B En los LLMs, los pesos de atención proporcionan explicaciones limitadas — SHAP es laborioso y menos confiable. C LLMs no necesitan explicabilidad ya que generan texto

14. ¿Qué métrica de RAGAS mide si una respuesta RAG está respaldada por los documentos recuperados?

A relevancia_de_la_respuesta B context_precision C fidelidad

15. ¿Qué ofrece la Microsoft Responsible AI Toolbox además de Fairlearn?

A Solo una mejor interfaz de usuario para las métricas de Fairlearn B Análisis de errores, inferencia causal, escenarios hipotéticos y contrafactuales en un panel de control C Monitoreo de Producción y Alertas

16. ¿Cuál es la mejor herramienta para la detección de desviaciones en producción?

A SHAP B Evidentemente AI C IBM watsonx.governance

17. Un agente tiene: acceso a CRM (PII), búsqueda web (no confiable), envío de correos electrónicos. ¿Cuál es el riesgo? 2 pts

A Riesgo mínimo: estas son funciones comerciales normales B Tríada Letal: las tres componentes permiten simultáneamente la exfiltración de datos a través de la inyección de instrucciones. C Riesgo medio — solo si el agente está mal entrenado

18. ¿Qué significa el Principio de Menor Privilegio para los agentes de AI?

A El agente recibe los recursos computacionales más bajos B El agente recibe solo las capacidades mínimamente necesarias para la tarea concreta. C El agente solo puede realizar tareas simples

19. Un agente espera 5 minutos para la aprobación HITL. Ninguna persona responde. ¿Qué sucede?

A El agente ejecuta la acción con la prioridad más baja. B El agente sigue esperando — La supervisión humana tiene prioridad C Timeout = Rechazo (fail-closed). Acción no se ejecutará.

20. Está desarrollando un sistema de puntuación de crédito. ¿Qué stack es completamente correcto para el EU AI Act de alto riesgo? 2 pts

A XGBoost + buena precisión + registro conforme a DSGVO B XGBoost + Fairlearn (Sesgo < 0.05) + SHAP + MLflow (Auditoría) + Evidently (Desviación) + Documentación Técnica (Annex IV) + HITL-Override C XGBoost + IBM watsonx.governance Licencia