1. Che cosa misura la Differenza di Parità Demografica (DPD)?

A La differenza nell'accuratezza del modello tra i gruppi B La differenza nel tasso di previsioni positive tra gruppi protetti C La differenza nel tempo di addestramento

2. Quale libreria Python fornisce MetricFrame per le metriche di equità per gruppo? 2 pts

A scikit-learn B Fairlearn (Microsoft) C TensorFlow

3. Perché la Parità Demografica e le Probabilità Equalizzate non possono essere soddisfatte contemporaneamente?

A Poiché necessitano di diverse librerie B Teorema dell'impossibilità: tranne quando i tassi di base sono uguali, si escludono a vicenda C Poiché Equalized Odds richiede più dati

4. Che cosa calcola SHAP per una singola previsione?

A La precisione complessiva del modello B Il contributo di ciascuna caratteristica alla previsione concreta (Valori di Shapley) C L'importanza delle caratteristiche sull'intero set di dati

5. Quando LIME è migliore di SHAP?

A Nei modelli ad albero — LIME è più veloce per Random Forests B Quando è necessario un metodo di spiegazione locale, indipendente dal modello C In caso di grandi set di dati — LIME scala meglio

6. Una Model Card contiene per un modello di credito ad alto rischio: le metriche di equità mostrano DPD=0.07. Cosa significa questo? 2 pts

A Il modello è conforme — 0.07 è inferiore a 0.1 B Revisione necessaria — 0.07 supera la soglia raccomandata di 0.05 C Il modello deve essere immediatamente disattivato

7. Cosa si registra secondo l'EU AI Act Art. 12 — e cosa NON si registra?

A Tutti i dati grezzi incl. PII per una completa tracciabilità B Input-Hash (nessun PII), Predizione, Decisione, Versione del Modello, Timestamp C Solo la decisione finale senza dettagli

8. Quale strumento viene utilizzato per il rilevamento del Data Drift in produzione?

A Pandas B Evidentemente C LIME

9. Cosa traccia MLflow nel contesto della governance dell'AI?

A Solo l'accuratezza del modello B Parametri dell'esperimento, metriche (incl. equità), artefatti — tracciabilità completa dell'audit C Solo configurazioni di distribuzione

10. Cosa prescrive l'Annex IV (Documentazione Tecnica) del EU AI Act per i sistemi ad alto rischio? 2 pts

A Solo una breve descrizione del tipo di modello B 8 sezioni obbligatorie: Scopo, Processo di sviluppo, Monitoraggio, Accuratezza, Equità, Dichiarazione di conformità ecc. C Una certificazione da parte di un revisore accreditato

11. Con quale frequenza deve essere aggiornata la Documentazione Tecnica secondo l'Art. 11?

A Annualmente B Ad ogni modifica sostanziale del sistema C Solo nella prima versione

12. Un modello di credito mostra per i richiedenti < 25 anni un TPR di 0.68 rispetto a 0.91 complessivo. Qual è la reazione corretta?

A Accettabile — i giovani richiedenti hanno spesso una storia creditizia meno consolidata B Rimuovere il modello dal punteggio, analisi delle cause principali, mitigazione del bias prima del re-deployment C Soglia per questo gruppo adattare

13. Qual è la differenza tra SHAP per modelli di ML classici e LLM?

A SHAP funziona con i LLM esattamente come con i modelli ad albero B Nei LLM, i pesi di attenzione forniscono spiegazioni limitate — SHAP è complesso e meno affidabile C LLM non necessitano di spiegabilità poiché emettono testo

14. Quale metrica RAGAS misura se una risposta RAG è coperta dai documenti recuperati?

A rilevanza_risposta B contesto_precisione C fedeltà

15. Cosa offre la Microsoft Responsible AI Toolbox oltre a Fairlearn?

A Solo una migliore interfaccia utente per le metriche di Fairlearn B Analisi degli errori, inferenza causale, scenari ipotetici e controfattuali in un dashboard C Monitoraggio della Produzione e Allerta

16. Quale strumento è la scelta migliore per il rilevamento del drift di produzione?

A SHAP B Evidentemente AI C IBM watsonx.governance

17. Un agente ha: accesso CRM (PII), ricerca web (non affidabile), invio e-mail. Qual è il rischio? 2 pts

A Rischio minimo — queste sono normali funzioni aziendali B Lethal Trifecta: consentire contemporaneamente a tutte e tre le componenti l'esfiltrazione di dati tramite Prompt Injection C Rischio medio — solo se l'agente è mal addestrato

18. Cosa significa il Principio del Minimo Privilegio per gli agenti AI?

A L'agente riceve le risorse computazionali minime B L'agente riceve solo le capacità che sono minimamente necessarie per il compito specifico. C L'agente può eseguire solo compiti semplici

19. Un agente attende 5 minuti per l'approvazione HITL. Nessun umano risponde. Cosa succede?

A L'agente esegue l'azione con la priorità più bassa B L'agente continua ad aspettare — La supervisione umana ha la precedenza C Timeout = Rifiuto (fail-closed). Azione non eseguita.

20. Stai sviluppando un sistema di scoring del credito. Quale stack è completamente corretto per il "EU AI Act" ad alto rischio? 2 pts

A XGBoost + buona accuratezza + logging conforme al DSGVO B XGBoost + Fairlearn (Bias < 0.05) + SHAP + MLflow (Audit) + Evidently (Drift) + Documentazione Tecnica (Annex IV) + HITL-Override C XGBoost + IBM watsonx.governance Licenza