从业者

NIST AI RMF — 人工智能风险管理

⏱ ~60 时长 · 9 模块

为什么重要？

NIST AI RMF (NIST AI 100-1) 是全球最常用的AI风险管理标准——被美国政府机构、国际公司使用，并作为ISO 42001的参考。了解EU AI Act的人需要NIST AI RMF来进行实际操作：该Act说明了要求是什么，而RMF展示了如何实施。结合这两个标准，几乎涵盖了全球AI治理的所有监管要求。

您将学到什么

您了解NIST AI Risk Management Framework的四个核心功能（GOVERN, MAP, MEASURE, MANAGE），理解其与EU AI Act的区别，并能够将该框架作为您组织中AI风险管理的实用工具。

Video

什么是AI风险？— IBM技术（8分钟）

IBM Technology 解释了AI风险的核心概念，通俗易懂——是深入了解框架之前的理想入门。

Lesen

NIST AI RMF — 概述及四个核心功能

~15 Min

NIST AI RMF — 框架概览

为什么需要一个AI风险框架？

AI系统的失败方式与传统软件不同。它们可能：

幻觉 — 提供看似合理但错误的结果
偏见增强 — 从训练数据中继承系统性歧视
漂移 — 部署后行为与测试时不同
不透明 — 黑箱决策没有可追溯的逻辑

NIST AI RMF 提供了一个结构化框架，以主动而非被动的方式管理这些风险。

GOVERN — 组织框架

核心问题： 我们是否有正确的结构来负责任地运营AI？

GOVERN 是所有其他功能的基础。没有它，MAP、MEASURE 和 MANAGE 将无效。

GOVERN 涵盖的内容：

政策： 我们可以使用哪些AI系统？哪些不可以？
角色和责任： 谁负责AI风险？
文化： AI风险是否被认真对待——不仅仅是IT问题？
文档： AI系统及其风险是否被清晰记录？
治理流程： AI决策如何被审核？

实践示例： 一个机构使用AI进行欺诈检测。GOVERN 意味着：有书面政策规定谁可以使用该系统，如何审核结果，以及哪些情况需要人工处理。

MAP — 识别和情境化风险

核心问题： 在这个背景下，这个AI系统产生了哪些风险？

MAP 超越了技术分析——它询问社会技术背景。

MAP 涵盖的内容：

背景： 系统在什么环境中使用？
利益相关者： 谁会受到系统的影响？
潜在损害： 可能出什么问题——对谁——概率是多少？
分类： 哪种类型的风险？（偏见、安全、数据保护、性能……）
依赖性： AI系统依赖哪些数据、系统和人员？

重要提示： MAP 不是一次性步骤。AI系统的背景会变化——2023年安全的系统，可能在2025年在不同背景下有不同的风险。

MEASURE — 分析和量化风险

核心问题： 识别的风险到底有多大？

MEASURE 将定性风险转化为可测量的量。

MEASURE 涵盖的内容：

性能指标： 准确性、精确度、召回率——以及背景相关的指标
公平性和偏见： 某些群体是否被系统性地不公平对待？
鲁棒性： 系统在异常输入下的表现如何？
可解释性： 决策是否可以追溯？
漂移监控： 系统行为是否随时间变化？

关键见解： 准确性本身不够。一个95%准确率的系统可能对某一群体有60%的错误率。MEASURE 要求多层次分析。

MANAGE — 优先化和减少风险

核心问题： 我们采取哪些措施——以及如何监控其效果？

MANAGE 是框架的实施层面。

MANAGE 涵盖的内容：

优先化： 哪些风险需要首先解决？
措施： 如何减少风险？（技术、流程、组织）
持续监控： 系统在部署后是否被监控？
事件响应： 如果出现AI问题会发生什么？
反馈循环： 如何将见解反馈到MAP和MEASURE？

协同作用

GOVERN (设定框架条件)
    ↓
MAP (识别风险)
    ↓
MEASURE (量化风险)
    ↓
MANAGE (减少和监控风险)
    ↑_________________________________|
        (持续循环)

该框架不是线性的——在实践中，所有四个功能是并行运行并相互影响的。

Quiz

检查：四个核心功能

1. NIST AI RMF 有哪四个核心功能？

A 计划、构建、测试、部署 B 治理, 映射, 测量, 管理 C 识别、保护、检测、响应 D 评估, 设计, 监控, 报告

2. 是什么使GOVERN与其他功能区别开来？

A GOVERN仅供外部审查员使用 B GOVERN 仅包括技术安全措施 C GOVERN 创建了组织框架——政策、责任、文化 D GOVERN 完全取代 MAP 和 MEASURE

Lesen

MAP 和 MEASURE — 识别和评估风险

~15 Min

MAP 和 MEASURE — 识别和评估风险

实践中的 MAP

MAP 不仅仅是一个检查清单——它是一种关于背景和后果的结构化思维方式。

步骤 1: 理解系统和目的

在识别风险之前，必须明确：

系统具体做什么？
它不做什么（系统的边界）？
它嵌入在哪个决策过程中？

步骤 2: 利益相关者分析

直接受影响者： 谁通过系统获得决策？ 间接受影响者： 谁的数据被使用？谁承担后果？ 运营者： 谁部署系统并承担责任？

示例： 在一个AI支持的招聘筛选器中，直接受影响者：求职者。间接受影响者：未来的同事，企业文化。运营者：人力资源部门和管理层。

步骤 3: 识别风险类别

NIST 区分了多个风险维度：

类别	示例
偏见/公平性	系统性地歧视某些群体
安全性	通过对抗性输入进行操控
数据隐私	训练中的个人数据
性能	在关键场景中的错误率
可解释性	无法追踪逻辑的黑箱
鲁棒性	在漂移或意外输入下的表现

实践中的 MEASURE

超越准确性

MEASURE 的重要见解：单一指标永远不够。

指标	它显示了什么	它隐藏了什么
准确性 (Accuracy)	系统正确的频率	对某些子群体可能显著较差
精确度	正预测的可靠性	不涉及假阴性
召回率	识别出多少真实案例	不涉及误报
公平性指标	各群体的平等待遇	必须明确测量

公平性测量 — 具体

三种常见的公平性指标：

人口平等： 每个群体获得正面决策的频率是否相同？
机会平等： 每个群体的真实正率是否相同？
校准： 各群体的概率声明是否等价？

重要： 这些指标可能相互矛盾——没有完美的公平性标准。决定优先考虑哪个指标是一个伦理和组织决策，而非纯技术决策。

漂移监控

AI 系统随着时间变化——不是在代码中，而是在其影响上：

数据漂移： 输入数据发生变化（例如，新的客户群体）
概念漂移： 现实发生变化（例如，经济危机改变了信用风险）
模型漂移： 由于数据模式变化，模型退化

MEASURE 要求持续监控——而不是在部署时进行一次性测试。

Praxisfall

实践案例：AI支持的信用评分

Situation

一家银行引入了一个用于自动化信贷决策的AI系统。该系统是在历史信贷数据上训练的。IT部门表示：“该模型的准确率为94%——这对我们来说很好。”

从NIST AI RMF的角度来看，银行忽视了什么？

Lösung anzeigen

仅靠准确性不足以进行充分的风险分析。
NIST MAP 要求：背景、利益相关者、潜在损害。
NIST MEASURE 要求：公平性指标，而不仅仅是准确性。
历史信用数据包含系统性偏见（歧视）。
94% 的准确性可能意味着：对某些群体系统性错误。
缺乏治理（GOVERN）：谁承担责任？如何提出异议？

Häufige Fehler:

✗ 仅依赖准确性作为质量指标

准确性掩盖偏见——一个系统可以有94%的准确率，但仍然对少数群体系统性错误。

✗ 将AI风险视为纯粹的技术问题处理

NIST AI RMF 强调：AI 风险是组织性的、社会技术性的——不仅仅是代码。

Lesen

管理 — 降低和监控风险

~10 Min

管理 — 降低和监控风险

从认知到行动

管理是将风险分析转化为可操作的治理的关键点。

风险优先级排序

并非所有风险都能立即解决。管理始于优先级排序：

标准：

严重性： 如果风险发生，会造成什么损害？
可能性： 损害发生的可能性有多大？
可逆性： 损害是否可以逆转？
受影响者： 有多少人受到影响？

具有高严重性 + 高可能性 + 不可逆影响的风险优先处理。

措施类型

技术措施

训练或后处理中的偏差校正
稳健性测试和对抗性测试
可解释性层（LIME, SHAP）
自动漂移警报

流程措施

人机协作 (HITL)： 人在执行前审查关键决策
高风险决策的双重审核原则
边界情况的升级路径
定期模型审查

组织措施

明确的AI系统责任
受影响者的投诉机制
系统运营者的培训

持续监控

管理并不在系统引入后结束。监控包括：

监控内容	频率	责任人
性能指标	持续/每日	AI团队
公平性指标	每月	AI团队 + 合规部门
用户反馈和投诉	持续	运营者
模型漂移	每季度	AI团队
治理合规性	每年	合规部门

事件响应

如果AI系统造成损害，该如何处理？

准备（事件前）：

记录AI系统的事件响应计划
定义明确的升级路径
"紧急停止" — 系统可关闭

响应（事件中）：

停止系统或置于安全模式
通知受影响者
分析原因（根本原因）
记录措施
将经验教训反馈到治理和映射阶段

管理与循环

管理不是终点。监控中的见解反馈回：

新风险 → 返回到映射
指标恶化 → 返回到测量
结构性问题 → 返回到治理

这是风险管理框架的核心：持续改进，而非一次性合规。

Lesen

NIST AI RMF 与 EU AI Act — 差异与共同点

~10 Min

NIST AI RMF vs. EU AI Act

两个框架，一个目标

两个标准都希望实现负责任的AI——但方式不同：

	NIST AI RMF	EU AI Act
来源	美国 (NIST)	欧盟
状态	自愿	法律（在欧盟具有约束力）
方法	过程框架（如何）	监管（什么）
重点	风险管理过程	风险类别和义务
技术中立	✅ 是	✅ 是
国际认可	✅ 非常广泛	✅ 日益增加

互补之处

EU AI Act → NIST AI RMF

EU AI Act 规定，高风险AI系统必须遵循风险管理系统（Art. 9）。NIST AI RMF 是一个公认的系统实现方法。

实际应用： 实施 NIST AI RMF 的公司自动满足 EU AI Act 对 AI 风险管理系统的许多要求。

NIST AI RMF → EU AI Act

NIST AI RMF 帮助将 EU AI Act 的要求可操作化。它提供具体的活动（配置文件、操作手册），而 EU AI Act 提出抽象要求。

详细重叠

EU AI Act 要求	NIST AI RMF 功能
风险管理系统 (Art. 9)	GOVERN + MAP + MEASURE + MANAGE
技术文档 (Art. 11)	GOVERN（文档义务）
数据治理 (Art. 10)	MAP（数据分析）+ MEASURE
人工监督 (Art. 14)	MANAGE（HITL 过程）
上市后监控 (Art. 72)	MANAGE（持续监控）

每个框架的优势

EU AI Act 更适合：

明确问题：“我是否合规？”
高风险决策（“我可以使用这个系统吗？”）
向当局进行监管报告

NIST AI RMF 更适合：

风险管理的实际实施
欧盟以外的国际项目
详细的操作指导

实践建议

结合使用两者：

EU AI Act 作为合规检查清单和法律界限

NIST AI RMF 作为日常实施的过程框架

追求 ISO 42001 的企业：NIST AI RMF 和 ISO 42001 也高度协调——NIST 的实施大大加速 ISO 认证。

Reflexion

适用于您组织的RMF配置文件

在您的组织中，哪一个功能（GOVERN/MAP/MEASURE/MANAGE）最为薄弱？

具体思考：是否有AI指南？风险是否被记录？是否有监控？

Beispiele:

GOVERN fehlt: keine KI-Richtlinie, keine Verantwortlichkeiten definiert
MAP fehlt: KI-Systeme werden eingesetzt ohne Risikokontext-Analyse
MEASURE fehlt: kein Monitoring auf Fairness oder Drift
MANAGE fehlt: bekannte Risiken werden nicht aktiv reduziert

Wird nur in deinem Browser gespeichert.

Merke

你的收获

GOVERN: Organisatorischer Rahmen — Richtlinien, Rollen, Kultur
MAP: Kontext und Risiken identifizieren — wer ist betroffen?
MEASURE: Risiken quantifizieren — Fairness, Genauigkeit, Bias
MANAGE: Risiken priorisieren, reduzieren, überwachen
EU AI Act sagt WAS — NIST RMF zeigt WIE
Beide Standards zusammen = vollständige KI-Governance-Abdeckung
RMF ist zyklisch — Risiken ändern sich, Monitoring läuft kontinuierlich

准备好进行评估了吗？

课程完成！测试你的知识。

开始评估 →

下一个课程

AI治理的技术实施

从理论到实践：HITL-Gates、审计追踪和技术治理措施。

→