从业者

NIST AI RMF — 人工智能风险管理

⏱ ~60 时长 · 9 模块
为什么重要?

NIST AI RMF (NIST AI 100-1) 是全球最常用的AI风险管理标准——被美国政府机构、国际公司使用,并作为ISO 42001的参考。了解EU AI Act的人需要NIST AI RMF来进行实际操作:该Act说明了要求是什么,而RMF展示了如何实施。结合这两个标准,几乎涵盖了全球AI治理的所有监管要求。

您将学到什么

您了解NIST AI Risk Management Framework的四个核心功能(GOVERN, MAP, MEASURE, MANAGE),理解其与EU AI Act的区别,并能够将该框架作为您组织中AI风险管理的实用工具。

Video

什么是AI风险?— IBM技术(8分钟)

IBM Technology 解释了AI风险的核心概念,通俗易懂——是深入了解框架之前的理想入门。

Lesen

NIST AI RMF — 概述及四个核心功能

~15 Min

NIST AI RMF — 框架概览


为什么需要一个AI风险框架?

AI系统的失败方式与传统软件不同。它们可能:

  • 幻觉 — 提供看似合理但错误的结果
  • 偏见增强 — 从训练数据中继承系统性歧视
  • 漂移 — 部署后行为与测试时不同
  • 不透明 — 黑箱决策没有可追溯的逻辑

NIST AI RMF 提供了一个结构化框架,以主动而非被动的方式管理这些风险。


GOVERN — 组织框架

核心问题: 我们是否有正确的结构来负责任地运营AI?

GOVERN 是所有其他功能的基础。没有它,MAP、MEASURE 和 MANAGE 将无效。

GOVERN 涵盖的内容:

  • 政策: 我们可以使用哪些AI系统?哪些不可以?
  • 角色和责任: 谁负责AI风险?
  • 文化: AI风险是否被认真对待——不仅仅是IT问题?
  • 文档: AI系统及其风险是否被清晰记录?
  • 治理流程: AI决策如何被审核?

实践示例: 一个机构使用AI进行欺诈检测。GOVERN 意味着:有书面政策规定谁可以使用该系统,如何审核结果,以及哪些情况需要人工处理。


MAP — 识别和情境化风险

核心问题: 在这个背景下,这个AI系统产生了哪些风险?

MAP 超越了技术分析——它询问社会技术背景

MAP 涵盖的内容:

  • 背景: 系统在什么环境中使用?
  • 利益相关者: 谁会受到系统的影响?
  • 潜在损害: 可能出什么问题——对谁——概率是多少?
  • 分类: 哪种类型的风险?(偏见、安全、数据保护、性能……)
  • 依赖性: AI系统依赖哪些数据、系统和人员?

重要提示: MAP 不是一次性步骤。AI系统的背景会变化——2023年安全的系统,可能在2025年在不同背景下有不同的风险。


MEASURE — 分析和量化风险

核心问题: 识别的风险到底有多大?

MEASURE 将定性风险转化为可测量的量。

MEASURE 涵盖的内容:

  • 性能指标: 准确性、精确度、召回率——以及背景相关的指标
  • 公平性和偏见: 某些群体是否被系统性地不公平对待?
  • 鲁棒性: 系统在异常输入下的表现如何?
  • 可解释性: 决策是否可以追溯?
  • 漂移监控: 系统行为是否随时间变化?

关键见解: 准确性本身不够。一个95%准确率的系统可能对某一群体有60%的错误率。MEASURE 要求多层次分析。


MANAGE — 优先化和减少风险

核心问题: 我们采取哪些措施——以及如何监控其效果?

MANAGE 是框架的实施层面。

MANAGE 涵盖的内容:

  • 优先化: 哪些风险需要首先解决?
  • 措施: 如何减少风险?(技术、流程、组织)
  • 持续监控: 系统在部署后是否被监控?
  • 事件响应: 如果出现AI问题会发生什么?
  • 反馈循环: 如何将见解反馈到MAP和MEASURE?

协同作用

GOVERN (设定框架条件)
    ↓
MAP (识别风险)
    ↓
MEASURE (量化风险)
    ↓
MANAGE (减少和监控风险)
    ↑_________________________________|
        (持续循环)

该框架不是线性的——在实践中,所有四个功能是并行运行并相互影响的。

Quiz

检查:四个核心功能

1. NIST AI RMF 有哪四个核心功能?

2. 是什么使GOVERN与其他功能区别开来?

Lesen

MAP 和 MEASURE — 识别和评估风险

~15 Min

MAP 和 MEASURE — 识别和评估风险


实践中的 MAP

MAP 不仅仅是一个检查清单——它是一种关于背景和后果的结构化思维方式。

步骤 1: 理解系统和目的

在识别风险之前,必须明确:

  • 系统具体做什么?
  • 做什么(系统的边界)?
  • 它嵌入在哪个决策过程中?

步骤 2: 利益相关者分析

直接受影响者: 谁通过系统获得决策? 间接受影响者: 谁的数据被使用?谁承担后果? 运营者: 谁部署系统并承担责任?

示例: 在一个AI支持的招聘筛选器中,直接受影响者:求职者。 间接受影响者:未来的同事,企业文化。 运营者:人力资源部门和管理层。

步骤 3: 识别风险类别

NIST 区分了多个风险维度:

类别 示例
偏见/公平性 系统性地歧视某些群体
安全性 通过对抗性输入进行操控
数据隐私 训练中的个人数据
性能 在关键场景中的错误率
可解释性 无法追踪逻辑的黑箱
鲁棒性 在漂移或意外输入下的表现

实践中的 MEASURE

超越准确性

MEASURE 的重要见解:单一指标永远不够

指标 它显示了什么 它隐藏了什么
准确性 (Accuracy) 系统正确的频率 对某些子群体可能显著较差
精确度 正预测的可靠性 不涉及假阴性
召回率 识别出多少真实案例 不涉及误报
公平性指标 各群体的平等待遇 必须明确测量

公平性测量 — 具体

三种常见的公平性指标:

  1. 人口平等: 每个群体获得正面决策的频率是否相同?
  2. 机会平等: 每个群体的真实正率是否相同?
  3. 校准: 各群体的概率声明是否等价?

重要: 这些指标可能相互矛盾——没有完美的公平性标准。决定优先考虑哪个指标是一个伦理和组织决策,而非纯技术决策。

漂移监控

AI 系统随着时间变化——不是在代码中,而是在其影响上:

  • 数据漂移: 输入数据发生变化(例如,新的客户群体)
  • 概念漂移: 现实发生变化(例如,经济危机改变了信用风险)
  • 模型漂移: 由于数据模式变化,模型退化

MEASURE 要求持续监控——而不是在部署时进行一次性测试。

Praxisfall

实践案例:AI支持的信用评分

Situation

一家银行引入了一个用于自动化信贷决策的AI系统。该系统是在历史信贷数据上训练的。IT部门表示:“该模型的准确率为94%——这对我们来说很好。”

从NIST AI RMF的角度来看,银行忽视了什么?
Lösung anzeigen

仅靠准确性不足以进行充分的风险分析。
NIST MAP 要求:背景、利益相关者、潜在损害。
NIST MEASURE 要求:公平性指标,而不仅仅是准确性。
历史信用数据包含系统性偏见(歧视)。
94% 的准确性可能意味着:对某些群体系统性错误。
缺乏治理(GOVERN):谁承担责任?如何提出异议?

Häufige Fehler:
✗ 仅依赖准确性作为质量指标
准确性掩盖偏见——一个系统可以有94%的准确率,但仍然对少数群体系统性错误。
✗ 将AI风险视为纯粹的技术问题处理
NIST AI RMF 强调:AI 风险是组织性的、社会技术性的——不仅仅是代码。
Lesen

管理 — 降低和监控风险

~10 Min

管理 — 降低和监控风险


从认知到行动

管理是将风险分析转化为可操作的治理的关键点。


风险优先级排序

并非所有风险都能立即解决。管理始于优先级排序:

标准:

  • 严重性: 如果风险发生,会造成什么损害?
  • 可能性: 损害发生的可能性有多大?
  • 可逆性: 损害是否可以逆转?
  • 受影响者: 有多少人受到影响?

具有高严重性 + 高可能性 + 不可逆影响的风险优先处理。


措施类型

技术措施

  • 训练或后处理中的偏差校正
  • 稳健性测试和对抗性测试
  • 可解释性层(LIME, SHAP)
  • 自动漂移警报

流程措施

  • 人机协作 (HITL): 人在执行前审查关键决策
  • 高风险决策的双重审核原则
  • 边界情况的升级路径
  • 定期模型审查

组织措施

  • 明确的AI系统责任
  • 受影响者的投诉机制
  • 系统运营者的培训

持续监控

管理并不在系统引入后结束。监控包括:

监控内容 频率 责任人
性能指标 持续/每日 AI团队
公平性指标 每月 AI团队 + 合规部门
用户反馈和投诉 持续 运营者
模型漂移 每季度 AI团队
治理合规性 每年 合规部门

事件响应

如果AI系统造成损害,该如何处理?

准备(事件前):

  • 记录AI系统的事件响应计划
  • 定义明确的升级路径
  • "紧急停止" — 系统可关闭

响应(事件中):

  1. 停止系统或置于安全模式
  2. 通知受影响者
  3. 分析原因(根本原因)
  4. 记录措施
  5. 将经验教训反馈到治理和映射阶段

管理与循环

管理不是终点。监控中的见解反馈回:

  • 新风险 → 返回到映射
  • 指标恶化 → 返回到测量
  • 结构性问题 → 返回到治理

这是风险管理框架的核心:持续改进,而非一次性合规。

Lesen

NIST AI RMF 与 EU AI Act — 差异与共同点

~10 Min

NIST AI RMF vs. EU AI Act


两个框架,一个目标

两个标准都希望实现负责任的AI——但方式不同:

NIST AI RMF EU AI Act
来源 美国 (NIST) 欧盟
状态 自愿 法律(在欧盟具有约束力)
方法 过程框架(如何) 监管(什么)
重点 风险管理过程 风险类别和义务
技术中立 ✅ 是 ✅ 是
国际认可 ✅ 非常广泛 ✅ 日益增加

互补之处

EU AI Act → NIST AI RMF

EU AI Act 规定,高风险AI系统必须遵循风险管理系统(Art. 9)。NIST AI RMF 是一个公认的系统实现方法。

实际应用: 实施 NIST AI RMF 的公司自动满足 EU AI Act 对 AI 风险管理系统的许多要求。

NIST AI RMF → EU AI Act

NIST AI RMF 帮助将 EU AI Act 的要求可操作化。它提供具体的活动(配置文件、操作手册),而 EU AI Act 提出抽象要求。


详细重叠

EU AI Act 要求 NIST AI RMF 功能
风险管理系统 (Art. 9) GOVERN + MAP + MEASURE + MANAGE
技术文档 (Art. 11) GOVERN(文档义务)
数据治理 (Art. 10) MAP(数据分析)+ MEASURE
人工监督 (Art. 14) MANAGE(HITL 过程)
上市后监控 (Art. 72) MANAGE(持续监控)

每个框架的优势

EU AI Act 更适合:

  • 明确问题:“我是否合规?”
  • 高风险决策(“我可以使用这个系统吗?”)
  • 向当局进行监管报告

NIST AI RMF 更适合:

  • 风险管理的实际实施
  • 欧盟以外的国际项目
  • 详细的操作指导

实践建议

结合使用两者:

  • EU AI Act 作为合规检查清单和法律界限
  • NIST AI RMF 作为日常实施的过程框架

追求 ISO 42001 的企业:NIST AI RMF 和 ISO 42001 也高度协调——NIST 的实施大大加速 ISO 认证。

Reflexion

适用于您组织的RMF配置文件

在您的组织中,哪一个功能(GOVERN/MAP/MEASURE/MANAGE)最为薄弱?

具体思考:是否有AI指南?风险是否被记录?是否有监控?

Beispiele:
  • GOVERN fehlt: keine KI-Richtlinie, keine Verantwortlichkeiten definiert
  • MAP fehlt: KI-Systeme werden eingesetzt ohne Risikokontext-Analyse
  • MEASURE fehlt: kein Monitoring auf Fairness oder Drift
  • MANAGE fehlt: bekannte Risiken werden nicht aktiv reduziert
Wird nur in deinem Browser gespeichert.
Merke

你的收获

  • GOVERN: Organisatorischer Rahmen — Richtlinien, Rollen, Kultur
  • MAP: Kontext und Risiken identifizieren — wer ist betroffen?
  • MEASURE: Risiken quantifizieren — Fairness, Genauigkeit, Bias
  • MANAGE: Risiken priorisieren, reduzieren, überwachen
  • EU AI Act sagt WAS — NIST RMF zeigt WIE
  • Beide Standards zusammen = vollständige KI-Governance-Abdeckung
  • RMF ist zyklisch — Risiken ändern sich, Monitoring läuft kontinuierlich

准备好进行评估了吗?

课程完成!测试你的知识。

开始评估 →