DeepMind 更新前沿安全框架以应对高级 AI 风险
### 前沿安全框架 2.0
DeepMind发布了更新后的前沿安全框架(FSF),以应对与先进人工智能模型相关的潜在风险,特别是在这些模型接近通用人工智能(AGI)之际。该框架强调更强大的安全协议,特别是针对具有关键能力的模型,建议提高安全级别以防止未经授权的访问和模型权重的泄露。
关键更新包括增强的部署缓解程序,确保彻底的安全评估和公司治理审查。该框架还概述了一种行业领先的方法来解决欺骗性对齐的风险,包括自动化监控和主动研究缓解策略。最终目标是为评估和保障未来人工智能模型的益处建立通用标准和最佳实践,并采取由研究人员、公司和政府共同参与的合作方式。
https://deepmind.google/discover/blog/updating-the-frontier-safety-framework/>