360发布《大模型安全白皮书》

2025年11月09日 68474

中证报中证网讯（记者孟培嘉）11月8日，在世界互联网大会乌镇峰会上，360数字安全集团发布《大模型安全白皮书》。该白皮书首次系统性阐释大模型运行时的五大关键风险，提出“外筑‘以模治模’动态屏障，内固‘平台原生’安全底座”的核心理念，并提供了可落地的安全解决方案，为大模型应用拉起了全链路安全防线，助力推动人工智能行业向“安全、向善、可信、可控”方向稳健发展。

360发布《大模型安全白皮书》
图片来源于网络，如有侵权，请联系删除

白皮书以2025年国内外多起典型大模型安全事件为切入点，系统性归纳了威胁大模型安全的五大关键风险。

360发布《大模型安全白皮书》
图片来源于网络，如有侵权，请联系删除

首先是基础设施安全风险，包括设备控制、供应链漏洞、拒绝服务攻击以及算力资源滥用等问题；其次是内容安全风险，涉及不符合核心价值观、虚假或违规内容、大模型幻觉，以及提示注入攻击等；第三类是数据与知识库安全风险，数据泄露、越权访问、隐私滥用和知识产权问题日益突出；第四是智能体安全风险，随着智能体自主性增强，插件调用、算力调度、数据流转等环节的安全边界更加模糊；最后是用户端安全风险，包括权限控制、API调用监控、恶意脚本执行以及MCP执行安全等。

面对上述复杂挑战，白皮书基于实战经验，给出了“外挂式安全 + 平台原生安全”双轨治理策略——前者灵活应对实时风险，后者从根源筑牢安全基础，两者配合形成全链路防护网。该方式具备两大优势：一是适配性强、部署成本低，可作为通用组件快速接入不同企业环境，避免重复开发；二是响应迅速，具备独立监测与拦截机制，可在毫秒级别识别并阻断实时威胁，如异常算力消耗或恶意内容。

据悉，目前360已将这一能力落地政务、金融、制造等各行业，真正让大模型安全从“理论变成“能落地、能管用”的实战方案。未来，还将联合产学研各界，共同推动安全标准建设与技术共享，携手共建安全、可信的AI生态。