全球首个单智能体运行安全测试标准发布情况
发布信息
2025年7月14日消息,世界数字科学院(WDTA)在联合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》。该标准由蚂蚁集团、清华大学、中国电信牵头,联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外机构、企业及高校共同编制,为全球首个单智能体运行安全测试标准。
智能体运行安全测试标准相关背景
近年来,随着人工智能技术的快速发展,智能体在各个领域的应用日益广泛。但与此同时,智能体运行过程中的安全问题也逐渐凸显,如数据隐私问题、算法偏见以及AI决策的不透明性等潜在风险愈发显著。此前,国际上已在人工智能安全与伦理标准制定方面有所行动:
2024年4月15 - 19日,第27届联合国科技大会期间,世界数字技术院(WDTA)正式发布了《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准,这两项标准由来自OpenAI、谷歌、微软等数十家中外科技企业的专家学者共同编制而成,代表全球人工智能安全评估和测试进入新的基准。
2024年9月22日,在联合国未来峰会上,世界数字科学院(WDTA)首次宣布启动人工智能安全、可信和负责任(AISTR)认证计划,该计划旨在通过设立严格的国际标准,确保AI在设计、开发及应用中的每一个阶段都符合最高的伦理和安全标准。
此次全球首个单智能体运行安全测试标准的发布,进一步完善了人工智能安全标准体系,为智能体的安全运行提供了更具针对性的规范和指导,有助于推动人工智能技术更加安全、可靠地发展。