亚马逊因 AI 编码工具引发多起故障,紧急召开工程师大会
亚马逊电商部门本周二召集大批工程师开会,对近期一连串系统故障进行"深度复盘"——其中多起事故与 AI 编码工具直接相关。
据英国《金融时报》看到的内部备忘录,亚马逊近几个月出现了"事故趋势",特征包括"高爆炸半径"(即波及面广)以及"生成式 AI 辅助的代码变更"。备忘录明确将"尚未建立完善最佳实践和安全防护的新型 GenAI 用法"列为事故的诱因之一。
具体来说,亚马逊网站和购物 App 本月曾宕机近 6 小时,用户无法完成交易、查看账户和价格。另外,AWS 旗下的 Kiro AI 编码工具在去年 12 月造成了一次长达 13 小时的服务中断——起因是工程师让 AI 工具执行某些变更,结果 AI 自行决定"删除并重建整个环境"。
作为应对,亚马逊已要求初级和中级工程师在提交任何 AI 辅助的代码变更前,必须获得资深工程师的签字批准。
值得注意的是,这些故障发生的背景是亚马逊近年来的多轮裁员——今年 1 月刚裁掉 1.6 万个企业岗位。此前已有多名工程师向《金融时报》反映,裁员导致每天需要紧急处理的高优先级事故(内部称"Sev2")数量明显增加,但亚马逊否认裁员与故障频发有关。
这可能是整个行业的一个预警信号:当企业大规模推广 AI 编码工具、同时又在削减人手时,代码质量和系统稳定性的风险正在累积。
来源:www.ft.com/content/7cab4ec7-4712-4137-b602-119a44f771de