亚马逊已披露其对最近影响全球网站和用户的AWS中断原因的调查结果。PrimeVideo、Alexa和Ring等各种亚马逊服务,以及Facebook和DisneyPlus等高级客户,都因AWS地区的一个持续数小时的问题而出现停机或显着放缓。

该公司现已完成对停电的调查,并表示这归结为一系列意外事件,最初旨在提升其服务。
“一项用于扩展托管在AWS主网络中的一项AWS服务的容量的自动化活动触发了内部网络中大量客户端的意外行为,”AWS在一篇博客文章中写道。
“这导致连接活动大量涌现,使内部网络和AWS主网络之间的网络设备不堪重负,导致这些网络之间的通信延迟。”
该公司表示,它现在已经采取了“几项行动”来防止这一事件再次发生,包括进一步评估此类扩展活动和部署额外的网络配置。
AWS还承诺将彻底改革其跟踪和提供未来中断信息的方式,并指出,“我们理解,当有关正在发生的事情的信息不易获得时,此类事件会更具影响力和令人沮丧。”
该公司表示,现在将为其支持服务部署“多项增强功能”,以确保能够快速与客户沟通未来的任何问题,并在2022年初部署升级。
“最后,我们要为这次事件给我们的客户造成的影响道歉,”该博客总结道。“虽然我们为我们的可用性记录感到自豪,但我们知道我们的服务对我们的客户、他们的应用程序和最终用户以及他们的业务有多么重要。我们知道这次事件对许多客户产生了重大影响。我们将尽我们所能从这次活动中学习并利用它进一步提高我们的可用性。”

