
超大规模云服务商的宕机证明,游戏服务器的未来是采用多云部署的混合编排。

发布时间:2021.12.23。注:本文引用了 2021 年末的特定故障事件。关于平台可用性和基础设施行为的相关说法具有时效性,应结合本文撰写时期的背景进行理解。
一个熟悉的挑战再次浮现。在 2020 年 11 月的 AWS 故障期间,部分 AWS 服务中断了数小时。这给全球各地的公司造成了严重干扰。游戏行业直接感受到了影响,而诸如 Slack 这样的关键居家办公工具也出现了严重问题。
在游戏行业,时间流逝,同样的基础设施挑战会反复出现。一个由经验丰富的开发者组成的团队——无论是在有数百人打造下一款爆款游戏的大型 AAA 环境中,还是由少数小型独立团队连续数月努力构建他们心目中最佳电子游戏——都会面临一个共同的压力点。上线前几天,压力和焦虑达到顶点。发布日期到来并过去。玩家涌入新游戏,评价极佳。开发者为之自豪,收益也在增长。就在这时,难以想象的事情发生了:服务器问题。

这不仅仅是一个常见问题,它往往反映了为不可预测需求扩展基础设施所固有的挑战。一些开发者无法为玩家的大规模涌入做好规划,即使经过周密准备,也仍可能发生宕机。在付出所有这些努力之后,值得思考是否有更好的方案来适应变化并最大化在线可用时间。选择服务器提供商时,成本往往是首要驱动因素,有时会以牺牲冗余性或可扩展性为代价。较低成本的选项可能意味着在硬件质量、冗余能力或扩容速度上的取舍——在最终选择提供商之前,这些因素都值得仔细评估。
解决方案比看起来更直接:多云和混合云服务器基础设施。这种方法可避免依赖单一网络或单一提供商。在 Edgegap,我们在幕后处理集成和基础设施管理,使客户无需亲自承担这些工作。在过去的故障期间,我们的客户保持了业务连续性,工作负载可透明地重新路由到未受影响的服务器——从而保证最终用户体验不受影响。
选择托管服务提供商对游戏的成功至关重要。确保提供商能够随着游戏热度增长而扩展同样必不可少。根据我们的经验,一些编排模型依赖预留容量而非按需分配,这可能导致更高的基础成本和更低的冗余能力。2020 年 11 月 Amazon Web Services 宕机事件和Microsoft Azure VM 宕机事件说明了基础设施集中化如何影响整个生态系统,从像Among Us这样的独立工作室到像Square Enix这样的大型 AAA 发行商。
Edgegap 专注于在全球范围内管理和编排游戏服务器及组件。相关基础设施已经存在,可用于保护你的玩家和收入。请在下一次发布之前花时间评估你的选择。
书写者
Edgegap团队







