目录
如何衡量正常运行时间?
您可以通过将系统运行时间除以测量周期来计算正常运行时间;然后将结果乘以 100,即可得到百分比。
停机事件通常由监控工具/服务记录,这些工具/服务也负责跟踪系统是否可用。如果您想提高正常运行时间报告的准确性,则应查看与此相关的文档和日志。
用于测量正常运行时间的工具:StatusCake 和 UptimeRobot 是两个可用于测量系统正常运行时间的工具/服务的示例。
什么样的正常运行时间才算好?
99.9% 通常被认为是不同行业“良好”的正常运行时间。如果您衡量一整年的系统可用性,您实际上有 8 小时 45 分钟的允许停机时间(当然,您仍然应该尽可能减少使用)。
虽然 99.9% 被认为是可以接受的水平,但许多企业的目标是更高的正常运行时间。99.99% 通常被认为是努力的目标,您还会听到“四个九”的说法。正常运行时间保证通常根据您选择的价格等级而有所不同,企业级的目标是更高的百分比。
如何提高我的系统的正常运行时间?
您可以通过以下几种方式提高系统的正常运行时间:
- 使用备用系统和组件实现冗余,以最大程度地减少中断。
- 监控您的基础设施,并在发现问题后立即解决,最好是在问题变成大问题之前就解决。考虑使用监控工具来实现这一点。
- 定期执行维护,以防止软件出现错误或功能下降。可以考虑定期发布更新/补丁。
- 跨多台服务器负载均衡流量,而不是孤注一掷。
- 制定灾难恢复计划,以确保停机时间最短,并且不会引起后续问题。
总结
在提供任何在线服务和使用不同系统时,您必须关注正常运行时间。客户满意度很大程度上取决于您的服务随时可用,并且争取至少 99.9% 的正常运行时间至关重要。
即使几分钟的停机时间也会损害您的业务及其声誉,因此值得 寻找合适的托管服务提供商 从一开始就仔细评估 SLA 并考虑提供商正在采取哪些措施来降低停机风险。主动识别和解决系统错误的方法可以最大限度地减少最终影响,并防止出现重大中断。