关于 赢咖2娱乐负责人 〖q3597730〗转jbaeoi米保网 的搜索结果,共1193
红****2 2018-07-10
故障自愈机器你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因大致可以分为四类: 基础设施故障:物理机房故障、络链路拥塞、流量发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,工临时介入的误操作等 依赖服务故障:第三方服务故障例如通用的认证服务、支付服务、存储服务、计算服务故障等 单机房故障止损可靠性与效率急需提升 工处理场景下,运维员通常选择7*24小时值班,接收大量的报警,随时准备在紧急情况下进行响应、决策、操作一系列故障止损动作,尽量挽回服务损失,降低故障影响。 但上述解决方案会面临如下问题: 响应可能不够迅速:例如夜间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执行的完整故障处理过程,并及时向运维员同步故障处理状态。运维员的职由处理向管理,最终运维员在低压力值班中证服务稳定运行。
TOP