关于 银行POS机境外机内开外POS机 132=2665=3417微 的搜索结果,共760
雪****魁 2018-07-11
危险背后的遇--云服务故障危分析
本文的目的就是归类IaaS云故障的表层现象和深层原因,客户知道云服务的短板才好做系统设计,云厂商出故障也要老实认错,别总把客户当来糊弄。 至于PaaS云和IaaS云的设计实现思路完全不同,不在本文讨论范围。 客户的感知和建议 IaaS云的核心资源是云主,其他IaaS资源都是依附于云主的;云主的可靠性略高于物理,但并不是云主永不宕。 只要云主采购量稍上规模,云主用户总会遇到一些故障。请谅解和忘记供应商的营销话述,云主用户必须自己在架构设计层面规避这些故障。 网络抖动 现在云平台已经都用SDN组网,SDN本质是“软件定义网络”,其主打卖点是灵活管理和控制,其性能和稳定性并不是主打方向,SDN软件的质量也要略差与于传统厂商。云平台都会有网络IO超卖复用,而且用服务器CPU软解海量报文,其性能还是比传统网络略差的。云用户做架构设计时,建议通过更多节点的方式分散单节点网络压力。 硬件故障 硬件故障无法彻底避免,依附于物理硬件的云主也会意中断。云主可以在计划跨硬件迁移,所以可以说云主可靠性略高于物理
红****2 2018-07-10
故障自愈器人,保你安心好睡眠
干货概览 在大型互联网公司中,单房故障因为其故障时间长、影响范围大,一直是互联网公司运维人员的心头之痛。在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响服务的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度部网络环建设了基于智能流量调度的单房故障自愈能力。结合网运营商链路监测、网链路质量监测与业务指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字服务(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单房故障时业务均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单房故障自愈场景。 单房故障频发影响业务可用性 回顾近2年来各大互联网公司被披露的故障事件,单房故障层出不穷。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
因此,在部署系统的发后期,自身的功能变更主要集中于单部署工具。为了提高自身发迭代效率,脚本未采用全网部署的方案,只部署到特定插件集群。每次执时,单agent会从插件集群下载最新MD5,如果有变更,将重新下载最新插件进任务的执。这种设计形式增强了执端功能的可横向扩展性,并且极大降低了每次自身升级的成本。每次升级只需更新一个集群的插件代码,在全部器上即可生效。 总结 百度部署服务经历了手工上线- Web化- 放化一系列发展进程,目前正在向智能化逐步发展。Archer作为放化一代的运维产品,在百度部具有极高的使用率。期待本文的介绍能为您提供一些思路,也欢迎同们与我们进交流,共同促进AIOps的发展!
w****0 2018-07-11
房故障自愈-黎明之战
我们来具体看下百度的监控系统与流量调度系统是如何在单房故障止损场景中起作用。 故障发现:百度监控平台 百度监控平台,针对单房止损过程中的可用性场景,覆盖故障发现、止损决策、问题定位各阶段的监控。同时针对单房止损依赖的容量管理场景,提供资源类监控采集,为容量规划、扩缩容提供数据支持。实现从运营商网链路、百度部网络设备/链路、服务/实例、器/容器的全方位数据采集与监控。满足网络类单房故障、业务类单房故障的监控覆盖需求。 同时提供一系列数据分析方法。如智能异常检测、趋势预测、多维度分析、关联分析、服务和链路拓扑分析,实现故障的精准发现和定位。 故障止损:百度流量调度平台 针对百度的网络架构和业务架构,我们将流量调度拆分为三层:接入层、服务层、依赖层。 接入层:从网用户发起请求经过运营商网络到百度统一前端(BFE)的过程,使用DNS实现网流量调度。 服务层:从BFE流量转发至网服务的过程,使用BFE提供的GSLB动态负载均衡进流量调度。 依赖层:网上下游业务之间的流量调度过程,使用百度名字服务(BNS)进流量调度。
TOP