关于 兼职少妇包夜全套服务_薇V:78792796薇邵阳上门按摩服务房 的搜索结果,共864
w****0 2018-07-11
单机故障自愈-黎明之战
干货概览 在故障自愈机器人,保你安心好睡眠一文中,我们介绍了单机故障自愈的必要性和解决思路。本文主要介绍单机故障自愈前需要进行的准备工作,具体括: 单机容灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机容灾能力--常见问题 单机故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一个实例或者多个实例部部署在同一物理机的程序模块即为单点。 问题:单点所在机或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机故障时,可快速切换至其他机。 2.跨机混联 描述:下游之间存在常态的跨机混联。 问题:逻辑单元未隔离在独立的物理范围内,单机故障会给产品线带来局性影响。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
单机故障诱因众多不可避免 单机故障诱因众多,详细复盘若干单机故障发现故障诱因大致可以分为四类: 基础设施故障:物理机故障、网络链路拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储、计算故障等 单机故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24小时值班,接收大量的报警,随时准备在紧急情况下进行响应、决策、操作一系列故障止损动作,尽量挽回损失,降低故障影响。 但述解决方案会面临如下问题: 响应可能不够迅速:例如间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机故障自愈程序可独立完成故障感知、决策、执行的完整故障处理过程,并及时向运维人员同步故障处理状态。运维人员的责由处理转向管理,最终运维人员在低压力值班中保证稳定运行。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一分布式的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息括:在机器部署信息(机器IP,部署路径,配置,端口信息),的实例运行状况等其他重要信息。简单来讲,它提供了一个名到资源信息的一个映射关系。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
Archer的配置文件路径、的启停脚本及运维命令具有固定的标准并且支持定制化,使用Archer进行部署的具有统一的结构; 支持分级发布,及时拦截部署引入的线故障 针对分级发布的使用场景,Archer支持串并行线及暂停点功能,可照单实例、单机、单地域等级别设置暂停点,并支持部署过程中进行暂停、继续、重试、撤销等操作; 业的多地域部署 的多地域部署主要需要解决不同地域配置不同的问题。Archer提供了配置派生功能以支持多地域部署的场景。Archer支持在同一份配置文件中设置配置变量,并在特定地域(机)中生成特定配置值; 多种网络环境及大部署 针对多种网络环境及大部署的使用场景,Archer提供了部署数据中转传输。采用中转的线在发起任后,部分代码将首先被转存至中转机
流****水 2018-07-11
度云企业级运维平台——NoahEE
简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例子。这个例子中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通过对资源合理的组织,极大的简化了运维操作,提升了运维效率。 资产管理 在机里,各种各样的器、网络设备和安设备7x24小时的运转,为我们的业提供了硬件保障,是企业的重要资产。各种设备的物理损坏、升级、新增、搬迁等等都在考验着机运维人员的能力。怎样维护这些资产并记录信息,是个很重要的问题,搞得不好,这些资产可能变成运维人员的“袱”,越多越头疼。 对这些设备的运维操作,通常都涉及不的物理操作,比如说更换损坏的硬盘,增加内存条等等。这里涉及到几个要解决的问题: 故障如何及时发现?发现后由谁来进行修复?
p****d 2018-07-11
单机故障自愈--运维的春天
干货概览 在单机故障自愈--黎明之战中,我们介绍了单机故障自愈的准备工作和基础设施,括容灾能力建设、监控平台以及流量调度平台。本篇主要介绍单机故障自愈的具体解决方案,内容括: 单机故障止损的能力标准 单机故障自愈的整体架构 单机故障自愈的常见问题和解决方案 单机故障止损的能力标准 在单机容灾能力、故障发现能力、流量调度能力基础,业线具备了通过流量调度进行单机故障止损的条件。理想情况下,我们希望构建一完整、自动、智能的自愈方案,但各个业线的特点不同和基础能力参差不齐,很难一蹴而就,所以我们建立起一自愈能力的等级标准,业线根据自身情况制定相应建设计划,逐步提升自愈能力。 自愈能力等级标准划分为5级,从Level 0的完人工止损,到Level 4的自动化、智能化止损。对于Level0、Level1,人工感知止损面临着速度慢、误操作、场景覆盖不、风险控制能力不足等问题;、Level2则实现了止损操作的平台化、预案化,一定程度提升了止损效率;Level3则实现了自动化报警联动故障止损,实现了止损效率的进一步提升。
s****d 2018-07-11
亿元级云用户分析
1.云目的分析 大型云用户云的宏观目的和普通用户类似,但多角色多部的利益诉求非常复杂。 降低成本:客户最直观的诉求,或者削减IT预算,或者同等预算下支撑更多的;其他客户诉求都难以清晰描述,唯独成本可以看发票和合同。 明确责任:客户不想承担各个IT系统的衔接和选型责任,相比软件厂商和系统集成商,云厂商的责任覆盖范围会更广泛一些。 收拢数据:云本身并不碰业数据,但云是很好明确业数据存储位置的机会,云业改造是规范数据结构的理由。 求新图变:企业客户在气势如虹时要居安思危,在困境危难之中穷极思变,IT技术是企业的潜在增长点甚至退路。 本文讨论的是有模糊度和利润空间的云计算项目,CDN和IDC资源可以用做计收载体,但不能做为云目的分析。亿元以器、CDN的订单很多但既无技巧也无利润,这些资源厂商也在跟云厂商学习如何装项目。 2.客户角色利益分析 大企业多角色之间的利益诉求不同,所以表现形式也不同。我将客户三大角色列出来讨论,销售-售前-项目经理铁三角组合明确客户的诉求,才更好游刃有余的客户。
M****点 2018-07-10
中国云计算现状——产品篇
OpenStack API可以将网卡在主机之间插拔管理,网卡从主机附属设备变成了独立资源,内网IP的分配责从系统工程师变成了网络工程师,无数被安组恶心过的用户,也逐渐放弃了本机防火墙。这些改变是从网络层面践行云计算的设计哲学,单机(IP/防火墙)不重要,云主机就是生生不息的群狼,组织群狼的网络更加重要了。 二、PaaS产品 相比同质化竞争主打价格牌的IaaS云,PaaS产品才是云计算的未来。用好PaaS产品可以更省人力、更快交付,用量付费可能会比资源付费更便宜(也可能更贵),而PaaS平台的恼人和诱人之处均在于产品形态很模糊、质量很难评估、很难独立运营、没有领头羊企业和事实标准。 PaaS云平台和IaaS云资源的区别就在于,平台需要理解客户的动作和状态。对象存储和CDN就是最典型的PaaS,云平台照数据容量、访问流量、访问次数和方法收费;Mysql RDS只能照内存和日志空间限计费,但仍然可以替客户做数据库状态展示、分析和备份,这是过渡性的PaaS。
追****圣 2018-07-11
给书记省长讲清楚云计算
人不仅要住子还可以盖子,不仅会逛超市也会开菜市场。 政府和大型国企不仅能采购云计算,早晚也会走向发展云计算的路。 本文不谈任何技术细节和商业情怀,而是从政企的角度说明什么是云计算。 本文含如下内容。 从大时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以球的行业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了球的信息技术革命,我国借助这次技术革命的大好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的生活,其行业生态也在逐步分化扩大,这一现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等数行业,国计算机从业人员不超过万人,从业人员大都有很深的学术背景。 世纪90年代,户、论坛、邮件系统开始影响部分群众的生活,国内从业人员约为十万人,可以分为软件和硬件两类工程师。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD做时间调整会有效减这类情形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量影响业(详情见附录实验);也不会盲目信任远端时钟源,甚至固执的拒绝同步时间。NTPD相信本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发选择权威稳定的时间源,算出双方间的网络延迟,然后才会采信新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。我们很难成功调试NTPD,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD就背黑锅了。 真有TOP10的互联网公司和亿国家级项目里用ntpdate+crond,一代架构师为什么有这个误会无人深究,下一代人将误会固化为偏见,新一代人将偏见神化为迷信。
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因为卡得一匹。
w****t 2018-07-10
AIOps中的四大金刚
该方案主要解决的问题场景如下:某个业由于网络、设备、变更、程序Bug、容量等原因造成故障,但故障范围仅局限在单个机或单个Region内部。那么,我们可以基于流量调度等手段,将访问流量调度到非故障机或Region,实现该类型故障的自动止损。 在这个过程中,需要AIOps四种角色分工明确、紧密配合,来完成整个AIOps解决方案的落地实现。 运维工程师 在单机故障自愈项目中,运维工程师基于日常运维工作中所积累的场景、问题和经验,确定以单机故障止损作为主要需求和突破口,通过定义单机故障止损的问题域、解决思路以及风险点,明确AI可以发力的领域。 在完成问题域的定义后,运维工程师需要跟踪整个单机故障自愈解决方案的落地,括在策略设计前期提供数据标注支持,在中期进行效果的验收,在后期将单机故障自愈方案实际部署运行到生产环境。 AIOps时代的责和技能变化 运维工程师承担线质量的责任,是质量的关键保证。在工作过程中,会与研发、产品、运营等各类角色、不同团队进行深度的沟通和协作。 传统运维中,运维工程师的主要责分为三个方面:质量、成本、效率。
若****客 2018-07-10
IT架构的本质--我的五点感悟
需求优化最重要 依赖,Less is more 一个IT系统是多角色多模块分层分级的,像OSI模型层应用简单依赖下层支撑,SOA设计中同级角色也只看对方的接口。 各角色分工明确方便快速实现业,但是给架构优化也埋下大坑,底层的盲目支撑是巨大资源浪费,平级调度协作也没任何弹性。前端一个小逻辑需求会导致后端大规模联动,不同也没权限理解对方的内存数据,各个角色的工程师都只看自己的工作范围,这是正常又无奈的现状。 我们要搞架构设计最重要的就是砍需求,将层应用的需求优化删减,让同级的业能容错。层需求优化,即前端对后端输入查询多容错,而同级容错可以看做应用间的需求优化,比如两个可以幂等重试就是好解耦,而A系统会等B系统等到死锁就是架构悲剧。 某电商ERP系统的用户点一次查询钮,后台系统就锁库查询一次;实操过程中系统越慢用户就重复点查询钮,而并行查询越多后台速度就更慢。这种环境要搞架构优化,首先要理解自然人并不要求实时数据,ERP客户端限制每15秒才能点一次查询钮,在Web接入层限制每个Session每分钟只能查询一次,还可在数据库链接类库做一层控制策略。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
但是从云资源的管理、调度、监控软件,到客户界面,API管理、账户和后台策略层面,越往走的软件质量还不如XXXX,此处省略一万五千字,客户自己揣吧。 厂商深层原因 厂商报故障就跟滚刀肉挨揍一样,脸疼了就把屁股凑过来,屁股疼了就捏捏脸,一般不会住一只羊使劲薅羊毛,毕竟云报障也要负载均衡。但客户自己心里要有秆秤,厂商究竟是偶尔发挥失常还是烂泥扶不墙,故障的性质对长久的品质很重要。 我列一下潜在的故障原因,哪些故障能忍,哪些故障不能忍,这些要云客户自己评估了。 技术原因 IaaS的核心主体功能(云主机、云硬盘、VPC),在没有特型要求前提下,是可以用开源方案搭建。如果是云厂商连个开源平台标准模块都部署失败,那就该换厂商了;如果是偶发的BUG,那确实客户要自认倒霉,因为友商也会遇到同样问题。 现在容易出问题的是云平台的运营维护和云厂商的自定义管理模块,客户就是缺合格运维才被逼的云平台,但云厂商自己也缺人;在软件BUG这一部分我已经吐槽过做云平台外延模块程序员的技能水平了。这些地方出了问题该投诉投诉、该索赔索赔,逼着客户去招更敬业专业的工程师。
M****H 2018-07-11
故障定位场景下的数据可视化实践
图所示,我们可以照问题定位的思路,将整体的可用性情况、分功能可用性情况、分模块的核心指标、流量的同环比对比、分IDC的流量对比等,依次通过丰富的可视化组件进行呈现。使得在收到报警时,可以快速将故障缩小到具体功能、模块、接入流量、机级别。 深入数据确定根因 在故障处理过程中,景数据仪表盘为我们缩小了故障定位的范围,但大多数的根因仍然隐藏在数据的细分维度中。由此多维度分析的重要性就体现出来了。常见的多维度分析括如下几种场景: 单维度取值对比分析:针对同一个维度的不同取值进行对比分析,例如确定流量下跌出现在哪个省份。 多维度关联分析:分析两个甚至更多维度互相作用后数据的分析,例如如何确定一个下跌是机级别还是模块级别。 维度下钻分析:一些维度含多个层级,例如省份、城市等相关联维度的逐层下钻定位。 我们针对这些场景,设计了相应的解决方案。 单维度取值对比分析 维度取值对比分析是一种最常见的细分维度定位方式。对于同一个维度下取值数量较的情况,可以通过多维度趋势图和饼图等可视化方式进行快速的分析,查看不同维度取值的取值状态,以及占整体比例情况。
TOP