关于 乐业县找上门小姐包夜〖8843O306VX〗服务真实谛复凑浊墙 的搜索结果,共1365
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的杂性,通常需要人工止损,但人工处理的时效性会影响的恢速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭州电信接入故障,中断时级别 2017年1月某天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响的可用性并且会给公司带来直接或间接的损失。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 部署(熟称线)是运维领域最常见的类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论过)。一般的线具有不定时操作、部署情况杂、单机启停策略杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一套产品线全过程的可迁移发布解决方案,现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作中,Archer可以作为一个环节结合进整条测试发布流水线中。
w****0 2018-07-11
单机房故障自愈-黎明之战
那么如何验证线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同线故障情况及止损效率,并给出相应的优化意见。 根据线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、效果等方面权衡,将盲测分为三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测可根据监控数据决策流量调度目标,对于际无影响,主要验证故障处置流程是否符合预期、入口级流量切换预案是否完整。 提前通知有损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对有损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知盲测时间和可能的影响,线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知有损盲测:在各线单机房容灾能力建设完成后,进行不提前通知的有损盲测,对来说与发生故障场景完全相同。验证线在单机房故障情况下的止损恢能力。 单机房故障止损流程 一个完整的故障处理生命周期括感知、止损、定位、分析四个阶段。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,含了哪些例,规模、部署情况、例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一套分布式的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息括:在机器部署信息(机器IP,部署路径,配置,端口信息),例运行状况等其他重要信息。简单来讲,它提供了一个名到资源信息的一个映射关系。
M****点 2018-07-10
中国云计算现状——产品篇
Serverless的之处在于要求程序为自己进行改造,其他强调按需付费的计算只是快速释放资源的把戏,Serverless才是正的计算能力集装箱,未来计算场景下的CDN。 三、SaaS产品 其SaaS产品和狭义的云计算没一毛钱关系,广义的云计算连设备租赁和人员外都能算进去吹水框架,自然也给SaaS云预留了位置。 SaaS产品已经出现并流行了十几二十年了, OA/ERP/CRM/邮箱/模板建站等等SaaS都是比各位读者从年龄还长的老古董,最新流行的各种在线办公、协作、通话、众测等SaaS产品也不依赖云器,这些应用云走公网和之前走内网区别并不大,用物理机和虚拟机区别也不大。 狭义的云计算是企,目标用户的是企IT技术人员,而SaaS云的目标用户和IT人员只在Helpdesk时有关联。 从这一点来看,这些SaaS只是云平台的普通用户,和游戏、网站、APP、没有区别。只要SaaS云没自建IaaS和PaaS的技术能力和意图,那他们就是客户而非友商。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD是一个时间同步,ntpdate是个时间同步命令。很多工程师都会采用Crond+ntpdate的方式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,大部分人没做好为ntpdate这个动作负责。 正常的时间是个持续增长的向量,即老时间t1肯定于新时间t2,新时间t2也于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商数据库自带时钟源以外,大部分对系统时间是盲目信任,不相信t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和安全性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目信任;假设一个根NTP不稳定,所有的器获得了错误的时间,虽然现在层可以容异常,不会出现算出负利息或倒扣费的情况,但混乱是免不了的。
s****d 2018-07-11
亿元级云用户分析
1.云目的分析 大型云用户云的宏观目的和普通用户类似,但多角色多部的利益诉求非常杂。 降低成本:客户最直观的诉求,或者削减IT预算,或者同等预算下支撑更多的;其他客户诉求都难以清晰描述,唯独成本可以看发票和合同。 明确责任:客户不想承担各个IT系统的衔接和选型责任,相比软件厂商和系统集成商,云厂商的责任覆盖范围会更广泛一些。 收拢数据:云本身并不碰数据,但云是很好明确数据存储位置的机会,改造是规范数据结构的理由。 求新图变:企客户在气势如虹时要居安思危,在困境危难之中穷极思变,IT技术是企的潜在增长点甚至退路。 本文讨论的是有模糊度和利润空间的云计算项目,CDN和IDC资源可以用做计收载体,但不能做为云目的分析。亿元以器、CDN的订单很多但既无技巧也无利润,这些资源厂商也在跟云厂商学习如何装项目。 2.客户角色利益分析 大企多角色之间的利益诉求不同,所以表现形式也不同。我将客户三大角色列出来讨论,销售-售前-项目经理铁三角组合明确客户的诉求,才更好游刃有余的客户。
流****水 2018-07-11
度云企级运维平台——NoahEE
管理这个概念的出现,是随着快速膨胀的必然,其要解决的主要问题是一个“量”,或者说“规模”的问题。在早期较为简单时,一个可能部署在几台甚至一台机器,进行变更等运维操作简单直接,登录到机器人工操作就好了。随着的发展,分布式应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例子,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。在规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
商誉分为企商誉和个人商誉,云厂商的企商誉都积淀不足,胜者也是比烂大赛中靠友商更烂胜出的,和IDC/CDN的比优大赛无法相提并论。大客户在吃够了厂商的亏以后,会选择信任能有个人商誉,能做出承诺、调动资源和平问题的销售和人员。 有个客户非常信任某个云销售,他告诉该销售,虽然某大云有高层合作,某大云也说报价肯定比某云低5%;但是某大云的机制有问题,出故障从来都是衙话,每次故障都要客户去乱猜和背锅。最终这个单子在客户执行层的暗助之下,该云快速把切过来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和大客户谈故障的时候,喜欢把详细故障原因刨析给客户,企客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。面对意外故障,我们有信心向客户证明,换了其他厂商也一样会挂;面对人为故障,踏认错是对客户的最后尊重,而公开事也是逼着内部不会重蹈覆辙犯同样的错误。 过去大家卖IDC、CDN、器和软硬件积累的个人商誉,是可以应用到云计算领域的。而云的高科技光环褪去、产品同质化以后,企的核心竞争力仍然是有商誉的销售-售前-售后团队,这类人才永远是稀缺资源。
小****君 2018-07-11
踏云落地--谈IT就趋势
云厂商有集采优势,云厂商多给点资源就能省下很多优化工作;部分情况云厂商还有数据优势,比如基于本站数据做风控需要反调试,而对接云厂商外部参考画像会简单很多。5.技术大牛都是让变态需求给压出来的,如果公司有技术大牛,那各种需求就来了,但如果没有技术大牛,公司也会压缩自己的IT难度。比如搞大促秒杀就要准备2000万云费,就会掂量成本。客户要使用PaaS云就要按照云厂商的是数据和的格式约定。我们看到越来越多的证据,有了对象存储就不用招存储工程师,有了鉴黄和人脸识别就不用自己推演模型,有是反作弊系统就不用自己研究刷单,有了IM就不用自己做openfire。正的行精英是不会护食眼前这碗饭,到问题最优解比保住铁饭碗重要的多。当精英们无事可做的时候,哪怕钱给够了也很容易跳槽,他们将会富集在云计算公司、大IT部和独角兽企,而IT部和创团队留不住技术大牛了。精英们遗世独立,让普通工程师去买云了,对其他工程师可不是好事。
TOP