关于 广州在水一方什么服务(81604940微信) 的搜索结果,共1585
h****e 2018-07-10
程序:我从哪里来?
干货概览 计算机程序或者的层次上,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 包含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 的上游有哪些,不同的上游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是呢? 百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的套分布式的名字系统,是百度云Noah智能运维产品中的个重要基础系统。它为每赋予个独无二的名字,根据这个名字,我们就可以获取到这个的相关息 ,这些息包括:机器上部署息(机器IP,部署路径,配置,端口息),的实例运行状况等其他重要息。简单来讲,它提供了名到资源息的个映射关系。
追****圣 2018-07-11
给书记省长讲清楚云计算
最近的十年,移动互联网兴起,便捷的通、打车、外卖、电子支付等功能层出不穷,所有面向个人消费者的行业都加速互联网化;未来十年里,计算机技术将深刻影响工业生产领域。这时问题出现了,我们需要上千万名工程师吗,我们有这多工程师吗? 历史总是惊人相似的轮回,国家决策层面,云计算是个可以和能源、金融相提并论的领域。 第次工业革命开始时,每个矿山都安装各自的蒸汽机;第二次工业革命开始时,每个工厂都要重点解决电力等能源问题;息技术革命开始时每个公司都要有计算机工程师。但百川终到海,发动机能统标准,电力能源能集中供应,云计算平台可以实现计算机技术的标准化,凭借规模效应降低成本,让客户直接付费购买息技术,极大减少了客户的人力投入以及衍生的时间和管理成本。 息技术革命的核心工作是息的存储和处理,最重要的资源是数据。客户的数据放云平台就像资金放银行样,银行可以根据储户的流评估用,央行可以对货币进行宏观调控,云平台样可以对用户息进行评估计算,甚至国家层面可以进行宏观管理调控。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 大型互联网公司中,单机房故障因为其故障时间长、影响范围大,直是互联网公司运维人员的心头之痛。传统的运维式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全位故障发现能力,基于百度统前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。
s****7 2018-07-10
知著看技术误解——从裸光纤和NTPD谈起
我们很难成功调试NTPD,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD就背上黑锅了。 真有TOP10的互联网公司和上亿国家级项目里用ntpdate+crond,上代架构师为有这个误会无人深究,下代人将误会固化为偏见,新代人将偏见神化为迷。 但无论误会、偏见还是迷,时间跃变、回退和停滞对应用健壮性和业安全性的威胁始终存,时间不仅仅是我玩游戏时用的魔法,忽视问题并不能掩埋问题。 六、见知著和防杜渐 我讲NTPD和裸纤并不是为卖弄知识,也不是为做偏门科普,而是希望进阶工程师们多考虑下如何规避这类误会?我们做技术工作时,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事也不会知道时间也能错误和波动,他们能说清楚业逻辑就不错了。 把所有的精力都用到做业逻辑,你只是个编程语言翻译机而已;自己主动观测技术环境依赖,有资格有能力做出技术选型决策,才是给Coder群集做技术校准的人。即使你不想做技术决策人和管理者,多怀疑和观察环境,也能少些沟通成本,少走些冤枉路,多份自和自尊。
疏****月 2018-07-09
键上线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称上线)是运维领域最常见的业类型,主要涉及线上代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已数据传输文章《嗖的下,让数据自动生效》中专门讨论过)。般的业上线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由上线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 运维自动化的大潮下,百度运维管理平台Noah发布了键上线部署系统——Archer。Archer致力于提供套产品线全过程的可迁移发布解决案,实现键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全过程的自动操作。操作面,Archer提供了命令行工具作为发起次上线的操作入口,这种设计模式也决定了其易于集成的特点。DevOps流线作业中,Archer可以作为个环节结合进整条测试发布流线中。
布****五 2018-07-10
如何执行条命令
面临的困难 命令行的三要素,也是如何执行条命令行面对的三个问题,如前文所述,对于单机环境来说,这三个问题前人的努力下已经被很好的解决。可是如果要几十万台机器上每天执行几十亿条命令,同时保证时效性,保证执行成功率,保证结果正确收集,保证7*24小时稳定运行,就不是件简单的事情了。所谓远行无轻担,量大易也难,构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例子如下: 息存储问题:为了支持平扩展,需要高效的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令息持久化。日均几十亿的热数据,年均上万亿的冷数据,需要仔细选择存储案。 任调度问题:为了达到任意多台器上执行命令的要求,需要确定何时分发命令、何时回收结果以及怎样的并发度批量下发。 消息传输问题:为了保证命令高效正确送达目标器,需要构建个可靠的命令传输网络,使命令准确送达的前提下保障传输的可靠与高效,毕竟百度的几十万台器分布世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要目标机构建执行代理,以应对单机的复杂执行环境。
流****水 2018-07-11
度云企业级运维平台——NoahEE
我们推出的NoahEE(Noah Enterprise Edition)脱始于Noah,为企业提供了站式运维解决案,覆盖了包括日常的故障管理和变更管理中典型的运维场景,致力于为政企、金融、教育等行业提供业可用性保障、提升运维效率。 图1 NoahEE概览 接下来,我们把这艘诺亚舟分解开来,近距离观察下这艘船的面面。 管理 我们首先介绍管理是因为管理是整个运维工作的基础,也是NoahEE这个平台上各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是个“量”,或者说“规模”的问题。早期业较为简单时,可能部署几台甚至台机器上,进行变更等运维操作简单直接,登录到机器上人工操作就好了。随着业的发展,分布式应用与广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例子,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源哪里。
TOP