关于 〖微⒌3⒒3⒊75〗曲阜桑拿全套按摩-上饶维也纳酒店妹子服务EJ 的搜索结果,共1162
流****水 2018-07-11
度云企业级运平台——NoahEE
我们推出的NoahEE(Noah Enterprise Edition)脱始于Noah,为企业提供了一站式运解决方案,覆盖了包括日常的故障管理和变更管理中典型的运场景,致力于为政企、金融、教育等行业提供业可用性保障、提升运效率。 图1 NoahEE概览 接下来,我们把这艘诺亚方舟分解开来,近距离观察一下这艘船的方方面面。 管理 我们首先介绍管理是因为管理是整个运工作的基础,是NoahEE这个平台各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是一个“量”,或者说“规模”的问题。在早期业较为简单时,一个可能部署在几台甚至一台机器,进行变更等运操作简单直接,登录到机器人工操作就好了。随着业的发展,分布式应用与的广泛使用,我们越来越多的面临着运场景与运执行之间的脱节。 举个例,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运场景”;而对于运人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运团队研发的一分布式的名字系统,是百度云Noah智能运产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息包括:在机器部署信息(机器IP,部署路径,配置,端口信息),的实例运行状况等其他重要信息。简单来讲,它提供了一个名到资源信息的一个映射关系。
3****3 2018-07-10
百度智能运工程架构
背景:为什么要做智能运 百度云智能运团队在运工具和平台研发方向历史悠久,支撑了百度数十万规模的的运,所提供的包括管理、资源定位、监控、部署、分布式任调度等等。最近几年,团队着力于发展智能化运能力以及AIOps产品化建设。 众所周知,百度除了搜索业之外,还有很多其他的业线,有像地图、百科、知道、网盘这样的老牌业有诸如像教育、医疗这样的新兴业,每个业在规模架构都有很大差异。业本身对稳定性的要求很高,需要保持99.995%的高可用,同时在业云的背景下,虚拟化、混合云等都给我们带来了新的挑战。 百度运经历了从脚本 工具、基础运平台、开放可定制运平台到我们现在的智能运平台,这样四个阶段的转变。过去运的核心目标是提升效果,比如持续交付的速度、稳定性、运营成本等。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专门讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运时代,运人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运平台研发人员所亟需解决的问题。 基本介绍 在运自动化的大潮下,百度运管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决方案,实现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运职位展望
2、进行云计算护;几大云供应商自己器,那些大中型企业肯定会自己做私有云,在这个云计算平台里是需要运人员进行从低端监控到高端架构的一系列护工作,但自动化运技术会让运人员的数量大大减少,可能每个公司都只有一两个小团队了。 3、进传统行业继续做运;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成有限的技术革新,比如说实现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛大新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。除了通讯公司之外,生产领域(比如管理生产线)有类似的顾虑,云计算的优势和公司的业需求完不沾边,所以这类公司的运可能会是最后的运。大家找工作的时候都习惯找网站相关的工作,但你学过Web就一定要找网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足一个没有前途的行业。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
看看各的启动优先级是一个讲究多多的过程,iptables会比network先启动这类依存关系很好理解;但我遇到过云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动过程,正式版的启动过程可以写十万字,有兴趣的朋友可以自己查基百科,或我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在大家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程师,云确实很有意义啊。 夜静人稀,沙龙关好了小门,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又一笑,“不传!不传!”----老舍《断魂枪》
s****7 2018-07-10
知著看技术误解——从裸光纤和NTPD谈起
但无论误会、偏见还是迷信,时间跃变、回退和停滞对应用健壮性和业性的威胁始终存在,时间不仅仅是我玩游戏时用的魔法,忽视问题并不能掩埋问题。 六、见知著和防杜渐 我讲NTPD和裸纤并不是为卖弄知识,不是为做偏门科普,而是希望进阶工程师们多考虑一下如何规避这类误会?我们在做技术工作时,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事不会知道时间能错误和波动,他们能说清楚业逻辑就不错了。 把所有的精力都用到做业逻辑,你只是个编程语言翻译机而已;自己主动观测技术环境依赖,有资格有能力做出技术选型决策,才是给Coder群集做技术校准的人。即使你不想做技术决策人和管理者,多怀疑和观察环境,能少些沟通成本,少走一些冤枉路,多一份自信和自尊。 附录:NTPD时间跃变不遗漏Crond的实验 1、当前系统时间是 23点35分。
M****H 2018-07-11
故障定位场景下的数据可视化实践
而对于度取值数量多,且不同取值数量级差距较大情况(例如分省份的流量下跌判定),使用饼图或趋势图很容易把流量较小省份的信息隐藏掉。这种场景下,我们可以通过度取值自动展开功能,分别查看每个省份的状态。 多个度关联分析 细分度的故障所带来的表象可能会在多个度均有表现,比如整体的访问拒绝升,我们会发现分机房的拒绝量升,看到分模块的拒绝升。那么我们如何确认故障的根因是来源于某个机房还是某个模块,还是这两者的交叉度,即某个机房的某个模块导致的问题。 矩阵热力图可以解决这一问题。将需要做分析的两个度分别作为横纵坐标,通过阶梯的阈值颜色将对应交叉度的取值展现再坐标。我们便可非常直观的看到这这两个度对于整个业的影响情况,如下图所示: 我们可以看到,从纵向的分模块度,可以看到Module 4在多个机房都有明显的访问拒绝情况,而在横向分机房度,则没有明显的特征。则说明是Module 4模块导致的问题。 嵌度下钻分析 类似于国家-省份-城市的行政区域划分,区域-机房-机器的部署划分,我们可以看到很多度之间存在着层次嵌的关系。
TOP