关于 容红小妹上门全套服务【薇V:78792796】福州水部一夜情按 的搜索结果,共1568
疏****月 2018-07-09
线Archer | 百度持续署的瑞士军刀
干货概览 业署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的下,让数据自动生效》中专讨论过)。般的业线具有不定时操作、业况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了线署系统——Archer。Archer致力于提供产品线过程的可迁移发布解决方案,实现键完成机器初始化、署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流线作业中,Archer可以作为个环节结合进整条测试发布流线中。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的分布式的名字系统,是百度云Noah智能运维产品中的个重要基础系统。它为每赋予个独无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息包括:在机器署信息(机器IP,署路径,配置,端口信息),的实例运行状况等其他重要信息。简单来讲,它提供了名到资源信息的个映射关系。
p****d 2018-07-11
单机房故障自愈--运维的春天
【解决方案】 基于位的动态均衡 在流量调度时,对于量不准确存在的风险,我们划分两条量警戒线。 安位线:流量处于在安线以下则风险较,可以步进行切换。 限:该位线表明的最大承载能力,旦流量超过故障位线,很大概率会导致量过载。 如果安位线提供的量不足以满足止损,那我们期望使用两条中间的量buffer,同时流量调度过程中进行分步试探,避免次性调度压垮。 基于快速熔断的过载保护 在流量调度时,建立快速的熔断机制作为防止过载的最后屏障。旦出现过载风险,则快速停止流量调度,降低次生故障发生的概率。 基于降级功能的过载保护 在流量调度前,如果已经出现对应机房的量过载况,则动态联动对应机房的降级功能,实现故障的恢复。 2业线止损策略需求差异大 【问题描述】 我们实现了基础的单机房故障流量调度止损算法,但在分业线中仍存在较大的需求差异,比如: 分步动态调度需求:业存在充Cache的况,过程中能力降低,需要控制切换速度。
w****0 2018-07-11
单机房故障自愈-黎明之战
干货概览 在故障自愈机器人,保你安心好睡眠文中,我们介绍了单机房故障自愈的必要性和解决思路。本文主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统前端(BFE)和百度名字(BNS)的流量调度能力 单机房灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有个实例或者多个实例署在同物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 在大型互联网公司中,单机房故障因为其故障时间长、影响范围大,直是互联网公司运维人员的心头之痛。在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了方位故障发现能力,基于百度统前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。同时,基于实时量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。
y****i 2018-07-11
器云的最佳用户
前言 我直瞧不器厂商的企宣话述,连带着看轻了器技术;但器技术是有价值的,器编排技术更是片大好的发展方向。 我很讨厌这些电线杆广告的宣传方式:可以实现弹性伸缩、自动化运维、持续交付、微、秒级署、高强度灾、多版本控制等功能,从而改善和解决复杂的IT应用场景。事实是使用者自己设计维护可以弹性伸缩、自动运维、灾冗余的程序,无论是用物理机、虚拟机还是器(进程),本来能弹性的还是能弹性,没灾的还是在赌命。 合格的架构和运维都瞧不这些废话,因为十年前我们用裸机就能实现这些功能了。但世没有那么多合格的架构师,云计算要解决的就是缺人的问题。最早的云主机也是类似夸张无赖的宣传,我第眼看云主机也觉得是个噱头,这些遗毒至今还在误导客户。本文是为说清器的能力特性,我们该如何用好器编排系统。 器的基础特性 器和虚拟机都属于IaaS云的范畴,申请资源量付费,不关注客户业逻辑和访问频率。器只是隔离出个进程,而虚拟机是模拟了操作系统,这是双方的本质区别。
流****水 2018-07-11
度云企业级运维平台——NoahEE
图胜千言,我们看看资产管理的特点: 图3 资产管理 署管理 应用直是运维工作中的重点,般来说,我们面临的问题有: 批量署难,怎样定位目标机器?如何快速署? 灰度测试难,怎样通过灵活的署方式,先进行流量线测试,待效果达到预期后再扩大署? 回滚难,发现问题后怎样回滚? 面的第个问题,实际管理中已经解决了,也就是说管理帮我们完成了资源定位工作。其他的问题,NoahEE的署管理模块通过“分级发布”来解决。在署管理模块中,我们可以方便的定义并发度、署步骤、影响范围以及暂停操作等,在署的过程中发现问题即可暂停并回滚至之前的状态。除了署等操作,署管理模块还提供了批量执行命令等操作(比如批量启停某)。如图来总结署系统的能力: 图4 署管理 监控管理 在任何工作里,信息掌握的面与否往往关乎到工作的成败。“知己知彼百战不殆”这句话说的就是这个道理。运维工作中,监控系统就是这个让我们做到这点的关键。软硬件是否工作正常,出了问题是否能及时发现与报警,甚至是对异常事件等进行提前预测,都仰仗监控系统。
若****客 2018-07-10
IT架构的本质--我的五点感悟
2.群集设计通用规则 前端复制后端拆,实时改异步,三组件互换 前端复制后端拆,实时改异步,IO-算力-空间可互换——要做架构就要群集,而群集设计调优翻来覆去就是这三板斧: 前端是管道是逻辑,而后端是状态是数据,所以前端复制后端拆。前端器压力大了就多做平复制扩,在网站类应用,无状态-会话保持-弹性伸缩等技术应用纯熟。后端要群集化就是多做业拆分,常见的就是数据库拆库拆表拆键值,拆的越散微操作就越爽,但局操作开销更大更难控制。 实时改异步是我学的最后IT技术,绝大分“实时操作”都不是业需求,而是某应用无法看到后端和Peer状态,默认就要实时处理结果了。CS模式的实时操作会给支撑带来巨大压力,Peer合作的实时操作可能会让数据申请方等宿。架构师将个无脑大事拆分成多个,这就是异步架构,但拆分事就跟拆分数据表样,拆散的需要更高业层级局事保障。 在群集性能规划中,网络和硬盘IO+CPU算力+磁盘和内存空间是可以互换的,架构师要完成补不足而损有余的选型。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
云计算历经多年发展,从最初的概念模型,到被大众熟知,再到现在行业拥抱云,取得了巨大的进步。云的主要客户已从最初的中初创公司逐步渗透到各行各业的大型企业。可以说,企业云已是企业发展的必由之路。分数据敏感的企业结合自身数据的安性、所有权和控制权等综合因素考虑,会选择搭建自己的私有云或者混合云环境。 但是在述环境中,用户的机器都需要自行管理,这就必然给云运维人员带来很多意想不到的麻烦。 其实我们面临的问题从来就没有什么大的变化,唯不同的只是机器规模越来越大,人心越来越复杂。 Q如何在1台机器署基础设施?A 切都源于那个亘古不变的道理:扔个文件到机器,然后跑个命令。 Q如何在10台机器署基础设施?A 写个for循环搞定。 Q如何在10000台机器署基础设施?A 这个也好办!定制操作系统镜像CUSTOM.iso装机自动化安装! then…… Q如何快速升级所有机器的基础设施? Q因异常挂掉,能自动重启保活吗? Q公司做活动,预计流量突增,能扩吗? Q公司活动结束,为节约成本,能缩吗? Q新开发的基础设施有问题,能立马回滚吗?
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD是个时间同步,ntpdate是个时间同步命令。很多工程师都会采用Crond+ntpdate的方式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是个体系化的,而ntpdate只是个动作,大分人没做好为ntpdate这个动作负责。 正常的时间是个持续增长的向量,即老时间t1肯定于新时间t2,新时间t2也于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,大分业对系统时间是盲目信任,不相信t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和业性,甚至分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目信任;假设个根NTP不稳定,所有的器获得了错误的时间,虽然现在业层可以包异常,不会出现算出负利息或倒扣费的况,但业混乱是免不了的。
s****d 2018-07-11
亿元级云用户分析
3.2 CDN和带宽池 CDN和带宽池不同于器硬件,其原始资源是相对稀缺死板的广域网带宽,其交付的资源是持续不断的,所以资源署比较慎重但客户流动成本较低。制约客户量迁移的是厂商的承载能力,而挖角和反挖时刻都在细长流。CDN和带宽池首先考察的是企业内功,有没有廉价海量资源;再考验销售内协调能力,能不能把好资源好价格抢到手里;而盯客户的路和百万级销售类似,工作力度加大三五倍而已。 3.3数据存储池 数据存储池是很难年均摊营收亿的,但定个1000万的目标是能实现的;如果有1000万的非冷备存储池,那很易带来数倍数十倍的计算和带宽消费。存储资源是大订单曲线突破的好选项,还是AI和大数据项目的基石,我们和客户讲的是有技术含量的故事,需要精英售前给销售做幕后军师。 配图说明:谁掌握了数据,谁就掌握了真理 3.4人力资源池 亿元项目不可能是客户自助实施的,人力营收占比很低但画龙点睛,可能会干掉纯卖资源的友商,也可能晚交付半月就亏损千万。
TOP