关于 昆明丰宁找妹子服务同城〖10669708薇信〗 的搜索结果,共878
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个的实例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署息,怎么办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署实例有一个出现故障了,我想对下游屏蔽该故障实例,怎么办? 下面以一个简单的例来说,假设一个模块名是Server,它的上游是Proxy,下游是Redis,当出现变更或者故障时,如何让上游感知到呢? 当新增上线实例、下线摘除实例或者实例发生故障时,BNS系统通过部署在机器上的客户端实时感知到实例的状态变化,时新增和删除实例的变更情况会立即步到分布式的缓存系统中,这样用户通过一个BNS名字就可以感知到下游的实例变化。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD是一个时间,ntpdate是个时间步命令。很多工程师都会采用Crond+ntpdate的方式步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,大部分人没做好为ntpdate这个动作负责。 正常的时间是个持续增长的向量,即老时间t1肯定小于新时间t2,新时间t2也小于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,大部分业对系统时间是盲目任,不相t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和业安全性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目任;假设一个根NTP不稳定,所有的器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的情况,但业混乱是免不了的。
追****圣 2018-07-11
给书记省长讲清楚云计算
综上所述,云计算就是将分散在各个公司的息技术资源汇聚到一个大平台,其兴起始于需求扩大而人力短缺,其未来发展趋势是通过规模经营和数据共享,成为新型息化社会的技术基石。 云计算如何带动地方经济 云计算落地是要自建数据中心机房,我们一般称之为云基地,云基地在经济利益和社会影响上和传统工厂并不相。云基地通俗易懂的展现形式就是开启数十万个高速运转的电脑铁皮箱,但这些电脑不用接显示器也不用人员现场操作,只要这些电脑能开机能上网就能对外。云基地和数字地产不完全相,数字地产只装修好房,云基地关注用这些房做什么。 云基地是无烟工业,并不需要雇佣大量人口,对直接促进就业帮助不大;但云计算没有实体矿产投入和物品产出,只需要大量电力启动电脑也不会产生大量污染。 云基地像电视台和号塔一样,通过产生和扩散数据息对客户提供,这些息的传输没有物流成本,光速直达全球每个角落。 因为云基地全球客户,所以云基地可创造极高的营收,但不能简单的计入地方政府的GDP。一个耗电三千瓦的机柜加附属空间占地5平方米,如果云计算资源全部售出,每年可产生20万元以上的营收。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12小时 2016年5月某公司杭州电接入故障,中断小时级别 2017年1月某业天津机房故障,数小时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。
w****0 2018-07-11
单机房故障自愈-黎之战
要求:将拆分为若干不的逻辑单元,每个逻辑单元处于不的物理机房,均能提供产品线完整。 3.不满足N+1冗余 描述:任意单个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房过载,造成多个机房故障,造成更大范围的影响。 要求:容量建设需要对于每个逻辑单元都要有确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,时需要保证变化时及时更新数据和扩容,避免容量数据退化。时对于流量的变化趋势,也需要有提前的预估,为重大事件流量高峰预留足够容量(如节日、运营、假期)。 4.关联强耦合 描述:上下游使用固定IP或固定机器名进行直接连接。 问题:单机房故障发生时,关联的上下游之间无法进行快速的流量调度止损。 要求:线上关联不允许使用固定IP或机器名链接,需使用具备流量调度能力的上下游连接方式以实现上下游依赖解耦,下游发生单机房故障,可以快速调整路由比例实现止损。 单机房容灾能力--盲测验收 完成以上四点单机房容灾能力建设后,业线就具备了通过流量调度进行止损单机房故障的基本条件。
M****H 2018-07-11
故障定位场景下的数据可视化实践
基于上面的需求,可以总结为以下三个定位的层次,从整体到局部逐步缩小故障范围,到故障根因: 全局问题定位:快速确认线上状态,缩小故障判定范围。为可能的止损操作提供判断依据。本文会介绍如何构建一个全景分析仪表盘。 细分维度定位:通过分析地域、机房、模块、接口、错误码等细分维度,进一步缩小问题范围,确定需要排障的目标模块、接口等。本文会介绍如何基于多维度数据可视化解决维度数量暴增带来的定位难题。 故障根因确认:一些情况下,问题的根因需要借助除监控指标之外的数据进行分析。例如上线变更、运营活动导致的故障。本文针对导致故障占比最高的变更上线类故障进行分析,看如何快速到可能导致故障的变更事件。 全景掌控缩小范围 对于一个乃至一条产品线而言,拥有一个布局合理、富的全景监控仪表盘(Dashboard)对于状态全景掌控至关重要,因此在百度智能监控平台中,我们提供了一款可定制化的、组件富的仪表盘。 用户可以根据的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据息。
流****水 2018-07-11
度云企业级运维平台——NoahEE
管理 我们首先介绍管理是因为管理是整个运维工作的基础,也是NoahEE这个平台上各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是一个“量”,或者说“规模”的问题。在早期业较为简单时,一个可能部署在几台甚至一台机器上,进行变更等运维操作简单直接,登录到机器上人工操作就好了。随着业的发展,分布式应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的学来说,关注点是语义确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不部门(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本上升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。
s****d 2018-07-11
亿元级云用户分析
降低成本:客户最直观的诉求,或者削减IT预算,或者等预算下支撑更多的;其他客户诉求都难以清晰描述,唯独成本可以看发票和合确责任:客户不想承担各个IT系统的衔接和选型责任,相比软件厂商和系统集成商,云厂商的责任覆盖范围会更广泛一些。 收拢数据:上云本身并不碰业数据,但上云是很好确业数据存储位置的机会,上云业改造是规范数据结构的理由。 求新图变:企业客户在气势如虹时要居安思危,在困境危难之中穷极思变,IT技术是企业的潜在增长点甚至退路。 本文讨论的是有模糊度和利润空间的云计算项目,CDN和IDC资源可以用做计收载体,但不能做为上云目的分析。亿元以上的器、CDN的订单很多但既无技巧也无利润,这些资源厂商也在跟云厂商学习如何包装项目。 2.客户角色利益分析 大企业多角色之间的利益诉求不,所以表现形式也不。我将客户三大角色列出来讨论,销售-售前-项目经理铁三角组合确客户的诉求,才更好游刃有余的客户。 2.1业采购决策人 企业里CEO/COO/CFO或实权VP,他们不关注云产品云技术,更关注业上的求新图变,互联网决策人还会敏感IT成本。
无****禾 2018-07-11
云客户需求引导管理--实战型IT太极拳
客户技术工程师认让最终用户学采用LB加多台虚拟机,比改QoS和停机加网卡更可靠。但最终用户愿纠缠客户技术人员也懒得学如何用LB,我给支招说我们的操作人日免费送,但硬件改造成本有20万,问这用户只是想试试还是改完网卡就能付费。最后该用户果然只是想试试,我们和客户技术部门都躲过一场折腾。 案例2.有个IDC新上线一套外售型私有云,运营负责人第一次操盘公有云心里痒痒,总是提需求但总被我拒绝。他想开放注册并给新用户大量赠额,而我跟他聊运营数据,让他意赠送小用户并不能带来多大收益。他说在主机和网络性能测试没友商好,我跟他说权威测试方法和意义,让他相友商性能比他好就是作弊或者烧钱。他想不客户不产品给不折扣,我们研发人员半年内没这个排期;我们已经有充分的任,我就直接告诉他我做不过来,给用户充值后赠送样可以达到折扣效果;给云资源做独立折扣我们要收开发费用,而且这不是强需求。(这些运营问题都是2015年的,可能略有老化) 案例3.客户被集团的云计算公司的欲哭无泪,我们接盘时提了一大堆需求,我样是拒的比接的多。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
Archer的配置文件路径、的启停脚本及运维命令具有固定的标准并且支持定制化,使用Archer进行部署的具有统一的包结构; 支持分级发布,及时拦截部署引入的线上故障 针对分级发布的使用场景,Archer支持串并行上线及暂停点功能,可按照单实例、单机房、单地域等级别设置暂停点,并支持部署过程中进行暂停、继续、重试、撤销等操作; 业的多地域部署 的多地域部署主要需要解决不地域配置不的问题。Archer提供了配置派生功能以支持多地域部署的场景。Archer支持在一份配置文件中设置配置变量,并在特定地域(机房)中生成特定配置值; 多种网络环境及大包部署 针对多种网络环境及大包部署的使用场景,Archer提供了部署数据中转传输。采用中转的上线在发起任后,部分代码将首先被转存至中转机上。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
最终这个单在客户执行层的暗助之下,该小云快速把业切过来并坐实站住了,这份暗中相助就是靠个人商誉带来的任。 我和大客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。面对意外故障,我们有心向客户证,换了其他厂商也一样会挂;面对人为故障,踏实认错是对客户的最后尊重,而公开事实也是逼着内部不会重蹈覆辙犯样的错误。 过去大家卖IDC、CDN、器和软硬件积累的个人商誉,是可以应用到云计算领域的。而云的高科技光环褪去、产品质化以后,企业的核心竞争力仍然是有商誉的销售-售前-售后团队,这类人才永远是稀缺资源。 附录 请各位多琢磨评估本厂的云到底哪些组件是靠谱的,不要让赖你的客户受伤又受骗。如要学习云计算相关知识,可以多关注我往期云计算文章,比如说 云计算最重要的工作是配合销售和客户:云客户需求引导管理--实战型IT太极拳 中国云计算现状系列汇总: 做云计算要花哪些钱,请看第一篇成本篇,原创链接。
p****d 2018-07-11
单机房故障自愈--运维的春天
自愈方案通过抽象、规范处理流程实现单机房故障自愈的自动化,即将止损过程划分为统一的感知、决策、执行三个阶段;时通过运维知识库解决基础数据、基础设施差异化问题;通过策略框架支持智能化异常检测、策略编排、流量调度问题,时支持用户自定义策略需求。实现单机房故障自愈的标准化、智能化。 在单机房故障自愈--黎之战提到的百度网络与业架构情况,我们将整体流量调度止损架构拆分为3层:接入层、层、依赖层。 针对这3层的监控感知、止损决策与故障止损方式的不,将止损自动决策拆分为外网止损自动决策与内网止损自动决策。 外网止损自动决策:覆盖接入层。基于外网、内网监控号;触发外网止损决策器进行止损决策;执行DNS流量调度止损。 内网止损自动决策:覆盖层、依赖层。基于内网监控、基础监控、业监控提供的故障号;触发内网止损决策器进行止损决策;执行流量调度、主备切换、弹性降级等止损操作。 单机房故障自愈的常见问题和解决方案 传统的流量调度自动止损方案存在如下问题: 1容量风险控制能力不足 【问题描述】 传统流量调度的模式有两种:固定比例模式与容量保护模式。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
那是在更早的版本GRUB程序读不了GB级磁盘分区,没办法加载vmlinuz内核,现在已经只是一个迷而已。 5.内核启动加载驱动,但这还没触及任何业。 不硬件一个版本的vmlinuz内核hash值是相的,因为驱动息放在initrd*.img里。Initrd*.img是一个精简但带了所有驱动的linux镜像,一般系统安装完之后自动生成,也可以事后手动生成。 曾经某偏门软件推荐用集成镜像安装,装完了就是起不来,我把内核版本、硬件配置的init*.img替换以后系统就正常启动。 Kernel加载了所有驱动后就会卸载initrd*.img,早期linux版本在系统启动过程中还能看到很多“umount filesystem”的提示,那不是卸载正式文件系统,而是卸载了initrd*.img这个迷你系统, 6.Init进程启动,正式启动。 从看到“Welcome use CentOS”的彩色欢迎文字开始,init已经启动了。 在这之前的启动过程也就读取BIOS/MBR/GRUB和/boot分区,现在终于开始读/etc目录的配置文件了。
TOP