关于 重庆小姐有真正服务〖8843O306VX〗服务真实职匠由蓝世 的搜索结果,共1231
h****e 2018-07-10
程序:我从哪里来?
通过部署在机器上的客户端感知到例的状态变化(比如例状态0变成-1,即常变成非常),并将数据同步到系统中的分布式缓存,上游模块可以通过查询redis.noah.all的例状态结果,主动过滤非常的例,也可以在BNS系统中发起屏蔽故障例的操作,在查询过程中会自动过滤该故障例。 在下一节中将具体介绍BNS系统的整体架构。 基本架构 BNS系统主要包含几个部分:流量接入层,Web Server,存储层,代理客户端。 作为一个底层的基础,BNS系统每天的访问量近千亿次,这对系统的可用性提出了很高的要求,因而系统需要在各个层面完善的容灾能力和流量管控能力。 1流量接入层 系统通过HTTP接口对外提供变更,用户通过Web页面或者接口进行例信息注册。为了保证平台稳定和安全的运行,需要对非法和异常请求进行拒绝,在流量接入层(Proxy)端提供了以下两个功能: 流量鉴权:每一个组、单元、例的注册都需要进行权限验证,用户只申请了合法的Token才能允许访问,另外系统还提供了白名单等其他的鉴权方式。
w****0 2018-07-11
单机房故障自愈-黎明之战
那么如何验证业线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同业线故障情况及止损效率,并给出相应的优化意见。 根据业线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、效果等方面权衡,将盲测分为三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测业可根据监控数据决策流量调度目标,对于业际无影响,主要验证故障处置流程是否符合预期、入口级流量切换预案是否完整。 提前通知损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对业损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知业盲测时间和可能的影响,业线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知损盲测:在各业线单机房容灾能力建设完成后,进行不提前通知的损盲测,对业来说与发生故障场景完全相同。验证业线在单机房故障情况下的止损恢复能力。 单机房故障止损流程 一个完整的故障处理生命周期包括感知、止损、定位、分析四个阶段。
M****点 2018-07-10
中国云计算现状——产品篇
CDN是最早出现也是最成熟的云计算,它下列迷人的特点给云计算行业的未来立下标杆: 客户没学习成本,肯付费、懂IT常识就能接入,所客户都认同使用CDN能节省成本提高质量。 客户没对接成本,可以随时更换其他云厂商,或默认即使用多个云厂商,普通项目不需要高级售前、解决方案和质性定制开发。 客户只关注价格和质量两个维度,不用承担太多选型责任,大不了切走就行,甚至专门的中立CDN监测的平台。 虽然业内对CDN生意评价不高,认为这就是卖资源,但每个云平台都将CDN收入列为要单项,成熟的模式催熟了巨大蛋糕。 关于Serverless的介绍,我建议大家搜一下ZStack张鑫的那篇文章。Serverless的之处在于要求程序为自己进行改造,其他强调按需付费的计算只是快速释放资源的把戏,Serverless才是的计算能力集装箱,未来计算场景下的CDN。 三、SaaS产品 其SaaS产品和狭义的云计算没一毛钱关系,广义的云计算连设备租赁和人员外包都能算进去吹水框架,自然也给SaaS云预留了位置。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方式中,于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭州电信接入故障,中断时级别 2017年1月某业天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。
h****8 2018-07-10
能力比梦想更要——企业级难寻产品经理
个人产品经理是一个需要梦想和热情的业,但在政企和工业级IT领域,能力比梦想更要。 本文是想说清楚,政企和工业级软件领域,能力比梦想更要,个人产品经理来到这个行业就会被秒成渣。如果一个企业要招产品经理,要知道这个行业哪些难点痛点,需要什么样的产品经理(其是软件和设计师)。 1. 需求拆解的能力 个人产品经理在设计一款APP时,是可以用生理上的主观感受给产品打分的。但是让一个产品经理来设计个流水线自控系统,他的主观感受并不要,必须用技术和业能力将客户需求描述和引导。某些产品经理因为自己毫无感受憋不出词来,就把客户的要求当做圣旨跪拜,这不仅是吃里扒外,还是会搅黄项目的搅屎棍。 要拆解客户的需求,必须技术上能跟客户做平等对话,业上了解客户工作流程,还要理解大型客户内部的利害关系,不能靠“视察”客户会议室装专家上宾,也不能像外行一样凡事都跪问客户。 我举第一个例子是很多系统都监控,监控系统的产品经理要完成下列工作才合格: 技术:产品经理对“check tcp 80”和“check http 200”这类业术语没概念,需要客户被坑一次骂一次才能改一点点。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
每次执行时,单机agent会从插件集群下载最新MD5,如果变更,将新下载最新插件进行任的执行。这种设计形式增强了执行端功能的可横向扩展性,并且极大降低了每次自身升级的成本。每次升级只需更新一个集群的插件代码,在全部机器上即可生效。 总结 百度部署经历了手工上线- Web化- 开放化一系列发展进程,目前在向智能化逐步发展。Archer作为开放化一代的运维产品,在百度内部具极高的使用率。期待本文的介绍能为您提供一些思路,也欢迎同行们与我们进行交流,共同促进AIOps的发展!
s****d 2018-07-11
亿元级云用户分析
单纯靠销售搞不定亿元采购决策人,亿元大项目必须是高层互访合作,最终敲定合作的原因的就这几种: 一把手政绩工程 战略投资的附加条件 海量或结构性压缩成本 生态圈陪玩的附加条件 高层利益互换 高级IT人力外包 业采购决策人只能敲定项目可以开始,但不保证落袋为安,IT方案决策人和技术执行人员同样要。 2.2 IT方案决策人 从CTO/技术VP到权总监,业决策人选择云厂商,而IT决策人可以否决候选厂商。他们要考虑公司总体利益,比如云厂商的技术梦想是否辱智商,超低资源报价是否可行性,生态合作是否伏笔暗枪等等。IT决策人要度考量IT部门利益,这就是云销售和售前的工作点了,售前和销售要安抚IT决策人的顾虑,尊客户IT部门的权益: 业方案的IT可行性 新架构带来的新责任 新项目带来的新权益 云迁移的隐性成本 技术锻炼的团队收益 新愿景带来的团队增效 工作量转移的减员压力 IT方案决策人明确项目的过程、执行人和验收标准,但从云供应商角度看,搞定方案决策人是项目式启动,不代表项目能完成验收。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
三、确的时间是向量 Linux环境下两个常用工具,NTPD和ntpdate。NTPD是一个时间同步,ntpdate是个时间同步命令。很多工程师都会采用Crond+ntpdate的方式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,大部分人没做好为ntpdate这个动作负责。 常的时间是个持续增长的向量,即老时间t1肯定于新时间t2,新时间t2也于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,大部分业对系统时间是盲目信任,不相信t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和业安全性,甚至部分程序崩溃的稀里糊涂。
流****水 2018-07-11
度云企业级运维平台——NoahEE
不同角色(责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE通过故障自动发现与工单流程解决了上面的问题。系统自动探测故障放入故障池,并建立故障工单,相应的人员进行操作。另外,NoahEE提供了不同的工单流程覆盖了日常机房运维中的操作,从设备采购入库、上架、机架变更,直到设备下架、出库全生命周期覆盖,做到所运维操作记录可追溯。了资产管理,运维人员可以在器完成入库、上架工单后即可在管理中看到该器并进行管理,无须任何其他操作。一图胜千言,我们看看资产管理的特点: 图3 资产管理 部署管理 应用部署一直是运维工作中的点,一般来说,我们面临的问题: 批量部署难,怎样定位目标机器?如何快速部署? 灰度测试难,怎样通过灵活的部署方式,先进行流量线上测试,待效果达到预期后再扩大部署? 回滚难,发现问题后怎样回滚? 上面的第一个问题,际上在管理中已经解决了,也就是说管理帮我们完成了资源定位工作。其他的问题,NoahEE的部署管理模块通过“分级发布”来解决。
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因为卡得一匹。
小****园 2018-07-10
让PB级云存储不再神秘
要去的文件就是那些电影,随着版权保护的加深,电影只存原片盗版减少会是趋势,其他文件即使做切片去,命中率也非常低。我们提供hash值让客户判断该不该删文件,该不该做文件映射就够了。 长周期软硬件换代 对象存储是付费企业级,并不是终身免费但匆匆关张的个人网盘。我们必须考虑十年为刻度的长周期维护问题,某种硬件停产了怎么办,假设系统内核停止维护怎么办?我强烈反对极端优化单点性能,就是因为单点性能极限优化必然和硬件、内核、文件系统都深度关联。我推荐存储主力是应用层用户态进程,老中青三代器和谐运行,群集性能瓶颈本来就不在单点,不要给自己的软件无故设限。 冷存储问题 冷存储分冷和低温两种类型,冷存储就是用磁带、光盘、可离线存储节点来存储数据,这样可以节省机柜电量,但这是个工程学问题不是计算机问题了。低温存储就是标准存储换更大更慢更省电的磁盘,通过硬件选型来降低硬件和机柜成本。 5、存储测试标准 前文我大量篇幅介绍对象存储和传统存储的不同,如果搭建一个私对象存储群集,我们该做的测试也要贴合场景。
双****4 2018-07-11
【杂谈】猎场没那么精彩--还原的猎头
第四点,猎头不会固执于一个项目,猎头不会跟候选人强推意向单位的宏大图,因为候选人本人也是业内专家不用猎头来教;更不会向甲方强推候选人,面试官眼拙运气差那就只能认栽,本公司bHR都无法说得的面试官,外部猎头能说什么?而且稀缺人才总是供不应求的,转手把这个人卖给别的公司或者别的猎头一样能拿佣金 第四部分.如何识别资深还是新手猎头 面试者来看资深猎头和新手猎头是很容易区别的。 新手猎头只会看你的履历里几个技能和位的关键字,除此之外一个字都不懂;资深猎头眼睛脑子,会分析和询问你的简历。 新手猎头对位的解析和路人甲没什么区别,只会强调待遇、级别和公司是名企;资深猎头可以说明这个位在该企业内是具体做什么的,多大要性。 新手猎头是撒网炸鱼,对每个面试者没花时间也并不热心;资深猎头为了一次面试准备了超过水货同行十倍的时间,催面试反馈她比你还着急。 当遭遇面试失败,资深猎头能要到失败原因通报给候选人,而新手猎头不关注面试失败原因,用人部门给的失败原因都是敷衍套话。 也一部分猎头会和优质候选人保持长时间关系,但这太费时间了,猎头五年内给同一个候选人介绍两次工作的几率在是太了。
w****t 2018-07-10
AIOps中的四大金刚
在传统的自动化运维体系中,复性运维工作的人力成本和效率问题得到了效解决。但在复杂场景下的故障处理、变更管理、容量管理、资源过程中,仍需要人来掌控决策的过程,这阻碍了运维效率的进一步提升。而AI方法的引入,使得机器能够代替人来做出决策,从而让意义上的现完全自动化成为了可能。 在AIOps的落地施过程中,最关键的因素还是人,即AIOps的建设者们。 AIOps作为一个全新的技术发展和应用方向,并不是简单地说具备某一种技能或招募一两个大牛就可以完成的,它需要不同角色、多个团队的配合才可以达成。根据近几年来整个业界对AIOps的理解和践,AIOps参与角色的划分也越来越清晰。在百度4年的AIOps践中,我们总结得出了如下四种不可或缺的角色: 运维工程师 运维研发工程师 平台研发工程师 运维AI工程师 可以看到,除了运维AI工程师外,其他角色并不是AIOps产生之后才出现的,他们在传统运维中也发挥了要作用。我们今天主要想和大家探讨一下,在AIOps时代,他们的责究竟发生了哪些变化。为了方便大家理解,我们会基于百度AIOps的践案例,来进行具体说明。
布****五 2018-07-10
如何执行一条命令
部署过程可以拆解为两个的步骤,一是新软件包的上传,二是进程的新启动。进程的新启动不必多说,软件包的上传可能多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维过程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的时信息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,一种是通过业软件提供的接口直接读取状态数据,另一种是通过日志/进程状态/系统状态等(如使用grep提取日志,通过ps查询进程状态,通过df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量器上执行命令并收集结果”这一基础能力,这也是今天我们的主题“如何执行一条命令”的意义所在。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维位展望
生产领域的公司因为运维涉及到在在的钱,所以运维人员待遇高(都是专技术难培养)、做的事情少(自发做事多了会出错,不如找厂商技术支持),只是跳槽的难度比通用运维要大一些(都是专技术不通用) 4、彻底转型,做和计算机无关的工作;选这条路的人一部分是自己大觉悟或巧机缘,但另一部分人是的适应不了环境变化,希望各位不要被淘汰掉。 最后总结一下,云计算是不可阻挡的历史趋势,它还给了运维五到十年的时间去修自己的场规划,我们可以顺势而为也可以激流勇进,但不可得过且过随波逐流最终。 天行健,君子自强不息。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
个客户非常信任某个云销售,他告诉该销售,虽然某大云高层合作,某大云也说报价肯定比某云低5%;但是某大云的机制问题,出故障从来都是衙门话,每次故障都要客户去乱猜和背锅。最终这个单子在客户执行层的暗助之下,该云快速把业切过来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和大客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。面对意外故障,我们信心向客户证明,换了其他厂商也一样会挂;面对人为故障,踏认错是对客户的最后尊,而公开事也是逼着内部不会蹈覆辙犯同样的错误。 过去大家卖IDC、CDN、器和软硬件积累的个人商誉,是可以应用到云计算领域的。而云的高科技光环褪去、产品同质化以后,企业的核心竞争力仍然是商誉的销售-售前-售后团队,这类人才永远是稀缺资源。 附录 请各位多琢磨评估本厂的云到底哪些组件是靠谱的,不要让信赖你的客户受伤又受骗。
TOP