关于 达州找上门小姐包夜〖8843O306VX〗服务真实问胰文蓝蹲 的搜索结果,共1187
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个题。 题 1.我是谁? 叫什么,含了哪些例,规模、部署情况、例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的题,我们的答案是什么呢? 在百度的运维践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一套分布式的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息括:在机器部署信息(机器IP,部署路径,配置,端口信息),例运行状况等其他重要信息。简单来讲,它提供了一个名到资源信息的一个映射关系。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
Archer的配置件路径、的启停脚本及运维命令具有固定的标准并且支持定制化,使用Archer进行部署的具有统一的结构; 支持分级发布,及时拦截部署引入的线故障 针对分级发布的使用场景,Archer支持串并行线及暂停点功能,可按照单例、单机房、单地域等级别设置暂停点,并支持部署过程中进行暂停、继续、重试、撤销等操作; 业的多地域部署 的多地域部署主要需要解决不同地域配置不同的题。Archer提供了配置派生功能以支持多地域部署的场景。Archer支持在同一份配置件中设置配置变量,并在特定地域(机房)中生成特定配置值; 多种网络环境及大部署 针对多种网络环境及大部署的使用场景,Archer提供了部署数据中转传输。采用中转的线在发起任后,部分代码将首先被转存至中转机
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致题扩大。 为了解决这类题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭电信接入故障,中断时级别 2017年1月某业天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。
w****0 2018-07-11
单机房故障自愈-黎明之战
干货概览 在故障自愈机器人,保你安心好睡眠一中,我们介绍了单机房故障自愈的必要性和解决思路。本主要介绍单机房故障自愈前需要进行的准备工作,具体括: 单机房容灾能力建设中遇到的常见题及解决方法 基于网络故障及业故障场景的全面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一个例或者多个例全部部署在同一物理机房的程序模块即为单点。 题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来全局性影响。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的题。百度对于这个题给出的答案是,必须先要解决资源组织管理题。简单的说,管理要解决的最核心题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的题 在管理这个地基打好后,我们再来回顾下面的例子。这个例子中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件成时报警。管理通过对资源合理的组织,极大的简化了运维操作,提升了运维效率。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
附录2:网到一个写NTPD和ntpdate的水和本内容有些类似,那个是我多年以前写的,不是借鉴和抄袭,严肃脸。
小****园 2018-07-10
让PB级云存储不再神秘
云存储不能违背商业的本质,甲方没蠢到敢让乙方赔钱做,但采购决策层更喜欢看谁的报价最低。数十PB的数据云后基本下不来,平台方无论是提价还是降速,有的是追加预算的手段;如果对方是赔本卖吆喝,成功了就会甩开这个袱,失败了就直接倒闭。我谈PB级存储项目时,我很愿意分享不同底层技术带来的际成本构成,为什么同样的价格我们还能挣钱而友商已经在贴钱,相关内容会在第四章节详细说明。 成功案例是很重要的决策依据,但这个依据很难考证性。厂商做过PB级项目但其是一群TB项目做的计费融合,厂商确做过数百P的项目却和标准对象存储功能不通用,这类事情太多了,对象存储合同不会有总容量,发票存根也只是简单的信息费。客户的成功案例必须是单一命名空间容量到PB级别,并简要说明件数量和主要读写场景。考察案例性的方法主要靠听对方能否自圆其说,甚至让多个厂商当面质疑,能逻辑自治的厂商终归还是靠谱一些。 大客户对云端数据的处理的要求比中客户更简单,因为复杂业功能可以自己做,还可以要求厂商为自己做定制开发。
布****五 2018-07-10
如何执行一条命令
部署过程可以拆解为两个的步骤,一是新软件传,二是进程的重新启动。进程的重新启动不必多说,软件传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维过程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的时信息(前期章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储题而研发的)。监控数据的来源主要分两种,一种是通过业软件提供的接口直接读取状态数据,另一种是通过日志/进程状态/系统状态等(如使用grep提取日志,通过ps查询进程状态,通过df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量执行命令并收集结果”这一基础能力,这也是今天我们的主题“如何执行一条命令”的意义所在。
M****点 2018-07-10
中国云计算现状——产品篇
先说IT咨询,过去云计算平台吸引到的都是成本敏感的游戏客户或者技术优先的创业客户,这两类客户都不会为一时一千元的咨询付费。现在高净值客户放出来的云计算咨询标了却没人投标,因为型云计算企业因为资质、高层合作、客户关系等原因没有投标的机会。 我们经常遇到咨询标,但我们也不想投这个标。咨询标的交付物就是各种档和报表,互联网公司的技术积淀都在技术部,技术人员最烦的就是写档,而且技术人员匮乏的想象力和沟通能力并不适合做咨询标,让售前承担技术档书写也扛不住。传统IT外企做云IT咨询流程题,但技术水平太差,也不被政策扶持。此外还有个哈哈哈哈的大杀器让我们不能投咨询标,投了咨询标就不能投施标了,施标的金额要比咨询标大很多。 到了施阶段,其矛盾和咨询标差不多,既要干活又要写档,而且验收者并不专业,施工作有传统厂商会抢着压价,还会有各种意外拖进度抢进度,各互联网企业的施团队根本支撑不下来。传统厂商虽然压价抢标,但他们要是有能施云计算项目的人才,互联网公司加价三倍挖走谢谢。
M****H 2018-07-11
故障定位场景下的数据可视化
基于面的需求,可以总结为以下三个定位的层次,从整体到局部逐步缩故障范围,到故障根因: 全局题定位:快速确认线状态,缩故障判定范围。为可能的止损操作提供判断依据。本会介绍如何构建一个全景分析仪表盘。 细分维度定位:通过分析地域、机房、模块、接口、错误码等细分维度,进一步缩题范围,确定需要排障的目标模块、接口等。本会介绍如何基于多维度数据可视化解决维度数量暴增带来的定位难题。 故障根因确认:一些情况下,题的根因需要借助除监控指标之外的数据进行分析。例如线变更、运营活动导致的故障。本针对导致故障占比最高的变更线类故障进行分析,看如何快速到可能导致故障的变更事件。 全景掌控缩范围 对于一个乃至一条产品线而言,拥有一个布局合理、信息丰富的全景监控仪表盘(Dashboard)对于状态全景掌控至关重要,因此在百度智能监控平台中,我们提供了一款可定制化的、组件丰富的仪表盘。 用户可以根据的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据信息。
笑****山 2018-07-10
监控专用对象存储的畅想
元数据内容一般括:filename、filesize、createtime、hash、filehandle、Mimetype,理论来说除了Filename和Filehandle,其他属性都可以压缩和放弃,但放弃这些属性对元数据的性能提升不大,反倒是丧失了很多debug便利性。 通用场景的对象存储对Filehandle是一条递归记录还是多条并行记录、一层件记录还是Trunk+件记录,原始件记录还是纠删码记录的选型研究很谨慎。而监控存储场景下写多读少、件体积较件可以预取、定期批量删除,做选型的难度会比通用存储很多,场景简单也很容易做性能压测。 从系统架构来看,元数据数据库可以“均匀的”分库读写,对回看读库可以接受1s以的延迟,几乎没有汇总管理和筛选类需求,其数据库优化压力非常。 存储池现 存储池现部分都是硬碰硬的干货了,科普章只能谈三个题的选型。 新手厂商可以技术降级,直接做本机RAID而不是做分布式存储。监控存储毕竟可靠性要求低,坏器又不是丢失数据,厂商的驻场工程师勤快可靠一些,功能可用性也能到99.9%,数据可靠性也能到99.99%。
TOP