关于 解巴桑拿全套服务十薇v信78792796保定塘湖镇小妹酒店一条 的搜索结果,共1409
h****e 2018-07-10
程序:我从哪里来?
总结 BNS系统满足间交互中常见的的资源位、IP白名单维护等需求,也可以用于机器列表查询,使用场景包括机器列表查询、位、白名单维护、数据库智能授权等,决了程序“我是谁?我从哪里来?该往哪里去?”的问题。 今天我们起聊了百度云Noah智能运维产品中的BNS系统,目前系统还在持续迭代和优化中,若您想进步了BNS问题,欢迎大家积极留言。
疏****月 2018-07-09
键上线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称上线)是运维领域最常见的业类型,主要涉及线上代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的下,让数据自动生效》中专门讨论过)。般的业上线具有不时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由上线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳的部署系统是运维平台研发人员所亟需决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了键上线部署系统——Archer。Archer致力于提供产品线过程的可迁移发布决方案,实现键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起次上线的操作入口,这种设计模式也决了其易于集成的特点。在DevOps流水线作业中,Archer可以作为个环节结合进整测试发布流水线中。
流****水 2018-07-11
度云企业级运维平台——NoahEE
资产管理 在机房里,各种各样的器、网络设备和安设备7x24时的运转,为我们的业提供了硬件障,是企业的重要资产。各种设备的物理损坏、升级、新增、搬迁等等都在考验着机房运维人员的能力。怎样维护这些资产并记录息,是个很重要的问题,搞得不好,这些资产可能变成运维人员的“包袱”,越多越头疼。 对这些设备的运维操作,通常都涉及不少的物理操作,比如说更换损坏的硬盘,增加内存等等。这里涉及到几个要决的问题: 故障如何及时发现?发现后由谁来进行修复? 物理操作维护怎样反应到系统里? 不同角色(职责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE通过故障自动发现与工单流程决了上面的问题。系统自动探测故障放入故障池,并建立故障工单,由相应的人员进行操作。另外,NoahEE提供了不同的工单流程覆盖了日常机房运维中的操作,从设备采购入库、上架、机架变更,直到设备下架、出库生命周期覆盖,做到所有运维操作记录可追溯。有了资产管理,运维人员可以在器完成入库、上架工单后即可在管理中看到该器并进行管理,无须任何其他操作。
布****五 2018-07-10
如何执行命令
面临的困难 命令行的三要素,也是如何执行命令行面对的三个问题,如前文所述,对于单机环境来说,这三个问题在前人的努力下已经被很好的决。可是如果要在几万台机器上每天执行几亿命令,同时证时效性,证执行成功率,证结果正确收集,证7*24时稳运行,就不是件简单的事情了。所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例子如下: 息存储问题:为了支持水平扩展,需要高效的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令息持久化。日均几亿的热数据,年均上万亿的冷数据,需要仔细选择存储方案。 任调度问题:为了达到在任意多台器上执行命令的要求,需要确何时分发命令、何时回收结果以及怎么样的并发度批量下发。 消息传输问题:为了证命令高效正确送达目标器,需要构建个可靠的命令传输网络,使命令息在准确送达的前提下障传输的可靠与高效,毕竟百度的几万台器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。
追****圣 2018-07-11
给书记省长讲清楚云计算
器就是高功耗高价格的专业电脑,云计算企业的采购规模般远大于政企集采,他们能从硬件厂商那里到极限低价,政府和国企能提供的更多是采购资金的支持。 云计算是个商业,不仅需要硬性支持,还需要足够的环境和政策支持。当前云计算公司聚集在线大城市,环境规范稳但成本极高竞争压力极大,云计算企业也在尝试向二三线转移突围。二三线城市不仅要积极准备云计算硬性资源,还可以用合作融资、税收优惠等等灵活政策承担产能转移的,最终说云计算公司将GDP和税收留在当地。 云计算平台提供的都是互联网,大量的互联网部署在本地会有极大的管控压力。二三线城市对互联网还只是简单的管控,稍有不可能就会封禁大批互联网,但道封网命令就可以毁掉个云计算公司的声誉。如果当地政企要做好云计算就要从管理者变为者,必须在管控违规违法时不惊扰正常业,甚至主动出击为正常网络驾护航。 前几都是从降低成本可靠的角度请云计算企业来合作建厂,如果你有市场有客户那对方会主动上门寻求合作。
p****d 2018-07-11
单机房故障自愈--运维的春天
单机房故障自愈的常见问题和决方案 传统的流量调度自动止损方案存在如下问题: 1容量风险控制能力不足 【问题描述】 传统流量调度的模式有两种:固比例模式与容量护模式。 固比例模式:按照预先设的固预案,个机房故障,该机房的流量按照预先设的比例分配到其他的机房。很可能某个机房的容量或剩余机房的总容量不足,切流量后导致多个机房发生故障。 容量护模式:针对固比例模式存在的容量风险问题,改进的流量调度方式为执行前判断容量是否充足,容量充足则进行流量调度,否则不进行调度并通知人工介入处理。但此种方案面对的问题是: 1.容量仍有buffer可以进行部分止损。期望能够在不超过容量护的情况下进行尽可能的调度,减少对用户的影响。 2.即使按照容量进行调度,过载仍可能发生,容量数据本身存在误差,流量成分的变化以及变更等导致的容量退化,都可能导致原先容量无法完。 【决方案】 基于容量水位的动态均衡 在流量调度时,对于容量不准确存在的风险,我们划分两容量警戒线。 安水位线:流量处于在安线以下则风险较,可以步进行切换。
M****H 2018-07-11
故障位场景下的数据可视化实践
基于上面的需求,可以总结为以下三个位的层次,从整体到局部逐步缩故障范围,找到故障根因: 局问题位:快速确认线上状态,缩故障判范围。为可能的止损操作提供判断依据。本文会介绍如何构建景分析仪表盘。 细分维度位:通过分析地域、机房、模块、接口、错误码等细分维度,进步缩问题范围,确需要排障的目标模块、接口等。本文会介绍如何基于多维度数据可视化决维度数量暴增带来的位难题。 故障根因确认:些情况下,问题的根因需要借助除监控指标之外的数据进行分析。例如上线变更、运营活动导致的故障。本文针对导致故障占比最高的变更上线类故障进行分析,看如何快速找到可能导致故障的变更事件。 景掌控缩范围 对于乃至产品线而言,拥有个布局合理、息丰富的景监控仪表盘(Dashboard)对于状态景掌控至关重要,因此在百度智能监控平台中,我们提供了款可制化的、组件丰富的仪表盘。 用户可以根据的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据息。
s****7 2018-07-10
见微知著看技术误——从裸光纤和NTPD谈起
时间不稳会威胁到的程序健壮性和业性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目任;假设个根NTP不稳,所有的器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的情况,但业混乱是免不了的。我们就说联机调试分布式日志,几个节点的时间有错可能日志就看不懂了。 NTPD做时间调整会有效减少这类情形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详情见附录实验);也不会盲目任远端时钟源,甚至固执的拒绝同步时间。NTPD本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳的时间源,算出双方间的网络延迟,然后才会采新的时刻进行时钟同步。 五、误的根源和影响 因为NTPD不盲从其他时间源,让老辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确,且要观测NTPD同步效果需要时间。
1****2 2018-07-09
百度安:AI 是系统工程 需要真正开放的安护航
隔离不但影响了安息的互 通,也造成了诸多限制,引发了新的安问题,比如Android App Store 不允许开发 者更换签名证书,如果开发者私钥被偷窃,他只能继续使用这私钥,眼睁睁看着偷得 私钥黑客发布冒名顶替的恶意App。应用开发者其实早就意识到了签名束缚之痛,只是目前应用较为广泛的签名证书更换手段(提示用户安装新证书签名的新版本应用,安 卓5.0 以上可以自动升级等),要么用户体验极差,要么存在降级攻击等风险。 为决这个问题,百度安开源了OASP 应用签名安方案——种更安、灵 活的密钥证书管理方案。它首创了应用状态在线查询机制,是种生态联防、去中心化的安方案:开发者能及时提供应用状态;安厂商能大规模扫描监控签名息生成息,并在端上结合息判断App 是否恶意;应用商可以收纳开发者提交的 应用息,并期下架有问题的App;设备厂商则能通过OASP 的签名机制进行额外的安校验。 传输层面的安 终端设备和云端的过程中,传输通道的安性至关重要,旦被黑客恶意 劫持,设备和云端器的数据也就都处在风险中。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
第二天 工程师们说:“这个系统必须运行稳,性能卓越,支持跨平台(Linux、Windows、ARM)安装,要做到同时管理上万台器,点儿都不慌”。 第三天 工程师们说:“这个系统不能像瑞士军刀,而应该重剑无锋、大巧不工,仅支持基础设施的维护管理,要能做到快速扩缩容!出现问题能立刻回滚,障云环境的安和稳。” 第四天 工程师们说:“这个系统还要做到‘麻雀虽,五脏俱’!要为基础设施提供虚拟化容器隔离,应用部署,应用拓扑搭建和集群控制的功能。为应用的整个生命周期驾护航,提供。” 总之就是四个字,“轻”、“稳”、“专”、“”,对于这切,工程师们很满意。 于是百度云的工程师们结合百度历年来云计算的经验与技术沉淀,潜心打磨,匠心打造,最终强势推出新代私有云云基础设施管理引擎HALO。 Q:HALO是什么?
红****2 2018-07-10
故障自愈机器人,你安心好睡眠
例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭州电接入故障,中断时级别 2017年1月某业天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。直接损失包括访问流量丢失、商业收入下降、用户体验受损、打破等级协议(SLA)造成的商业赔付等,间接损失包括用户任度下降、给竞品占领市场机会等。
若****客 2018-07-10
IT架构的本质--我的五点感悟
前端器压力大了就多做水平复制扩容,在网站类应用上,无状态-会话持-弹性伸缩等技术应用纯熟。后端要群集化就是多做业拆分,常见的就是数据库拆库拆表拆键值,拆的越散微操作就越爽,但局操作开销更大更难控制。 实时改异步是我学的最后门IT技术,绝大部分“实时操作”都不是业需求,而是某应用无法看到后端和Peer状态,默认就要实时处理结果了。CS模式的实时操作会给支撑带来巨大压力,Peer合作的实时操作可能会让数据申请方等宿。架构师将个无脑大事拆分成多个,这就是异步架构,但拆分事就跟拆分数据表样,拆散的需要更高业层级上做局事障。 在群集性能规划中,网络和硬盘IO+CPU算力+磁盘和内存空间是可以互换的,架构师要完成补不足而损有余的选型。比如数据压缩技术就是用算力资源来置换IO和空间,缓存技术是用空间和IO来缓算力压力,每个新选型都会带来细节上的万千变化,但每种变化都是符合自然规律有章可循的。 个经典微机系统就是中央处理器+主存储器+IO设备,这几个概念居然和群集性能规划是对应。 3.
小****园 2018-07-10
让PB级云存储不再神秘
4、何时选择私有云 对象存储般是公有云,但是超大型国企、电运营商、国家级项目、大型独立互联网企业、金融行业、智慧城市、基因、气象、医疗等行业都因特原因使用私有云存储。 对象存储适用于私有云主要基于这三方面考虑: (1)建设成本 公有云建设成本有三大头,器、IDC和公网带宽。公有云对比对中型客户在这三方面成本有巨大优势,但也给自己留了利润空间。很多客户能到比云厂商更低价格的资源,那可以掉给云平台留的利润,自建私有云存储。 (2)网络通成本 这里提的网络通讯成本和前文的公网带宽并不重复,公网带宽是面向分散的广域网客户的,网络通讯成本是强调几个固的大带宽消耗对象。假设你某个应用的数据读写速度是10Gb/s,云存储和客户端两侧的广域网带宽成本是巨大的,某些弱势运营商甚至要考虑网间结算费用。大读写速率的客户端和云存储会是固长期合作关系,无论是内网互联、同IDC光纤、同城专线的成本都比互联网通讯的成本低很多。 (3)数据安等合规需求 有些客户连计费日志都不想让公有云看到,或者确实有强安性法规限制,或者只让采购资产不认可采购,那也会采用私有云的建设方式。
w****0 2018-07-11
单机房故障自愈-黎明之战
干货概览 在故障自愈机器人,你安心好睡眠文中,我们介绍了单机房故障自愈的必要性和决思路。本文主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及决方法 基于网络故障及业故障场景的面故障发现能力 百度统前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有个实例或者多个实例部部署在同物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:上下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。
TOP