关于 羿全小妹找服务全套十薇v信78792796上海伊犁路那个啪啪保 的搜索结果,共1380
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一分布式的名字系统,是百度云Noah智能运维产品中的一重要基础系统。它为每一赋予一独一无二的名字,根据这名字,我们就可以获取到这的相关息 ,这些息包括:在机器部署息(机器IP,部署径,配置,端口息),的实例运行状况等其他重要息。简单来讲,它提供了一名到资源息的一映射关系。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
云计算历经多年发展,从最初的概念模型,到被大众熟知,再到现在行业拥抱云,取得了巨大的进步。云的主要客户已从最初的中初创公司逐步渗透到各行各业的大型企业。可以说,企业云已是企业发展的必由之。部分数据敏感的企业结合自身数据的安性、所有权和控制权等综合因素考虑,会选择搭建自己的私有云或者混合云环境。 但是在述环境中,用户的机器都需要自行管理,这就必然给云运维人员带来很多意想不到的麻烦。 其实我们面临的问题从来就没有什么大的变化,唯一不同的只是机器规模越来越大,人心越来越复杂。 Q如何在1台机器部署基础设施?A 一切都源于亘古不变的道理:扔一文件到机器,然后跑一命令。 Q如何在10台机器部署基础设施?A 写for循环搞定。 Q如何在10000台机器部署基础设施?A 这也好办!定制操作系统镜像CUSTOM.iso装机自动化安装! then…… Q如何快速升级所有机器的基础设施? Q因异常挂掉,能自动重启活吗? Q公司做活动,预计流量突增,能扩容吗? Q公司活动结束,为节约成本,能缩容吗? Q新开发的基础设施有问题,能立马回滚吗?
1****2 2018-07-09
百度安:AI 是系统工程 需要真正开放的安护航
这一隔离不但影响了安息的互 通,也造成了诸多限制,引发了新的安问题,比如Android App Store 不允许开发 者更换签名证书,如果开发者私钥被偷窃,他只能继续使用这一私钥,眼睁睁看着偷得 私钥黑客发布冒名顶替的恶意App。应用开发者其实早就意识到了签名束缚之痛,只是目前应用较为广泛的签名证书更换手段(提示用户安装新证书签名的新版本应用,安 卓5.0 以可以自动升级等),要么用户体验极差,要么存在降级攻击等风险。 为解决这问题,百度安开源了OASP 应用签名安方案——一种更安、灵 活的密钥证书管理方案。它首创了应用状态在线查询机制,是一种生态联防、去中心化的安方案:开发者能及时提供应用状态;安厂商能大规模扫描监控签名息生成息,并在端结合息判断App 是否恶意;应用商店可以收纳开发者提交的 应用息,并定期下架有问题的App;设备厂商则能通过OASP 的签名机制进行额外的安校验。 传输层面的安 终端设备和云端的过程中,传输通道的安性至关重要,一旦被黑客恶意 劫持,设备和云端器的数据也就都处在风险中。
追****圣 2018-07-11
给书记省长讲清楚云计算
所述,云计算就是将分散在各公司的息技术资源汇聚到一大平台,其兴起始于需求扩大而人力短缺,其未来发展趋势是通过规模经营和数据共享,成为新型息化社会的技术基石。 云计算如何带动地方经济 云计算落地是要自建数据中心机房,我们一般称之为云基地,云基地在经济利益和社会影响和传统工厂并不相同。云基地通俗易懂的展现形式就是开启数高速运转的电脑铁皮箱,但这些电脑不用接显示器也不用人员现场操作,只要这些电脑能开机能网就能对外。云基地和数字地产不完相同,数字地产只装修好房子,云基地关注用这些房子做什么。 云基地是无烟工业,并不需要雇佣大量人口,对直接促进就业帮助不大;但云计算没有实体矿产投入和物品产出,只需要大量电力启动电脑也不会产生大量污染。 云基地像电视台和号塔一样,通过产生和扩散数据息对客户提供,这些息的传输没有物流成本,光速直达球每角落。 因为云基地球客户,所以云基地可创造极高的营收,但不能简单的计入地方政府的GDP。一耗电三千瓦的机柜加附属空间占地5平方米,如果云计算资源部售出,每年可产生20万元以的营收。
M****H 2018-07-11
故障定位场景下的数据可视化实践
干货概览 百度拥有百条产品线,数万的,每时时刻刻都在产生着量的监控数据,形成的监控项规模总数已达数亿。面对如此量的数据,在日常运维(如故障诊断、成本分析、性能优化等场景)过程中,传统的统计图表难以有效直观地展示如此庞大的数据。因此,优秀的监控数据可视化产品就呼之欲出,他既要数据准确、面、时效性高,也需要提升用户的使用体验,使其能在茫茫数据中一眼就能发现想要观察的数据。 么怎么做才能适应用户需求、完成精准展示,同时又能挖掘数据价值呢?下面我们从故障诊断的场景出发,来看百度智能监控平台是如何充分利用数据可视化武器来解决实际业问题的。 故障定位可视化思 在标准的故障处理流程中,故障定位一般可分为两阶段: 故障止损前:期望可以快速获得可用于止损决策的息,做出相应的止损操作使得恢复。比如通过确定故障范围,调度流量绕过故障机房或摘除故障实例等。 故障止损后:仍需要进一步到导致故障的深层次原因,确定故障根因,将线环境恢复到正常状态。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
三、正确的时间是向量 Linux环境下有两常用工具,NTPD和ntpdate。NTPD是一时间同步,ntpdate是时间同步命令。很多工程师都会采用Crond+ntpdate的方式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是一体系化的,而ntpdate只是一动作,大部分人没做好为ntpdate这动作负责。 正常的时间是持续增长的向量,即老时间t1肯定于新时间t2,新时间t2也于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,大部分业对系统时间是盲目任,不相t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和业性,甚至部分程序崩溃的稀里糊涂。
w****0 2018-07-11
单机房故障自愈-黎明之战
干货概览 在故障自愈机器人,你安心好睡眠一文中,我们介绍了单机房故障自愈的必要性和解决思。本文主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一实例或者多实例部部署在同一物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
其中损失最严重的是中网站,他们已经不需要的运维人员;大型网站对运维人员的需求会逐渐减少;对非网站应用的影响可能仅仅限于技术革新;因此对软硬件生产商、IDC托管商甚至运维培训、IT论坛都会造成衍生影响。 当前云计算技术的势头很好,但因为技术和市场等原因还需要慢慢发展,而且云计算做的是“锦添花”的事情,企业用不用云计算对自身业功能影响不大。我们运维人员从做事的可靠性、有局意识,凭借这些特性仍然能活的很好。运维这岗位可能会消失,但做过运维的人还是有很多可以走的。 大家都知道黑云压城也该未雨绸缪了,如果你已经是运维老鸟或者很快就投身运维工作,我建议大家往这几方向动动脑子: 1、企业采用公有云方案后,仍然需要一懂行的人解决公有云平台的监控、评估、采购、报修这类问题。但这职位应该一公司公司只需要一人,且再等年云计算彻底标准化后还会再次消失。当然了,我相能胜任这岗位的人,在云计算已经规范到不需要专人维护的时候,他们也会有能力到更合适的岗位。
流****水 2018-07-11
度云企业级运维平台——NoahEE
资产管理 在机房里,各种各样的器、网络设备和安设备7x24时的运转,为我们的业提供了硬件障,是企业的重要资产。各种设备的物理损坏、升级、新增、搬迁等等都在考验着机房运维人员的能力。怎样维护这些资产并记录息,是很重要的问题,搞得不好,这些资产可能变成运维人员的“包袱”,越多越头疼。 对这些设备的运维操作,通常都涉及不少的物理操作,比如说更换损坏的硬盘,增加内存条等等。这里涉及到几要解决的问题: 故障如何及时发现?发现后由谁来进行修复? 物理操作维护怎样反应到系统里? 不同角色(职责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE通过故障自动发现与工单流程解决了面的问题。系统自动探测故障放入故障池,并建立故障工单,由相应的人员进行操作。另外,NoahEE提供了不同的工单流程覆盖了日常机房运维中的操作,从设备采购入库、架、机架变更,直到设备下架、出库生命周期覆盖,做到所有运维操作记录可追溯。有了资产管理,运维人员可以在器完成入库、架工单后即可在管理中看到该器并进行管理,无须任何其他操作。
红****2 2018-07-10
故障自愈机器人,你安心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链监测、内网链质量监测与业指标监控构建了方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭州电接入故障,中断时级别 2017年1月某业天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。
不****主 2018-07-09
高精地图
与普通地图不同,高精地图主要于自动驾驶车辆,通过一独特的导航体系,帮助自动驾驶解决系统性能问题,扩展传感器检测边界。目前 Apollo 内部高精地图主要应用在高精定位、环境感知、决策规划、仿真运行四大场景,帮助解决林荫道GPS号弱、红绿灯是定位与感知以及口复杂等导航难题。 一、高精地图与传统地图 当我们开车时,打开导航地图通常会给我们推荐几条线,甚至会显示道是否拥堵以及每条线将花费多长时间、是否有交通管制,有多少交通号灯或限速标志等,我们会根据地图提供的息来决定是在行驶中直行、左转还是右转以及对周围驾驶环境的评估。 而无人驾驶车缺乏人类驾驶员固有的视觉和逻辑能力。如我们可以利用所看到的东西和GPS来确定自己的位置,还可以轻松准确地识别障碍物、车辆、行人、交通号灯等,但要想让无人车变得和人类一样聪明,可是一项非常艰巨的任。 这时就需要高精地图了,高精地图是当前无人驾驶车技术不可或缺的一部分。它包含了大量的驾驶辅助息,最重要是包含道网的精确三维表征,例如交叉口布局和标位置。
小****园 2018-07-10
让PB级云存储不再神秘
对象存储还会用Fuse/NFS/FTP等手段来一些传统客户的低负载低需求需求,以证尽量减少客户的业变化。比如说银行里依赖一存储的应用有50,其中5高性能应用必须改用对象存储接口,而另外45低需求应用可以沿袭旧的访问方式,否则换存储要改50应用是推不下去的。 三、如何采购对象存储 各家公有云都做对象存储么该从哪些维度选存储,我有一些思考和建议。不用带任何情怀和理想,一年内能达到的存储容量是用户分类的唯一标准,GB/TB和PB。同样也不带任何理想和情怀,企业采购云就是公平交易,不要奢求免费的蛋糕,我们只期望能物有所值就够了。 1、型用户宽松心态 如果你是一GB级用户,一年内存储量都不会达到1TB,这时候用对象存储只是为了方便开发应用,不用太多思考存储自身特性。 首先谈价格,100G数据的存储成本每天就几毛钱,我不想讨论如何节约一毛钱的问题。 对象存储和云主机没任何直接技术关联,它是一独立到孤立的,典型互联网架构中,对象存储甚至不和云主机交互任何业数据,云存储直通客户APP。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专门讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决方案,实现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一环节结合进整条测试发布流水线中。
布****五 2018-07-10
如何执行一条命令
面临的困难 命令行的三要素,也是如何执行一条命令行面对的三问题,如前文所述,对于单机环境来说,这三问题在前人的努力下已经被很好的解决。可是如果要在几万台机器每天执行几亿条命令,同时证时效性,证执行成功率,证结果正确收集,证7*24时稳定运行,就不是一件简单的事情了。所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几突出的例子如下: 息存储问题:为了支持水平扩展,需要高效的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令息持久化。日均几亿的热数据,年均万亿的冷数据,需要仔细选择存储方案。 任调度问题:为了达到在任意多台执行命令的要求,需要确定何时分发命令、何时回收结果以及怎么样的并发度批量下发。 消息传输问题:为了证命令高效正确送达目标器,需要构建一可靠的命令传输网络,使命令息在准确送达的前提下障传输的可靠与高效,毕竟百度的几万台器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。
TOP