关于 在线讲解『快三压大小单双稳赢公式及运用方法』Q65 173 9 的搜索结果,共1676
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 型互联网司中,机房故障因为其故障时间长、影响范围,一直是互联网维人员的心头之痛。传统的中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响服务的恢复速度,同时人的不可靠性也可能导致问题扩。 为了决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的机房故障自愈能力。结合外网营商链路监测、内网链路质量监测与业务指标监控构建了全位故障发现能力,基于百度统一前端(BFE)与百度名字服务(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意机房故障时业务均可速自愈的效果。当前此案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的机房故障自愈场景。 机房故障频发影响业务可性 回顾近2年来各互联网司被披露的故障事件,机房故障层出不穷。
w****t 2018-07-10
AIOps中的四金刚
具体职责包括: AIOps时代,维工程师一面需要熟悉维领域的知识,了维的难题和决思路;另一面需要了人工智能和机器学习的思路,能够理哪些场景问题适合机器学习决,需要提供怎样的样本和数据,即成为AI维领域落地实施的案专家。 维AI工程师 机房故障自愈场景中,维AI工程师将机器学习的算与实际的故障处理业务场景相结合,针对机房故障场景的风险点,进行策略研发与实验工作。如下图所示: 维AI工程师分别设计了如下算策略来满足整个复杂故障场景的自动决策: 异常检测算决故障发现时指标异常判断问题,基于AI实现较高的准确率和召回率,作为整个故障自愈的数据基础。 策略编排算:基于当前线上的实际流量和服务状态,设计损益计算模型,判断基于何种的操作组合或步骤,能够使整个自动止损带来收益最,风险最。 流量调度算:基于线上服务容量与实时流量情况,进行精确流量比例计算,防御容量不足或不准风险,并实现流量调度收益最化。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
干货概览 业务部署(熟称上线)是维领域最常见的业务类型,主要涉线上代码变更、配置文件变更(数据变更由于其高频、量的特点,我们已数据传输文章《嗖的一下,让数据自动生效》中专门讨论过)。一般的业务上线具有不定时操作、业务部署情况复杂、机启停策略复杂等特点。手工维时代,维人员需要花费量精力进行此类重复性工作,且易于出错。从布的数据显示,Google 70%的生产事故由上线变更触发,如何减少变更过程中人为误操作,提供一个灵活、定的部署系统是维平台研发人员所亟需决的问题。 基本介绍 维自动化的潮下,百度维管理平台Noah发布了一键上线部署系统——Archer。Archer致力于提供一套产品线全过程的可迁移发布案,实现一键完成机器初始化、服务部署、添加模块监控、添加CT任务、动态数据文件的分发等全过程的自动操作。操作面,Archer提供了命令行工具作为发起一次上线的操作入口,这种设计模也决定了其易于集成的特点。DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
3****3 2018-07-10
百度智能维工程架构
相比较原有的机房故障处理感知、决策、执行面,L4级的机房故障自愈系统效果显著: 1.感知面,智能异常检测算替代过去量误报漏报的阈值检测; 2.决策面,具备全局信息、自动决策的算组件替代了过去“老中医会诊”的人工决策模; 3.执行面,状态机等执行长流程组件的加入,让执行过程可定位、可复。 目前L4级的机房故障自愈,已经覆盖百度多数核心业务线,止损效率可做到分钟级,最秒级止损,较人工止损效率提升60%-99%。 总结 随着AIOps逐渐走向成熟和产品化,必将有越来越多的维场景被AIOps所变革,而我们,百度云智能维团队,也希望秉承着这个向,为行业贡献更多的创新理念、技术和产品,欢迎家一起加入探讨。 最后,一句话来总结下工程架构对于智能维的意义: 框架手,AI我有:智能时代,框架会越来越重要,从机器学习框架TensorFlow到自动驾驶框架Apollo,概莫能外。
流****水 2018-07-11
度云企业级维平台——NoahEE
一图胜千言,我们看看资产管理的特点: 图3 资产管理 部署管理 应部署一直是维工作中的重点,一般来说,我们面临的问题有: 批量部署难,怎样定位目标机器?如何速部署? 灰度测试难,怎样通过灵活的部署,先进行流量线上测试,待效果达到预期后再扩部署? 回滚难,发现问题后怎样回滚? 上面的第一个问题,实际上服务管理中已经决了,也就是说服务管理帮我们完成了资源定位工作。其他的问题,NoahEE的部署管理模块通过“分级发布”来决。部署管理模块中,我们可以便的定义并发度、部署步骤、影响范围以暂停操作等,部署的过程中发现问题即可暂停并回滚至之前的状态。除了部署等操作,部署管理模块还提供了批量执行命令等操作(比如批量启停某一服务)。如图来总结部署系统的能力: 图4 部署管理 监控管理 任何工作里,信息掌握的全面与否往往关乎到工作的成败。“知己知彼百战不殆”这句话说的就是这个道理。维工作中,监控系统就是这个让我们做到这点的关键。软硬件是否工作正常,出了问题是否能时发现与报警,甚至是对异常事件等进行提前预测,都仰仗监控系统。
h****e 2018-07-10
程序:我从哪里来?
配额限流:针对产品线户、IP提供一定的配额,当请求的数量超过配额,就会拒绝响应的请求,并提示户Quota超限。 2Web Server Web Server提供户进行各类BNS变更的接口,承担了BNS系统的部分写入流量,采分布多地域的部署,可以避免实例、机房的故障对可性造成的影响。 3存储层 这里主要包含数据库和Cache层两个部分。 数据库:采MySQL存储,采主从集群部署、读写分离的。 Cache层:是BNS系统自研的一个缓存模块,缓存了全量的BNS系统数据,采多地域部署的,它主要功能是降低数据库的查询力。 4客户端 BNS系统主要包含两个客户端:查询客户端和健康检查客户端,我们分别Naming Agent和Check Agent来代指两个。 客户端部署所有的机器上,并提供命令行工具和丰富的SDK以各类插件,便各个场景使。 Naming Agent:提供BNS的查询功能,户可以根据一个名字(服务组、服务元、实例)就能得到详细的服务信息。
布****五 2018-07-10
如何执行一条命令
如何决 为了决这个简的难题,我们设计了如图3所示的百度集群控制系统(Cluster Control System,简称CCS系统),通过分离控制信息与执行信息建立了两级数据模型,结合命令执行机房部署特点建立了四级传输模型,通过级守护建立了定的执行代理,规模服务器集群上决了“命令要素”问题。 图3百度集群控制系统架构 截至目前,CCS系统已经部署全百度的所有机房中,户可以便的任意一台机器上进行秒级命令下发和结果收集,日均承载数亿次来自各产品的接口调。关于数据模型、传输模型、执行代理这“分布命令要素”的设计,我们将下一篇文章中详细介绍。
****ac 2018-07-12
亿元免费算力 | 百度脑AI Studio重磅推出算力支持计划
新建一个机项目,或选择一个现有的机项目,点击”行项目”即可选择使GPU。 点击”确定”后,系统开始进行算力卡计费。算力卡计费规则:毎分钟进行计费,如不满1分钟则不计费(例如使了1分钟50秒, 则只计算1分钟的算力卡消耗),毎6分钟进行一次汇总,并”算力卡明细”页面中显示消耗算力卡总数。 进入系统,可以看到项目环境中已经包含V100资源 当您关闭浏览器时,资源不会立刻回收,而是会继续行2时,2时之后将会被中止。如果希望关闭浏览器后立即回收资源,请”我的项目”列表中直接中止(中止并重置环境的过程需要1-2分钟)。手动退出成功或2时自动中止后即停止计费。 9. 您可以回到”算力卡明细”页面查看剩余算力卡余额和本次算力卡消耗的明细。 怎么样,心动吗? 心动不如赶行动,立即点击申请吧! 如使中有遭遇什么问题,可以联系AI Studio官邮件组:aistudio@baidu.com
p****d 2018-07-11
机房故障自愈--维的春天
水位上限:该水位线表明服务的最承载能力,一旦流量超过故障水位线,很概率会导致容量过载。 如果安全水位线提供的容量不足以满足止损,那我们期望使上两条中间的容量buffer,同时流量调度过程中进行分步试探,避免一次性调度垮服务。 基于速熔断的过载保护 流量调度时,建立速的熔断机制作为防止服务过载的最后屏障。一旦出现过载风险,则速停止流量调度,降低次生故障发生的概率。 基于降级功能的过载保护 流量调度前,如果已经出现对应机房的容量过载情况,则动态联动对应机房的降级功能,实现故障的恢复。 2业务线止损策略需求差异 【问题描述】 我们实现了基础的机房故障流量调度止损算,但部分业务线中仍存的需求差异,比如: 分步动态调度需求:业务存充Cache的情况,过程中服务能力降低,需要控制切换速度。 优先级调度需求:产品对延迟敏感,止损时需要优先切到同地域机房;业务服务于多个上游,多个上游的重要程度不同,优先保证重要上游服务定。 容量负载计算需求:请求成分不同,不同成分请求带来的容量负载不同。
w****0 2018-07-11
机房故障自愈-黎明之战
同时流量调度也无使得服务恢复正常。 要求:将服务拆分为若干不同的逻辑元,每个逻辑元处于不同的物理机房,均能提供产品线完整服务。 3.服务不满足N+1冗余 描述:任意个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房服务过载,造成多个机房服务故障,造成更范围的影响。 要求:容量建设需要对于每个逻辑服务元都要有明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,同时需要保证服务变化时时更新数据和扩容服务,避免容量数据退化。同时对于流量的变化趋势,也需要有提前的预估,为重事件流量高峰预留足够容量(如节日、营、假期)。 4.服务关联强耦合 描述:上下游服务使固定IP或固定机器名进行直接连接。 问题:机房故障发生时,关联的上下游之间无进行速的流量调度止损。 要求:线上服务关联不允许使固定IP或机器名链接,需使具备流量调度能力的上下游连接以实现上下游依赖耦,下游服务发生机房故障,可以速调整路由比例实现止损。
思****来 2018-07-11
重磅:构建AIOps的MNIST
路上… 除了上述已有功能,一波更新正路上,接下来还会有: 更的加载速度,标注过程更加流畅:原型实现中,包括数据库、网络交互内的诸多工程细节都没有进行针对性优化,导致标注中会出现轻微卡顿情况,这些卡顿将下一版完整修复。 线的标注工具,打开即前期试中发现,对于标注人员,从源代码开始部署一个服务比较麻烦。为了让使者更加便,我们会收集足够意见反馈后整合出一个SaaS化的标注平台,让标注人员即开即。 拉一波标注数据出来祭天:调研时发现,时序数据异常检测领域缺少一个类似MNIST的标准数据集,虽然有部分高校给出了一些数据集(如石溪学的http://odds.cs.stonybrook.edu/),但是这些数据集过,难以于统计和机器学习建模。为了让更多有想但是接触不到数据的同学有条件参与相关探索,我们将开部分标注数据,和家一起建设一个共的标准数据集。 INVITATIONS 上文中提到的各种基础功能优化和辅助功能均通过插件的形实现,家可以参照给出的样例便地编写适合自己场景的插件。
j****2 2018-07-10
百度脑开放日来袭 24种全新AI能力呈现
比如百度EasyDL与分形科技打造的智能垃圾桶已成功地落地海淀园,可以对7种常见垃圾自动分类,后期还可以通过增加训练数据识别更多种类;和德邦物流的合作中,为户免去了自行填写信息的麻烦,使定制词分析递申请,一秒拆分姓名、电话、住址等信息;更具科研意义的还有百度EasyDL与中科院珍稀鸟类识别项目上展开的合作,传统分类学日渐没落的今天,百度EasyDL可以利的图像识别技术协助专家们对动植物标本、照片进行速鉴定,目前中科院使EasyDL训练对超过12万幅图片进行分析,目前700多种鸟类模top5上的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%,满足上线服务要求。 与卓繁信息的合作,百度脑还打造了“AI便民”的新型无人值守受理站。通过UNIT、OCR、人脸识别等AI技术,“无人值守”的政务服务新模为社会众提供全年无休的24时自助办事服务,提升了政府为民服务的能力。 开放日当天,网红智能猫窝的设计者百度脑工程师晚兮也现场为述了智能猫窝设计者们的初心。
l****m 2018-07-10
五年前的预言——2012年云计算时代的维职位展望
其中损失最严重的是中网站,他们已经不需要的维人员;型网站对维人员的需求会逐渐减少;对非网站应的影响可能仅仅限于技术革新;因此对软硬件生产商、IDC托管商甚至维培训、IT论坛都会造成衍生影响。 当前云计算技术的势头很好,但因为技术和市场等原因还需要慢慢发展,而且云计算做的是“锦上添花”的事情,企业云计算对自身业务功能影响不。我们维人员从做事的可靠性、有全局意识,凭借这些特性仍然能活的很好。维这个岗位可能会消失,但做过维的人还是有很多路可以走的。 家都知道黑云城也该未雨绸缪了,如果你已经是个维老鸟或者很就投身维工作,我建议家往这几个向上动动脑子: 1、企业采有云案后,仍然需要一个懂行的人有云平台的监控、评估、采购、报修这类问题。但这个职位应该一个司只需要一个人,且再等上十年云计算彻底标准化后还会再次消失。当然了,我相信能胜任这个岗位的人,云计算已经规范到不需要专人维护的时候,他们也会有能力找到更合适的岗位。
x****7 2018-07-10
从外行进阶专业 传统企业AI转型差的可能只是一个百度EasyDL
许多企业主都迫切希望能将人脸、语音、图像等AI技术速应起来,扩竞争优势,但往往却苦于无从下手。 传统企业落地AI,普遍存痛点: 1)通的AI无满足企业的个性化需求。与企业业务深度结合的AI应需求,往往需要结合所领域很强的专业知识,通AI技术无满足,例如,目前业界推出的通物体和场景识别的API无满足量个性化的需求:家装企业想识别装修图库中的细分家居风格、房间布局分类等,物业司想通过摄像头识别区垃圾桶是否已满,施工位想通过图像识别工地上的工人有没有穿工服、戴安全帽等,这些场景需求是常见的业务场景,但是企业很难找到现成可的AI技术,往往需要自己做定制化的研发。 2)AI技术自研维成本高昂。自己研发AI技术会面临多道难关,首先是AI人才关,国内AI人才池有限,据人民日报的报道,我国人工智能的人才缺口超过500万,供求比例仅为1:10。AI人才的年薪动辄数十万,除非有庞的业务场景,否则,一般体量的企业难以组建独立的AI团队。其次是基础设施关,AI维需要的服务器、GPU,财务上也是不可承受之重。 3)开发周期过于漫长。
双****4 2018-07-11
【杂谈】猎场没那么精彩--还原真实的猎头
部分猎头司也无所谓简历库,特别是互联网行业更为明显。高端猎头是要钓鱼的,但钓鱼先要等鱼长,中国企业都兴起没几年,还没有定的高管和高工群体,同城同行业挖来挖去就那几个熟人;而那些新手猎头个月不开锅就要饿死,撒网甚至炸鱼的收益会更保底一些。从长周期来看,猎头属于利信息不对称来牟利的行业,互联网技术本来就是要消除信息不对称。现有跳槽意向的普通员工会招聘网站更新简历,中高层会主动布局等待候选位上钩,专门找一猎头更新简历库的互联网人才越来越少了。 来看,找个猎头司签个合作协议是很随意的,这些猎头谁做成了才给钱,做不成也没损失,甲还能享受一呼百应蜂拥而上的感。但天下没有免费午餐,免费供应的简历质量无保障,耽误的人力和时间都无衡量。滥猎头还会增不必要支出,中下级岗位人事自己也能搜到简历,而很多初级猎头就做佣金几千块的子。 如果甲要找精英猎头,先要确认该岗位是否值得去找专业人才服务;当甲觉得能付出十万块钱的佣金是值得的,好甲就能找到好供应商;如果招聘把几千块佣金当做传家宝贝,给猎头花这个钱还不如给面试者报销打车费。
小****园 2018-07-10
让PB级云存储不再神秘
4、何时选择私有云 对象存储一般是有云服务,但是超型国企、电信营商、国家级项目、型独立互联网企业、金融行业、智慧城市、基因、气象、医疗等行业都因特定原因使私有云存储。 对象存储适于私有云主要基于这面考虑: (1)建设成本 有云建设成本有头,服务器、IDC和网带宽。有云对比对中型客户面成本有巨优势,但也给自己保留了利润空间。很多客户能拿到比云厂商更低价格的资源,那可以拿掉给云平台留的利润,自建私有云存储。 (2)网络通信成本 这里提的网络通讯成本和前文的网带宽并不重复,网带宽是面向分散的广域网客户的,网络通讯成本是强调几个固定的带宽消耗对象。假设你某个应的数据读写速度是10Gb/s,云存储和客户端两侧的广域网带宽成本是巨的,某些弱势营商甚至要考虑网间结算费读写速率的客户端和云存储会是固定长期合作关系,无论是内网互联、同IDC光纤、同城专线的成本都比互联网通讯的成本低很多。 (3)数据安全等合规需求 有些客户连计费日志都不想让有云看到,或者确实有强安全性规限制,或者只让采购资产不认可采购服务,那也会采私有云的建设
TOP