关于 中银基_缅甸维加斯下载二维码 【13150767771】陆 的搜索结果,共738
b****z 2018-07-11
智能运础-运知识库之ETL
干货概览 在百度智能化运的持续演进过程,我们在逐步建设以智能运机器人为核心的运能力,将其应用于故障自愈、根因定位、智能变更等运场景。而建设以智能运机器人为核心的运能力,最础的工作是要先建立运的世界观(环境模型),以机器人的视角来理解运世界、感知系统状态、获取环境变化等。 在传统运模式,运数据分散在不同的系统,这些运数据存在几个问题:访问方式不一致;数据术语、概念、模型不一致;系统间没有数据关联。 这些问题使得我们日常的运工作,经常需要理解、处理各种不同的数据,导致运成本高,效率难以提升。因此希望建立运知识库统一运工作的语言,对运工作的对象进行统一建模,收集并转录日常运工作的资源与操作,为日常运工作提供一种『书同文,车同轨,行同伦』的础。(PS:借鉴自秦始皇) 本文主要介绍百度云Noah智能运产品,在构建运知识库过程的思考。
w****t 2018-07-10
AIOps的四大金刚
在百度4年的AIOps实践,我们总结得出了如四种不可或缺的角色: 运工程师 运研发工程师 平台研发工程师 运AI工程师 可以看到,除了运AI工程师外,其他角色并不是AIOps产生之后才出现的,他们在传统运也发挥了重要作用。我们今天主要想和大家探讨一,在AIOps时代,他们的职责究竟发生了哪些变化。为了方便大家理解,我们会于百度AIOps的实践案例,来进行具体说明。 单机房故障自愈场景 单机房故障自愈是一个典型的AIOps落地项目。该方案主要解决的问题场景如:某个业务由于网络、设备、变更、程序Bug、容量等原因造成故障,但故障范围仅局限在单个机房或单个Region内部。那么,我们可以于流量调度等手段,将访问流量调度到非故障机房或Region,实现该类型故障的自动止损。 在这个过程,需要AIOps四种角色分工明确、紧密配合,来完成整个AIOps解决方案的落地实现。
3****3 2018-07-10
百度智能运工程架构
经过这么多年的建设,整个运行业已经非常成熟,而我们所支撑业务规模仍在不断增长,越来越多的运场景和问题无法用传统方法来解决,而运效率也难以继续支撑业务规模的快速扩张,所以我们更关注怎么样解放运自身的效率,以及解决传统运方法(人工、自动化)所解决不了的问题。 这就好比从马车到汽车是为了提升运输效率,而到汽车已经接近饱和的时候,我们又希望用自动驾驶把驾驶员从开车这项体力劳动解放出来,不仅可以增运行效率,同时也可以减少交通事故率,这也是我们对智能运的诉求。 发展:AIOps,从理念到落地 2016年Gartner报告提出了AIOps概念,也就是Algorithmic IT Operations;于算法的IT运,主要指用大数据、机器学习驱动自动化、服务台、监控这些场景的能力提升。 我们从2014年开始做智能运方面的探索,最开始也是集在监控指标分析、报警分析、故障根因分析、性能和成本分析这些方面,到2016年我们已经完成将AI应用于完整的运平台研发的论证。
流****水 2018-07-11
度云企业级运平台——NoahEE
在业务规模发展到一定程度后,运工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在实际的运,还有更多的因素需要考虑,例如机器是否会分配给不同部门(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本上升,然而效率低、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,服务管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在服务管理这个地打好后,我们再来回顾上面的例子。这个例子,地图研发的同学就可以在运平台导航的模块进行升级,运平台会通过服务管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE的所有运系统,都以服务管理为础来进行运操作,例如在监控系统,我们可以对导航模块(而不是单台机器进行操作)添一些指标采集任务,并在一定条件达成时报警。服务管理通过对资源合理的组织,极大的简化了运操作,提升了运效率。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运职位展望
人员一多半都是网站运,这些运受到云计算行业的碾压性冲击,必然会波及整个运行业,以及因此衍生的培训、管理、硬件销售、IDC工作。 我原先一直不愿意承认这一点,我也认为运工作很重要,但前端时间我看了一个故事,想和大家分享一。 在191x年的时候,每个工厂都有一个副厂长负责管理电力,那个时候新建工厂要考虑是自己建水电站还是火电站,甚至连拉煤球的车都要自己准备;但后来各个工厂用的电力标准趋于一致,就没有企业自主发电而是从电网买电了,这个电力副总裁的职位就成为历史了。 我记得05年以前做运,我们都要自己找很多种驱动、学习不同的主板配置方式、研究自有机房的空调系统,但如今运的职位完全不用关心这些事情了,反倒是对负均衡、高可用、大数据等问题越研究越深了。 云计算的目标是让IT服务像电力一样随时可用,这是一个积极正面的趋势,没有人能也没有人应该挡住他,运职位可用消失,但你不应该因此而失业。 本次去参WOT云计算架构师大会,我就是想看一云计算究竟发展成什么样子了。这次会后我大胆估计,云计算会在短则五年、长则十年的时间里将大部分运的饭碗抢走。
M****H 2018-07-11
故障定位场景的数据可视化实践
细分度定位:通过分析地域、机房、模块、接口、错误等细分度,进一步缩小问题范围,确定需要排障的目标模块、接口等。本文会介绍如何于多度数据可视化解决度数量暴增带来的定位难题。 故障根因确认:一些情况,问题的根因需要借助除监控指标之外的数据进行分析。例如上线变更、运营活动导致的故障。本文针对导致故障占比最高的变更上线类故障进行分析,看如何快速找到可能导致故障的变更事件。 全景掌控缩小范围 对于一个服务乃至一条产品线而言,拥有一个布局合理、信息丰富的全景监控仪表盘(Dashboard)对于服务状态全景掌控至关重要,因此在百度智能监控平台,我们提供了一款可定制化的、组件丰富的仪表盘服务。 用户可以根据服务的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据信息。 如上图所示,我们可以按照问题定位的思路,将服务整体的服务可用性情况、分功能可用性情况、分模块的核心指标、流量的同环比对比、分IDC的流量对比等,依次通过丰富的可视化组件进行呈现。使得在收到报警时,可以快速将故障缩小到具体功能、模块、接入流量、机房级别。
TOP