关于 规律球探即时比分 zs25.vip 主管Q:86349338通 的搜索结果,共966
嘟****y 2018-07-11
大型企业适用的云平台账户体系
但很多客户怕自己配置错误不想要这个权限,如怕自己手滑删了CDN域名设置导致业务中断,所以干脆就有什么操作都让供应商和理员帮配,这就引出了其他低阶权限。 b.操作角色,操作类角色只能完成各类可逆性云资源变更,如说不可以释放RDS但可以备份RDS,不可以释放“核心必要”云机但可以创建和删除“临扩展”云机。只有云平台精产品的真实使用场景,才可能定义好各类资源的理和操作的权限;开放给DevOPS的“低风险日常操作API权限”也集中在这个角色上。 c.查看角色,对不想或不能承担操作责任的客户可以给与查看权限;有些大公司有线上变更流程,事件发起方、业审核方、业务执行方是离的,事件发起和审核方都只要查看资源权限就可以了。 d.财务角色,有些财务人员要上云平台做截图和导出账单,这就需要财务角色。 e.平台代操作授权角色,这不是一个恒定的角色,而是前文查看型客户没有操作能力,那就需要进行临操作授权。 以上各个角色的登陆和操作过程都要有详细的步骤日志记录。 第四.平台知和理机制 前文将各种资源和权限进行了区,那接下来要区的就是平台知机制。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
Agent过定期心跳的方式,与Master进行信,在心跳发包中发送本机状态信息,在心跳回包中获取Master期望的本机状态plan,并把期望plan与本地实际plan进行对,针对有差异的地方做相应修改,使二者保持一致,从而保证集群中所有机器最终状态一致。 总之一句话,一朝HALO在手,从此不用发愁。所有运维需求,直接调用接口。 结 语 为了防止大模集群被破坏,为了保护集群世界的安全,贯彻高效和简单的运维理念,这就是我们新一代的基础设施理引擎HALO。 亲爱的读者如果你看到这,恭喜你在有意义的事上花费不止1钟。来都来了,不妨看个硬广再走~ 在全行业拥抱上云的大背景下,如果您的企业在各类云场景中存在痛点或困境,欢迎到“阅读原文”了解和联系试用我们的智能运维产品,其中除了有重磅企业级运维平台NoahEE,更有我们在智能运维领域的实践和索! 最后的最后,如果本文能让你快乐1秒,请评论,点赞,好看,收藏,转发,打赏!祝全家不脱发!
m****t 2018-07-11
设计中立公有云云平台
经过对多个云平台的调研统计,其核心必须的业务系统有四个,别是“理平台”“用户系统”“计费系统”“厂商API封装工作”。这几个业务子系统都有几个人月就可以做出的简易版核心功能,也可以按照大型软件工程去做全功能划设计。 理平台 这是运营人员使用的的资源统计、展示操作平台。 平台首页是一个全部资源汇总页,平台已经开多少用户、多少机、多少带宽等等,无论是日常运营还是工作汇报都需要汇总统计。如有余力可以和计费系统配合,做出各个厂商资源汇总对页面。 平台还要有各项资源类汇总及单资源详情页,虚拟机、硬盘等资源。这里要求可以做整体list,也可以查看单独一个资源的状态。前文提到要统一的资源ID可以调用厂商API快速查询和操作资源。前文提到的统一资源名称前后缀,可用于快速过滤出单个用户的云资源。如果快速施工可以只做资源的统计展示,云平台操作员去各厂商的理控制台上执行资源操作;如果间来得及那就把厂商提供的功能在本平台全部实现出来。
思****来 2018-07-11
重磅:构建AIOps的MNIST
干货概览 我们在《AIOps代,你准备好了吗?》一文中提到,运维操作一般可以为感知、决策、执行三部,而在感知阶段我们过识别服务指标数据中不符合预期的模式来发现服务异常,监控数据的异常检测。 很多候,大家手中的异常检测是一条拍脑袋想出来的则,或者根据经验大致估算的阈值。这样的异常检测常常存在较多误报、漏报、效果不佳的情况。而上线前基于标注数据的效果评估是提高效果最重要的手段。为了获取大量、准确的标注数据来评估算法效果,我们进行了一系列索。 本文将要介绍在监控数据异常标注实践中遇到的问题和解决方案,并给出一个当前由百度智能运维团队与清华大学Netman实验室合作研发的辅助标注工具原型https://github.com/baidu/Curve,欢迎大家一起讨。 序数据异常标注 在监测服务的收入、流量、可用性、性能等指标常会对数据进行流式的采集和汇聚,每个数据点反映的是某段间内的服务状态,这些间序列数据简称序数据。 在异常检测方面大家或多或少都有过类似经历:针对一次故障设置了报警则,其中的阈值根据这次故障设置。上线后不断发生误报,因此调低阈值。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
我们很难成功调试NTPD服务,会装NTPD又没有会装LAMP可以拿去吹牛,间长了NTPD服务就背上黑锅了。 真有TOP10的互联网公司和上亿国家级项目里用ntpdate+crond,上一代架构师为什么有这个误会无人深究,下一代人将误会固化为偏见,新一代人将偏见神化为迷信。 但无论误会、偏见还是迷信,间跃变、回退和停滞对应用健壮性和业务安全性的威胁始终存在,间不仅仅是我玩游戏用的魔法,忽视问题并不能掩埋问题。 六、见微知著和防微杜渐 我讲NTPD和裸纤并不是为卖弄知识,也不是为做偏门科普,而是希望进阶工程师们多考虑一下如何避这类误会?我们在做技术工作,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事也不会知道间也能错误和波动,他们能说清楚业务逻辑就不错了。 把所有的精力都用到做业务逻辑,你只是个编程语言翻译机而已;自己动观测技术环境依赖,有资格有能力做出技术选型决策,才是给Coder群集做技术校准的人。使你不想做技术决策人和理者,多怀疑和观察环境,也能少些沟成本,少走一些冤枉路,多一份自信和自尊。
流****水 2018-07-11
度云企业级运维平台——NoahEE
服务理这个概念的出现,是随着业务快速膨胀的必然,其要解决的要问题是一个“量”,或者说“模”的问题。在早期业务较为简单,一个服务可能部署在几台甚至一台机器上,进行变更等运维操作简单直接,登录到机器上人工操作就好了。随着业务的发展,布式应用与服务的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例子,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。在业务模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会配给不同部门(资源的隔离)?权限又该如何控制?随着模变大,人力成本等理成本上升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织理问题。
h****e 2018-07-10
程序:我从哪里来?
过部署在机器上的客户端感知到实例的状态变化(如实例状态由0变成-1,正常变成非正常),并将数据同步到系统中的布式缓存,上游模块可以过查询redis.noah.all的实例状态结果,动过滤非正常的实例,也可以在BNS系统中发起屏蔽故障实例的操作,在查询过程中会自动过滤该故障实例。 在下一节中将具体介绍BNS系统的整体架构。 基本架构 BNS系统要包含几个部:流量接入层,Web Server,存储层,代理客户端。 作为一个底层的基础服务,BNS系统每天的访问量近千亿次,这对系统的可用性提出了很高的要求,因而系统需要在各个层面有完善的容灾能力和流量控能力。 1流量接入层 系统过HTTP接口对外提供变更服务,用户过Web页面或者接口进行服务或实例信息注册。为了保证平台稳定和安全的运行,需要对非法和异常请求进行拒绝,在流量接入层(Proxy)端提供了以下两个功能: 流量鉴权:每一个服务组、服务单元、实例的注册都需要进行权限验证,用户只有申请了合法的Token才能允许访问,另外系统还提供了白名单等其他的鉴权方式。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
另外,Archer也可作为上层服务托平台的底层工具链,为PaaS平台提供稳定的底层部署服务。 用场景 在百度内部,用的部署系统需要适用于以下场景: 各业务线拥有各自的包范,语言、框架不统一,部署策略不一致; 支持级发布,及拦截部署引入的线上故障; 业务的多地域部署; 多种网络环境及大包部署; 提高自动化效率,能够集成测试发布自动化流水线。 后面,我们将结合上面场景,向大家介绍百度持续部署是如何实现的。 服务架构 整个系统由命令行工具、web服务、中转服务及单机agent+部署插件几部组成(如图2所示)。用户过命令行工具触发一次变更,在web端进行参数解析及任务发,对应执行机器agent过心跳获取任务后,调用部署插件执行实际任务。涉及大包及不同网络环境的部署会进行中转下载。 解决方案 各业务线拥有各自的包范,语言、框架不统一,部署策略不一致 为避免杂乱无章又不范的服务代码及配置文件的目录结构,Archer定了一套既灵活又完整的包范。
TOP