关于 全套服务绥化火车站找妹子上门41435693】qcq 的搜索结果,共936
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决方案,实现一键完成机器初始部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
当前云计算技术的势头很好,但因为技术和市场等原因还需要慢慢发展,而且云计算做的是“锦添花”的事情,企业用不用云计算对自身业功能影响不大。我们运维人员从做事的可靠性、有局意识,凭借这些特性仍然能活的很好。运维这个岗位可能会消失,但做过运维的人还是有很多路可以走的。 大家都知道黑云压城也该未雨绸缪了,如果你已经是个运维老鸟或者很快就投身运维工作,我建议大家往这几个方向动动脑: 1、企业采用公有云方案后,仍然需要一个懂行的人解决公有云平台的监控、评估、采购、报修这类问题。但这个职位应该一个公司公司只需要一个人,且再等十年云计算彻底标准后还会再次消失。当然了,我相信能胜任这个岗位的人,在云计算已经规范到不需要专人维护的时候,他们也会有能力到更合适的岗位。 2、进行云计算器维护;几大云供应商自己也要维护器,那些大中型企业肯定会自己做私有云,在这个云计算平台里也是需要运维人员进行从低端监控到高端架构的一系列维护工作,但自动运维技术会让运维人员的数量大大减少,可能每个公司都只有一两个小团队了。
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个的实例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署信息,怎么办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署实例有一个出现故障了,我想对下游屏蔽该故障实例,怎么办? 下面以一个简单的例来说明,假设一个模块名是Server,它的游是Proxy,下游是Redis,当出现变更或者故障时,如何让游感知到呢? 当新增线实例、下线摘除实例或者实例发生故障时,BNS系统通过部署在机器的客户端实时感知到实例的状态变,同时新增和删除实例的变更情况会立即同步到分布式的缓存系统中,这样用户通过一个BNS名字就可以感知到下游的实例变
流****水 2018-07-11
度云企业级运维平台——NoahEE
随着业的发展,分布式应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。
j****2 2018-07-10
百度大脑开放日来袭 24种新AI能力呈现
比如百度EasyDL与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对7种常见垃圾自动分类,后期还可以通过增加训练数据识别更多种类;在和德邦物流的合作中,为用户免去了自行填写信息的麻烦,使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;更具科研意义的还有百度EasyDL与中科院在珍稀鸟类识别项目展开的合作,在传统分类学日渐没落的今天,百度EasyDL可以利用强大的图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前中科院使用EasyDL训练对超过12万幅图片进行分析,目前在700多种鸟类模top5的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%,满足线要求。 与卓繁信息的合作,百度大脑还打造了“AI便民”的新型无人值守受理。通过UNIT、OCR、人脸识别等AI技术,“无人值守”的政新模式为社会公众提供年无休的24小时自助办事,提升了政府为民的能力。 开放日当天,网红智能猫窝的设计者百度大脑工程师晚兮也在现场为大家讲述了智能猫窝设计者们的初心。
w****0 2018-07-11
单机房故障自愈-黎明之战
要求:将拆分为若干不同的逻辑单元,每个逻辑单元处于不同的物理机房,均能提供产品线完整。 3.不满足N+1冗余 描述:任意单个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房过载,造成多个机房故障,造成更大范围的影响。 要求:容量建设需要对于每个逻辑单元都要有明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,同时需要保证时及时更新数据和扩容,避免容量数据退。同时对于流量的变趋势,也需要有提前的预估,为重大事件流量高峰预留足够容量(如节日、运营、假期)。 4.关联强耦合 描述:下游使用固定IP或固定机器名进行直接连接。 问题:单机房故障发生时,关联的下游之间无法进行快速的流量调度止损。 要求:线关联不允许使用固定IP或机器名链接,需使用具备流量调度能力的下游连接方式以实现下游依赖解耦,下游发生单机房故障,可以快速调整路由比例实现止损。 单机房容灾能力--盲测验收 完成以四点单机房容灾能力建设后,业线就具备了通过流量调度进行止损单机房故障的基本条件。
s****d 2018-07-11
亿元级云用户分析
限制客户梦想的是老旧系统是否支持常见协议,还有底层工程师能否推动层业测试和变动。 API调用PaaS——API云就是不可控过程的黑箱,客户没预算没精力就盲目信任云厂商。客户有精力就做多云冗余校验,有预算就做专有资源池部署;未来云厂商还会自定义SLA标准——大部分API云连等待超时都没定义。 版本发布和数字转型——无论是微观的版本发布还是宏观的数字转型,其实都和云没直接联系,一个是室内装修工作,一个是新建房屋工作,但装修的最好时机是房屋重建的时候,云厂商要帮客户推动IT技术革新。 5.输出分析 云厂商输出给客户的即有云端IT资源,也有平台输出。是个比资源更难量的概念,我只引一把苗出来。 咨询规划--如果直接给客户买资源,那就只能谈性价比,而且资源本身不会说话,所以云厂商要做好咨询规划。 明晰验收--云项目的实施和结项都是以结果为导向的,明确的过程控制和验收标准对供求双方都是保护。 友好接口--面对亿元大金主,云厂商的下限是类比传统IDC,要把金主伺候舒了就要学IOE类集成商。
追****圣 2018-07-11
给书记省长讲清楚云计算
人不仅要住房还可以盖房,不仅会逛超市也会开菜市场。 政府和大型国企不仅能采购云计算,早晚也会走向发展云计算的路。 本文不谈任何技术细节和商业情怀,而是从政企的角度说明什么是云计算。 本文包含如下内容。 从大时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以球的行业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了球的信息技术革命,我国借助这次技术革命的大好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的生活,其行业生态也在逐步分扩大,这一现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等少数行业,国计算机从业人员不超过万人,从业人员大都有很深的学术背景。 世纪90年代,户、论坛、邮件系统开始影响部分群众的生活,国内从业人员约为十万人,可以分为软件和硬件两类工程师。
冰****蓝 2018-07-09
如何调节『控制参数』?
“所有”辆的基础横向控制器调谐步骤如下: 1.将matrix_q中所有元素设置为零。 2.增加matrix_q中的第三个元素,它定义了航向误差加权,以最小航向误差。 3.增加matrix_q的第一个元素,它定义横向误差加权以最小横向误差。 林肯MKZ调谐 对于Lincoln MKZ,有四个元素指的是状态加权矩阵Q的对角线元素: 横向误差加权 横向误差率加权 航向误差加权 航向差错率加权 通过在横向控制器调谐中列出的基本横向控制器调整步骤来调整加权参数。下面是一个例。 lat_controller_conf { matrix_q: 0.05 matrix_q: 0.0 matrix_q: 1.0 matrix_q: 0.0 } 调谐附加辆类型 当调整除林肯MKZ以外的辆类型时,首先更新辆相关的物理参数,如下面的示例所示。然后,按照面列出的基本横向控制器调整步骤横向控制器调谐和定义矩阵Q参数。 下面是一个例
小****君 2018-07-11
踏云落地--谈IT就业趋势
一个新软件新的诞生和优,足以让你们的工作变得毫无疑义。企业有饕餮鲸吞般的IT人力需求,现在在用高薪低质的泡面人才充饥,云厂商看到商机正在加速下饺。一旦企业吃饱不饿了,或者云计算饺生产够多了,谁会在意泡面的死活哪?IT行业必然会随着云产品和生态的变发生巨大改变,下图为我的推演总览: 第三.单纯快乐的基础操作员云计算想要解决IT人力短缺问题,但云的降槛功能,引爆了企业更多新项目需求,让整个社会的IT人力更加稀缺。云厂商本来想着云了就可以挤掉操作员的工资了,但实操几年下来倒是越搞人越多:打网线装系统的团队只管理50台物理机,但是云后要管理2000台虚拟机啊,工作不仅保住了还更轻松了;做黑盒测试的团队过去只测试10款手机,用了移动端测试云,一天可以测500款手机;做鉴黄标注的团队扩大了3倍,以前怕风险没开放的功能都重新开放了,过去只鉴黄现在要鉴政了;出大数据报表的团队,做报表的频率从每周一次变成了每天三次,还要人工写分析报告了。因为云而失业的操作员都是笨死的,网约是会抢黑生意,但脑正常的黑司机都会去开网约
x****7 2018-07-10
从外行进阶专业 传统企业AI转型差的可能只是一个百度EasyDL
与企业业深度结合的AI应用需求,往往需要结合所在领域很强的专业知识,通用AI技术无法满足,例如,目前业界推出的通用物体和场景识别的API无法满足大量个性的需求:家装企业想识别装修图库中的细分家居风格、房间布局分类等,物业公司想通过摄像头识别小区垃圾桶是否已满,施工单位想通过图像识别工地的工人有没有穿工、戴安帽等,这些场景需求是常见的业场景,但是企业很难到现成可用的AI技术,往往需要自己做定制的研发。 2)AI技术自研及运维成本高昂。自己研发AI技术会面临多道难关,首先是AI人才关,国内AI人才池有限,据人民日报的报道,我国人工智能的人才缺口超过500万,供求比例仅为1:10。AI人才的年薪动辄数十万,除非有庞大的业场景,否则,一般体量的企业难以组建独立的AI团队。其次是基础设施关,AI运维需要的器、GPU,在财也是不可承受之重。 3)开发周期过于漫长。用传统的构造深度学习算法模型的方式来做,整个流程至少要花几个月时间,此时市场需求可能已经“凉”了。同时面对新型的AI场景,企业也无法预测投入AI研发能对业带来的实际效果,这是一大隐患。
p****d 2018-07-11
单机房故障自愈--运维的春天
本篇主要介绍单机房故障自愈的具体解决方案,内容包括: 单机房故障止损的能力标准 单机房故障自愈的整体架构 单机房故障自愈的常见问题和解决方案 单机房故障止损的能力标准 在单机房容灾能力、故障发现能力、流量调度能力基础,业线具备了通过流量调度进行单机房故障止损的条件。理想情况下,我们希望构建一完整、自动、智能的自愈方案,但各个业线的特点不同和基础能力参差不齐,很难一蹴而就,所以我们建立起一自愈能力的等级标准,业线根据自身情况制定相应建设计划,逐步提升自愈能力。 自愈能力等级标准划分为5级,从Level 0的完人工止损,到Level 4的自动、智能止损。对于Level0、Level1,人工感知止损面临着速度慢、误操作、场景覆盖不、风险控制能力不足等问题;、Level2则实现了止损操作的平台、预案,一定程度提升了止损效率;Level3则实现了自动报警联动故障止损,实现了止损效率的进一步提升。2016年,百度大部分核心产品线已经实现了Level 2、Level 3的自动止损能力,但在场景覆盖与风险控制仍存在不足。由此,Level 4智能自愈方案应运而生。
M****H 2018-07-11
故障定位场景下的数据可视实践
基于面的需求,可以总结为以下三个定位的层次,从整体到局部逐步缩小故障范围,到故障根因: 局问题定位:快速确认线状态,缩小故障判定范围。为可能的止损操作提供判断依据。本文会介绍如何构建一个景分析仪表盘。 细分维度定位:通过分析地域、机房、模块、接口、错误码等细分维度,进一步缩小问题范围,确定需要排障的目标模块、接口等。本文会介绍如何基于多维度数据可视解决维度数量暴增带来的定位难题。 故障根因确认:一些情况下,问题的根因需要借助除监控指标之外的数据进行分析。例如线变更、运营活动导致的故障。本文针对导致故障占比最高的变更线类故障进行分析,看如何快速到可能导致故障的变更事件。 景掌控缩小范围 对于一个乃至一条产品线而言,拥有一个布局合理、信息丰富的景监控仪表盘(Dashboard)对于状态景掌控至关重要,因此在百度智能监控平台中,我们提供了一款可定制的、组件丰富的仪表盘。 用户可以根据的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据信息。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
附录2:网到一个写NTPD和ntpdate的水文和本文内容有些类似,那个是我多年以前写的,不是借鉴和抄袭,严肃脸。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
AHALO称Hybrid-cloud Application Layout and Operation system,顾名思义,它是私有云或混合云环境中的基础设施部署和集群控制系统,是混乱集群中的第一束光,让无序的集群世界变得有序可控,是云最底层的基石,肩负着裸机环境配置,root域权限控制和智能托管基础设施的重任。如果没有HALO,集群机器将处于失控的状态。它屏蔽了云底层繁杂的管控逻辑,提供简接口给层系统NoahEE调用,使层系统更好更快地释放价值。 Q这么优秀的系统到底是如何实现的呢? AHALO系统采用主从架构,分为Master端和Agent端。 Master端主要做复杂的任调度和管控逻辑,并且所有功能都是模块设计,用户可以根据自己的需求定制安装,包括虚拟容器管理,应用包管理、部署、扩缩容、拓扑搭建和保活,集群控制等。 Agent端则以简单为原则,弱繁琐功能,仅作为任的执行器,其中的supervisor组件,结合父双进程原理,做到自升级和自保活,把云运维人员的工作量降到最低。 整个系统的工作流程也十分简洁优雅!
TOP