关于 明屈桑拿全套服务 78792796-微V号上海闵行区一夜情特殊 的搜索结果,共1547
疏****月 2018-07-09
线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的点,我们已在数据传输文章《嗖的下,让数据自动生效》中专门讨论过)。般的业线具有不定时操作、业部署况复杂、单机启停策略复杂等点。在手工运维时代,运维人员需要花费大量精力进此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了线部署系统——Archer。Archer致力于提供产品线过程的可迁移发布解决方案,实现键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令工具作为发起线的操作入口,这种设计模式也决定了其易于集成的点。在DevOps流水线作业中,Archer可以作为个环节结合进整条测试发布流水线中。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、部署况、实例运状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的分布式的名字系统,是百度云Noah智能运维产品中的个重要基础系统。它为每赋予个独无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息包括:在机器部署信息(机器IP,部署路径,配置,端口信息),的实例运状况等其他重要信息。简单来讲,它提供了名到资源信息的个映射关系。
布****五 2018-07-10
如何执条命令
干货概览 今天我们不聊层建筑,不聊单机房自愈,也不聊智能运维的暗与黎,今天我们聊个很基础的话题:如何执条命令。许多人看到这,可能觉得这是个简单至极的问题,事实果真如此吗,别急,下面我们来抽丝剥茧,探究竟。 什么是命令 首先回顾下“命令”的具体含义,发令以使之,谓发令而使其做某事,这是“命令”词的基础释义。从这里我们可以看命令的三个最基本的要素:命令内容(令)、命令传递(发)、命令执(使)。如果将这三要素限定在,它们又是如何运作的呢? 图1 windows与linux下的命令 命令内容(令) 无论是windows还是linux操作系统,都会提供相应的CLI(不要吐槽windows的CLI难用),供使用者交互执命令或运批处理脚本。仔细观察,所有命令都有个相同的点:固定词+选项+参数,无出其右。因CLI伴随着操作系统的诞生,且命令处理又是个复杂但相似的过程,因此各种语言也都提供了相应的库支持,如C语言提供了getopt/getopt_long等函数,C++的boost提供了Options库,shell中处理此事的是getopts和getopt。
s****d 2018-07-11
亿元级云用户分析
资源持续--亿元大客户不要求云平台永不故障,但要云平台承诺清晰SLA,事后给个合理的故障报告。 后记 如我在《复制阿里云并不难》中所说的,个云业半个IT界”,云业将垄断IT界半的营收和利润。本文讨论的亿元大项目,目标就是下IT圈的营收限。现在亿元大单都是云厂商在侵入系统集成商的势力范围,后面云厂商会得到越来越多的亿元大单。
流****水 2018-07-11
度云企业级运维平台——NoahEE
发现后由谁来进修复? 物理操作维护怎样反应到系统里? 不同角色(职责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE通过故障自动发现与工单流程解决了面的问题。系统自动探测故障放入故障池,并建立故障工单,由相应的人员进操作。另外,NoahEE提供了不同的工单流程覆盖了日常机房运维中的操作,从设备采购入库、架、机架变更,直到设备下架、出库生命周期覆盖,做到所有运维操作记录可追溯。有了资产管理,运维人员可以在器完成入库、架工单后即可在管理中看到该器并进管理,无须任何其他操作。图胜千言,我们看看资产管理的点: 图3 资产管理 部署管理 应用部署直是运维工作中的重点,般来说,我们面临的问题有: 批量部署难,怎样定位目标机器?如何快速部署? 灰度测试难,怎样通过灵活的部署方式,先进小流量线测试,待效果达到预期后再扩大部署? 回滚难,发现问题后怎样回滚? 面的第个问题,实际管理中已经解决了,也就是说管理帮我们完成了资源定位工作。其他的问题,NoahEE的部署管理模块通过“分级发布”来解决。
s****7 2018-07-10
知著看技术误解——从裸光纤和NTPD谈起
NTPD做时间调整会有效减少这类形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详见附录实验);也不会盲目信任远端时钟源,甚至固执的拒绝同步时间。NTPD相信本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳定的时间源,算出双方间的网络延迟,然后才会采信新的时刻进时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。我们很难成功调试NTPD,会装NTPD又没有会装LAMP可以去吹牛,时间长了NTPD就背黑锅了。 真有TOP10的互联网公司和亿国家级项目里用ntpdate+crond,代架构师为什么有这个误会无人深究,下代人将误会固化为偏见,新代人将偏见神化为迷信。
追****圣 2018-07-11
给书记省长讲清楚云计算
本文不谈任何技术细节和商业怀,而是从政企的角度说什么是云计算。 本文包含如下内容。 从大时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以球的业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了球的信息技术革命,我国借助这次技术革命的大好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的生活,其业生态也在逐步分化扩大,这现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等少数业,国计算机从业人员不超过万人,从业人员大都有很深的学术背景。 世纪90年代,门户、论坛、邮件系统开始影响部分群众的生活,国内从业人员约为十万人,可以分为软件和硬件两类工程师。 进入2000年,无纸化办公、游戏、社交、电商改变了大众的生活的方式,国内从业人员已经远超百万,按技术分类有数十种工程师。
p****d 2018-07-11
单机房故障自愈--运维的春天
干货概览 在单机房故障自愈--黎之战中,我们介绍了单机房故障自愈的准备工作和基础设施,包括容灾能力建设、监控平台以及流量调度平台。本篇主要介绍单机房故障自愈的具体解决方案,内容包括: 单机房故障止损的能力标准 单机房故障自愈的整体架构 单机房故障自愈的常见问题和解决方案 单机房故障止损的能力标准 在单机房容灾能力、故障发现能力、流量调度能力基础,业线具备了通过流量调度进单机房故障止损的条件。理想况下,我们希望构建完整、自动、智能的自愈方案,但各个业线的点不同和基础能力参差不齐,很难蹴而就,所以我们建立起自愈能力的等级标准,业线根据自身况制定相应建设计划,逐步提升自愈能力。 自愈能力等级标准划分为5级,从Level 0的完人工止损,到Level 4的自动化、智能化止损。对于Level0、Level1,人工感知止损面临着速度慢、误操作、场景覆盖不、风险控制能力不足等问题;、Level2则实现了止损操作的平台化、预案化,定程度提升了止损效率;Level3则实现了自动化报警联动故障止损,实现了止损效率的进步提升。
M****点 2018-07-10
中国云计算现状——产品篇
前言 篇文章《中国云计算现状——成本篇》(首发改名为《做好云计算要花多少钱》)讲的是成本问题,即什么企业有可能能做云计算。本文是第二篇产品篇,目标客户是云计算产品经理和云计算标准用户。我从个老用户的角度谈谈每种云计算产品该如何使用,哪些产品改进是刚需放心吐槽,哪些产品有内因就是改不了。本文主要说用云产品的问题,买云产品的问题在采购篇单聊。 正文 现在是2017年,云计算是物理硬件的优质替代方案,客户很认可云计算极低的采购和交付成本优势。这时候我们要少被企宣PPT洗脑,追求华而不实的远景,这些PR文章的受众是风险投资、客户决策层和创业者。我们应该摸清楚云方案和硬件方案比有什么点和局限性,客户点才能使用得心应手,客户白局限性才会早作备用方案,产品经理心里不慌才会关注核心功能。 、IaaS产品 IaaS平台的本质是,产品以做硬件资源的虚拟化为本,业承接物理硬件替代需求,其优势是最快速度最低成本交付,客户为预占的物理资源付费。IaaS产品是最经典的云计算,核心组件是云主机,如虚拟网络、云硬盘和安组都是为支撑云主机业的。
w****0 2018-07-11
单机房故障自愈-黎之战
干货概览 在故障自愈机器人,保你安心好睡眠文中,我们介绍了单机房故障自愈的必要性和解决思路。本文主要介绍单机房故障自愈前需要进的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进止损: 1.存在单点 描述:系统内只有个实例或者多个实例部部署在同物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。
M****H 2018-07-11
故障定位场景下的数据可视化实践
而对于维度取值数量多,且不同取值数量级差距较大况(例如分省份的流量下跌判定),使用饼图或趋势图很容易把流量较小省份的信息隐藏掉。这种场景下,我们可以通过维度取值自动展开功能,分别查看每个省份的状态。 多个维度关联分析 细分维度的故障所带来的表象可能会在多个维度均有表现,比如整体的访问拒绝升,我们会发现分机房的拒绝量升,也看到分模块的拒绝升。那么我们如何确认故障的根因是来源于某个机房还是某个模块,还是这两者的交叉维度,即某个机房的某个模块导致的问题。 矩阵热力图可以解决这问题。将需要做分析的两个维度分别作为横纵坐标,通过阶梯的阈值颜色将对应交叉维度的取值展现再坐标。我们便可非常直观的看到这这两个维度对于整个业的影响况,如下图所示: 我们可以看到,从纵向的分模块维度,可以看到Module 4在多个机房都有显的访问拒绝况,而在横向分机房维度,则没有显的征。则说是Module 4模块导致的问题。 嵌维度下钻分析 类似于国家-省份-城市的域划分,域-机房-机器的部署划分,我们可以看到很多维度之间存在着层次嵌的关系。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因大致可以分为四类: 基础设施故障:物理机房故障、网络链路拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储、计算故障等 单机房故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24小时值班,接收大量的报警,随时准备在紧急况下进响应、决策、操作系列故障止损动作,尽量挽回损失,降低故障影响。 但述解决方案会面临如下问题: 响应可能不够迅速:例如间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执的完整故障处理过程,并及时向运维人员同步故障处理状态。运维人员的职责由处理转向管理,最终运维人员在低压力值班中保证稳定运
TOP