关于 全套服务文昌找妹子上门41435693】xtd 的搜索结果,共866
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置件变更(数据变更由于其高频、大量的特点,我们已在数据传输章《嗖的一下,让数据自动生效》中专讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决方案,实现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一分布式的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息包括:在机器部署信息(机器IP,部署路径,配置,端口信息),的实例运行状况等其他重要信息。简单来讲,它提供了一个名到资源信息的一个映射关系。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通过对资源合理的组织,极大的简化了运维操作,提升了运维效率。
w****0 2018-07-11
单机房故障自愈-黎明之战
干货概览 在故障自愈机器人,保你安心好睡眠一中,我们介绍了单机房故障自愈的必要性和解决思路。本主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一个实例或者多个实例部部署在同一物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
这个件注释很简单但水很深,我们该用标签还是UUID来标识磁盘,件系统自检功能要不要开,这都可以聊好几个小时。 看看各的启动优先级也是一个讲究多多的过程,iptables会比network先启动这类依存关系很好理解;但我也遇到过云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动过程,正式版的启动过程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在大家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程师,云确实也很有意义啊。 夜静人稀,沙龙关好了小,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又微微一笑,“不传!不传!”----老舍《断魂枪》
追****圣 2018-07-11
给书记省长讲清楚云计算
人不仅要住房还可以盖房,不仅会逛超市也会开菜市场。 政府和大型国企不仅能采购云计算,早晚也会走向发展云计算的路。 本不谈任何技术细节和商业情怀,而是从政企的角度说明什么是云计算。 本包含如下内容。 从大时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以球的行业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了球的信息技术革命,我国借助这次技术革命的大好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的生活,其行业生态也在逐步分化扩大,这一现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等少数行业,国计算机从业人员不超过万人,从业人员大都有很深的学术背景。 世纪90年代,户、论坛、邮件系统开始影响部分群众的生活,国内从业人员约为十万人,可以分为软件和硬件两类工程师。
s****d 2018-07-11
亿元级云用户分析
1.云目的分析 大型云用户云的宏观目的和普通用户类似,但多角色多部的利益诉求非常复杂。 降低成本:客户最直观的诉求,或者削减IT预算,或者同等预算下支撑更多的;其他客户诉求都难以清晰描述,唯独成本可以看发票和合同。 明确责任:客户不想承担各个IT系统的衔接和选型责任,相比软件厂商和系统集成商,云厂商的责任覆盖范围会更广泛一些。 收拢数据:云本身并不碰业数据,但云是很好明确业数据存储位置的机会,云业改造是规范数据结构的理由。 求新图变:企业客户在气势如虹时要居安思危,在困境危难之中穷极思变,IT技术是企业的潜在增长点甚至退路。 本讨论的是有模糊度和利润空间的云计算项目,CDN和IDC资源可以用做计收载体,但不能做为云目的分析。亿元以器、CDN的订单很多但既无技巧也无利润,这些资源厂商也在跟云厂商学习如何包装项目。 2.客户角色利益分析 大企业多角色之间的利益诉求不同,所以表现形式也不同。我将客户三大角色列出来讨论,销售-售前-项目经理铁三角组合明确客户的诉求,才更好游刃有余的客户。
小****园 2018-07-10
让PB级云存储不再神秘
ToB业的用户规模远不如ToC应用,但件的存储周期和可靠性要求十倍于个人娱乐用户。ToB业涉及人员请注意一下,带宽和存储已经都降价了,连带着大数据和AI技术都在进步,以前不敢想的业场景可以去实践了。比如高清企业视频会议和无人机航拍后人工智能做设备点检,还有一呼之欲出的IOT方案,这都是在促进生产力的进步。 近几年自然数据的产生和处理能力急剧提升,PB存储俱乐部里也有了一批高科技新玩家,我们愿意帮着他们改变世界。比如医疗信息化整改,一个区域的所有PX影像要集中存十年以,而且随着医疗器械的更新换代,这些影像数据会越来越大。以前我们拍个CT片是横着切5片,一个胶片20MB,现在我们拍个CT是纵切30片,一个胶片是200M。比如基因测序,每家基因公司都立志将人类的基因记录一遍,录完人类的还有其他生物可以搞。比如气象和地质活动,现在有了更新的监测手段、更密集的监测网点,数据记录量也翻倍增加。这类方案对存储要求长周期平滑扩容,云厂商的对象存储会是这类客户的最佳方案。 4、变通和妥协 对象存储并不是万能解决方案,它有解决不了的问题,也愿意为适应现状做兼容和妥协。
M****点 2018-07-10
中国云计算现状——产品篇
前言 章《中国云计算现状——成本篇》(特大号首发改名为《做好云计算要花多少钱》)讲的是成本问题,即什么企业有可能能做云计算。本是第二篇产品篇,目标客户是云计算产品经理和云计算标准用户。我从一个老用户的角度谈谈每种云计算产品该如何使用,哪些产品改进是刚需放心吐槽,哪些产品有内因就是改不了。本主要说用云产品的问题,买云产品的问题在采购篇单聊。 正 现在是2017年,云计算是物理硬件的优质替代方案,客户很认可云计算极低的采购和交付成本优势。这时候我们要少被企宣PPT洗脑,追求华而不实的远景,这些PR章的受众是风险投资、客户决策层和创业者。我们应该摸清楚云方案和硬件方案比有什么特点和局限性,客户明白特点才能使用得心应手,客户明白局限性才会早作备用方案,产品经理心里不慌才会关注核心功能。 一、IaaS产品 IaaS平台的本质是,产品以做硬件资源的虚拟化为本,业承接物理硬件替代需求,其优势是最快速度最低成本交付,客户为预占的物理资源付费。IaaS产品是最经典的云计算,核心组件是云主机,如虚拟网络、云硬盘和安组都是为支撑云主机业的。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
附录2:网到一个写NTPD和ntpdate的水和本内容有些类似,那个是我多年以前写的,不是借鉴和抄袭,严肃脸。
嘟****y 2018-07-11
大型企业适用的云平台账户体系
用过去管理虚拟机的经验,管理IaaS和PaaS时要有资源池隔离,不同部和项目的主机资源要分别计费和管理。 一个很常见的场景是,人事部的OA系统申请了15万云主机费用,生产车间的ERP和销售部的CRM系统不设限,外部客户A项目预算是50万,B项目是200万,等等等等。 如果没有资源池的概念,就是一个账户管所有资源的“大通铺”模式,客户要把脚趾头都掰完了才能算清各项目的消费金额;万一云平台调整了资源价格,较真的客户又要从头重算一次。 这个“大通铺”最尴尬的不是计费繁琐,而是一个账户下所有资源毫无权限隔离,客户或者只有一个人去登录云平台,或者将不同业注册完孤立的账户。互联网公司无法理解传统企业和自然人有关的流程是多沉重,客户选一个云平台管理员完成所有操作,客户的项目越多管理员员就越晕越累。将不同业区分为不同账户也解决不了问题,因为客户和云平台都要将这批账户统一管理,但实际扣费进度总会超出意外,项目欠费停机或者追加预算,挨骂受累的都是平台管理员。
无****禾 2018-07-11
云客户需求引导管理--实战型IT太极拳
(这些运营问题都是2015年的,可能略有老化) 案例3.客户被同集团的云计算公司的欲哭无泪,我们接盘时提了一大堆需求,我同样是拒的比接的多。客户问能利旧设备么,我认为利旧设备的配置都太高啦,还不如租我们的廉价器。客户要我们按照旧接口去定制开发,我指出用我们的SDK对接只有半个人日,而旧接口连档都没有只能猜。客户要我们派几个高工长期驻场,我说明所有故障都可控且已演练,远程排障我们有10个高工主程,但长期驻场我们高工得抑郁离职了。客户担心日常无事可做了,我们就帮客户做了月度巡检流程,但整个流程我们程不参与,他们巡检成功就是双保险,忘了巡检也有我们的监控兜底。 案例4.有公有云客户说要买最便宜的带宽,但最终沟通发现对方是要做非核心日志传。云平台默认的计费规则是行带宽免费,但免费不限流的行带宽不承诺SLA。最终结果是建议客户短期内买几十台低配云主机,同时做好客户端容错,长期看建议这些日志直接传至对象存储,还能配合我方大数据做MR。 案例解析 云计算主要企业客户,企业客户内部分为采购、技术、业、管理等多个角色,在本案例中的技术和运营团队是非常讲道理的。
M****H 2018-07-11
故障定位场景下的数据可视化实践
基于面的需求,可以总结为以下三个定位的层次,从整体到局部逐步缩小故障范围,到故障根因: 局问题定位:快速确认线状态,缩小故障判定范围。为可能的止损操作提供判断依据。本会介绍如何构建一个景分析仪表盘。 细分维度定位:通过分析地域、机房、模块、接口、错误码等细分维度,进一步缩小问题范围,确定需要排障的目标模块、接口等。本会介绍如何基于多维度数据可视化解决维度数量暴增带来的定位难题。 故障根因确认:一些情况下,问题的根因需要借助除监控指标之外的数据进行分析。例如线变更、运营活动导致的故障。本针对导致故障占比最高的变更线类故障进行分析,看如何快速到可能导致故障的变更事件。 景掌控缩小范围 对于一个乃至一条产品线而言,拥有一个布局合理、信息丰富的景监控仪表盘(Dashboard)对于状态景掌控至关重要,因此在百度智能监控平台中,我们提供了一款可定制化的、组件丰富的仪表盘。 用户可以根据的特征,自由灵活的组织仪表盘布局,配置所需要展示的数据信息。
TOP