关于 全套服务方正找妹子上门41435693】uig 的搜索结果,共1009
h****e 2018-07-10
程序:我从哪里来?
通过部署在机器的客户端感知到实例的状态变化(比如实例状态由0变成-1,即常变成非常),并将数据同步到系统中的分布式缓存,游模块可以通过查询redis.noah.all的实例状态结果,主动过滤非常的实例,也可以在BNS系统中发起屏蔽故障实例的操作,在查询过程中会自动过滤该故障实例。 在下一节中将具体介绍BNS系统的整体架构。 基本架构 BNS系统主要包含几个部分:流量接入层,Web Server,存储层,代理客户端。 作为一个底层的基础,BNS系统每天的访问量近千亿次,这对系统的可用性提出了很高的要求,因而系统需要在各个层面有完善的容灾能力和流量管控能力。 1流量接入层 系统通过HTTP接口对外提供变更,用户通过Web页面或者接口进行或实例信息注册。为了保证平台稳定和安的运行,需要对非法和异常请求进行拒绝,在流量接入层(Proxy)端提供了以下两个功能: 流量鉴权:每一个组、单元、实例的注册都需要进行权限验证,用户只有申请了合法的Token才能允许访问,另外系统还提供了白名单等其他的鉴权式。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决案,实现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本式执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通过对资源合理的组织,极大的简化了运维操作,提升了运维效率。
w****0 2018-07-11
单机房故障自愈-黎明之战
本文主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及解决法 基于网络故障及业故障场景的面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一个实例或者多个实例部部署在同一物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。同时流量调度也无法使得恢复常。
追****圣 2018-07-11
给书记省长讲清楚云计算
前几条都是从降低成本可靠的角度请云计算企业来合作建厂,如果你有市场有客户那对会主动寻求合作。从长周期来看云计算的客户是覆盖行业的,各地内部采购的计算机项目根本不值一提,市场和客户要靠云计算厂商自己去。但现在云计算厂商还在早期扩张摸索之中,云厂商极端渴求各种政云企业云成功模式案例,一旦摸出来案例会迅速推广到国。这个窗口期只有三五年,随着政云企业云被其他公司摸透并推广开,这些项目就从首发明星案例变为普通捆绑销售了。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 前文说的为何要引凤,如何算筑巢。当云厂商看到商机肯合作时,我们要掌握各类云厂商的特点才能心里有数。 第一类是大型云厂商,他们自身有很强的资源整合能力和执行销售能力。地政企和这类企业合作的话语权很弱,但极小风险就能看到收益。 第二类是创业云厂商,他们一般是靠技术优势和态度从大型云企手里抢单。地政企和这类企业合作时有很强的议价能力,注意不要盲目倾向技术优先的创业云厂商,而是选择态度和执行能力好的创业云厂商。地政企很难确切搞懂厂商的技术有哪些优势,而项目的推进落地都是要靠云厂商来执行的。
s****d 2018-07-11
亿元级云用户分析
IT决策人要重度考量IT部利益,这就是云销售和售前的工作重点了,售前和销售要安抚IT决策人的顾虑,尊重客户IT部的权益: 业案的IT可行性 新架构带来的新责任 新项目带来的新权益 云迁移的隐性成本 技术锻炼的团队收益 新愿景带来的团队增效 工作量转移的减员压力 IT案决策人明确项目的过程、执行人和验收标准,但从云供应商角度看,搞定案决策人是项目式启动,不代表项目能完成验收。 2.3 IT技术执行人 各类具体干活的工程师架构师,他们对云的过程程参与,从自身立场品味着云项目的利害关系和云产品的使用感受。每个公司环境都不相同,他们可能强力推进项目,也可能暗地里阻塞实施,大部分情况下是被动拖沓进度,但合理引导很容易积极配合。他们的诉求更简单直白: 操作的简便清晰不出错 建设和维护的劳累程度 云IT技能的个人稀缺含金量 云对旧有烂工作的解放 云对个人基础技能的替代 稳定故障清晰 汇报汇总展示便 要想让IT技术执行人成为云厂商的好帮手,工程进度靠项目经理配合,资源协调靠销售配合,技术操作类诉求靠售前引导。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
运维人员的职责由处理转向管理,最终运维人员在低压力值班中保证稳定运行。 单机房故障自愈解决案概述 百度AIOps框架中,单机房故障自愈解决案构建在运维知识库、运维开发框架、运维策略框架三个核心能力之。具体过程为自愈程序搜集分散的运维对象状态数据,自动感知异常后进行决策,得出基于动态编排规划的止损操作,并通过标准化运维操作接口执行。该解决案策略和架构解耦,并且托管到高可用的自动化运维平台之,实现了业在任意单个机房故障情况下皆可自愈的效果。 截至目前该案已覆盖百度大多数核心产品,止损效率较人工处理提升60%以。典型案例: 在8月28日某产品在单机房故障发生后1min55s完成止损。 在后续文章中我们会继续介绍单机房故障自愈的更多详细内容,敬请期待! 单机房故障容灾能力的建设 在容灾能力建设中有哪些常见问题? 如何证明已经具备单机房容灾能力? 单机房故障人工止损法 人工止损时如何感知故障? 人工止损时如何收集故障信息? 人工止损时如何进行流量调度? 单机房故障机器人止损法 如何设计单机房故障自愈整体案? 如何降低流量调度风险?
无****禾 2018-07-11
云客户需求引导管理--实战型IT太极拳
我们并不介入用户内部管理问题,但我们要把客户变成朋友,而不是做一个冷脸旁观的衙。 4.推进业的能力 无论是个人技术革新业绩,团队节省成本业绩,还是内部工作流改善,甚至对外能力优化,都是帮推进客户的业,帮客户出政绩。 客户很容易会异想天开,我现在更多是说他们的想法达不到出政绩的目的,大鸣大放后黯然收场,对客户也不是好事。 传统IT企业在198X年成功崛起,是因为他们的技术帮客户延伸了业能力,比如用ATM机帮银行拓展柜台、用更好的技术算账和转账;最近十几年则只能靠拿软硬件升级来从客户手里钱,那些IT系统只是保命续命却诞生不了新生命。 希望云厂商能够引以为鉴,我也在摸索如何帮客户真意义推进业。 人员需求 客户需求不能靠谦卑的态度来引导,而是可靠IT技能案的输出。这对案推进者,也就是解决案架构师的个人素质要求非常高。技术要可以取信于客户技术团队,又要非常了解云产品,还要认可企业级IT模式,这才有可能胜任这项工作,让客户的消费额千万甚至亿。 只了解产品说明书的业售前是完不成这种工作的,从云技术后台转售前的同样也搞不定该工作。
1****2 2018-07-09
百度安:AI 是系统工程 需要真开放的安护航
然而,AI 是一个大的生态系统,它的安也是复杂的多层面的。任何一个企业都无 力涵盖所有。这也是OASES 联盟的价值所在。它希望针对AI 安能够发动整个产 业链的力量,联合终端厂商、安厂商和研究机构,通过生态开放、联合的力量,保护 各种智能设备的安,最大化避免AI 生态出现安和隐私的灾难。据悉,百度安已 经将述的云管端安案对联盟内开放。 作为一个技术型的生态联盟,它跟以往联盟最大的不同之处就在于实现了真的开 放,不仅是提供单向的,而且是核心基础技术开源,专利共享。这就打消了产业 链的顾虑,有效地推动了核心技术落地,推动联盟之间的合作。 AI 时代,百度安寄希望于行业联合和技术创新,让安的天秤向防御的一倾斜 一点,再倾斜一点。
嘟****y 2018-07-11
大型企业适用的云平台账户体系
供应商用“认证”“审核”这类词跟甲说话就是态度不端,这又是一句“客户你好,你要从管理,爱审不审,不审就滚”。这类甲的身份资料是公开的,也不会恶意赖账,这时应该由乙主动记录合规信息,后台透明完成功能开通,设置消费和透支限。 假设客户是成长型公司,以前CEO创建的账户让员工继续使用。某天CEO被老婆打了一顿,因为他的网购记录有给“丽丽”订花和开房;或者网警约谈该倒霉蛋,警告他不要用网盘传播非法视频;也可能CEO打开聊天工具,发现自己很多幼稚鸡汤文给投资商。不要误会是有人要整这个CEO,SSO单点登录多项,同事用混了账户也常。 如果客户放弃使用某云之后,原账户不注销滚动欠费几千万怎么办?云巨头们都是横向一体化经营,搞不好会和客户有竞争,霸王注册条款下的法风险确实存在。 一个企业的账户不应该由客户注册,而是供应商主动提供,像IDC和CDN就会主动给客户提供查带宽的账户。这个账户只是为了让客户低成本的获取,不包含客户给供应商的任何承诺,双的权利义要看商合同。 第二.账户内资源隔离 企业客户尽量会将资源集中采购,在采购IDC/CDN这类简单时不用担心资源混淆。
M****点 2018-07-10
中国云计算现状——产品篇
前言 篇文章《中国云计算现状——成本篇》(特大号首发改名为《做好云计算要花多少钱》)讲的是成本问题,即什么企业有可能能做云计算。本文是第二篇产品篇,目标客户是云计算产品经理和云计算标准用户。我从一个老用户的角度谈谈每种云计算产品该如何使用,哪些产品改进是刚需放心吐槽,哪些产品有内因就是改不了。本文主要说用云产品的问题,买云产品的问题在采购篇单聊。 文 现在是2017年,云计算是物理硬件的优质替代案,客户很认可云计算极低的采购和交付成本优势。这时候我们要少被企宣PPT洗脑,追求华而不实的远景,这些PR文章的受众是风险投资、客户决策层和创业者。我们应该摸清楚云案和硬件案比有什么特点和局限性,客户明白特点才能使用得心应手,客户明白局限性才会早作备用案,产品经理心里不慌才会关注核心功能。 一、IaaS产品 IaaS平台的本质是,产品以做硬件资源的虚拟化为本,业承接物理硬件替代需求,其优势是最快速度最低成本交付,客户为预占的物理资源付费。IaaS产品是最经典的云计算,核心组件是云主机,如虚拟网络、云硬盘和安组都是为支撑云主机业的。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
前言 沙龙的镳局已改成客栈。东的大梦没法不醒了。----老舍《断魂枪》 云计算大潮到来了,我把IT技术像五虎断魂枪一样收起来了。我不会将它压到箱底,偶尔我也会练练聊聊,纪念一下那个搞技术的黄金时代。 本文聊个很有嚼头的技术问题,Linux系统的启动过程,当我们不用自己安装系统以后,丧失了这么多乐趣。 文 1.主板加电和硬件自检,就是开机第一屏启动界面。 CPU和内存插得有问题器会滴滴乱叫,而网卡和硬盘插不插都无所谓,因为这些外设都不属于经典的计算机系统。 早期小内存器一般有内存检测的功能,但256G内存的器启动的速度也太慢了,重启一分钟能启动的还能恢复,重启三分钟可能群集性状就变了,所以我们经常顺手就把他关掉了。 2.读取主板引导配置,现在终于要从外部设备读取数据了。 主板大都是BIOS引导,也有是UEFI引导,但从器用户看区别也不大。 主板可选从USB/SATA/NIC这几类接口获取引导数据,而且可以排队式加载,第一个加载不成功就尝试第二个。系统安装镜像都有个防止误操作的倒计时,而网络引导一般是排在末位,硬盘引导就是通用的系统启动的式。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
假设我认为TCP连接超时断开链接了,你怎么给我传输数据; 玩各种定时给奖励收益的花园经营类游戏,我经常通过修改时间快速刷分; 你的系统时间不对网银都会拒绝登陆,因为加密程序算不出双认可的Token。 三、确的时间是向量 Linux环境下有两个常用工具,NTPD和ntpdate。NTPD是一个时间同步,ntpdate是个时间同步命令。很多工程师都会采用Crond+ntpdate的式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,大部分人没做好为ntpdate这个动作负责。 常的时间是个持续增长的向量,即老时间t1肯定小于新时间t2,新时间t2也小于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,大部分业对系统时间是盲目信任,不相信t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。
p****d 2018-07-11
单机房故障自愈--运维的春天
本篇主要介绍单机房故障自愈的具体解决案,内容包括: 单机房故障止损的能力标准 单机房故障自愈的整体架构 单机房故障自愈的常见问题和解决案 单机房故障止损的能力标准 在单机房容灾能力、故障发现能力、流量调度能力基础,业线具备了通过流量调度进行单机房故障止损的条件。理想情况下,我们希望构建一完整、自动、智能的自愈案,但各个业线的特点不同和基础能力参差不齐,很难一蹴而就,所以我们建立起一自愈能力的等级标准,业线根据自身情况制定相应建设计划,逐步提升自愈能力。 自愈能力等级标准划分为5级,从Level 0的完人工止损,到Level 4的自动化、智能化止损。对于Level0、Level1,人工感知止损面临着速度慢、误操作、场景覆盖不、风险控制能力不足等问题;、Level2则实现了止损操作的平台化、预案化,一定程度提升了止损效率;Level3则实现了自动化报警联动故障止损,实现了止损效率的进一步提升。2016年,百度大部分核心产品线已经实现了Level 2、Level 3的自动止损能力,但在场景覆盖与风险控制仍存在不足。由此,Level 4智能自愈案应运而生。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
大家都知道黑云压城也该未雨绸缪了,如果你已经是个运维老鸟或者很快就投身运维工作,我建议大家往这几个动动脑: 1、企业采用公有云案后,仍然需要一个懂行的人解决公有云平台的监控、评估、采购、报修这类问题。但这个职位应该一个公司公司只需要一个人,且再等十年云计算彻底标准化后还会再次消失。当然了,我相信能胜任这个岗位的人,在云计算已经规范到不需要专人维护的时候,他们也会有能力到更合适的岗位。 2、进行云计算器维护;几大云供应商自己也要维护器,那些大中型企业肯定会自己做私有云,在这个云计算平台里也是需要运维人员进行从低端监控到高端架构的一系列维护工作,但自动化运维技术会让运维人员的数量大大减少,可能每个公司都只有一两个小团队了。 3、进传统行业继续做运维;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成有限的技术革新,比如说实现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛大新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。
TOP