关于 犍为县怎么找到附近服务〖8843O306VX〗服务真实吓染亚疾子 的搜索结果,共1372
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那多部署信息,办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容通知给下游模块? 场景三:我的部署例有一个出现故障了,我想对下游屏蔽该故障例,办? 下面以一个简单的例来说明,假设一个模块名是Server,它的上游是Proxy,下游是Redis,当出现变更或者故障时,如何让上游感知呢? 当新增上线例、下线摘除例或者例发生故障时,BNS系统通过部署在机器上的客户端时感知例的状态变化,同时新增和删除例的变更情况会立即同步分布式的缓存系统中,这样用户通过一个BNS名字就可以感知下游的例变化。
w****0 2018-07-11
单机房故障自愈-黎明之战
如何验证业线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同业线故障情况及止损效率,并给出相应的优化意见。 根据业线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、效果等方面权衡,将盲测分三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测业可根据监控数据决策流量调度目标,对于业际无影响,主要验证故障处置流程是否符合预期、入口级流量切换预案是否完整。 提前通知有损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对业有损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知业盲测时间和可能的影响,业线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知有损盲测:在各业线单机房容灾能力建设完成后,进行不提前通知的有损盲测,对业来说与发生故障场景完全相同。验证业线在单机房故障情况下的止损恢复能力。 单机房故障止损流程 一个完整的故障处理生命周期包括感知、止损、定位、分析四个阶段。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
录2:网上能一个写NTPD和ntpdate的水文和本文内容有些类似,那个是我多年以前写的,不是借鉴和抄袭,严肃脸。
流****水 2018-07-11
度云企业级运维平台——NoahEE
我们推出的NoahEE(Noah Enterprise Edition)脱始于Noah,企业提供了一站式运维解决方案,覆盖了包括日常的故障管理和变更管理中典型的运维场景,致力于政企、金融、教育等行业提供业可用性保障、提升运维效率。 图1 NoahEE概览 接下来,我们把这艘诺方舟分解开来,距离观察一下这艘船的方方面面。 管理 我们首先介绍管理是因管理是整个运维工作的基础,也是NoahEE这个平台上各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是一个“量”,或者说“规模”的问题。在早期业简单时,一个可能部署在几台甚至一台机器上,进行变更等运维操作简单直接,登录机器上人工操作就好了。随着业的发展,分布式应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因卡得一匹。
M****点 2018-07-10
中国云计算现状——产品篇
非技术因素必须用物理机,比如说某软件查不出问题来怪虚拟机,了避免麻烦给它们特地安排了物理机。 了利旧等原因接着用物理机,有些单位的电费是行政部负担的。 既然要用物理机,要和虚拟机联动就要用混合云。混合云就是用专线打通两朵云,或者让物理机和虚拟机内网互通。肯定有读者怪我认识浅薄,但是云内资源调度都做不好的用户,能做好跨云的资源调度。 既然谈了混合云,肯定就要谈云管平台,云管平台不是伪需求而是新需求。当客户的非CDN云资源采购金额过500万以后,其项目之间没有内网互通的需求,这时候该做一个跨厂商的云端资源管理方案了。现在虚拟机不能像CDN一样随意迁移,但未来Serverless崛起,计算能力也会在多厂商之间漂移的。客户提前把云管平台从计费和权限层面做好,至少在项目级别可以和多个厂商侃价,还能模糊计费相关业数据。 五、企业IT咨询和 前面的云计算都免不了卖资源或者卖软件,搞IT咨询和可以让公司增加企业的融资概念和收入构成。中小型云厂商都尝试转型做这类工作避开成本搏杀,大厂商嘴上说不要眼神也很诚
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 在大型互联网公司中,单机房故障因其故障时间长、影响范围大,一直是互联网公司运维人员的心头之痛。在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
后面任下发至具体机器,具体机器再从中转机拉取需要被部署的文件;中转机跨网络环境的部署提供了可能,隔离网段中的机器无法访问内网机器,通过中转的“搭桥”完成了跨网段的数据传输; 提高自动化效率,能够集成测试发布自动化流水线 自动化效率方面,Archer提供了命令行工具,可接入各种脚本、平台。另外,Archer也可定制化单机流程:针对不同的业场景,Archer提供了名“operation_list” 的配置文件,采用YAML语法。单机执行流程步骤被定制化成固定几个种类。用户通过简单的配置,即可现“启停监控”、“启停”、“数据传输”、“执行某些命令或脚本”、“启停定时任”等上线过程中的常见操作的自由组织及编排。这种形式大大扩展了Archer的适用范围。在了解Archer使用方法的情况下,OP几分钟内即可配置出适用于数十条不同产品的上线方案。 其他设计点 每次的部署流程通过web总控端的参数解析后,就被作下发每台被部署的目标机器。当部署任从总控端发被部署机器上时,任的具体执行依赖agent及一系列脚本。
追****圣 2018-07-11
给书记省长讲清楚云计算
综上所述,云计算就是将分散在各个公司的信息技术资源汇聚一个大平台,其兴起始于需求扩大而人力短缺,其未来发展趋势是通过规模经营和数据共享,成新型信息化社会的技术基石。 云计算如何带动地方经济 云计算落地是要自建数据中心机房,我们一般称之云基地,云基地在经济利益和社会影响上和传统工厂并不相同。云基地通俗易懂的展现形式就是开启数十万个高速运转的电脑铁皮箱,但这些电脑不用接显示器也不用人员现场操作,只要这些电脑能开机能上网就能对外。云基地和数字地产不完全相同,数字地产只装修好房,云基地关注用这些房做什。 云基地是无烟工业,并不需要雇佣大量人口,对直接促进就业帮助不大;但云计算没有体矿产投入和物品产出,只需要大量电力启动电脑也不会产生大量污。 云基地像电视台和信号塔一样,通过产生和扩散数据信息对客户提供,这些信息的传输没有物流成本,光速直达全球每个角落。 因云基地全球客户,所以云基地可创造极高的营收,但不能简单的计入地方政府的GDP。一个耗电三千瓦的机柜加属空间占地5平方米,如果云计算资源全部售出,每年可产生20万元以上的营收。
s****d 2018-07-11
亿元级云用户分析
每个公司环境都不相同,他们可能强力推进项目,也可能暗地里阻塞施,大部分情况下是被动拖沓进度,但合理引导很容易积极配合。他们的诉求更简单直白: 操作的简便清晰不出错 建设和维护的劳累程度 云IT技能的个人稀缺含金量 云对旧有烂工作的解放 云对个人基础技能的替代 稳定故障清晰 汇报汇总展示方便 要想让IT技术执行人成云厂商的好帮手,工程进度靠项目经理配合,资源协调靠销售配合,技术操作类诉求靠售前引导。 3.主体贩售资源分析 云供应商不可能靠软件和亿元销售额,只有以资源载体,客户才会给亿元大单。这个观点跟前文的“资源可以用做计收载体,但不能做上云目的分析”并不是冲突而是印证。 以软件和做亿元营收载体,采购决策人会承担巨大决议风险;但平庸的贩售资源又会陷入价格战和关系战之中,云厂商追求市值和利润都不能讲这些老套路了。 我们先列出来哪些资源是单体贩售能过亿的,云厂商把这些资源和其他的软件资源做打包混淆集中交付,云厂商就不是卖资源而是卖梦想了。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
录 请各位多琢磨评估本厂的云底哪些组件是靠谱的,不要让信赖你的客户受伤又受骗。如要学习云计算相关知识,可以多关注我往期云计算文章,比如说 云计算最重要的工作是配合销售和客户:云客户需求引导管理--战型IT太极拳 中国云计算现状系列汇总: 做云计算要花哪些钱,请看第一篇成本篇,原创链接。 云计算产品各有什特色该如何分类,请看第二篇产品篇,原创链接 客户的采购人员如何看云计算,厂商如何锁定采购人员需求,请看第三篇采购篇,原创连接。 如果我们? 时无英雄使竖成名,但这也是机遇, 看云厂商花式作死的九种方法 。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
我在写一篇新的文章,其中会引用这篇2012年的旧文,所以我原样摘抄下来,很庆幸能转型进入云计算这个行业。 云计算的时代正在来临,运维的工作也将在今后几年中发生翻天覆地的变化。 如果你是一个能给自己做主的人,你必须看清形势顺势而,在变革的时代埋头苦干仍然保证不了你的正常生活;如果你是一个弓骑兵,无论你勤学苦练都打不过坦克手的;铁达尼号上的乘客无论多有钱,总是免不了泡进海水里的。 首先,我作一个运维何唱衰运维这个职业。 我们运维靠什能力在公司里自立哪? A.关心硬件和施工; B.关注网络问题; C.擅长系统和的调试维护; D.相对与架构师/DBA的价格优势; E.快速可靠的响应. 大家看看云计算能给企业带来的好处。 A.硬件完全免维护; B.网络接免维护; C.系统、免维护; D.无论是硬件还是人力成本都很廉价; E.可靠性高于个人。 我们会发现,云计算的目标就是要做的比运维人员更好,好“不用关心”的地步。从技术上来说,各大云计算运营商对通用的Web、RDBMS、存储 都是可以做很好的。
布****五 2018-07-10
如何执行一条命令
所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例如下: 信息存储问题:了支持水平扩展,需要高效的内存数据库作缓存。了做执行命令的可追溯、可统计,需要对执行过的命令信息持久化。日均几十亿的热数据,年均上万亿的冷数据,需要仔细选择存储方案。 任调度问题:了达在任意多台器上执行命令的要求,需要确定何时分发命令、何时回收结果以及样的并发度批量下发。 消息传输问题:了保证命令高效正确送达目标器,需要构建一个可靠的命令传输网络,使命令信息在准确送达的前提下保障传输的可靠与高效,毕竟百度的几十万台器分布在世界各地。 代理执行问题:了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。 图2简单问题放大后也变得困难 百度目前拥有分布在世界各地的几十万台器,并且随着业的不断扩张,这个数字还在持续增长,构建一个高效稳定通用可扩展的命令描述、传递、执行系统在这样的环境中有着重要的现意义。对百度各产品线的用户来说,这样的一个系统,最基础的要求是:执行高效,控制灵活,扩展方便。
小****园 2018-07-10
让PB级云存储不再神秘
数据去重问题 对象存储不做数据去重功能,看着简单的功能背后都有蛛网一样的复杂考量,元数据、计费、存储、增数据逻辑、删数据逻辑、回收空间逻辑、用户资源隔离逻辑都会因这个很炫的功能被彻底改变。正要去重的文件就是那些电影,随着版权保护的加深,电影只存原片盗版减少会是趋势,其他文件即使做切片去重,命中率也非常低。我们提供hash值让客户判断该不该删文件,该不该做文件映射就够了。 长周期软硬件换代 对象存储是付费企业级,并不是终身免费但匆匆关张的个人网盘。我们必须考虑十年刻度的长周期维护问题,某种硬件停产了办,假设系统内核停止维护办?我强烈反对极端优化单点性能,就是因单点性能极限优化必然和硬件、内核、文件系统都有深度关联。我推荐存储主力是应用层用户态进程,老中青三代器和谐运行,群集性能瓶颈本来就不在单点,不要给自己的软件无故设限。 冷存储问题 冷存储分冷和低温两种类型,冷存储就是用磁带、蓝光盘、可离线存储节点来存储数据,这样可以节省机柜电量,但这是个工程学问题不是计算机问题了。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
前言 沙龙的镳局已改成客栈。东方的大梦没法不醒了。----老舍《断魂枪》 云计算大潮来了,我把IT技术像五虎断魂枪一样收起来了。我不会将它压箱底,偶尔我也会练练聊聊,纪念一下那个搞技术的黄金时代。 本文聊个很有嚼头的技术问题,Linux系统的启动过程,当我们不用自己安装系统以后,丧失了这多乐趣。 正文 1.主板加电和硬件自检,就是开机第一屏启动界面。 CPU和内存插得有问题器会滴滴乱叫,而网卡和硬盘插不插都无所谓,因这些外设都不属于经典的计算机系统。 早期小内存器一般有内存检测的功能,但256G内存的器启动的速度也太慢了,重启一分钟能启动的还能恢复,重启三分钟可能群集性状就变了,所以我们经常顺手就把他关掉了。 2.读取主板引导配置,现在终于要从外部设备读取数据了。 主板大都是BIOS引导,也有是UEFI引导,但从器用户看区别也不大。 主板可选从USB/SATA/NIC这几类接口上获取引导数据,而且可以排队式加载,第一个加载不成功就尝试第二个。系统安装镜像都有个防止误操作的倒计时,而网络引导一般是排在末位,硬盘引导就是通用的系统启动的方式。
w****t 2018-07-10
AIOps中的四大金刚
在传统的自动化运维体系中,重复性运维工作的人力成本和效率问题得了有效解决。但在复杂场景下的故障处理、变更管理、容量管理、资源过程中,仍需要人来掌控决策的过程,这阻碍了运维效率的进一步提升。而AI方法的引入,使得机器能够代替人来做出决策,从而让正意义上的现完全自动化成了可能。 在AIOps的落地施过程中,最关键的因素还是人,即AIOps的建设者们。 AIOps作一个全新的技术发展和应用方向,并不是简单地说具备某一种技能或招募一两个大牛就可以完成的,它需要不同角色、多个团队的配合才可以达成。根据几年来整个业界对AIOps的理解和践,AIOps参与角色的划分也越来越清晰。在百度4年的AIOps践中,我们总结得出了如下四种不可或缺的角色: 运维工程师 运维研发工程师 平台研发工程师 运维AI工程师 可以看,除了运维AI工程师外,其他角色并不是AIOps产生之后才出现的,他们在传统运维中也发挥了重要作用。我们今天主要想和大家探讨一下,在AIOps时代,他们的职责究竟发生了哪些变化。了方便大家理解,我们会基于百度AIOps的践案例,来进行具体说明。
TOP