关于 玉林找小姐上门一条龙服务〖8843O306VX〗服务真实粟计坊 的搜索结果,共1708
h****e 2018-07-10
程序:我从哪里来?
干货概览 在算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些例,规模、部署情况、例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的套分布式的名字系统,是百度云Noah智能运维产品中的个重要基础系统。它为每赋予个独无二的名字,根据这个名字,我们就可以获取到这个的相关信息 ,这些信息包括:在机器部署信息(机器IP,部署路径,配置,端口信息),例运行状况等其他重要信息。简单来讲,它提供了名到资源信息的个映射关系。
w****0 2018-07-11
单机房故障自愈-黎明之战
单机房容灾能力--盲测验收 完成以四点单机房容灾能力建设后,业线就具备了通过流量调度进行止损单机房故障的基本件。那么如何验证业线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同业线故障情况及止损效率,并给出相应的优化意见。 根据业线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、效果等方面权衡,将盲测分为三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测业可根据监控数据决策流量调度目标,对于业际无影响,主要验证故障处置流程是否符合预期、入口级流量切换预案是否完整。 提前通知有损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对业有损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知业盲测时间和可能的影响,业线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知有损盲测:在各业线单机房容灾能力建设完成后,进行不提前通知的有损盲测,对业来说与发生故障场景完全相同。验证业线在单机房故障情况下的止损恢复能力。
M****点 2018-07-10
中国云算现状——产品篇
当客户的非CDN云资源采购金额过500万以后,其子项目之间没有内网互通的需求,这时候该做个跨厂商的云端资源管理方案了。现在虚拟机不能像CDN样随意迁移,但未来Serverless崛起,算能力也会在多厂商之间漂移的。客户提前把云管平台从费和权限层面做好,至少在项目级别可以和多个厂商侃价,还能模糊费相关业数据。 五、企业IT咨询和 前面的云都免不了卖资源或者卖软件,搞IT咨询和可以让公司增加企业的融资概念和收入构成。中型云厂商都尝试转型做这类工作避开成本搏杀,大厂商嘴说不要眼神也很诚。但具体参与过程中,这类工作很少有成功案例,我做成功过这类项目感慨也很深,本段落重点解释这些现象并给出建议。 先说IT咨询,过去云算平台吸引到的都是成本敏感的游戏客户或者技术优先的创业客户,这两类客户都不会为千元的咨询付费。现在高净值客户放出来的云算咨询标了却没人投标,因为型云算企业因为资质、高层合作、客户关系等原因没有投标的机会。 我们经常遇到咨询标,但我们也不想投这个标。
疏****月 2018-07-09
线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的下,让数据自动生效》中专讨论过)。般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了线部署系统——Archer。Archer致力于提供套产品线全过程的可迁移发布解决方案,键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全过程的自动操作。在操作方面,Archer提供了命令行工具作为发起线的操作入口,这种设模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为个环节结合进整测试发布流水线中。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
、裸光纤的故事 前几天和朋友聊天,谈到根裸光纤可以分波分多大的问题。 几个业内好友都明确说根裸光纤最多跑10G带宽,而于老板明确表示裸光纤任何个波分(或者不做波分)都可以跑100G以。 后来我和于老板深究原因,不可能几个朋友都骗我或者都蠢,很可能前些年光纤波分机自己只能甩出10G口,或运营商租光纤套餐里只有10G规格,给大家造成了裸光纤只能跑10G带宽的印象。同样固有的印象是光纤必须从运营商那里租,而且价格很贵还必须买波分设备等等;其现在企业专线的市场竞争很充分,拉同城裸纤公里也就几百块钱,而且短距离裸纤也不值得波分设备,直接对接模块即可。 二、NTD是试金石 我对裸光纤是外汉,但同样的技术误解让我想到了NTP,我直拿ntpd和ntpdate当做初中级系统工程师的试金石,分不清就月薪五千,分得清就八千以(2014年市价)。但很多货的IT专家也在此事跌倒,我也希望通过聊清楚层误会,说明高级工程师该少迷信多思考。 NTP是网络时间协议,它是多项传输、算、加密技术的核心参数。
追****圣 2018-07-11
给书记省长讲清楚云
如果当地政企要做好云算就要从管理者变为者,必须在管控违规违法时不惊扰正常业,甚至主动出击为正常网络保驾护航。 前几都是从降低成本可靠的角度请云算企业来合作建厂,如果你有市场有客户那对方会主动寻求合作。从长周期来看云算的客户是覆盖全球全行业的,各地内部采购的算机项目根本不值提,市场和客户要靠云算厂商自己去。但现在云算厂商还在早期扩张摸索之中,云厂商极端渴求各种政云企业云成功模式案例,旦摸出来案例会迅速推广到全国。这个窗口期只有三五年,随着政云企业云被其他公司摸透并推广开,这些项目就从首发明星案例变为普通捆绑销售了。 挑选合格的云算合作厂商,每类厂商有哪些特点。 前文说的为何要引凤,如何算筑巢。当云厂商看到商机肯合作时,我们要掌握各类云厂商的特点才能心里有数。 第类是大型云厂商,他们自身有很强的资源整合能力和执行销售能力。地方政企和这类企业合作的话语权很弱,但极风险就能看到收益。 第二类是创业云厂商,他们般是靠技术优势和态度从大型云企手里抢单子。
s****d 2018-07-11
亿元级云用户分析
3.2 CDN和带宽池 CDN和带宽池不同于器硬件,其原始资源是相对稀缺死板的广域网带宽,其交付的资源是持续不断的,所以资源部署比较慎重但客户流动成本较低。制约客户全量迁移的是厂商的承载能力,而挖角和反挖时刻都在细水长流。CDN和带宽池首先考察的是企业内功,有没有廉价海量资源;再考验销售内部协调能力,能不能把好资源好价格抢到手里;而盯客户的套路和百万级销售类似,工作力度加大三五倍而已。 3.3数据存储池 数据存储池是很难年均摊营收亿的,但定个1000万的目标是能现的;如果有1000万的非冷备存储池,那很容易带来数倍数十倍的算和带宽消费。存储资源是大订单曲线突破的好选项,还是AI和大数据项目的基石,我们和客户讲的是有技术含量的故事,需要精英售前给销售做幕后军师。 配图说明:谁掌握了数据,谁就掌握了理 3.4人力资源池 亿元项目不可能是客户自助施的,人力营收占比很低但画点睛,可能会干掉纯卖资源的友商,也可能晚交付半月就亏损千万。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因大致可以分为四类: 基础设施故障:物理机房故障、网络链路拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储故障等 单机房故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24时值班,接收大量的报警,随时准备在紧急情况下进行响应、决策、操作系列故障止损动作,尽量挽回损失,降低故障影响。 但述解决方案会面临如下问题: 响应可能不够迅速:例如夜间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执行的完整故障处理过程,并及时向运维人员同步故障处理状态。运维人员的职责由处理转向管理,最终运维人员在低压力值班中保证稳定运行。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
对于落是人为导致的故障,甲方单纯的索赔追责并不能解决问题,因为云厂商总是比甲方的际损失更,甲方无法触及云厂商能倒腾出故障的部。甲方只能根据云厂商销售和线的能力和态度,确认自己交钱了能否买到靠谱的。 最重是商誉 云算既是资源又是,资源相对可以量化,但短期内看直观感受,长期看商业信誉。商誉分为企业商誉和个人商誉,云厂商的企业商誉都积淀不足,胜者也是比烂大赛中靠友商更烂胜出的,和IDC/CDN的比优大赛无法相提并论。大客户在吃够了厂商的亏以后,会选择信任能有个人商誉,能做出承诺、调动资源和平复问题的销售和人员。 有个客户非常信任某个云销售,他告诉该销售,虽然某大云有高层合作,某大云也说报价肯定比某云低5%;但是某大云的机制有问题,出故障从来都是衙话,每次故障都要客户去乱猜和背锅。最终这个单子在客户执行层的暗助之下,该云快速把业切过来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和大客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。
流****水 2018-07-11
度云企业级运维平台——NoahEE
图1 NoahEE概览 接下来,我们把这艘诺亚方舟分解开来,近距离观察下这艘船的方方面面。 管理 我们首先介绍管理是因为管理是整个运维工作的基础,也是NoahEE这个平台各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是个“量”,或者说“规模”的问题。在早期业较为简单时,可能部署在几台甚至台机器,进行变更等运维操作简单直接,登录到机器人工操作就好了。随着业的发展,分布式应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例子,今天17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作所涉及的机器等资源在哪里。在业规模发展到定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
这个文件注释很简单但水很深,我们该用标签还是UUID来标识磁盘,文件系统自检功能要不要开,这都可以聊好几个时。 看看各的启动优先级也是个讲究多多的过程,iptables会比network先启动这类依存关系很好理解;但我也遇到过云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动过程,正式版的启动过程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在大家都云了,它们就只是闲聊的谈资了。但客户云就能少招个研究这事的工程师,云确也很有意义啊。 夜静人稀,沙子关好了气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒的威风。叹口气,用手指慢慢摸着凉滑的枪身,又微微笑,“不传!不传!”----老舍《断魂枪》
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因为卡得匹。
l****m 2018-07-10
五年前的预言——2012年云算时代的运维职位展望
2、进行云器维护;几大云供应商自己也要维护器,那些大中型企业肯定会自己做私有云,在这个云算平台里也是需要运维人员进行从低端监控到高端架构的系列维护工作,但自动化运维技术会让运维人员的数量大大减少,可能每个公司都只有两个团队了。 3、进传统行业继续做运维;笔者就是在个通讯公司工作,我可以很乐观的说云算会对公司造成有限的技术革新,比如说现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛大新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站类的东西根本不是我们的核心竞争力,能用就好效率低些没关系。除了通讯公司之外,生产领域(比如管理生产线)也有类似的顾虑,云算的优势和公司的业需求完全不沾边,所以这类公司的运维可能会是最后的运维。大家工作的时候都习惯网站相关的工作,但你学过Web就定要网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足个没有前途的行业。
布****五 2018-07-10
如何执行命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发运维过程中重要的环,频繁的交互意味着频繁的部署。部署过程可以拆解为两个的步骤,是新软件包的传,二是进程的重新启动。进程的重新启动不必多说,软件包的传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维过程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的时信息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,种是通过业软件提供的接口直接读取状态数据,另种是通过日志/进程状态/系统状态等(如使用grep提取日志,通过ps查询进程状态,通过df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量执行命令并收集结果”这基础能力,这也是今天我们的主题“如何执行命令”的意义所在。
小****园 2018-07-10
让PB级云存储不再神秘
云存储不能违背商业的本质,甲方没蠢到敢让乙方赔钱做,但采购决策层更喜欢看谁的报价最低。数十PB的数据云后基本下不来,平台方无论是提价还是降速,有的是追加预算的手段;如果对方是赔本卖吆喝,成功了就会甩开这个包袱,失败了就直接倒闭。我谈PB级存储项目时,我很愿意分享不同底层技术带来的际成本构成,为什么同样的价格我们还能挣钱而友商已经在贴钱,相关内容会在第四章节详细说明。 成功案例是很重要的决策依据,但这个依据很难考证性。厂商做过PB级项目但其群TB项目做的费融合,厂商确做过数百P的项目却和标准对象存储功能不通用,这类事情太多了,对象存储合同不会有总容量,发票存根也只是简单的信息费。客户的成功案例必须是单命名空间容量达到PB级别,并简要说明文件数量和主要读写场景。考察案例性的方法主要靠听对方能否自圆其说,甚至让多个厂商当面质疑,能逻辑自治的厂商终归还是靠谱些。 大客户对云端数据的处理的要求比中客户更简单,因为复杂业功能可以自己做,还可以要求厂商为自己做定制开发。
m****t 2018-07-11
中立公有云云管平台
云厂商提供OSS+CDN的好处就是内网互通节省带宽费用,但大客户很可能越过云管平台直接采购,客户年可能只节省几十块钱。云管平台要集成OSS和CDN时,定要注意这两个是没有区域概念的,比如客户用了百度北京的虚拟机加七牛浙江的云存储和阿里全国的CDN,此时客户业绝对跑的通,三方互通有额外网络开销。云管平台的资源创建和费系统都要考虑清楚,尽量资源走个供应商,或要求不同供应商之间相互免费。 述PaaS资源都有个特点,可以按照使用量付费,或者提供贴合到业逻辑操作层面的支持功能,那也就代表着客户的费访问数据铁定会被供应商拿到,而业数据是否被偷窥要看供应商自律。 我们再看看下文些更专业(偏)的。 容器云入槛太高,在中客户场景下缺乏成功案例,如果没有具体项目要求容器云,就等到接完面的PaaS再考虑接入容器云。 反DDOS攻击只能由云厂商提供,因为开销偏大费不灵活,但又没有日常管理需求,客户到云管平台到厂商沟通时直接用邮件、工单和合同即可,如果没有频繁攻击和检测需求,可以不留展示界面只用邮件通知。
若****客 2018-07-10
IT架构的本质--我的五点感悟
前端器压力大了就多做水平复制扩容,在网站类应用,无状态-会话保持-弹性伸缩等技术应用纯熟。后端要群集化就是多做业拆分,常见的就是数据库拆库拆表拆键值,拆的越散微操作就越爽,但全局操作开销更大更难控制。 时改异步是我学的最后IT技术,绝大部分“时操作”都不是业需求,而是某应用无法看到后端和Peer状态,默认就要时处理结果了。CS模式的时操作会给支撑带来巨大压力,Peer合作的时操作可能会让数据申请方等宿。架构师将个无脑大事拆分成多个,这就是异步架构,但拆分事就跟拆分数据表样,拆散的需要更高业层级做全局事保障。 在群集性能规划中,网络和硬盘IO+CPU算力+磁盘和内存空间是可以互换的,架构师要完成补不足而损有余的选型。比如数据压缩技术就是用算力资源来置换IO和空间,缓存技术是用空间和IO来缓解算力压力,每个新选型都会带来细节的万千变化,但每种变化都是符合自然规律有章可循的。 个经典微机系统就是中央处理器+主存储器+IO设备,这几个概念居然和群集性能规划是对应。 3.
TOP