关于 双流县哪里有小姐服务大保健〖8843O306VX〗服务真实傧肆 的搜索结果,共1459
h****e 2018-07-10
程序:我从来?
Check Agent:提供BNS例的康检查功能,用户通过在Web页面对每一个例配置康检查的方式,机器上的Check Agent会主动探测所例的运行状况,并将康检查的结果上报给Cache层,同时更新数据库内容。 总结 BNS系统满足间交互中常见的的资源定位、IP白名单维护等需求,也可以用于机器列表查询,使用场景包括机器列表查询、定位、白名单维护、数据库智能授权等,解决了程序“我是谁?我从来?该往去?”的问题。 今天我们一起聊了百度云Noah智能运维产品中的BNS系统,目前系统还在持续迭代和优化中,若您想进一步了解BNS问题,欢迎家积极留言。
w****0 2018-07-11
单机房故障自愈-黎明之战
同时量调度也无法使得恢复正常。 要求:将拆分为若干不同的逻辑单元,每个逻辑单元处于不同的物理机房,均能提供产品线完整。 3.不满足N+1冗余 描述:任意单个机房故障时,其余机房剩余容量不足以承担该机房切出的量。 问题:量调度导致其余机房过载,造成多个机房故障,造成更范围的影响。 要求:容量建设需要对于每个逻辑单元都要明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分量,同时需要变化时及时更新数据和扩容,避免容量数据退化。同时对于量的变化趋势,也需要提前的预估,为重事件量高峰预留足够容量(如节日、运营、假期)。 4.关联强耦合 描述:上下游使用固定IP或固定机器名进行直接连接。 问题:单机房故障发生时,关联的上下游之间无法进行快速的量调度止损。 要求:线上关联不允许使用固定IP或机器名链接,需使用具备量调度能力的上下游连接方式以现上下游依赖解耦,下游发生单机房故障,可以快速调整路由比例现止损。
红****2 2018-07-10
故障自愈机器人,你安心好睡眠
该解决方案策略和架构解耦,并且托管到高可用的自动化运维平台之上,现了业在任意单个机房故障情况下皆可自愈的效果。 截至目前该方案已覆盖百度多数核心产品,止损效率较人工处理提升60%以上。典型案例: 在8月28日某产品在单机房故障发生后1min55s完成止损。 在后续文章中我们会继续介绍单机房故障自愈的更多详细内容,敬请期待! 单机房故障容灾能力的建设 在容灾能力建设中些常见问题? 如何证明已经具备单机房容灾能力? 单机房故障人工止损方法 人工止损时如何感知故障? 人工止损时如何收集故障信息? 人工止损时如何进行量调度? 单机房故障机器人止损方法 如何设计单机房故障自愈整体方案? 如何降低量调度风险? 如何应对不同业量调度策略和平台的差异?
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
时间不稳会威胁到的程序壮性和业安全性,甚至部分程序崩溃的稀糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目信任;假设一个根NTP不稳定,所器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的情况,但业混乱是免不了的。我们就说联机调试分布式日志,几个节点的时间错可能日志就看不懂了。 NTPD做时间调整会效减少这类情形,它不是简单的龟速调整时间,而是柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详情见附录验);也不会盲目信任远端时钟源,甚至固执的拒绝同步时间。NTPD相信本机时刻可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳定的时间源,算出方间的网络延迟,然后才会采信新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。
s****d 2018-07-11
亿元级云用户分析
3.2 CDN和带宽池 CDN和带宽池不同于器硬件,其原始资源是相对稀缺死板的广域网带宽,其交付的资源是持续不断的,所以资源部署比较慎重但客户动成本较低。制约客户全量迁移的是厂商的承载能力,而挖角和反挖时刻都在细水长。CDN和带宽池首先考察的是企业内功,廉价海量资源;再考验销售内部协调能力,能不能把好资源好价格抢到手;而盯客户的套路和百万级销售类似,工作力度加三五倍而已。 3.3数据存储池 数据存储池是很难年均摊营收上亿的,但定个1000万的目标是能现的;如果1000万的非冷备存储池,那很容易带来数倍数十倍的计算和带宽消费。存储资源是订单曲线突破的好选项,还是AI和数据项目的基石,我们和客户讲的是技术含量的故事,需要精英售前给销售做幕后军师。 配图说明:谁掌握了数据,谁就掌握了理 3.4人力资源池 亿元项目不可能是客户自助施的,人力营收占比很低但画龙点睛,可能会干掉纯卖资源的友商,也可能晚交付半月就亏损上千万。
M****点 2018-07-10
中国云计算现状——产品篇
先说IT咨询,过去云计算平台吸引到的都是成本敏感的游戏客户或者技术优先的创业客户,这两类客户都不会为一时一千元的咨询付费。现在高净值客户放出来的云计算咨询标了却没人投标,因为型云计算企业因为资质、高层合作、客户关系等原因没投标的机会。 我们经常遇到咨询标,但我们也不想投这个标。咨询标的交付物就是各种文档和报表,互联网公司的技术积淀都在技术部,技术人员最烦的就是写文档,而且技术人员匮乏的想象力和沟通能力并不适合做咨询标,让售前承担技术文档书写也扛不住。传统IT外企做云IT咨询程上没问题,但技术水平太差,也不被政策扶持。此外还个哈哈哈哈的杀器让我们不能投咨询标,投了咨询标就不能投施标了,施标的金额要比咨询标很多。 到了施阶段,其矛盾和咨询标差不多,既要干活又要写文档,而且验收者并不专业,施工作传统厂商会抢着压价,还会各种意外拖进度抢进度,各互联网企业的施团队根本支撑不下来。传统厂商虽然压价抢标,但他们要是施云计算项目的人才,互联网公司加价三倍挖走谢谢。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
另外,Archer也可作为上层托管平台的底层工具链,为PaaS平台提供稳定的底层部署。 通用场景 在百度内部,通用的部署系统需要适用于以下场景: 各业线拥各自的包规范,语言、框架不统一,部署策略不一致; 支持分级发布,及时拦截部署引入的线上故障; 业的多地域部署; 多种网络环境及包部署; 提高自动化效率,能够集成测试发布自动化水线。 后面,我们将结合上面场景,向家介绍百度持续部署是如何现的。 架构 整个系统由命令行工具、web、中转及单机agent+部署插件几部分组成(如图2所示)。用户通过命令行工具触发一次变更,在web端进行参数解析及任分发,对应执行机器agent通过心跳获取任后,调用部署插件执行际任。涉及包及不同网络环境的部署会进行中转下载。 解决方案 各业线拥各自的包规范,语言、框架不统一,部署策略不一致 为避免杂乱无章又不规范的代码及配置文件的目录结构,Archer规定了一套既灵活又完整的包规范。
追****圣 2018-07-11
给书记省长讲清楚云计算
第三类是外企云厂商,这类厂商是被广阔的中国市场吸引过来的,也兼顾外企中国分部的客户。这类厂商在国内发展都不太顺,和他们沟通主要看他们什么合作诚意,是否穷极思变。 最后一类是系统集成企业,这类厂商已经地方政企几十年了。他们最的优点和缺点都是为政府和国企为生,他们可以买技术搭建出云平台,但他们建好云平台的目的是再卖给本地政府和国企。这类企业需要完成从供应商到合作方的转变。 云计算不是万能药,它无法解决些问题。 在地方政企看来,云计算只是一种商业形式,不能对它报以不切际的期望值。 云计算行业不需要量雇佣本地劳动力,无法解决批就业问题;云计算核心员工会呆在一线城市远程操控,很难将云计算人才引进到当地。 云计算不会产生污染,所以不用考虑环减排问题,但其带来的环节能问题很严重,每个数据中心都会占用量电力。 对于四线城市政府和中型国企,因为现困难资源限是搞不了云计算的;二三线城市和型国企才能提供云计算公司感兴趣的资源。
流****水 2018-07-11
度云企业级运维平台——NoahEE
资产管理 在机房,各种各样的器、网络设备和安全设备7x24时的运转,为我们的业提供了硬件障,是企业的重要资产。各种设备的物理损坏、升级、新增、搬迁等等都在考验着机房运维人员的能力。怎样维护这些资产并记录信息,是个很重要的问题,搞得不好,这些资产可能变成运维人员的“包袱”,越多越头疼。 对这些设备的运维操作,通常都涉及不少的物理操作,比如说更换损坏的硬盘,增加内存条等等。这涉及到几个要解决的问题: 故障如何及时发现?发现后由谁来进行修复? 物理操作维护怎样反应到系统? 不同角色(职责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE通过故障自动发现与工单程解决了上面的问题。系统自动探测故障放入故障池,并建立故障工单,由相应的人员进行操作。另外,NoahEE提供了不同的工单程覆盖了日常机房运维中的操作,从设备采购入库、上架、机架变更,直到设备下架、出库全生命周期覆盖,做到所运维操作记录可追溯。了资产管理,运维人员可以在器完成入库、上架工单后即可在管理中看到该器并进行管理,无须任何其他操作。
p****d 2018-07-11
单机房故障自愈--运维的春天
【解决方案】 基于容量水位的动态均衡 在量调度时,对于容量不准确存在的风险,我们划分两条容量警戒线。 安全水位线:量处于在安全线以下则风险较,可以一步进行切换。 水位上限:该水位线表明的最承载能力,一旦量超过故障水位线,很概率会导致容量过载。 如果安全水位线提供的容量不足以满足止损,那我们期望使用上两条中间的容量buffer,同时量调度过程中进行分步试探,避免一次性调度压垮。 基于快速熔断的过载护 在量调度时,建立快速的熔断机制作为防止过载的最后屏障。一旦出现过载风险,则快速停止量调度,降低次生故障发生的概率。 基于降级功能的过载护 在量调度前,如果已经出现对应机房的容量过载情况,则动态联动对应机房的降级功能,现故障的恢复。 2业线止损策略需求差异 【问题描述】 我们现了基础的单机房故障量调度止损算法,但在部分业线中仍存在较的需求差异,比如: 分步动态调度需求:业存在充Cache的情况,过程中能力降低,需要控制切换速度。
小****园 2018-07-10
让PB级云存储不再神秘
云存储都是多媒体数据,谁敢盗播打官司就好;日志文件加密了就用不了云端数据分析了,但不挂个人信息的基因测序样本被偷了也不怕。如果客户的特别害怕丢数据,云平台确没手段能自证清白,谁偷过用户数据只能听业内风闻。 正让用户头疼的是平台方会根据计费日志估算你的业规模,就像安总共能看到你何时出门一样。据不可靠传闻,某厂商本来能拿到某云厂商母公司数亿美元投资,自吹数据量数PB,该司投资部去调了一下他们的消费金额就取消投资了。单一个消费总金额就这么麻烦,访问日志可以看文件数量、用户规模分布和致的动作类型,一个新兴企业最好还是把业分散在两个厂商那,毕竟他们两家不能核对你的账单。 最后一条就是些领先厂直接压制,故意做技术无关的不兼容、甚至拒绝、甚至从其他层面正面打压业。这就不举例了,太明显针对单一厂商。如果只是技术不兼容那算和其他云平台恶意竞争,如果到了云平台明抢客户自身业的阶段,技术采购决策人请把风险告知公司决策层,该妥协还是硬扛不是你的职责范围。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
个客户非常信任某个云销售,他告诉该销售,虽然某高层合作,某云也说报价肯定比某云低5%;但是某云的机制问题,出故障从来都是衙门话,每次故障都要客户去乱猜和背锅。最终这个单子在客户执行层的暗助之下,该云快速把业切过来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。面对意外故障,我们信心向客户证明,换了其他厂商也一样会挂;面对人为故障,踏认错是对客户的最后尊重,而公开事也是逼着内部不会重蹈覆辙犯同样的错误。 过去家卖IDC、CDN、器和软硬件积累的个人商誉,是可以应用到云计算领域的。而云的高科技光环褪去、产品同质化以后,企业的核心竞争力仍然是商誉的销售-售前-售后团队,这类人才永远是稀缺资源。 附录 请各位多琢磨评估本厂的云到底些组件是靠谱的,不要让信赖你的客户受伤又受骗。
布****五 2018-07-10
如何执行一条命令
另外一种就是交互式,通过telnet/ssh等方式远程连接器后,直接在命令行界面执行。虽然从形式上我们将命令传递分为了两种方式,但从本质上来说,器上的命令传递,都没逃脱网络传输这个过程。 命令执行(使) 对于操作系统来说,命令的执行,其就是启动一个进程并传递相应的参数,运行完成后得到相应的结果。这我们并不关心进程如何创建,PBC的结构如何等细节,我们只关心命令进程的启动方式以及结果的获取方式。 为什么要执行命令 在分布式产品的开发维护过程中,三个主题是无法绕过的,分别是配置管理、部署升级和监控采集。 配置管理 配置管理的目标是为了标识变更、控制变更、确变更正确现并向其他关人员报告变更。从某种角度讲,配置管理是一种标识、组织和控制修改的技术。通常情况下,配置管理都会统一部署配置器来同步所节点的配置。但是在开发测试过程中,总会出现临时修改某个或某一批节点的配置的情况,这时通过人工逐个登录来完成修改显然是不太可能的。 部署升级 DevOps的概念如今日趋行,部署升级越发成为开发运维过程中重要的一环,频繁的交互意味着频繁的部署。
w****t 2018-07-10
AIOps中的四金刚
在AIOps落地施中,运维工程师是处于中心的角色,也赋予了新的职责,他们是AIOps具体施的需求提出者和成果验收者。具体职责包括: 在AIOps时代,运维工程师一方面需要熟悉运维领域的知识,了解运维的难题和解决思路;另一方面需要了解人工智能和机器学习的思路,能够理解些场景问题适合用机器学习方法解决,需要提供怎样的样本和数据,即成为AI在运维领域落地施的解决方案专家。 运维AI工程师 在单机房故障自愈场景中,运维AI工程师将机器学习的算法与际的故障处理业场景相结合,针对单机房故障场景的风险点,进行策略研发与验工作。如下图所示: 运维AI工程师分别设计了如下算法策略来满足整个复杂故障场景的自动决策: 异常检测算法:解决故障发现时指标异常判断问题,基于AI方法现较高的准确率和召回率,作为整个故障自愈的数据基础。 策略编排算法:基于当前线上的量和状态,设计损益计算模型,判断基于何种方式的操作组合或步骤,能够使整个自动止损带来收益最,风险最量调度算法:基于线上容量与量情况,进行精确量比例计算,防御容量不足或不准风险,并量调度收益最化。
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因为卡得一匹。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
3、进传统行业继续做运维;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成限的技术革新,比如说现OS的虚拟化。我们需要的SIP必须亲自搭建,阿新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。除了通讯公司之外,生产领域(比如管理生产线)也类似的顾虑,云计算的优势和公司的业需求完全不沾边,所以这类公司的运维可能会是最后的运维。家找工作的时候都习惯找网站相关的工作,但你学过Web就一定要找网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足一个没前途的行业。生产领域的公司因为运维涉及到在在的钱,所以运维人员待遇高(都是专技术难培养)、做的事情少(自发做事多了会出错,不如找厂商技术支持),只是跳槽的难度比通用运维要一些(都是专技术不通用) 4、彻底转型,做和计算机无关的工作;选这条路的人一部分是自己觉悟或巧机缘,但另一部分人是的适应不了环境变化,希望各位不要被淘汰掉。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
Q新开发的基础设施问题,能立马回滚吗? Q可以做虚拟化资源限制基础设施不占用过多的机器资源吗? Q如何先部署批量机器,确认无误之后,再做全集群部署?简而言之,灰度发布。 Q新到位10000机器,如何高效部署最新的基础设施?使集群中所机器环境同质化? 管中窥豹,我们可以发现如果在私云或者混合云场景中还是通过人肉运维的方式管理,那么管理效率将会十分低下,并且其中重复繁杂的操作,难以证云环境的稳定性和安全性。急人之所急,需人之所需。百度云的工程师们便展开了一场头脑风暴...... 原始太初 私云中存在规模的机器集群,集群中一片空虚混沌,渊面黑暗,仅字节在其间穿梭。为效地管控体量庞的集群,合理分配资源,降低运维成本,障云上穿越狂风暴雨,工程师们意识到:“必须要一个优秀系统来管控这混沌的集群世界!” 第一天 工程师们说:”这个系统要代表操作系统的意志!占用资源少!对外部系统零依赖!装机自带!要能自升级和自活!“。
TOP