关于 江安县找小姐妹子服务上门过夜〖8843O306VX〗服务真实沟 的搜索结果,共1336
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署信息,怎么办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署例有一个出现故障了,我想对下游屏蔽该故障例,怎么办? 下面以一个简单的例来说明,假设一个模块名是Server,它的游是Proxy,下游是Redis,当出现变更或者故障时,如何让游感知到呢? 当新增线例、下线摘除例或者例发生故障时,BNS系统通部署在机器的客户端时感知到例的状态变化,同时新增和删除例的变更情况会立即同步到分布式的缓存系统中,这样用户通一个BNS名字就可以感知到下游的例变化。
w****0 2018-07-11
单机房故障自愈-黎明之战
单机房容灾能力--盲测验收 完成以四点单机房容灾能力建设后,业线就具备了通流量调度进行止损单机房故障的基本条件。那么如何验证业线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同业线故障情况及止损效率,并给出相应的优化意见。 根据业线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、效果等方面权衡,将盲测分为三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测业可根据监控数据决策流量调度目标,对于业际无影响,主要验证故障处置流程是否符合预期、入口级流量切换预案是否完整。 提前通知有损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对业有损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知业盲测时间和可能的影响,业线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知有损盲测:在各业线单机房容灾能力建设完成后,进行不提前通知的有损盲测,对业来说与发生故障场景完全相同。验证业线在单机房故障情况下的止损恢复能力。
红****2 2018-07-10
故障自愈机器人,保你心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭州电信接入故障,中断时级别 2017年1月某业天津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且会给公司带来直接或间接的损失。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
我们很难成功调试NTPD,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD就背黑锅了。 有TOP10的互联网公司和亿国家级项目里用ntpdate+crond,一代架构师为什么有这个误会无人深究,下一代人将误会固化为偏见,新一代人将偏见神化为迷信。 但无论误会、偏见还是迷信,时间跃变、回退和停滞对应用健壮性和业全性的威胁始终存在,时间不仅仅是我玩游戏时用的魔法,忽视问题并不能掩埋问题。 六、见微知著和防微杜渐 我讲NTPD和裸纤并不是为卖弄知识,也不是为做偏科普,而是希望进阶工程师们多考虑一下如何规避这类误会?我们在做技术工作时,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事也不会知道时间也能错误和波动,他们能说清楚业逻辑就不错了。 把所有的精力都用到做业逻辑,你只是个编程语言翻译机而已;自己主动观测技术环境依赖,有资格有能力做出技术选型决策,才是给Coder群集做技术校准的人。即使你不想做技术决策人和管理者,多怀疑和观察环境,也能少些通成本,少走一些冤枉路,多一份自信和自尊。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一套产品线全程的可迁移发布解决方案,现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动
这个文件注释很简单但水很深,我们该用标签还是UUID来标识磁盘,文件系统自检功能要不要开,这都可以聊好几个时。 看看各的启动优先级也是一个讲究多多的程,iptables会比network先启动这类依存关系很好理解;但我也遇到云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动程,正式版的启动程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在大家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程师,云确也很有意义啊。 静人稀,沙龙关好了,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又微微一笑,“不传!不传!”----老舍《断魂枪》
M****点 2018-07-10
中国云计算现状——产品篇
但具体参与程中,这类工作很少有成功案例,我做成功这类项目感慨也很深,本段落重点解释这些现象并给出建议。 先说IT咨询,去云计算平台吸引到的都是成本敏感的游戏客户或者技术优先的创业客户,这两类客户都不会为一时一千元的咨询付费。现在高净值客户放出来的云计算咨询标了却没人投标,因为型云计算企业因为资质、高层合作、客户关系等原因没有投标的机会。 我们经常遇到咨询标,但我们也不想投这个标。咨询标的交付物就是各种文档和报表,互联网公司的技术积淀都在技术部,技术人员最烦的就是写文档,而且技术人员匮乏的想象力和通能力并不适合做咨询标,让售前承担技术文档书写也扛不住。传统IT外企做云IT咨询流程没问题,但技术水平太差,也不被政策扶持。此外还有个哈哈哈哈的大杀器让我们不能投咨询标,投了咨询标就不能投施标了,施标的金额要比咨询标大很多。 到了施阶段,其矛盾和咨询标差不多,既要干活又要写文档,而且验收者并不专业,施工作有传统厂商会抢着压价,还会有各种意外拖进度抢进度,各互联网企业的施团队根本支撑不下来。
s****d 2018-07-11
亿元级云用户分析
IT决策人要重度考量IT部利益,这就是云销售和售前的工作重点了,售前和销售要抚IT决策人的顾虑,尊重客户IT部的权益: 业方案的IT可行性 新架构带来的新责任 新项目带来的新权益 云迁移的隐性成本 技术锻炼的团队收益 新愿景带来的团队增效 工作量转移的减员压力 IT方案决策人明确项目的程、执行人和验收标准,但从云供应商角度看,搞定方案决策人是项目正式启动,不代表项目能完成验收。 2.3 IT技术执行人 各类具体干活的工程师架构师,他们对云的程全程参与,从自身立场品味着云项目的利害关系和云产品的使用感受。每个公司环境都不相同,他们可能强力推进项目,也可能暗地里阻塞施,大部分情况下是被动拖沓进度,但合理引导很容易积极配合。他们的诉求更简单直白: 操作的简便清晰不出错 建设和维护的劳累程度 云IT技能的个人稀缺含金量 云对旧有烂工作的解放 云对个人基础技能的替代 稳定故障清晰 汇报汇总展示方便 要想让IT技术执行人成为云厂商的好帮手,工程进度靠项目经理配合,资源协调靠销售配合,技术操作类诉求靠售前引导。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通对资源合理的组织,极大的简化了运维操作,提升了运维效率。
布****五 2018-07-10
如何执行一条命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发运维程中重要的一环,频繁的交互意味着频繁的部署。部署程可以拆解为两个的步骤,一是新软件包的传,二是进程的重新启动。进程的重新启动不必多说,软件包的传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策程更是需要采集大量的时信息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,一种是通软件提供的接口直接读取状态数据,另一种是通日志/进程状态/系统状态等(如使用grep提取日志,通ps查询进程状态,通df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量执行命令并收集结果”这一基础能力,这也是今天我们的主题“如何执行一条命令”的意义所在。
s****0 2020-08-29
百度云主机网络延迟问题
是很买 打折买了几台器 目前都荒废了,因为卡得一匹。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
对于落是人为导致的故障,甲方单纯的索赔追责并不能解决问题,因为云厂商总是比甲方的际损失更,甲方无法触及云厂商能倒腾出故障的部。甲方只能根据云厂商销售和线的能力和态度,确认自己交钱了能否买到靠谱的。 最重是商誉 云计算既是资源又是,资源相对可以量化,但短期内看直观感受,长期看商业信誉。商誉分为企业商誉和个人商誉,云厂商的企业商誉都积淀不足,胜者也是比烂大赛中靠友商更烂胜出的,和IDC/CDN的比优大赛无法相提并论。大客户在吃够了厂商的亏以后,会选择信任能有个人商誉,能做出承诺、调动资源和平复问题的销售和人员。 有个客户非常信任某个云销售,他告诉该销售,虽然某大云有高层合作,某大云也说报价肯定比某云低5%;但是某大云的机制有问题,出故障从来都是衙话,每次故障都要客户去乱猜和背锅。最终这个单在客户执行层的暗助之下,该云快速把业来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和大客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。
追****圣 2018-07-11
给书记省长讲清楚云计算
所述,云计算就是将分散在各个公司的信息技术资源汇聚到一个大平台,其兴起始于需求扩大而人力短缺,其未来发展趋势是通规模经营和数据共享,成为新型信息化社会的技术基石。 云计算如何带动地方经济 云计算落地是要自建数据中心机房,我们一般称之为云基地,云基地在经济利益和社会影响和传统工厂并不相同。云基地通俗易懂的展现形式就是开启数十万个高速运转的电脑铁皮箱,但这些电脑不用接显示器也不用人员现场操作,只要这些电脑能开机能网就能对外。云基地和数字地产不完全相同,数字地产只装修好房,云基地关注用这些房做什么。 云基地是无烟工业,并不需要雇佣大量人口,对直接促进就业帮助不大;但云计算没有体矿产投入和物品产出,只需要大量电力启动电脑也不会产生大量污染。 云基地像电视台和信号塔一样,通产生和扩散数据信息对客户提供,这些信息的传输没有物流成本,光速直达全球每个角落。 因为云基地全球客户,所以云基地可创造极高的营收,但不能简单的计入地方政府的GDP。一个耗电三千瓦的机柜加附属空间占地5平方米,如果云计算资源全部售出,每年可产生20万元以的营收。
p****d 2018-07-11
单机房故障自愈--运维的春天
期望能够在不超容量保护的情况下进行尽可能的调度,减少对用户的影响。 2.即使按照容量进行调度,载仍可能发生,容量数据本身存在一定误差,流量成分的变化以及变更等导致的容量退化,都可能导致原先容量无法完全可信。 【解决方案】 基于容量水位的动态均衡 在流量调度时,对于容量不准确存在的风险,我们划分两条容量警戒线。 全水位线:流量处于在全线以下则风险较,可以一步进行切换。 水位限:该水位线表明的最大承载能力,一旦流量超故障水位线,很大概率会导致容量载。 如果全水位线提供的容量不足以满足止损,那我们期望使用两条中间的容量buffer,同时流量调度程中进行分步试探,避免一次性调度压垮。 基于快速熔断的载保护 在流量调度时,建立快速的熔断机制作为防止载的最后屏障。一旦出现载风险,则快速停止流量调度,降低次生故障发生的概率。 基于降级功能的载保护 在流量调度前,如果已经出现对应机房的容量载情况,则动态联动对应机房的降级功能,现故障的恢复。
1****2 2018-07-09
百度全:AI 是系统工程 需要正开放的全护航
百度全最近发 布了OpenRASP 开源自适应全解决方案,保护引擎集成在了应用内部,在应用完成协议解析后,才开始检测攻击。 这与传统的全防护解决方案有什么差别呢?首先,传统防护产品主要依赖请求特 征,OpenRASP 是通监控应用的执行逻辑和行为来现防护;其次,OpenRASP 可 以现应用的热补丁,比如可以永久免疫Struts 系列漏洞;最后,OpenRASP 现了 编码规范检查、全基线检查,这也是传统防护产品无法现的。OpenRASP 和KARMA 分别在云端和终端两侧为智能终端产品和提供自适应全保障能力。 未来的AI 攻防:需要正的生态开放 AI 是一把双刃剑,用在全专家手里,能够更快、更高效地做好防御。将AI 用于 全领域,在感知层可以提升用户体验,认知鉴权由“知”(密码)、“有”(U 盾) 到“是”的转变;在执行层,AI 可以提升全攻防对抗的能力,无论是网络空间全 还是业全;在战略层,全专家角色现由人到机器的转变,AI 自主进行攻防对 抗。而将AI 用在黑客手里,就可能造成“永恒之蓝”那样席卷全球的灾难。
m****t 2018-07-11
设计中立公有云云管平台
云厂商提供OSS+CDN的好处就是内网互通节省带宽费用,但大客户很可能越云管平台直接采购,客户一年可能只节省几十块钱。云管平台要集成OSS和CDN时,一定要注意这两个是没有区域概念的,比如客户用了百度北京的虚拟机加七牛浙的云存储和阿里全国的CDN,此时客户业绝对跑的通,三方互通有额外网络开销。云管平台的资源创建和计费系统都要考虑清楚,尽量资源走一个供应商,或要求不同供应商之间相互免费。 述PaaS资源都有一个特点,可以按照使用量付费,或者提供贴合到业逻辑操作层面的支持功能,那也就代表着客户的计费访问数据铁定会被供应商拿到,而业数据是否被偷窥要看供应商自律。 我们再看看下文一些更专业(偏)的。 容器云入槛太高,在中客户场景下缺乏成功案例,如果没有具体项目要求容器云,就等到接完面的PaaS再考虑接入容器云。 反DDOS攻击只能由云厂商提供,因为开销偏大计费不灵活,但又没有日常管理需求,客户到云管平台到厂商通时直接用邮件、工单和合同即可,如果没有频繁攻击和检测需求,可以不留展示界面只用邮件通知。
TOP