关于 大新县找小姐妹子服务上门过夜〖8843O306VX〗服务真实蓝 的搜索结果,共1592
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署信息,怎么办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署例有一个出现故障了,我想对下游屏蔽该故障例,怎么办? 下面以一个简单的例来说明,假设一个模块名是Server,它的游是Proxy,下游是Redis,当出现变更或者故障时,如何让游感知到呢? 当线例、下线摘除例或者例发生故障时,BNS系统通部署在机器的客户端时感知到例的状态变化,同时增和删除例的变更情况会立即同步到分布式的缓存系统中,这样用户通一个BNS名字就可以感知到下游的例变化。
w****0 2018-07-11
单机房故障自愈-黎明之战
要求:将拆分为若干不同的逻辑单元,每个逻辑单元处于不同的物理机房,均能提供产品线完整。 3.不满足N+1冗余 描述:任意单个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房载,造成多个机房故障,造成更范围的影响。 要求:容量建设需要对于每个逻辑单元都要有明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,同时需要保证变化时及时更数据和扩容,避免容量数据退化。同时对于流量的变化趋势,也需要有提前的预估,为重事件流量高峰预留足够容量(如节日、运营、假期)。 4.关联强耦合 描述:下游使用固定IP或固定机器名进行直接连接。 问题:单机房故障发生时,关联的下游之间无法进行快速的流量调度止损。 要求:线关联不允许使用固定IP或机器名链接,需使用具备流量调度能力的下游连接方式以下游依赖解耦,下游发生单机房故障,可以快速调整路由比例现止损。 单机房容灾能力--盲测验收 完成以四点单机房容灾能力建设后,业线就具备了通流量调度进行止损单机房故障的基本条件。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一套产品线全程的可迁移发布解决方案,现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因致可以分为四类: 基础设施故障:物理机房故障、网络链路拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储、计算故障等 单机房故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24时值班,接收量的报警,随时准备在紧急情况下进行响应、决策、操作一系列故障止损动作,尽量挽回损失,降低故障影响。 但述解决方案会面临如下问题: 响应可能不够迅速:例如间报警 决策可能不够精确:例如手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执行的完整故障处理程,并及时向运维人员同步故障处理状态。运维人员的职责由处理转向管理,最终运维人员在低压力值班中保证稳定运行。
s****d 2018-07-11
亿元级云用户分析
IT决策人要重度考量IT部利益,这就是云销售和售前的工作重点了,售前和销售要安抚IT决策人的顾虑,尊重客户IT部的权益: 业方案的IT可行性 架构带来的责任 项目带来的权益 云迁移的隐性成本 技术锻炼的团队收益 愿景带来的团队增效 工作量转移的减员压力 IT方案决策人明确项目的程、执行人和验收标准,但从云供应商角度看,搞定方案决策人是项目正式启动,不代表项目能完成验收。 2.3 IT技术执行人 各类具体干活的工程师架构师,他们对云的程全程参与,从自身立场品味着云项目的利害关系和云产品的使用感受。每个公司环境都不相同,他们可能强力推进项目,也可能暗地里阻塞施,部分情况下是被动拖沓进度,但合理引导很容易积极配合。他们的诉求更简单直白: 操作的简便清晰不出错 建设和维护的劳累程度 云IT技能的个人稀缺含金量 云对旧有烂工作的解放 云对个人基础技能的替代 稳定故障清晰 汇报汇总展示方便 要想让IT技术执行人成为云厂商的好帮手,工程进度靠项目经理配合,资源协调靠销售配合,技术操作类诉求靠售前引导。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
假设我认为TCP连接超时断开链接了,你怎么给我传输数据; 玩各种定时给奖励收益的花园经营类游戏,我经常通修改时间快速刷分; 你的系统时间不对网银都会拒绝登陆,因为加密程序算不出双方认可的Token。 三、正确的时间是向量 Linux环境下有两个常用工具,NTPD和ntpdate。NTPD是一个时间同步,ntpdate是个时间同步命令。很多工程师都会采用Crond+ntpdate的方式同步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate同步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,部分人没做好为ntpdate这个动作负责。 正常的时间是个持续增长的向量,即老时间t1肯定时间t2,时间t2也于最的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以外,部分业对系统时间是盲目信任,不相信t1会越t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate同步时间,可能会带来时间的断档跃变或者停滞和回逆。
M****点 2018-07-10
中国云计算现状——产品篇
既然谈到了混合云,肯定就要谈云管平台,云管平台不是伪需求而是需求。当客户的非CDN云资源采购金额500万以后,其项目之间没有内网互通的需求,这时候该做一个跨厂商的云端资源管理方案了。现在虚拟机不能像CDN一样随意迁移,但未来Serverless崛起,计算能力也会在多厂商之间漂移的。客户提前把云管平台从计费和权限层面做好,至少在项目级别可以和多个厂商侃价,还能模糊计费相关业数据。 五、企业IT咨询和 前面的云计算都免不了卖资源或者卖软件,搞IT咨询和可以让公司增加企业的融资概念和收入构成。中型云厂商都尝试转型做这类工作避开成本搏杀,厂商嘴说不要眼神也很诚。但具体参与程中,这类工作很少有成功案例,我做成功这类项目感慨也很深,本段落重点解释这些现象并给出建议。 先说IT咨询,去云计算平台吸引到的都是成本敏感的游戏客户或者技术优先的创业客户,这两类客户都不会为一时一千元的咨询付费。现在高净值客户放出来的云计算咨询标了却没人投标,因为型云计算企业因为资质、高层合作、客户关系等原因没有投标的机会。 我们经常遇到咨询标,但我们也不想投这个标。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通对资源合理的组织,极的简化了运维操作,提升了运维效率。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动
这个文件注释很简单但水很深,我们该用标签还是UUID来标识磁盘,文件系统自检功能要不要开,这都可以聊好几个时。 看看各的启动优先级也是一个讲究多多的程,iptables会比network先启动这类依存关系很好理解;但我也遇到云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动程,正式版的启动程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程师,云确也很有意义啊。 静人稀,沙龙关好了,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又微微一笑,“不传!不传!”----老舍《断魂枪》
布****五 2018-07-10
如何执行一条命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发运维程中重要的一环,频繁的交互意味着频繁的部署。部署程可以拆解为两个的步骤,一是软件包的传,二是进程的重启动。进程的重启动不必多说,软件包的传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策程更是需要采集量的时信息(前期文章《百度规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,一种是通软件提供的接口直接读取状态数据,另一种是通日志/进程状态/系统状态等(如使用grep提取日志,通ps查询进程状态,通df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在执行命令并收集结果”这一基础能力,这也是今天我们的主题“如何执行一条命令”的意义所在。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
对于落是人为导致的故障,甲方单纯的索赔追责并不能解决问题,因为云厂商总是比甲方的际损失更,甲方无法触及云厂商能倒腾出故障的部。甲方只能根据云厂商销售和线的能力和态度,确认自己交钱了能否买到靠谱的。 最重是商誉 云计算既是资源又是,资源相对可以量化,但短期内看直观感受,长期看商业信誉。商誉分为企业商誉和个人商誉,云厂商的企业商誉都积淀不足,胜者也是比烂赛中靠友商更烂胜出的,和IDC/CDN的比优赛无法相提并论。客户在吃够了厂商的亏以后,会选择信任能有个人商誉,能做出承诺、调动资源和平复问题的销售和人员。 有个客户非常信任某个云销售,他告诉该销售,虽然某云有高层合作,某云也说报价肯定比某云低5%;但是某云的机制有问题,出故障从来都是衙话,每次故障都要客户去乱猜和背锅。最终这个单在客户执行层的暗助之下,该云快速把业来并坐站住了,这份暗中相助就是靠个人商誉带来的信任。 我和客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲道理的,不要把糊弄ToC用户的手段来对付ToB客户。
追****圣 2018-07-11
给书记省长讲清楚云计算
所述,云计算就是将分散在各个公司的信息技术资源汇聚到一个平台,其兴起始于需求扩而人力短缺,其未来发展趋势是通规模经营和数据共享,成为型信息化社会的技术基石。 云计算如何带动地方经济 云计算落地是要自建数据中心机房,我们一般称之为云基地,云基地在经济利益和社会影响和传统工厂并不相同。云基地通俗易懂的展现形式就是开启数十万个高速运转的电脑铁皮箱,但这些电脑不用接显示器也不用人员现场操作,只要这些电脑能开机能网就能对外。云基地和数字地产不完全相同,数字地产只装修好房,云基地关注用这些房做什么。 云基地是无烟工业,并不需要雇佣量人口,对直接促进就业帮助不;但云计算没有体矿产投入和物品产出,只需要量电力启动电脑也不会产生量污染。 云基地像电视台和信号塔一样,通产生和扩散数据信息对客户提供,这些信息的传输没有物流成本,光速直达全球每个角落。 因为云基地全球客户,所以云基地可创造极高的营收,但不能简单的计入地方政府的GDP。一个耗电三千瓦的机柜加附属空间占地5平方米,如果云计算资源全部售出,每年可产生20万元以的营收。
小****园 2018-07-10
让PB级云存储不再神秘
云计算是企业,云平台是我们的供应商不是我们的管理者。TB级用户正是业高速发展的关键时刻,我们更要防备某些吃相难看的混蛋。 云存储相对业简单,遇到野蛮运营的问题主要集中在窃取数据、估算业量、恶意不兼容其他这三方面。 窃取用户数据指的是监守者自盗后自用,要是泄露给第三方那是安全事故可以直接报警抓人,但平台方自用用户数据很难抓现行。云存储里都是多媒体数据,谁敢盗播打官司就好;日志文件加密了就用不了云端数据分析了,但不挂个人信息的基因测序样本被偷了也不怕。如果客户的特别害怕丢数据,云平台确没手段能自证清白,谁偷用户数据只能听业内风闻。 正让用户头疼的是平台方会根据计费日志估算你的业规模,就像区保安总共能看到你何时出一样。据不可靠传闻,某厂商本来能拿到某云厂商母公司数亿美元投资,自吹数据量有数PB,该司投资部去调了一下他们的消费金额就取消投资了。单一个消费总金额就这么麻烦,访问日志可以看文件数量、用户规模分布和致的动作类型,一个兴企业最好还是把业分散在两个厂商那里,毕竟他们两家不能核对你的账单。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
2、进行云计算器维护;几供应商自己也要维护器,那些中型企业肯定会自己做私有云,在这个云计算平台里也是需要运维人员进行从低端监控到高端架构的一系列维护工作,但自动化运维技术会让运维人员的数量减少,可能每个公司都只有一两个团队了。 3、进传统行业继续做运维;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成有限的技术革,比如说现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。除了通讯公司之外,生产领域(比如管理生产线)也有类似的顾虑,云计算的优势和公司的业需求完全不沾边,所以这类公司的运维可能会是最后的运维。工作的时候都习惯网站相关的工作,但你学Web就一定要网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足一个没有前途的行业。
j****2 2018-07-10
百度脑开放日来袭 24种全AI能力呈现
比如百度EasyDL与分形科技打造的智能垃圾桶已成功地落地海淀公园,可以对7种常见垃圾自动分类,后期还可以通增加训练数据识别更多种类;在和德邦物流的合作中,为用户免去了自行填写信息的麻烦,使用定制词法分析快递申请,一秒拆分姓名、电话、住址等信息;更具科研意义的还有百度EasyDL与中科院在珍稀鸟类识别项目展开的合作,在传统分类学日渐没落的今天,百度EasyDL可以利用强的图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前中科院使用EasyDL训练对超12万幅图片进行分析,目前在700多种鸟类模top5的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%,满足线要求。 与卓繁信息的合作,百度脑还打造了“AI便民”的型无人值守受理站。通UNIT、OCR、人脸识别等AI技术,“无人值守”的政模式为社会公众提供全年无休的24时自助办事,提升了政府为民的能力。 开放日当天,网红智能猫窝的设计者百度脑工程师晚兮也在现场为家讲述了智能猫窝设计者们的初心。
双****4 2018-07-11
【杂谈】猎场没那么精彩--还原的猎头
诸如“猎头要做的就是把顶尖人才放到合适的职位”这类话听听就好,候选者是不是顶尖人才猎头说了不算,能不能进这个公司猎头同样说了不算。猎头就是提供人才搜寻的供应商,这个供应商不能替甲方人事和业做决策。 第四点,猎头不会固执于一个项目,猎头不会跟候选人强推意向单位的宏图,因为候选人本人也是业内专家不用猎头来教;更不会向甲方强推候选人,面试官眼拙运气差那就只能认栽,本公司bHR都无法说得的面试官,外部猎头能说什么?而且稀缺人才总是供不应求的,转手把这个人卖给别的公司或者别的猎头一样能拿佣金 第四部分.如何识别资深还是手猎头 面试者来看资深猎头和手猎头是很容易区别的。 手猎头只会看你的履历里几个技能和职位的关键字,除此之外一个字都不懂;资深猎头有眼睛有脑,会分析和询问你的简历。 手猎头对职位的解析和路人甲没什么区别,只会强调待遇、级别和公司是名企;资深猎头可以说明这个职位在该企业内是具体做什么的,有多重要性。 手猎头是撒网炸鱼,对每个面试者没花时间也并不热心;资深猎头为了一次面试准备了超水货同行十倍的时间,催面试反馈她比你还着急。
TOP