关于 口服迷药真实效果【V信;799.196.362】瞬 的搜索结果,共785
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者务的层次上,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 务叫什么,务包含了哪些例,务规模、部署情况、例运行状况如何? 2.我从哪里来? 务的上游有哪些,不同的上游流量如何分配? 3.我往哪里去? 务的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字务)是百度云智能运维团队研发的一套分布式的名字务系统,是百度云Noah智能运维产品中的一个重要基础务系统。它为每一个务赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个务的相关息 ,这些息包括:务在机器上部署息(机器IP,部署路径,务配置,端息),务的例运行状况等其他重要息。简单来讲,它提供了一个务名到资源息的一个映射关系。
双****4 2018-07-11
【杂谈】猎场没那么精彩--还原的猎头
当遭遇面试失败,资深猎头能要到失败原因通报给候选人,而新手猎头不关注面试失败原因,用人部门给的失败原因都是敷衍套话。 也有一部分猎头会和优质候选人保持长时间关系,但这太费时间了,猎头五年内给同一个候选人介绍两次工作的几率在是太小了。 我这里没提诸如JD介绍、简历优化一类基础内容,合格的候选人会认专业的分析职位需求,不需要猎头来催的。 用人单位评估猎头的水平就更简单了,就是写推荐说明。新手猎头是写不出干货锤的推荐的,而资深猎头的推荐不仅是对候选人简历的解析,也会包含简历之外的大量建议说明。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD务做时间调整会有减少这类情形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业务(详情见附录验);也不会盲目任远端时钟源,甚至固执的拒绝同步时间。NTPD务相本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳定的时间源,算出双方间的网络延迟,然后才会采新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步需要时间。我们很难成功调试NTPD务,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD务就背上黑锅了。 有TOP10的互联网公司和上亿国家级项目里用ntpdate+crond,上一代架构师为什么有这个误会无人深究,下一代人将误会固化为偏见,新一代人将偏见神化为
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时性会影响务的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业务指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字务(BNS)现了智能流量调度与自动止损能力。同时,基于时容量与时流量调度自动止损策略与管控风险,现了任意单机房故障时业务均可快速自愈的。当前此解决方案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业务可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云务香港IDC节点电力故障崩溃12小时 2016年5月某公司杭州电接入故障,务中断小时级别 2017年1月某业务天津机房故障,数小时无法提供务 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业务的可用性并且会给公司带来直接或间接的损失。
l****m 2018-07-10
词向量(一)
XX是一个|V|×|V||V|×|V| 大小的矩阵,XijXij表示在所有语料中,词汇表VV(vocabulary)中第i个词和第j个词同时出现的词数,|V||V|为词汇表的大小。对XX做矩阵分解(如奇异值分解,Singular Value Decomposition [5]),得到的UU即视为所有词的词向量: X=USVTX=USVT 但这样的传统做法有很多问题: 由于很多词没有出现,导致矩阵极其稀疏,因此需要对词频做额外处理来达到好的矩阵分解; 矩阵非常大,维度太高(通常达到106×106106×106的数量级); 需要手动去掉停用词(如although, a,...),不然这些频繁出现的词也会影响矩阵分解的。 基于神经网络的模型不需要计算和存储一个在全语料上统计产生的大表,而是通过学习语义息得到词向量,因此能很好地解决以上问题。在本章里,我们将展示基于神经网络训练词向量的细节,以及如何用PaddlePaddle训练一个词向量模型。 展示 本章中,当词向量训练好后,我们可以用数据可视化算法t-SNE[4]画出词语特征在二维上的投影(如下图所示)。
w****0 2018-07-11
单机房故障自愈-黎明之战
那么如何验证业务线是否具备该能力、能力是否出现退化,我们采取盲测验收的方式,模拟或制造故障,验证不同业务线故障情况及止损率,并给出相应的优化意见。 根据业务线进行容灾能力建设的不同阶段,我们从对产品际可用性影响程度、成本、等方面权衡,将盲测分为三种类型: 无损盲测:仅从监控数据层面假造故障,同时被测业务可根据监控数据决策流量调度目标,对于业务际无影响,主要验证故障处置流程是否符合预期、入级流量切换预案是否完整。 提前通知有损盲测:植入际故障,从网络、连接关系等基础设施层面植入错误,对业务务有损,用于战验证产品线各个组件的逻辑单元隔离性、故障应急处置能力。同时提前告知业务盲测时间和可能的影响,业务线运维人员可以提前准备相应的止损操作,减少单机房止损能力建设不完善导致的损失。 无通知有损盲测:在各业务线单机房容灾能力建设完成后,进行不提前通知的有损盲测,对业务来说与发生故障场景完全相同。验证业务线在单机房故障情况下的止损恢复能力。 单机房故障止损流程 一个完整的故障处理生命周期包括感知、止损、定位、分析四个阶段。
布****五 2018-07-10
如何执行一条命令
可是如要在几十万台机器上每天执行几十亿条命令,同时保证时性,保证执行成功率,保证结正确收集,保证7*24小时稳定运行,就不是一件简单的事情了。所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例子如下: 息存储问题:为了支持水平扩展,需要高的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令息持久化。日均几十亿的热数据,年均上万亿的冷数据,需要仔细选择存储方案。 任务调度问题:为了达到在任意多台务器上执行命令的要求,需要确定何时分发命令、何时回收结以及怎么样的并发度批量下发。 消息传输问题:为了保证命令高正确送达目标务器,需要构建一个可靠的命令传输网络,使命令息在准确送达的前提下保障传输的可靠与高,毕竟百度的几十万台务器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。
TOP