关于 找小妹上门 78792796-微V号临武县酒店一条龙兼职按摩一 的搜索结果,共1582
布****五 2018-07-10
如何执行命令
的困难 命令行的三要素,也是如何执行命令行面对的三个问题,如前文所述,对于单机环境来说,这三个问题在前人的努力下已经被很好的解决。可是如果要在几十万台机器每天执行几十亿命令,同时保证时效性,保证执行成功率,保证结果正确收集,保证7*24时稳定运行,就不是件简单的事情了。所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面诸多困难,此处举几个突出的例子如下: 信息存储问题:为了支持水平扩展,需要高效的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令信息持久化。日均几十亿的热数据,年均万亿的冷数据,需要仔细选择存储方案。 任务调度问题:为了达到在任意多台服务器执行命令的要求,需要确定何时分发命令、何时回收结果以及怎么样的并发度批量下发。 消息传输问题:为了保证命令高效正确送达目标服务器,需要构建个可靠的命令传输网络,使命令信息在准确送达的前提下保障传输的可靠与高效,毕竟百度的几十万台服务器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。
l****m 2018-07-10
词向量(
XX是个|V|×|V||V|×|V| 大的矩阵,XijXij表示在所有语料中,词汇表VV(vocabulary)中第i个词和第j个词同时出现的词数,|V||V|为词汇表的大。对XX做矩阵分解(如奇异值分解,Singular Value Decomposition [5]),得到的UU即视为所有词的词向量: X=USVTX=USVT 但这样的传统做法有很多问题: 由于很多词没有出现,导致矩阵极其稀疏,因此需要对词频做额外处理来达到好的矩阵分解效果; 矩阵非常大,维度太高(通常达到106×106106×106的数量级); 需要手动去掉停用词(如although, a,...),不然这些频繁出现的词也会影响矩阵分解的效果。 基于神经网络的模型不需要计算和存储个在全语料统计产生的大表,而是通过学习语义信息得到词向量,因此能很好地解决以问题。在本章里,我们将展示基于神经网络训练词向量的细节,以及如何用PaddlePaddle训练个词向量模型。 效果展示 本章中,当词向量训练好后,我们可以用数据可视化算法t-SNE[4]画出词语特征在二维的投影(如下图所示)。
c****2 2018-07-10
个性化推荐(
将卷积核应用于句子中所有的词窗口x1:h,x2:h+1,…,xn−h+1:nx1:h,x2:h+1,…,xn−h+1:n,产生个特征图(feature map): c=[c1,c2,…,cn−h+1],c∈ℝn−h+1c=[c1,c2,…,cn−h+1],c∈Rn−h+1 接下来,对特征图采用时间维度的最大池化(max pooling over time)操作得到此卷积核对应的整句话的特征ĉ c^,它是特征图中所有元素的最大值: ĉ =max(c)c^=max(c) 融合推荐模型概览 在融合推荐模型的电影个性化推荐系统中: 首先,使用用户特征和电影特征作为神经网络的输入,其中: 用户特征融合了四个属性信息,分别是用户ID、性别、业和年龄。 电影特征融合了三个属性信息,分别是电影ID、电影类型ID和电影名称。 对用户特征,将用户ID映射为维度大为256的向量表示,输入全连接层,并对其他三个属性也做类似的处理。然后将四个属性的特征表示分别全连接并相加。
疏****月 2018-07-09
线Archer | 百度持续部署的瑞士军刀
干货概览 业务部署(熟称线)是运维领域最常见的业务类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的下,让数据自动生效》中专讨论过)。般的业务线具有不定时操作、业务部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了线部署系统——Archer。Archer致力于提供套产品线全过程的可迁移发布解决方案,实现键完成机器初始化、服务部署、添加模块监控、添加CT任务、动态数据文件的分发等全过程的自动操作。在操作方面,Archer提供了命令行工具作为发起线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为个环节结合进整测试发布流水线中。
TOP