关于 催情香水作用效果【V信;799.196.362】粱 的搜索结果,共763
l****m 2018-07-10
词向量(一)
神经网络求词向量之前,传统做法是统计一个词语的共生矩阵XX。XX是一个|V|×|V||V|×|V| 大小的矩阵,XijXij表示在所有语料中,词汇表VV(vocabulary)中第i个词和第j个词同时出现的词数,|V||V|为词汇表的大小。对XX做矩阵分解(如奇异值分解,Singular Value Decomposition [5]),得到的UU即视为所有词的词向量: X=USVTX=USVT 但这样的传统做法有很多问题: 由于很多词没有出现,导致矩阵极其稀疏,因此需要对词频做额外处理来达到好的矩阵分解; 矩阵非常大,维度太高(通常达到106×106106×106的数量级); 需要手动去掉停词(如although, a,...),不然这些频繁出现的词也会影响矩阵分解的。 基于神经网络的模型不需要计算和存储一个在全语料上统计产生的大表,而是通过学习语义息得到词向量,因此能很好地解决以上问题。在本章里,我们将展示基于神经网络训练词向量的细节,以及如何PaddlePaddle训练一个词向量模型。
1****6 2018-07-10
感分析
栈式双向LSTM(Stacked Bidirectional LSTM) 对于正常顺序的循环神经网络,htht包含了tt时刻之前的输入息,也就是上文息。同样,为了得到下文息,我们可以使反方向(将输入逆序处理)的循环神经网络。结合构建深层循环神经网络的方法(深层神经网络往往能得到更抽象和高级的特征表示),我们可以通过构建更加强有力的基于LSTM的栈式双向循环神经网络[9],来对时序数据进行建模。 如图4所示(以三层为例),奇数层LSTM正向,偶数层LSTM反向,高一层的LSTM使低一层LSTM及之前所有层的为输入,对最高层LSTM序列使时间维度上的最大池化即可得到文本的定长向量表示(这一表示充分融合了文本的上下文息,并且对文本进行了深层次抽象),最后我们将文本表示连接至softmax构建分类模型。 图4. 栈式双向LSTM于文本分类 数据集介绍 我们以IMDB感分析数据集为例进行介绍。IMDB数据集的训练集和测试集分别包含25000个已标注过的电影评论。其中,负面评论的得分小于等于4,正面评论的得分大于等于7,满分10分。
金****洲 2018-07-09
百度安全实验室|机器学习对抗性攻击报告
1.攻 击 图 像 语 音 识 别 系 统 目前人工智能和机器学习技术被广泛应在人机交互,推荐系统,安全防护等各个 领域。具体场景包括语音,图像识别,评估,防止欺诈,过滤恶意邮件,抵抗恶意 代码攻击,网络攻击等等。攻击者也试图通过各种手段绕过,或直接对机器学习模型进 行攻击达到对抗目的。特别是在人机交互这一环节,随着语音、图像为新兴的人机输 入手段,其便捷和实性被大众所欢迎。同时随着移动设备的普及,以及移动设备对这 些新兴的输入手段的集成,使得这项技术被大多数人所亲身体验。而语音、图像的识别 的准确性对机器理解并执行户指令的有性至关重要。与此同时,这一环节也是最容 易被攻击者利,通过对数据源的细微修改,达到户感知不到,而机器接受了该数据 后做出错误的后续操的目的。并会导致计算设备被入侵,错误命令被执行,以及执行 后的连锁反应造成的严重后。本文基于这个特定的场景,首先简单介绍下白盒黑盒攻 击模型,然后结合专家们的研究成,进一步介绍攻击场景,对抗数据构造攻击手段, 以及攻击
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
干货概览 业务部署(熟称上线)是运维领域最常见的业务类型,主要涉及线上代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生》中专门讨论过)。一般的业务上线具有不定时操、业务部署况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工,且易于出错。从公布的数据显示,Google 70%的生产事故由上线变更触发,如何减少变更过程中人为误操,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键上线部署系统——Archer。Archer致力于提供一套产品线全过程的可迁移发布解决方案,实现一键完成机器初始化、服务部署、添加模块监控、添加CT任务、动态数据文件的分发等全过程的自动操。在操方面,Archer提供了命令行工具为发起一次上线的操入口,这种设计模式也决定了其易于集成的特点。在DevOps流线业中,Archer可以为一个环节结合进整条测试发布流线中。
c****2 2018-07-10
个性化推荐(一)
优点是简单直接,不需要依据其他户对商品的评价,而是通过商品属性进行商品相似度度量,从而推荐给户所感兴趣商品的相似商品;缺点是对于没有任何行为的新户同样存在冷启动的问题。 组合推荐[5](Hybrid Recommendation):运不同的输入和技术共同进行推荐,以弥补各自推荐技术的缺点。 近些年来,深度学习在很多领域都取得了巨大的成功。学术界和工业界都在尝试将深度学习应于个性化推荐系统领域中。深度学习具有优秀的自动提取特征的能力,能够学习多层次的抽象特征表示,并对异质或跨域的内容息进行学习,可以一定程度上处理个性化推荐系统冷启动问题[6]。本教程主要介绍个性化推荐的深度学习模型,以及如何使PaddlePaddle实现模型。 展示 我们使包含息、电影息与电影评分的数据集为个性化推荐的应场景。当我们训练好模型后,只需要输入对应的户ID和电影ID,就可以得出一个匹配的分数(范围[0,5],分数越高视为兴趣越大),然后根据所有电影的推荐得分排序,推荐给户可能感兴趣的电影。
Z****E 2018-07-09
产品迭代的最后一公里
变更面临的问题 其实我们对变更的需求并不复杂,为迭代的最后一公里,我们只关注两点: 操过程足够快捷(率) 变更结符合预期(安全) 但是,在具有一定规模企业的生产环境中,户往往要面对比单台机器手工上线更加复杂的状况,在这些状况下上述两点要求通常难以满足: 大批量机器的操步骤繁琐,较依赖人的经验,变更操率低下; 由于缺少可靠的检查机制,变更无法保证,甚至引发线上较大异常。 我们在百度各核心产品的大规模变更实践中积累了丰富的经验,发现通过自动化部署可以有提升变更率,在变更过程中严格执行分级发布流程可以确保检查机制得到执行,并且能够有限制异常影响范围,加速异常恢复。在两者基础之上,融入AIOps智能变更策略,可以进一步降低管理成本,提升检查。下面将从三个方面详细介绍我们的解决方案。 我们的解决方案 1自动化部署 自动化部署包含变更策略和批量机器执行能力两部分。具体来说,户通过UI/API配置整个变更过程的执行策略,例如先执行A地域机器的变更,再执行B地域机器的变更;执行失败的机器超过10台就自动中止等。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
具体过程为自愈程序搜集分散的运维对象状态数据,自动感知异常后进行决策,得出基于动态编排规划的止损操,并通过标准化运维操接口执行。该解决方案策略和架构解耦,并且托管到高可的自动化运维平台之上,实现了业务在任意单个机房故障况下皆可自愈的。 截至目前该方案已覆盖百度大多数核心产品,止损率较人工处理提升60%以上。典型案例: 在8月28日某产品在单机房故障发生后1min55s完成止损。 在后续文章中我们会继续介绍单机房故障自愈的更多详细内容,敬请期待! 单机房故障容灾能力的建设 在容灾能力建设中有哪些常见问题? 如何证明服务已经具备单机房容灾能力? 单机房故障人工止损方法 人工止损时如何感知服务故障? 人工止损时如何收集故障息? 人工止损时如何进行流量调度? 单机房故障机器人止损方法 如何设计单机房故障自愈整体方案? 如何降低流量调度风险? 如何应对不同业务流量调度策略和平台的差异?
布****五 2018-07-10
如何执行一条命令
所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例子如下: 息存储问题:为了支持平扩展,需要高的内存数据库为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令息持久化。日均几十亿的热数据,年均上万亿的冷数据,需要仔细选择存储方案。 任务调度问题:为了达到在任意多台服务器上执行命令的要求,需要确定何时分发命令、何时回收结以及怎么样的并发度批量下发。 消息传输问题:为了保证命令高正确送达目标服务器,需要构建一个可靠的命令传输网络,使命令息在准确送达的前提下保障传输的可靠与高,毕竟百度的几十万台服务器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。 图2简单问题放大后也变得困难 百度目前拥有分布在世界各地的几十万台服务器,并且随着业务的不断扩张,这个数字还在持续增长,构建一个高稳定通可扩展的命令描述、传递、执行系统在这样的环境中有着重要的现实意义。对百度各产品线的户来说,这样的一个系统,最基础的要求是:执行高,控制灵活,扩展方便。
f****8 2018-07-09
如何调试Dreamview启动问题?
启动,按下r和enter键运行,如Dreamview崩溃,然后bt获得回溯。
TOP