关于 迷晕水作用效果【V信;799.196.362】炭 的搜索结果,共589
l****m 2018-07-10
词向量(一)
神经网络求词向量之前,传统做法是统计一个词语的共生矩阵XX。XX是一个|V|×|V||V|×|V| 大小的矩阵,XijXij表示在所有语料中,词汇表VV(vocabulary)中第i个词和第j个词同时出现的词数,|V||V|为词汇表的大小。对XX做矩阵分解(如奇异值分解,Singular Value Decomposition [5]),得到的UU即视为所有词的词向量: X=USVTX=USVT 但这样的传统做法有很多问题: 由于很多词没有出现,导致矩阵极其稀疏,因此需要对词频做额外处理来达到好的矩阵分解; 矩阵非常大,维度太高(通常达到106×106106×106的数量级); 需要手动去掉停词(如although, a,...),不然这些频繁出现的词也会影响矩阵分解的。 基于神经网络的模型不需要计算和存储一个在全语料上统计产生的大表,而是通过学习语义息得到词向量,因此能很好地解决以上问题。在本章里,我们将展示基于神经网络训练词向量的细节,以及如何PaddlePaddle训练一个词向量模型。
c****2 2018-07-10
个性化推荐(一)
优点是简单直接,不需要依据其他户对商品的评价,而是通过商品属性进行商品相似度度量,从而推荐给户所感兴趣商品的相似商品;缺点是对于没有任何行为的新户同样存在冷启动的问题。 组合推荐[5](Hybrid Recommendation):运不同的输入和技术共同进行推荐,以弥补各自推荐技术的缺点。 近些年来,深度学习在很多领域都取得了巨大的成功。学术界和工业界都在尝试将深度学习应于个性化推荐系统领域中。深度学习具有优秀的自动提取特征的能力,能够学习多层次的抽象特征表示,并对异质或跨域的内容息进行学习,可以一定程度上处理个性化推荐系统冷启动问题[6]。本教程主要介绍个性化推荐的深度学习模型,以及如何使PaddlePaddle实现模型。 展示 我们使包含息、电影息与电影评分的数据集为个性化推荐的应场景。当我们训练好模型后,只需要输入对应的户ID和电影ID,就可以得出一个匹配的分数(范围[0,5],分数越高视为兴趣越大),然后根据所有电影的推荐得分排序,推荐给户可能感兴趣的电影。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人会留下NTPD不好、不靠谱的误会。2005年个人测试虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步需要时间。我们很难成功调试NTPD服务,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD服务就背上黑锅了。 真有TOP10的互联网公司和上亿国家级项目里ntpdate+crond,上一代架构师为什么有这个误会无人深究,下一代人将误会固化为偏见,新一代人将偏见神化为。 但无论误会、偏见还是,时间跃变、回退和停滞对应健壮性和业务安全性的威胁始终存在,时间不仅仅是我玩游戏时的魔法,忽视问题并不能掩埋问题。 六、见微知著和防微杜渐 我讲NTPD和裸纤并不是为卖弄知识,也不是为做偏门科普,而是希望进阶工程师们多考虑一下如何规避这类误会?我们在做技术工时,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事也不会知道时间也能错误和波动,他们能说清楚业务逻辑就不错了。
Z****E 2018-07-09
产品迭代的最后一公里
变更面临的问题 其实我们对变更的需求并不复杂,为迭代的最后一公里,我们只关注两点: 操过程足够快捷(率) 变更结符合预期(安全) 但是,在具有一定规模企业的生产环境中,户往往要面对比单台机器手工上线更加复杂的状况,在这些状况下上述两点要求通常难以满足: 大批量机器的操步骤繁琐,较依赖人的经验,变更操率低下; 由于缺少可靠的检查机制,变更无法保证,甚至引发线上较大异常。 我们在百度各核心产品的大规模变更实践中积累了丰富的经验,发现通过自动化部署可以有提升变更率,在变更过程中严格执行分级发布流程可以确保检查机制得到执行,并且能够有限制异常影响范围,加速异常恢复。在两者基础之上,融入AIOps智能变更策略,可以进一步降低管理成本,提升检查。下面将从三个方面详细介绍我们的解决方案。 我们的解决方案 1自动化部署 自动化部署包含变更策略和批量机器执行能力两部分。具体来说,户通过UI/API配置整个变更过程的执行策略,例如先执行A地域机器的变更,再执行B地域机器的变更;执行失败的机器超过10台就自动中止等。
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
为了提高自身开发迭代率,脚本未采全网部署的方案,只部署到特定插件集群。每次执行时,单机agent会从插件集群下载最新MD5,如有变更,将重新下载最新插件进行任务的执行。这种设计形式增强了执行端功能的可横向扩展性,并且极大降低了每次自身升级的成本。每次升级只需更新一个集群的插件代码,在全部机器上即可生。 总结 百度部署服务经历了手工上线- Web化- 开放化一系列发展进程,目前正在向智能化逐步发展。Archer为开放化一代的运维产品,在百度内部具有极高的使率。期待本文的介绍能为您提供一些思路,也欢迎同行们与我们进行交流,共同促进AIOps的发展!
金****洲 2018-07-09
百度安全实验室|机器学习对抗性攻击报告
1.攻 击 图 像 语 音 识 别 系 统 目前人工智能和机器学习技术被广泛应在人机交互,推荐系统,安全防护等各个 领域。具体场景包括语音,图像识别,评估,防止欺诈,过滤恶意邮件,抵抗恶意 代码攻击,网络攻击等等。攻击者也试图通过各种手段绕过,或直接对机器学习模型进 行攻击达到对抗目的。特别是在人机交互这一环节,随着语音、图像为新兴的人机输 入手段,其便捷和实性被大众所欢迎。同时随着移动设备的普及,以及移动设备对这 些新兴的输入手段的集成,使得这项技术被大多数人所亲身体验。而语音、图像的识别 的准确性对机器理解并执行户指令的有性至关重要。与此同时,这一环节也是最容 易被攻击者利,通过对数据源的细微修改,达到户感知不到,而机器接受了该数据 后做出错误的后续操的目的。并会导致计算设备被入侵,错误命令被执行,以及执行 后的连锁反应造成的严重后。本文基于这个特定的场景,首先简单介绍下白盒黑盒攻 击模型,然后结合专家们的研究成,进一步介绍攻击场景,对抗数据构造攻击手段, 以及攻击
f****8 2018-07-09
如何调试Dreamview启动问题?
启动,按下r和enter键运行,如Dreamview崩溃,然后bt获得回溯。
y****n 2018-07-09
Apollo 自动驾驶感知技术分享
Apollo 搭建感知系统,如何选择传感器、传感器配置?希望它做什么任务。 这是三种基本传感器的对比,LiDAR 是激光雷达,Radar 是汽车通毫米波雷达,Camera 是摄像头。绿色代表做得好,黄色代表做得普通,红色代表做得差。最后,说明了三种传感器融合是最好的。 那么 ,感知系统开放模块怎么做? 点云感知。开放了 LiDAR 点云检测,可以判断点云里的每个点是否为障碍物,障碍物的类型是什么。 感知框架。的是深度学习,它可以做到精准检测和识别。而深度学习非常耗费计算量。需要依靠搭建的车载智能系统,来支撑深度学习模型,以达到毫秒级感知。 高精地图。先以当前的激光雷达为坐标系核心,把地图中的点投到坐标系里。然后建立快速的表格,根据感知的距离扩大坐标区域。之后对俯视图进行网格化,网格化参数可以在 Apollo 进行配置。最后输送给障碍物检测。 障碍物检测。分为特征抽取、点云检测、点云聚类、后处理、闭包提取。
TOP