关于 到哪买女用春药【V信;799.196.362】实 的搜索结果,共848
h****e 2018-07-10
程序:我从里来?
干货概览 在计算机程序或者服务的层次上,我们来试着分析前面提的几个问题。 问题 1.我是谁? 服务叫什么,服务包含了些实例,服务规模、部署情况、实例运行状况如何? 2.我从里来? 服务的上游有些,不同的上游流量如何分配? 3.我往里去? 服务的下游有些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字服务)是百度云智能运维团队研发的一套分布式的名字服务系统,是百度云Noah智能运维产品中的一个重要基础服务系统。它为每一个服务赋予一个独一无二的名字,根据这个名字,我们就可以获取这个服务的相关息 ,这些息包括:服务在机器上部署息(机器IP,部署路径,服务配置,端口息),服务的实例运行状况等其他重要息。简单来讲,它提供了一个服务名资源息的一个映射关系。
l****m 2018-07-10
词向量(一)
神经网络求词向量之前,传统做法是统计一个词语的共生矩阵XX。XX是一个|V|×|V||V|×|V| 大小的矩阵,XijXij表示在所有语料中,词汇表VV(vocabulary)中第i个词和第j个词同时出现的词数,|V||V|为词汇表的大小。对XX做矩阵分解(如奇异值分解,Singular Value Decomposition [5]),得的UU即视为所有词的词向量: X=USVTX=USVT 但这样的传统做法有很多问题: 由于很多词没有出现,导致矩阵极其稀疏,因此需要对词频做额外处理来达好的矩阵分解效果; 矩阵非常大,维度太高(通常达106×106106×106的数量级); 需要手动去掉停词(如although, a,...),不然这些频繁出现的词也会影响矩阵分解的效果。 基于神经网络的模型不需要计算和存储一个在全语料上统计产生的大表,而是通过学习语义息得词向量,因此能很好地解决以上问题。在本章里,我们将展示基于神经网络训练词向量的细节,以及如何PaddlePaddle训练一个词向量模型。
h****l 2018-07-09
大数据时代下的隐私保护(二)
如果攻击者想确认一个人 (小明)的敏感息(购偏好),通过查询他的年龄、邮编和性别,攻击者会发现数 据里至少有两个人是有相同的年龄、邮编和性别。这样攻击者就没办法区分这两条数据 个是小明了,从而也就保证了小明的隐私不会被泄露。 下面这个表就是2-anonymization 过的息: k-anonymity 的方法主要有两种,一种是删除对应的数据列,星号(*)代替。另外 一种方法是概括的方法使之无法区分,比如把年龄这个数字概括成一个年龄段。对于邮编这样的数据,如果删除所有邮编,研究人员会失去很多有意义的息,所以可以选 择删除最后一位数字。 从这个表中,即使我们知道小明是男性、24 岁、邮编是100083,却仍然无法知道小 明的购偏好。而研究人员依然可以根据这些数据统计出一些有意义的结果,这样既兼 顾了个人的隐私,又能为研究提供有效的数据。 k-anonymity 能保证以下三点: 攻击者无法知道某个人是否在公开的数据中2. 给定一个人,攻击者无法确认他是否有某项敏感属性3.
小****园 2018-07-10
让PB级云存储不再神秘
Last Modified time其实是文件的createtime或meta息的修改时间,对象存储所有的文件都没有修改,只有同名新文件。 不提供Owner息,访问域名已经标识了多租户级别的Owner息,开发者给自己的户颁发token的过程中就完成了对应级Owner的标识。 常规文件系统也提供了这些息(hash值除外),但文件系统在亿万文件管理是太缓慢了,而且很多程序员并不熟悉如何调这些息,怕只有几万个文件,他们也更习惯把这些息存在数据表里。现在有一个方便调的API接口,这比自己维护数据表的成本更低了。 3、PB数据的业务场景 上文阐述清楚PB级存储必须对象存储这种接口方式,什么样的场景会产生PB数据?即使我们现在只有10GB数据,我们也要做好成为PB户的规划。 如果你要做个有百万以上户级别的ToC应,或者出货量过百万的智能硬件,每客户每月产生100M持久存储数据,一年就是1PB。
TOP