关于 火凤网_灰色关键词排名代做接单σσ:8 的搜索结果,共901
l****m 2018-07-10
向量(一)
文章结构: 向量 背景介绍 效果展示 模型概览 数据准备 编程实现 模型应用 总结 参考文献 本教程源码目录在book/word2vec,初次使用请您参考Book文档使用说明。 背景介绍 本章我们介绍的向量表征,也称为word embedding。向量是自然语言处理中常见的一个操作,是搜索引擎、广告系统、推荐系统等互联服务背后常见的基础技术。 在这些互联服务里,我们经常要比较两个或者两段文本之间的相性。为了这样的比较,我们往往先要把表示成计算机适合处理的方式。最自然的方式恐怕莫过于向量空间模型(vector space model)。 在这种方式里,每个被表示成一个实数向量(one-hot vector),其长度为字典大小,每个维度对应一个字典里的每个,除了这个对应维度上的值是1,其他元素都是0。 One-hot vector虽然自然,但是用处有限。比如,在互联广告系统里,如果用户输入的query是“母亲节”,而有一个广告的是“康乃馨”。
c****2 2018-07-10
个性化推荐(一)
该方法的一个优势是它不依赖于机器去分析物品的内容特征,因此它无需理解物品本身也能够准确地推荐诸如电影之类的复杂物品;缺点是对于没有任何行为的新用户存在冷启动的问题,同时也存在用户与商品之间的交互数据不够多造成的稀疏问题。值得一提的是,社交络[3]或地理位置等上下文信息都可以结合到协同过滤中去。 基于内容过滤推荐[4](Content-based Filtering Recommendation):该方法利用商品的内容描述,抽象出有意义的特征,通过计算用户的兴趣和商品描述之间的相似度,来给用户推荐。优点是简,不需要依据其他用户对商品的评价,而是通过商品属性进行商品相似度度量,从而推荐给用户所感兴趣商品的相似商品;缺点是对于没有任何行为的新用户同样存在冷启动的问题。 组合推荐[5](Hybrid Recommendation):运用不同的输入和技术共同进行推荐,以弥补各自推荐技术的缺点。 近些年来,深度学习在很多领域都取得了巨大的成功。学术界和工业界都在尝试将深度学习应用于个性化推荐系统领域中。
双****4 2018-07-10
向量(三)
整个程序的入口很简: def main(use_cuda, is_sparse): if use_cuda and not fluid.core.is_compiled_with_cuda(): return params_dirname = "word2vec.inference.model" train( if_use_cuda=use_cuda, params_dirname=params_dirname, is_sparse=is_sparse) infer(use_cuda=use_cuda, params_dirname=params_dirname) main(use_cuda=use_cuda, is_sparse=True) 总结 本章中,我们介绍了向量、语言模型和向量的系、以及如何通过训练神经络模型获得向量。在信息检索中,我们可以根据向量间的余弦夹角,来判断query和文档这二者间的相性。在句法分析和语义分析中,训练好的向量可以用来初始化模型,以得到更好的效果。
用****在 2018-07-10
向量(二)
基于具体的应用场景,每一项可以是一个字母、或者音节。 n-gram模型也是统计语言模型中的一种重要方法,用n-gram训练语言模型时,一般用每个n-gram的历史n-1个语组成的内容来预测第n个。 Yoshua Bengio等科学家就于2003年在著论文 Neural Probabilistic Language Models [1] 中介绍如何学习一个神经元络表示的向量模型。文中的神经概率语言模型(Neural Network Language Model,NNLM)通过一个线性映射和一个非线性隐层连,同时学习了语言模型和向量,即通过学习大量语料得到语的向量表达,通过这些向量得到整个句子的概率。因所有的语都用一个低维向量来表示,用这种方法学习语言模型可以克服维度灾难(curse of dimensionality)。注意:由于“神经概率语言模型”说法较为泛泛,我们在这里不用其NNLM的本,考虑到其具体法,本文中称该模型为N-gram neural model。
小****园 2018-07-10
让PB级云存储不再神秘
如果你觉得元数据服务压力还是大,那还可以让计费系统、读写理都对查询结果缓存,或者将数据库挂在成熟的Proxy背后分库和调度。 我们的数据库能低压力运行,就是设计时充分理解适应了对象存储元数据这一简需求。 3、灵活的读写理 读写理是整个群集保持松耦合高性能的点,这也离不开对场景的深度理解。 首先说读写理的高可用、负载均衡和高性能,我们会在读写理前面加几台Nginx,客户端到读写理都是无状态连。客户端可以通过LVS、DNS轮询、多域分散业务等方式将请求分散到多台Nginx,Nginx将请求交给任意读写理都是能得到相同结果的。个读写理服务崩溃了SDK端会后台重试,直访问API的用户会以为是自己慢重新刷新。这么灵活的访问方式,有性能问题多堆几台机器就好了,20G带宽5万个链很容易消化。 读写理在访问客户时表存储服务端,在群集内部扮演的可信客户端。一个分布式系统中,客户端是可控可信,可以知晓群集内其他服务状态,则群集设计会非常简,可以到所有组件都自动协商、自宣告状态、有序引导流量以及异常错误重试。
w****0 2018-07-11
机房故障自愈-黎明之战
要求:将服务拆分为若干不同的逻辑元,每个逻辑元处于不同的物理机房,均能提供产品线完整服务。 3.服务不满足N+1冗余 描述:任意个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房服务过载,造成多个机房服务故障,造成更大范围的影响。 要求:容量建设需要对于每个逻辑服务元都要有明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,同时需要保证服务变化时及时更新数据和扩容服务,避免容量数据退化。同时对于流量的变化趋势,也需要有提前的预估,为重大事件流量高峰预留足够容量(如节日、运营、假期)。 4.服务联强耦合 描述:上下游服务使用固定IP或固定机器进行直。 问题:机房故障发生时,联的上下游之间无法进行快速的流量调度止损。 要求:线上服务联不允许使用固定IP或机器,需使用具备流量调度能力的上下游连方式以实现上下游依赖解耦,下游服务发生机房故障,可以快速调整路由比例实现止损。 机房容灾能力--盲测验收 完成以上四点机房容灾能力建设后,业务线就具备了通过流量调度进行止损机房故障的基本条件。
M****点 2018-07-10
中国云计算现状——产品篇
前言 上篇文章《中国云计算现状——成本篇》(特大号首发改为《好云计算要花多少钱》)讲的是成本问题,即什么企业有可能能云计算。本文是第二篇产品篇,目标客户是云计算产品经理和云计算标准用户。我从一个老用户的角度谈谈每种云计算产品该如何使用,哪些产品改进是刚需放心吐槽,哪些产品有内因就是改不了。本文主要说用云产品的问题,买云产品的问题在采购篇聊。 正文 现在是2017年,云计算服务是物理硬件的优质替方案,客户很认可云计算极低的采购和交付成本优势。这时候我们要少被企宣PPT洗脑,追求华而不实的远景,这些PR文章的受众是风险投资、客户决策层和创业者。我们应该摸清楚云方案和硬件方案比有什么特点和局限性,客户明白特点才能使用得心应手,客户明白局限性才会早作备用方案,产品经理心里不慌才会注核心功能。 一、IaaS产品 IaaS平台的本质是,产品以硬件资源的虚拟化为本,业务上承物理硬件替需求,其优势是最快速度最低成本交付,客户为预占的物理资源付费。IaaS产品是最经典的云计算服务,核心组件是云主机,如虚拟络、云硬盘和安全组都是为支撑云主机业务而服务的。
嘟****y 2018-07-11
大型企业适用的云平台账户体系
第五.其他随笔说明 a.过去云管平台计费和权限开发很繁琐,云平台支持精细控制后云管平台的对成本会瞬间降低,那些功能缺失又不是行业标杆的云平台会云管平台被逐渐放弃入。 b.有客户想给不同资源组不同资源价,这是个弱需求,该需求技术实现繁琐且有客户可受的变通方法,比如子账户登陆只计量不计价,价格在心中。 c.这套账户体系从对AD改为手动生成,同时调整其扣费账户设置,即可以将其改造成一个理商用的操控界面。
m****t 2018-07-11
设计中立公有云云管平台
如果你要大而全的云管平台,可以让客户随意操作资源称。但如果只是简易云管平台,我的建议是用资源不同用户的隔离标识,且让用户不可轻易修改该称。比如说用户user1创建的云主机字叫“web01”,那实际创建的云主机应该是“web01.user1”,且“.user1”部分不可修改。这样通过资源后缀就可以笨拙但有效的区分开不同用户的资源。 本文下来的内容就是云管平台拿到的不同供应商资源,哪些是必要资源,哪些是可选资源;这些资源至少要进行哪种程度的管理才能满足用户的基础需求,哪些功能用户嚷的响亮,但不是燃眉之急,可以放到二期三期来。 第三必要云资源 云计算平台最早是对物理服务器的模拟,所以必须的云资源就是模拟物理服务器的资源。但云平台用SDN管理络,云主机无法像物理机一样自由发ARP广播,所以和主机络相的配置也要独管理。现在云平台都把云硬盘独立于主机之外独管理,本地虚拟盘几乎绝迹。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 在大型互联公司中,机房故障因为其故障时间长、影响范围大,一直是互联公司运维人员的心头之痛。在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响服务的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部络环境建设了基于智能流量调度的机房故障自愈能力。结合外运营商链路监测、内链路质量监测与业务指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度字服务(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意机房故障时业务均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、信息流、贴吧、地图等众多核心产品的机房故障自愈场景。 机房故障频发影响业务可用性 回顾近2年来各大互联公司被披露的故障事件,机房故障层出不穷。
TOP