关于 小妹保健服务薇V:78792796迎泽民营区一夜情一夜情特殊奚 的搜索结果,共1381
1****6 2018-07-10
感分析
对卷积神经网络来说,首先使用卷积处理输入的词向量序列,产生征图(feature map),对征图采用时间维度上的最大池化(max pooling over time)操作得到此卷积核对应的整句话的征,最后,将所有卷积核得到的征拼接起来即为文本的定长向量表示,对于文本分类问题,将其连接至softmax即构建出完整的模型。在实际应用中,我们会使用多个卷积核来处理句子,窗口大相同的卷积核堆叠起来形成个矩阵,这样可以更高效的完成运算。另外,我们也可使用窗口大不同的卷积核来处理句子,推荐系统节的图3作为示意画了四个卷积核,既文本图1,不同颜色表示不同大的卷积核操作。 图1. 卷积神经网络文本分类模型 对于般的短文本分类问题,上文所述的简单的文本卷积网络即可达到很高的正确率[1]。若想得到更抽象更高级的文本征表示,可以构建深层文本卷积神经网络[2,3]。 循环神经网络(RNN) 循环神经网络是种能对序列数据进行精确建模的有力工具。实际上,循环神经网络的理论计算能力是图灵完备的[4]。
l****m 2018-07-10
词向量(
词向量是自然语言处理中常见的个操作,是搜索引擎、广告系统、推荐系统等互联网背后常见的基础技术。 在这些互联网里,我们经常要比较两个词或者两段文本之间的相关性。为了做这样的比较,我们往往先要把词表示成计算机适合处理的方式。最自然的方式恐怕莫过于向量空间模型(vector space model)。 在这种方式里,每个词被表示成个实数向量(one-hot vector),其长度为字典大,每个维度对应个字典里的每个词,除了这个词对应维度上的值是1,其他元素都是0。 One-hot vector虽然自然,但是用处有限。比如,在互联网广告系统里,如果用户输入的query是“母亲节”,而有个广告的关键词是“康乃馨”。虽然按照常理,我们知道这两个词之间是有联系的——母亲节通常应该送给母亲束康乃馨;但是这两个词对应的one-hot vectors之间的距离度量,无论是欧氏距离还是余弦相似度(cosine similarity),由于其向量正交,都认为这两个词毫无相关性。 得出这种与我们相悖的结论的根本原因是:每个词本身的信息量都太
h****e 2018-07-10
程序:我从哪里来?
总结 BNS系统满足间交互中常见的的资源定位、IP白名单维护等需求,也可以用于机器列表查询,使用场景包括机器列表查询、定位、白名单维护、数据库智能授权等,解决了程序“我是谁?我从哪里来?该往哪里去?”的问题。 今天我们起聊了百度云Noah智能运维产品中的BNS系统,目前系统还在持续迭代和优化中,若您想进步了解BNS问题,欢大家积极留言。
c****2 2018-07-10
个性化推荐(
候选生成网络结构 对于个用户UU,预测此刻用户要观看的视频ωω为视频ii的概率公式为: P(ω=i|u)=eviu∑j∈VevjuP(ω=i|u)=eviu∑j∈Vevju 其中uu为用户UU的征表示,VV为视频库集合,vivi为视频库中第ii个视频的征表示。uu和vivi为长度相等的向量,两者点积可以通过全连接层实现。 考虑到softmax分类的类别数非常多,为了定的计算效率:1)训练阶段,使用负样本类别采样将实际计算的类别数缩至数千;2)推荐(预测)阶段,忽略softmax的归化计算(不影响结果),将类别打分问题简化为点积(dot product)空间中的最近邻(nearest neighbor)搜索问题,取与uu最近的kk个视频作为生成的候选。 排序网络(Ranking Network) 排序网络的结构类似于候选生成网络,但是它的目标是对候选进行更细致的打分排序。和传统广告排序中的征抽取方法类似,这里也构造了大量的用于视频排序的相关征(如视频 ID、上次观看时间等)。
布****五 2018-07-10
如何执行条命令
面临的困难 命令行的三要素,也是如何执行条命令行面对的三个问题,如前文所述,对于单机环境来说,这三个问题在前人的努力下已经被很好的解决。可是如果要在几十万台机器上每天执行几十亿条命令,同时证时效性,证执行成功率,证结果正确收集,证7*24时稳定运行,就不是件简单的事了。所谓远行无轻担,量大易也难,在构建这样的执行系统的过程中要面临诸多困难,此处举几个突出的例子如下: 信息存储问题:为了支持水平扩展,需要高效的内存数据库作为缓存。为了做到执行命令的可追溯、可统计,需要对执行过的命令信息持久化。日均几十亿的热数据,年均上万亿的冷数据,需要仔细选择存储方案。 任调度问题:为了达到在任意多台器上执行命令的要求,需要确定何时分发命令、何时回收结果以及怎么样的并发度批量下发。 消息传输问题:为了证命令高效正确送达目标器,需要构建个可靠的命令传输网络,使命令信息在准确送达的前提下障传输的可靠与高效,毕竟百度的几十万台器分布在世界各地。 代理执行问题:为了更好的处理权限、单机并发等单机执行问题,需要在目标机构建执行代理,以应对单机的复杂执行环境。
红****2 2018-07-10
故障自愈机器人,你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因大致可以分为四类: 基础设施故障:物理机房故障、网络链路拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储、计算故障等 单机房故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24时值班,接收大量的报警,随时准备在紧急况下进行响应、决策、操作系列故障止损动作,尽量挽回损失,降低故障影响。 但上述解决方案会面临如下问题: 响应可能不够迅速:例如间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执行的完整故障处理过程,并及时向运维人员同步故障处理状态。运维人员的职责由处理转向管理,最终运维人员在低压力值班中稳定运行。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
时间不稳会威胁到的程序壮性和业安全性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目信任;假设个根NTP不稳定,所有的器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的况,但业混乱是免不了的。我们就说联机调试分布式日志,几个节点的时间有错可能日志就看不懂了。 NTPD做时间调整会有效减少这类形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详见附录实验);也不会盲目信任远端时钟源,甚至固执的拒绝同步时间。NTPD相信本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳定的时间源,算出双方间的网络延迟,然后才会采信新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。
疏****月 2018-07-09
键上线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称上线)是运维领域最常见的业类型,主要涉及线上代码变更、配置文件变更(数据变更由于其高频、大量的点,我们已在数据传输文章《嗖的下,让数据自动生效》中专门讨论过)。般的业上线具有不定时操作、业部署况复杂、单机启停策略复杂等点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由上线变更触发,如何减少变更过程中人为误操作,提供个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了键上线部署系统——Archer。Archer致力于提供套产品线全过程的可迁移发布解决方案,实现键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等全过程的自动操作。在操作方面,Archer提供了命令行工具作为发起次上线的操作入口,这种设计模式也决定了其易于集成的点。在DevOps流水线作业中,Archer可以作为个环节结合进整条测试发布流水线中。
TOP