关于 小妹SPA会所【v信78792796】温州天河莞式服务哪里比较 的搜索结果,共1342
h****e 2018-07-10
程序:我从来?
干货概览 在计算机程序或者的层次上,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了些实例,规模、部署情况、实例运行状况如何? 2.我从来? 的上游有些,不同的上游流量如何分配? 3.我往去? 的下游有些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一套分布的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关息 ,这些息包括:在机器上部署息(机器IP,部署路径,配置,端口息),的实例运行状况等其他重要息。简单来讲,它提供了一个名到资源息的一个映射关系。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
时间不稳威胁到的程序健壮性和业安全性,甚至部分程序崩溃的稀糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目任;假设一个根NTP不稳定,有的器获得了错误的时间,虽然现在业层可以包容异常,不出现算出负利息或倒扣费的情况,但业混乱是免不了的。我们就说联机调试分布日志,几个节点的时间有错可能日志就看不懂了。 NTPD做时间调整有效减少这类情形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详情见附录实验);也不盲目任远端时钟源,甚至固执的拒绝同步时间。NTPD本机时刻有可能不对,但不忽快忽慢甚至停滞,NTPD通过多次收发包选择权威稳定的时间源,算出双方间的网络延迟,然后才新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人留下NTPD不好用、不靠谱的误。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入生产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
在传统的运维方中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性影响的恢复速度,同时人的不可靠性也可能导致问题扩大。 为了解决这类问题,我们针对百度内外部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合外网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。同时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各大互联网公司被披露的故障事件,单机房故障层出不穷。例如: 2015年6月某公司云香港IDC节点电力故障崩溃12时 2016年5月某公司杭接入故障,中断时级别 2017年1月某业津机房故障,数时无法提供 2017年6月北京某处机房掉电,多家互联网公司受影响 单机房故障频繁影响业的可用性并且给公司带来直接或间接的损失。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
我不将它压到箱底,偶尔我也练练聊聊,纪念一下那个搞技术的黄金时代。 本文聊个很有嚼头的技术问题,Linux系统的启动过程,当我们不用自己安装系统以后,丧失了这么多乐趣。 正文 1.主板加电和硬件自检,就是开机第一屏启动界面。 CPU和内存插得有问题滴滴乱叫,而网卡和硬盘插不插都无谓,因为这些外设都不属于经典的计算机系统。 早期内存器一般有内存检测的功能,但256G内存的器启动的速度也太慢了,重启一分钟能启动的还能恢复,重启三分钟可能群集性状就变了,以我们经常顺手就把他关掉了。 2.读取主板引导配置,现在终于要从外部设备读取数据了。 主板大都是BIOS引导,也有是UEFI引导,但从器用户看区别也不大。 主板可选从USB/SATA/NIC这几类接口上获取引导数据,而且可以排队加载,第一个加载不成功就尝试第二个。系统安装镜像都有个防止误操作的倒计时,而网络引导一般是排在末位,硬盘引导就是通用的系统启动的方。 爱折腾桌面电脑的朋友从这一步开始就玩双系统/WINPE/U盘版Ubuntu/无盘工作站了,还好器维护人员单纯专一。
追****圣 2018-07-11
给书记省长讲清楚云计算
二三线城市对互联网还只是简单的管控,稍有不解可能就封禁一大批互联网,但一道封网命令就可以毁掉一个云计算公司的声誉。如果当地政企要做好云计算就要从管理者变为者,必须在管控违规违法时不惊扰正常业,甚至主动出击为正常网络保驾护航。 前几条都是从降低成本可靠的角度请云计算企业来合作建厂,如果你有市场有客户那对方主动上门寻求合作。从长周期来看云计算的客户是覆盖全球全行业的,各地内部采购的计算机项目根本不值一提,市场和客户要靠云计算厂商自己去找。但现在云计算厂商还在早期扩张摸索之中,云厂商极端渴求各种政云企业云成功模案例,一旦摸出来案例迅速推广到全国。这个窗口期只有三五年,随着政云企业云被其他公司摸透并推广开,这些项目就从首发明星案例变为普通捆绑销售了。 挑选合格的云计算合作厂商,每类厂商有些特点。 前文说的为何要引凤,如何算筑巢。当云厂商看到商机肯合作时,我们要掌握各类云厂商的特点才能心有数。 第一类是大型云厂商,他们自身有很强的资源整合能力和执行销售能力。地方政企和这类企业合作的话语权很弱,但极风险就能看到收益。
l****m 2018-07-10
词向量(一)
词向量是自然语言处理中常见的一个操作,是搜索引擎、广告系统、推荐系统等互联网背后常见的基础技术。 在这些互联网,我们经常要两个词或者两段文本之间的相关性。为了做这样的,我们往往先要把词表示成计算机适合处理的方。最自然的方恐怕莫过于向量空间模型(vector space model)。 在这种方,每个词被表示成一个实数向量(one-hot vector),其长度为字典大,每个维度对应一个字典的每个词,除了这个词对应维度上的值是1,其他元素都是0。 One-hot vector虽然自然,但是用处有限。如,在互联网广告系统,如果用户输入的query是“母亲节”,而有一个广告的关键词是“康乃馨”。虽然按照常理,我们知道这两个词之间是有联系的——母亲节通常应该送给母亲一束康乃馨;但是这两个词对应的one-hot vectors之间的距离度量,无论是欧氏距离还是余弦相似度(cosine similarity),由于其向量正交,都认为这两个词毫无相关性。 得出这种与我们相悖的结论的根本原因是:每个词本身的息量都太
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
资源投入 云资源贩售过程中,合格的厂商可以让云资源物有值,但巧妇难为无米之炊,原始资源投入不够云就不可能很稳定。面向中客户的时候,云厂商很忌讳透露具体硬件成本,也尽量避免承认资源不足,但面对大客户时很坦诚。 作为持久共生的大甲方,请关注乙方的成本红线,买家永远没有卖家精。如果甲方给够钱了,乙方仍然用劣质硬件IDC和过高超售云厂商一般是老板带头节俭,而大云厂商很可能是执行层的人弄错了,作为甲方该闹就要闹。 人为原因 云厂商的人为故障总是糊涂账,但细心的甲方是能看出来端倪的。有时候厂商想遮蔽技术和资源的问题,说是人为原因,缓过这一次故障赶紧修订BUG和准备资源;有时候明明是人为原因,但人为故障都是打脸实锤,厂商脸肿而且要赔偿,可能找个其他原因来给脸部降降。 对于落实是人为导致的故障,甲方单纯的索赔追责并不能解决问题,因为云厂商总是甲方的实际损失更,甲方无法触及云厂商能倒腾出故障的部门。甲方只能根据云厂商销售和线的能力和态度,确认自己交钱了能否买到靠谱的。 最重是商誉 云计算既是资源又是,资源相对可以量化,但短期内看直观感受,长期看商业誉。
小****园 2018-07-10
让PB级云存储不再神秘
我实践中不太推荐这种方,因为对三副本存储没太大优势。 纠删码存储是老技术了,大家买的超强纠错的VCD盘片就用的本地纠删码技术。我们可以简单把纠删码技术类成网络版Raid5,这种技术大大的节省磁盘,而且可以设置多块校验盘来提高数据安全性,是PB级存储的主力存储池。但它的缺点也很明显,因为数据要做聚合条带后重新编码,写入速度慢;Raid5磁盘修复时IO放大问题在EC同样严重;而且纠删码回收已删除文件的空间难度很大速度很慢。 SSD文件存储,这其实是标准三副本存储的SSD版本,一般用来存储文件,SSD盘再贵也缓存的内存便宜。文件存储的数据总量不大,一般在本盘存储即可,不用导入纠删码存储中。 上述存储手段只是落盘手段,作为存储组件还要通盘考虑下列问题。 磁盘故障时的修复性能。 商用磁盘都是按照36-60个月的使用周期设计的,假设你有6000块磁盘每个月要坏100块盘,坏盘修盘已经成为常态。厂商要保证损坏磁盘快速修复,避免修复周期内另外几块冗余盘一并损坏,又要保证磁盘修复时群集性能受不了太大影响。
流****水 2018-07-11
度云企业级运维平台——NoahEE
管理 我们首先介绍管理是因为管理是整个运维工作的基础,也是NoahEE这个平台上各个系统能够进行批量自动化操作的关键。管理这个概念的出现,是随着业快速膨胀的必然,其要解决的主要问题是一个“量”,或者说“规模”的问题。在早期业为简单时,一个可能部署在几台甚至一台机器上,进行变更等运维操作简单直接,登录到机器上人工操作就好了。随着业的发展,分布应用与的广泛使用,我们越来越多的面临着运维场景与运维执行之间的脱节。 举个例子,今17:00开始对X机房的地图导航模块进行升级。对于产品研发的同学来说,关注点是语义明确且更具描述性的“运维场景”;而对于运维人员来说,关注点是此次升级操作涉及的机器等资源在。在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否分配给不同部门(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本上升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。
布****五 2018-07-10
如何执行一条命令
部署过程可以拆解为两个的步骤,一是新软件包的上传,二是进程的重新启动。进程的重新启动不必多说,软件包的上传可能有多种方,如sftp的集中,p2p的点对点等。 监控采集 软件运维过程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的实时息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,一种是通过业软件提供的接口直接读取状态数据,另一种是通过日志/进程状态/系统状态等(如使用grep提取日志,通过ps查询进程状态,通过df查询磁盘使用等)方间接查询。 无论是配置管理、部署变更还是监控采集,都有一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量器上执行命令并收集结果”这一基础能力,这也是今我们的主题“如何执行一条命令”的意义在。
TOP