关于 上海宜川路找大学生服务过夜〖10669708薇信〗 的搜索结果,共1360
h****e 2018-07-10
程序:我从哪里来?
干货概览 在计算机程序或者的层次,我们来试着分析前面提到的几个问题。 问题 1.我是谁? 叫什么,包含了哪些实例,规模、部署情况、实例运行状况如何? 2.我从哪里来? 游有哪些,不同的游流量如何分配? 3.我往哪里去? 的下游有哪些,不同的下游流量如何分配? 面对这样的问题,我们的答案是什么呢? 在百度的运维实践中,我们只需“BNS”就可以获得想要的答案。 BNS(Baidu Naming Service,百度名字)是百度云智能运维团队研发的一套分布式的名字系统,是百度云Noah智能运维产品中的一个重要基础系统。它为每一个赋予一个独一无二的名字,根据这个名字,我们就可以获取到这个的相关息 ,这些息包括:在机器部署息(机器IP,部署径,配置,端口息),的实例运行状况等其他重要息。简单来讲,它提供了一个名到资源息的一个映射关系。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
单机房故障诱因众多不可避免 单机房故障诱因众多,详细复盘若干单机房故障发现故障诱因致可以分为四类: 基础设施故障:物理机房故障、网络链拥塞、流量转发基础设施故障等 程序缺陷:程序隐藏bug、程序性能严重退化等 变更故障:测试不充分的程序、配置、数据变更,人工临时介入的误操作等 依赖故障:第三方故障例如通用的认证、支付、存储、计算故障等 单机房故障止损可靠性与效率急需提升 人工处理场景下,运维人员通常选择7*24小时值班,接收量的报警,随时准备在紧急情况下进行响应、决策、操作一系列故障止损动作,尽量挽回损失,降低故障影响。 但述解决方案会面临如下问题: 响应可能不够迅速:例如间报警 决策可能不够精确:例如新手OP经验欠缺,误决策 操作可能出现失误:例如止损命令错误输入 “机器人”处理场景下,单机房故障自愈程序可独立完成故障感知、决策、执行的完整故障处理程,并及时向运维人员同步故障处理状态。运维人员的职责由处理转向管理,最终运维人员在低压力值班中保证稳定运行。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
Archer的配置文件径、的启停脚本及运维命令具有固定的标准并且支持定制化,使用Archer进行部署的具有统一的包结构; 支持分级发布,及时拦截部署引入的线故障 针对分级发布的使用场景,Archer支持串并行线及暂停点功能,可按照单实例、单机房、单地域等级别设置暂停点,并支持部署程中进行暂停、继续、重试、撤销等操作; 业的多地域部署 的多地域部署主要需要解决不同地域配置不同的问题。Archer提供了配置派功能以支持多地域部署的场景。Archer支持在同一份配置文件中设置配置变量,并在特定地域(机房)中成特定配置值; 多种网络环境及包部署 针对多种网络环境及包部署的使用场景,Archer提供了部署数据中转传输。采用中转的线在发起任后,部分代码将首先被转存至中转机
追****圣 2018-07-11
给书记省长讲清楚云计算
政府和型国企不仅能采购云计算,早晚也会走向发展云计算的。 本文不谈任何技术细节和商业情怀,而是从政企的角度说明什么是云计算。 本文包含如下内容。 从时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以全球的行业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了全球的息技术革命,我国借助这次技术革命的好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的活,其行业态也在逐步分化扩,这一现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等少数行业,全国计算机从业人员不超万人,从业人员都有很深的术背景。 世纪90年代,门户、论坛、邮件系统开始影响部分群众的活,国内从业人员约为十万人,可以分为软件和硬件两类工程师。 进入2000年,无纸化办公、游戏、社交、电商改变了众的活的方式,国内从业人员已经远超百万,按技术分类有数十种工程师。
j****2 2018-07-10
百度脑开放日来袭 24种全新AI能力呈现
比如百度EasyDL与分形科技打造的智能垃圾桶已成功地落地淀公园,可以对7种常见垃圾自动分类,后期还可以通增加训练数据识别更多种类;在和德邦物流的合作中,为用户免去了自行填写息的麻烦,使用定制词法分析快递申请,一秒拆分姓名、电话、住址等息;更具科研意义的还有百度EasyDL与中科院在珍稀鸟类识别项目展开的合作,在传统分类日渐没落的今天,百度EasyDL可以利用强的图像识别技术协助专家们对动植物标本、照片进行快速鉴定,目前中科院使用EasyDL训练对超12万幅图片进行分析,目前在700多种鸟类模top5的识别准确率达到93.89%,非雀形目鸟类模型top5准确率达到95.79%,满足线要求。 与卓繁息的合作,百度脑还打造了“AI便民”的新型无人值守受理站。通UNIT、OCR、人脸识别等AI技术,“无人值守”的政新模式为社会公众提供全年无休的24小时自助办事,提升了政府为民的能力。 开放日当天,网红智能猫窝的设计者百度脑工程师晚兮也在现场为家讲述了智能猫窝设计者们的初心。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
2、进行云计算器维护;几供应商自己也要维护器,那些中型企业肯定会自己做私有云,在这个云计算平台里也是需要运维人员进行从低端监控到高端架构的一系列维护工作,但自动化运维技术会让运维人员的数量减少,可能每个公司都只有一两个小团队了。 3、进传统行业继续做运维;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成有限的技术革新,比如说实现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而外宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。除了通讯公司之外,产领域(比如管理产线)也有类似的顾虑,云计算的优势和公司的业需求完全不沾边,所以这类公司的运维可能会是最后的运维。工作的时候都习惯网站相关的工作,但你Web就一定要网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足一个没有前途的行业。
w****0 2018-07-11
单机房故障自愈-黎明之战
同时流量调度也无法使得恢复正常。 要求:将拆分为若干不同的逻辑单元,每个逻辑单元处于不同的物理机房,均能提供产品线完整。 3.不满足N+1冗余 描述:任意单个机房故障时,其余机房剩余容量不足以承担该机房切出的流量。 问题:流量调度导致其余机房载,造成多个机房故障,造成更范围的影响。 要求:容量建设需要对于每个逻辑单元都要有明确的容量数据,并具备N+1冗余,即任意机房故障情况下,其余机房均可承载这部分流量,同时需要保证变化时及时更新数据和扩容,避免容量数据退化。同时对于流量的变化趋势,也需要有提前的预估,为重事件流量高峰预留足够容量(如节日、运营、假期)。 4.关联强耦合 描述:下游使用固定IP或固定机器名进行直接连接。 问题:单机房故障发时,关联的下游之间无法进行快速的流量调度止损。 要求:线关联不允许使用固定IP或机器名链接,需使用具备流量调度能力的下游连接方式以实现下游依赖解耦,下游单机房故障,可以快速调整由比例实现止损。
s****d 2018-07-11
亿元级云用户分析
限制客户梦想的是老旧系统是否支持常见协议,还有底层工程师能否推动层业测试和变动。 API调用PaaS——API云就是不可控程的黑箱,客户没预算没精力就盲目任云厂商。客户有精力就做多云冗余校验,有预算就做专有资源池部署;未来云厂商还会自定义SLA标准——部分API云连等待超时都没定义。 版本发布和数字化转型——无论是微观的版本发布还是宏观的数字化转型,其实都和云没直接联系,一个是室内装修工作,一个是新建房屋工作,但装修的最好时机是房屋重建的时候,云厂商要帮客户推动IT技术革新。 5.输出分析 云厂商输出给客户的即有云端IT资源,也有平台输出。是个比资源更难量化的概念,我只引一把火苗出来。 咨询规划--如果直接给客户买资源,那就只能谈性价比,而且资源本身不会说话,所以云厂商要做好咨询规划。 明晰验收--云项目的实施和结项都是以结果为导向的,明确的程控制和验收标准对供求双方都是保护。 友好接口--面对亿元金主,云厂商的下限是类比传统IDC,要把金主伺候舒了就要IOE类集成商。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部门(资源的隔离)?权限又该如何控制?随着规模变,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例子。这个例子中,地图研发的同就可以在运维平台中选中导航的模块进行升级,运维平台会通管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通对资源合理的组织,极的简化了运维操作,提升了运维效率。
不****主 2018-07-09
高精地图
与普通地图不同,高精地图主要于自动驾驶车辆,通一套独特的导航体系,帮助自动驾驶解决系统性能问题,扩展传感器检测边界。目前 Apollo 内部高精地图主要应用在高精定位、环境感知、决策规划、仿真运行四场景,帮助解决林荫道GPS号弱、红绿灯是定位与感知以及十字口复杂等导航难题。 一、高精地图与传统地图 当我们开车时,打开导航地图通常会给我们推荐几条线,甚至会显示道是否拥堵以及每条线将花费多长时间、是否有交通管制,有多少个交通号灯或限速标志等,我们会根据地图提供的息来决定是在行驶中直行、左转还是右转以及对周围驾驶环境的评估。 而无人驾驶车缺乏人类驾驶员固有的视觉和逻辑能力。如我们可以利用所看到的东西和GPS来确定自己的位置,还可以轻松准确地识别障碍物、车辆、行人、交通号灯等,但要想让无人车变得和人类一样聪明,可是一项非常艰巨的任。 这时就需要高精地图了,高精地图是当前无人驾驶车技术不可或缺的一部分。它包含了量的驾驶辅助息,最重要是包含道网的精确三维表征,例如交叉口布局和标位置。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
时间不稳会威胁到的程序健壮性和业安全性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目任;假设一个根NTP不稳定,所有的器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的情况,但业混乱是免不了的。我们就说联机调试分布式日志,几个节点的时间有错可能日志就看不懂了。 NTPD做时间调整会有效减少这类情形,它不是简单的龟速调整时间,而是有柔性时间调整策略,让时间线的跃变和调整尽量少影响业(详情见附录实验);也不会盲目任远端时钟源,甚至固执的拒绝同步时间。NTPD本机时刻有可能不对,但不会忽快忽慢甚至停滞,NTPD通多次收发包选择权威稳定的时间源,算出双方间的网络延迟,然后才会采新的时刻进行时钟同步。 五、误解的根源和影响 因为NTPD不盲从其他时间源,让老一辈IT人会留下NTPD不好用、不靠谱的误会。2005年个人测试用虚拟机的时间经常走慢,到2010年虚拟机还要防范时间停滞的Bug。即使你用物理机投入产,网络延迟仍然不确定,且要观测NTPD同步效果需要时间。
M****点 2018-07-10
中国云计算现状——产品篇
最常见的PaaS是数据库,最重要的PaaS是对象存储,最成熟的PaaS是CDN,最有魅力的PaaS是Serverless,我们重点看这四个。 一个经典PaaS应该只是一个进程,进程是无法长期存储数据的,小量结构化数据依赖数据库存储,量数据依赖对象存储。 云数据库(如RDS)很重要但想象空间有限,因为企业里已经有数据库和DBA了,DBA并不任云端未知架构数据库的性能、稳定性和数据安全性,而且企业仍然需要DBA承担设计维护工作。 对象存储是新兴需求,企业里本来就没规模对象存储搭建能力,而且对象存储对应用程序友好手简单,客户对它是积极拥抱甚至业依赖。一旦用户在对象存储平台堆积了TB的数据,数据和AI分析应用自然就部署来了。广域网传输稳定性不够成本又高,只能是计算组件跟着存储就近部署,PaaS云创业公司从对象存储入手才更有客户粘性和横向扩展空间。 数据类PaaS类似于云数据库,用户要自带量数据来,Mapreduce程和结果又都要用户负责,最终客户觉得云平台什么都没做,数据PaaS都用成IaaS定制模板虚拟机了。
M****H 2018-07-11
故障定位场景下的数据可视化实践
干货概览 百度拥有百条产品线,数十万的,每个时时刻刻都在产量的监控数据,形成的监控项规模总数已达数十亿。面对如此量的数据,在日常运维(如故障诊断、成本分析、性能优化等场景)程中,传统的统计图表难以有效直观地展示如此庞的数据。因此,优秀的监控数据可视化产品就呼之欲出,他既要数据准确、全面、时效性高,也需要提升用户的使用体验,使其能在茫茫数据中一眼就能发现想要观察的数据。 那么怎么做才能适应用户需求、完成精准展示,同时又能挖掘数据价值呢?下面我们从故障诊断的场景出发,来看百度智能监控平台是如何充分利用数据可视化武器来解决实际业问题的。 故障定位可视化思 在标准的故障处理流程中,故障定位一般可分为两个阶段: 故障止损前:期望可以快速获得可用于止损决策的息,做出相应的止损操作使得恢复。比如通确定故障范围,调度流量绕故障机房或摘除故障实例等。 故障止损后:仍需要进一步到导致故障的深层次原因,确定故障根因,将线环境恢复到正常状态。
布****五 2018-07-10
如何执行一条命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发运维程中重要的一环,频繁的交互意味着频繁的部署。部署程可以拆解为两个小的步骤,一是新软件包的传,二是进程的重新启动。进程的重新启动不必多说,软件包的传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策程更是需要采集量的实时息(前期文章《百度规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,一种是通软件提供的接口直接读取状态数据,另一种是通日志/进程状态/系统状态等(如使用grep提取日志,通ps查询进程状态,通df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有一个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在执行命令并收集结果”这一基础能力,这也是今天我们的主题“如何执行一条命令”的意义所在。
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动
看看各的启动优先级也是一个讲究多多的程,iptables会比network先启动这类依存关系很好理解;但我也遇到云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动程,正式版的启动程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程师,云确实也很有意义啊。 静人稀,沙子龙关好了小门,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又微微一笑,“不传!不传!”----老舍《断魂枪》
C****X 2018-07-10
群雄逐“图”,百度缘何备受关注?
这些改正后的数据不会保存在本地,而是传到云端,最终的高精度地图成品也会通云平台分发。 高精度地图究竟如何应用? 据了解,百度现在的高精度地图涉及到云端,就是以的方式,将云端已经采集好的高精度地图以数据的形式分发。 此外,关于径规划问题。例如一辆自动驾驶的汽车,需要某条车道高精度地图的数据。 首先会需要一个像地图一样的客户端,或者map engine的模块来融合这些高精度地图的道数据。这时候请求的数据就是从例如百度高精度地图的云端直接导出来,这个程可能是不同的开发者或车厂,他们的方案可能有不同,这与百度现在提供的方式有关系,可以以接口的形式(可以理解为API),也可以以车道级别的文件形式来直接获取。 面提到的径规划问题,如果用从技术角度抽丝剥茧的话,可以被这样理解。 在径规划的程中首先需要做几个限定: 一是地图已知,通常来说没有做到已知就无法规划。 二是立足自动驾驶领域,一般还是2D或2.5D地图,而不是在3D地图六个自由度运动规划(那是室内全自主无人机飞行),也就是明确地图的类型,个人认为。
TOP