关于 哈尔滨道外民主乡找大学生服务同城〖10669708薇信〗 的搜索结果,共1367
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个的实例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知名,记不住那么多部署息,怎么办? 场景二:我是一名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署实例有一个出现故障了,我想对下游屏蔽该故障实例,怎么办? 下面以一个简单的例子来说明,假设一个模块名是Server,它的上游是Proxy,下游是Redis,当出现变更或者故障时,如何让上游感知到呢? 当新增上线实例、下线摘除实例或者实例发故障时,BNS系统通过部署在机器上的客户端实时感知到实例的状态变化,时新增和删除实例的变更情况会立即步到分布式的缓存系统中,这样用户通过一个BNS名字就可以感知到下游的实例变化。
j****2 2018-07-10
百度脑开放日来袭 24种全新AI能力呈现
为了让流浪喵过上幸福的活,程序员出身的他用百度脑动物识别技术和百度EasyDL打造出 “猫脸门禁”、“病猫识别”、“绝育识别”三智能功能,给流浪猫一个温暖的住所的时帮助救助志愿者发现病和未绝育的流浪猫。晚兮提到,凭借百度脑的开放技术,他只用半天就设计出了智能猫窝的三项要AI功能,看似高冷的AI技术最终化为猫咪们的守护神,让现场的小伙伴们感到暖心又感动。 2018年百度脑走进6市举办7场行业创新论坛,发布了企业、地产物业、智能零售、智能工厂、智能校园、智能政7行业解决方案,推动AI与不行业、具体场景相结合,AI技术渗透到产业的毛细血管。百度脑目前已经落地20+行业,态赋能已成燎原之势。 百度脑新品体验师计划 如果只是技术“阅兵”会让你觉得意犹未尽,为了进一步激励开发者习应用百度脑开源能力,百度脑现已提出了“百度脑新品体验师计划”,希望与开发者一起推动百度脑进化,帮助他人一起成长,探索AI前沿应用。
追****圣 2018-07-11
给书记省长讲清楚云计算
数据中心对电力的要求是量且稳定,数据中心每年的电力消耗都在数万千瓦以上,其电力使用优先级等于医院手术室,绝对不能接受拉闸限电。 器就是高功耗高价格的专业电脑,云计算企业的采购规模一般远于政企集采,他们能从硬件厂商那里拿到极限低价,政府和国企能提供的更多是采购资金的支持。 云计算是一个商业,不仅需要硬性支持,还需要足够的环境和政策支持。当前云计算公司聚集在一线市,环境规范稳定但成本极高竞争压力极,云计算企业也在尝试向二三线转移突围。二三线市不仅要积极准备云计算硬性资源,还可以用合作融资、税收优惠等等灵活政策承担产能转移的,最终说云计算公司将GDP和税收留在当地。 云计算平台提供的都是互联网量的互联网部署在本地会有极的管控压力。二三线市对互联网还只是简单的管控,稍有不解可能就会封禁一批互联网,但一封网命令就可以毁掉一个云计算公司的声誉。如果当地政企要做好云计算就要从管理者变为者,必须在管控违规违法时不惊扰正常业,甚至动出击为正常网络保驾护航。
雪****魁 2018-07-11
危险背后的机遇--云故障危机分析
甲方只能根据云厂商销售和线的能力和态度,确认自己交钱了能否买到靠谱的。 最重是商誉 云计算既是资源又是,资源相对可以量化,但短期内看直观感受,长期看商业誉。商誉分为企业商誉和个人商誉,云厂商的企业商誉都积淀不足,胜者也是比烂赛中靠友商更烂胜出的,和IDC/CDN的比优赛无法相提并论。客户在吃够了厂商的亏以后,会选择任能有个人商誉,能做出承诺、调动资源和平复问题的销售和人员。 有个客户非常任某个小云销售,他告诉该销售,虽然某云有高层合作,某云也说报价肯定比某小云低5%;但是某云的机制有问题,出故障从来都是衙门话,每次故障都要客户去乱猜和背锅。最终这个单子在客户执行层的暗助之下,该小云快速把业切过来并坐实站住了,这份暗中相助就是靠个人商誉带来的任。 我和客户谈故障的时候,喜欢把详细故障原因刨析给客户,企业客户是讲理的,不要把糊弄ToC用户的手段来对付ToB客户。面对意故障,我们有心向客户证明,换了其他厂商也一样会挂;面对人为故障,踏实认错是对客户的最后尊重,而公开事实也是逼着内部不会重蹈覆辙犯样的错误。
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
NTPD是一个时间,ntpdate是个时间步命令。很多工程师都会采用Crond+ntpdate的方式步时间,究其原因是“NTPD不太好用”。 而我不喜欢用ntpdate步时间的工程师,NTPD是一个体系化的,而ntpdate只是一个动作,部分人没做好为ntpdate这个动作负责。 正常的时间是个持续增长的向量,即老时间t1肯定小于新时间t2,新时间t2也小于最新的时间t3,而且t1必定会渐进增长到t2和t3。除了少数商业数据库自带时钟源以部分业对系统时间是盲目任,不相t1会越过t2直接达到t3(即断档跃变),而t2减去t1会得到负数或者0(即时钟停滞和回逆)。 四、NTPD的优势 如果我们用ntpdate步时间,可能会带来时间的断档跃变或者停滞和回逆。时间不稳会威胁到的程序健壮性和业安全性,甚至部分程序崩溃的稀里糊涂。 ntpdate只是个命令不是,它对远端时钟源是盲目任;假设一个根NTP不稳定,所有的器获得了错误的时间,虽然现在业层可以包容异常,不会出现算出负利息或倒扣费的情况,但业混乱是免不了的。
w****0 2018-07-11
单机房故障自愈-黎明之战
时针对单机房止损依赖的容量管理场景,提供资源类监控采集,为容量规划、扩缩容提供数据支持。实现从运营商网链路、百度内部网络设备/链路、/实例、机器/容器的全方位数据采集与监控。满足网络类单机房故障、业类单机房故障的监控覆盖需求。 时提供一系列数据分析方法。如智能异常检测、趋势预测、多维度分析、关联分析、和链路拓扑分析,实现故障的精准发现和定位。 故障止损:百度流量调度平台 针对百度的网络架构和业架构,我们将流量调度拆分为三层:接入层、层、依赖层。 接入层:从网用户发起请求经过运营商网络到百度统一前端(BFE)的过程,使用DNS实现网流量调度。 层:从BFE流量转发至内网的过程,使用BFE提供的GSLB动态负载均衡进行流量调度。 依赖层:内网上下游业之间的流量调度过程,使用百度名字(BNS)进行流量调度。 对于单机房止损场景来说,DNS流量调度的效时间较层、依赖层的流量调度效时间要慢很多,所以我们期望在发某个业的局部单机房故障时,优先进行层、依赖层调度。提升止损时效性。
l****m 2018-07-10
五年前的预言——2012年云计算时代的运维职位展望
2、进行云计算器维护;几供应商自己也要维护器,那些中型企业肯定会自己做私有云,在这个云计算平台里也是需要运维人员进行从低端监控到高端架构的一系列维护工作,但自动化运维技术会让运维人员的数量减少,可能每个公司都只有一两个小团队了。 3、进传统行业继续做运维;笔者就是在一个通讯公司工作,我可以很乐观的说云计算会对公司造成有限的技术革新,比如说实现OS的虚拟化。我们需要的SIP必须亲自搭建,阿里盛新浪都没得卖,甚至因为硬件和网络限制让我们很难使用虚拟机;而宣网站一类的东西根本不是我们的核心竞争力,能用就好效率低一些没关系。除了通讯公司之产领域(比如管理产线)也有类似的顾虑,云计算的优势和公司的业需求完全不沾边,所以这类公司的运维可能会是最后的运维。工作的时候都习惯网站相关的工作,但你过Web就一定要网站工作是挺蠢的行为,危邦不入乱邦不居,最好不要涉足一个没有前途的行业。
红****2 2018-07-10
故障自愈机器人,保你安心好睡眠
干货概览 在型互联网公司中,单机房故障因为其故障时间长、影响范围,一直是互联网公司运维人员的心头之痛。在传统的运维方式中,由于故障感知判断、流量调度决策的复杂性,通常需要人工止损,但人工处理的时效性会影响的恢复速度,时人的不可靠性也可能导致问题扩。 为了解决这类问题,我们针对百度内部网络环境建设了基于智能流量调度的单机房故障自愈能力。结合网运营商链路监测、内网链路质量监测与业指标监控构建了全方位故障发现能力,基于百度统一前端(BFE)与百度名字(BNS)实现了智能流量调度与自动止损能力。时,基于实时容量与实时流量调度自动止损策略与管控风险,实现了任意单机房故障时业均可快速自愈的效果。当前此解决方案已覆盖搜索、广告、息流、贴吧、地图等众多核心产品的单机房故障自愈场景。 单机房故障频发影响业可用性 回顾近2年来各互联网公司被披露的故障事件,单机房故障层出不穷。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不部门(资源的隔离)?权限又该如何控制?随着规模变,人力成本等管理成本上升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下上面的例子。这个例子中,地图研发的就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通过对资源合理的组织,极的简化了运维操作,提升了运维效率。
M****点 2018-07-10
中国云计算现状——产品篇
传统IT企做云IT咨询流程上没问题,但技术水平太差,也不被政策扶持。此还有个杀器让我们不能投咨询标,投了咨询标就不能投实施标了,实施标的金额要比咨询标很多。 到了实施阶段,其实矛盾和咨询标差不多,既要干活又要写文档,而且验收者并不专业,实施工作有传统厂商会抢着压价,还会有各种意拖进度抢进度,各互联网企业的实施团队根本支撑不下来。传统厂商虽然压价抢标,但他们要是真有能实施云计算项目的人才,互联网公司加价三倍挖走谢谢。 现在云计算的实施标常常是两种情况,或者是打着云计算的招牌做虚拟机群集的超简化云计算,或者中标了但只有市场部发了下PR稿,别说施工结束时间了,施工开始时间都没定下来。 要解决这种窘境困局需要时机和努力。传统IT公司张开翅膀等风起,云计算技术已经越来越成熟了;今天看沙克的朋友圈,kolla的健壮可运维性已经超出想象,他很担心专业云计算运维会失业。互联网公司总有明白人会踏实做事,云计算软件也是软件,一个难以描述、难以使用、难以维护的软件是必然被淘汰的,带头淘汰行才是存之
疏****月 2018-07-09
一键上线Archer | 百度持续部署的瑞士军刀
Archer的配置文件路径、的启停脚本及运维命令具有固定的标准并且支持定制化,使用Archer进行部署的具有统一的包结构; 支持分级发布,及时拦截部署引入的线上故障 针对分级发布的使用场景,Archer支持串并行上线及暂停点功能,可按照单实例、单机房、单地域等级别设置暂停点,并支持部署过程中进行暂停、继续、重试、撤销等操作; 业的多地域部署 的多地域部署要需要解决不地域配置不的问题。Archer提供了配置派功能以支持多地域部署的场景。Archer支持在一份配置文件中设置配置变量,并在特定地域(机房)中成特定配置值; 多种网络环境及包部署 针对多种网络环境及包部署的使用场景,Archer提供了部署数据中转传输。采用中转的上线在发起任后,部分代码将首先被转存至中转机上。
无****禾 2018-07-11
云客户需求引导管理--实战型IT太极拳
(这些运营问题都是2015年的,可能略有老化) 案例3.客户被集团的云计算子公司的欲哭无泪,我们接盘时提了一堆需求,我样是拒的比接的多。客户问能利旧设备么,我认为利旧设备的配置都太高啦,还不如租我们的廉价器。客户要我们按照旧接口去定制开发,我指出用我们的SDK对接只有半个人日,而旧接口连文档都没有只能猜。客户要我们派几个高工长期驻场,我说明所有故障都可控且已演练,远程排障我们有10个高工程,但长期驻场我们高工得抑郁离职了。客户担心日常无事可做了,我们就帮客户做了月度巡检流程,但整个流程我们全程不参与,他们巡检成功就是双保险,忘了巡检也有我们的监控兜底。 案例4.有公有云客户说要买最便宜的带宽,但最终沟通发现对方是要做非核心日志上传。云平台默认的计费规则是上行带宽免费,但免费不限流的上行带宽不承诺SLA。最终结果是建议客户短期内买几十台低配云机,时做好客户端容错,长期看建议这些日志直接上传至对象存储,还能配合我方数据做MR。 案例解析 云计算企业客户,企业客户内部分为采购、技术、业、管理等多个角色,在本案例中的技术和运营团队是非常讲理的。
TOP