关于 幸运飞艇番摊软件 zs25.com 主管Q:86432556通 的搜索结果,共510
流****水 2018-07-11
度云企业级维平台——NoahEE
一图胜千言,我们看看资产理的特点: 图3 资产理 部署理 应用部署一直是维工作中的重点,一般来说,我们面临的问题有: 批量部署难,怎样定位目标机器?如何快速部署? 灰度测试难,怎样过灵活的部署方式,先进行小流量线上测试,待效果达到预期后再扩大部署? 回滚难,发现问题后怎样回滚? 上面的第一个问题,实际上在服务理中已经解决了,也就是说服务理帮我们完成了资源定位工作。其他的问题,NoahEE的部署理模块过“分级发布”来解决。在部署理模块中,我们可以方便的定义并发度、部署步骤、影响范围以及暂停操作等,在部署的过程中发现问题即可暂停并回滚至之前的状态。除了部署等操作,部署理模块还提供了批量执行命令等操作(比如批量启停某一服务)。如图来总结部署系统的能力: 图4 部署理 监控理 在任何工作里,信息掌握的全面与否往往关乎到工作的成败。“知己知彼百战不殆”这句话说的就是这个道理。维工作中,监控系统就是这个让我们做到这点的关键。是否工作正常,出了问题是否能及时发现与报警,甚至是对异常事等进行提前预测,都仰仗监控系统。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
它屏蔽了云服务底层繁杂的控逻辑,提供简化接口给上层系统NoahEE调用,使上层系统更好更快地释放价值。 Q这么优秀的系统到底是如何实现的呢? AHALO系统采用从架构,分为Master端和Agent端。 Master端要做复杂的任务调度和控逻辑,并且所有功能都是模块化设计,用户可以根据自己的需求定制安装,包括虚拟化容器理,应用包理、部署、扩缩容、拓扑搭建和保活,集群控制等。 Agent端则以简单为原则,弱化繁琐功能,仅作为任务的执行器,其中的supervisor组,结合父子双进程原理,做到自升级和自保活,把云维人员的工作量降到最低。 整个系统的工作流程也十分简洁优雅!Agent过定期心跳的方式,与Master进行信,在心跳发包中发送本机状态信息,在心跳回包中获取Master期望的本机状态plan,并把期望plan与本地实际plan进行对比,针对有差异的地方做相应修改,使二者保持一致,从而保证集群中所有机器最终状态一致。 总之一句话,一朝HALO在手,从此不用发愁。所有维需求,直接调用接口。
l****m 2018-07-10
五年前的预言——2012年云计算时代的维职位展望
我在写一篇新的文章,其中会引用到这篇2012年的旧文,所以我原样摘抄下来,很庆能转型进入云计算这个行业。 云计算的时代正在来临,维的工作也将在今后几年中发生翻天覆地的变化。 如果你是一个能给自己做的人,你必须看清形势顺势而为,在变革的时代埋头苦干仍然保证不了你的正常生活;如果你是一个弓骑兵,无论你怎么勤学苦练都打不过坦克手的;铁达尼号上的乘客无论多有钱,总是免不了泡进海水里的。 首先,我作为一个维为何唱衰维这个职业。 我们维靠什么能力在公司里自立哪? A.关心硬和施工; B.关注网络问题; C.擅长系统和服务的调试维护; D.相对与架构师/DBA的价格优势; E.快速可靠的响应. 大家看看云计算能给企业带来的好处。 A.硬完全免维护; B.网络接近免维护; C.系统、服务接近免维护; D.无论是硬还是人力成本都很廉价; E.可靠性高于个人。 我们会发现,云计算的目标就是要做的比维人员更好,好到“不用关心”的地步。从技术上来说,各大云计算营商对用的Web、RDBMS、存储 服务都是可以做到很好的。
2018-07-10
解密开源这门生意——商业角度看开源
菜鸟一样能参与开源项目刷履历,而导开源项目的可能是个技术投机分子。老一代精英做的开源项目有顶层架构设计和全场景测试,而码农导的低质量项目只看代码和功能。 开源社区的技术交流氛围也在发生变化,开源本意是以码会友,但现在提pr提issue的码农,有几个看过前人写下的代码的?大部分都是看一眼说明文档就来github上指点江山了。现在的码农只关注能出名能赚钱的热门项目,像OpenSSL这种核心项目,冷清到几乎没人关注。 对于一个公司来说,“拥抱开源”只是一种融入生态的策略,投入大量码农并不等于导项目,导项目不等于独裁式控制项目,独裁制控制项目是逼着Mysql变成MariaDB。大公司投入再多码农去做开源,本质上还是在开源协作场景里增加自己关注的功能,无关道德只有利益。 结束语 开源是一好事,但只有对的人才能把这事做好。希望本文让大家评估开源的商业价值、产品价值、理价值时,能有一些新的认识。 附录:关于开源质量 一切都是人写的,设计和实现者的能力决定了的质量。
嘟****y 2018-07-11
大型企业适用的云平台账户体系
单账户大铺模式下,所有的平台短信和邮都往一个账户发就行了,但现在要重新设计。我的一线技术工作经历并不依赖第三方(如云平台)知机制,对知功能的研究较少,所以我只能提出用性设计建议: a.别把平台维护知当做甩锅知,大客户会因此忙到鸡狗跳。 b.员工正常操作不要知到理员,自然人收到的信息太多会麻木。 c.员工执行摧毁核心资源等高危的操作要及时理员。 d.这些操作日志可以过API等方式对接到企业自身的平台。 e.合规和安全风险发送平台理员和资源池理员。 云平台有知机制就要有理权限,比如说某IP存在合规隐患,理员要能查看和操作该IP;否则平台理员只能组织各部门领导开会,平台的理员一般不是公司高,其处理速度和处理效果就很慢也很扰民了。 第五.其他随笔说明 a.过去云平台做计费和权限开发很繁琐,云平台支持精细控制后云平台的对接成本会瞬间降低,那些功能缺失又不是行业标杆的云平台会云平台被逐渐放弃接入。 b.有客户想给不同资源组做不同资源单价,这是个弱需求,该需求技术实现繁琐且有客户可接受的变方法,比如子账户登陆只计量不计价,价格在心中。
雪****魁 2018-07-11
危险背后的机遇--云服务故障危机分析
客户的感知和建议 IaaS云的核心资源是云机,其他IaaS资源都是依附于云机的;云机的可靠性略高于物理机,但并不是云机永不宕机。 只要云机采购量稍微上规模,云机用户总会遇到一些故障。请谅解和忘记供应商的营销话述,云机用户必须自己在架构设计层面规避这些故障。 网络抖动 现在云平台已经都用SDN组网,SDN本质是“定义网络”,其打卖点是灵活理和控制,其性能和稳定性并不是打方向,SDN的质量也要略差与于传统厂商。云平台都会有网络IO超卖复用,而且用服务器CPU解海量报文,其性能还是比传统网络略差的。云用户做架构设计时,建议过开更多节点的方式分散单节点网络压力。 硬故障 硬故障无法彻底避免,依附于物理硬的云机也会意外中断。云机可以在计划内跨硬迁移,所以可以说云机可靠性略高于物理机。但是云厂商可能买劣质资源,或者频繁迁移云机,甚至后台操作误停机误删除,以前用物理机客户自维的各种故障点依然存在。理论上云平台技术人员会很专业和敬业,但很难深入了解客户业务。云用户以前的硬冗余设计仍然有效,而且可以利用多AZ/多region/多云等云上隔离方案。
布****五 2018-07-10
如何执行一条命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发维过程中重要的一环,频繁的交互意味着频繁的部署。部署过程可以拆解为两个小的步骤,一是新包的上传,二是服务进程的重新启动。服务进程的重新启动不必多说,包的上传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 维过程需要时刻监控系统及业务行状态,各种维决策都是以这些数据为依据进行的。随着自动化维的发展,很多维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的实时信息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源要分两种,一种是过业务提供的接口直接读取状态数据,另一种是过日志/进程状态/系统状态等(如使用grep提取日志,过ps查询进程状态,过df查询磁盘使用等)方式间接查询。 无论是配置理、部署变更还是监控采集,都有一个共同的目的:控制服务器。在现阶段,要想对服务器进行控制,离不开“在大量服务器上执行命令并收集结果”这一基础能力,这也是今天我们的题“如何执行一条命令”的意义所在。
TOP