关于 牧浦找服务小妹一条龙 78792796-微V号通州杨庄上门上门卞 的搜索结果,共1695
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示的实例集合,般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景:我是名OP工程师,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署信息,怎么办? 场景二:我是名RD工程师,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么知给下游模块? 场景三:我的部署实例有个出现故障了,我想对下游屏蔽该故障实例,怎么办? 下面以个简单的例子来说明,假设个模块名是Server,它的游是Proxy,下游是Redis,当出现变更或者故障时,如何让游感知到呢? 当新增线实例、下线摘除实例或者实例发生故障时,BNS系统过部署在机器的客户端实时感知到实例的状态变化,同时新增和删除实例的变更情况会立即同步到分布式的缓存系统中,这样用户个BNS名字就可以感知到下游的实例变化。
疏****月 2018-07-09
线Archer | 百度持续部署的瑞士军刀
另外,Archer也可作为托管平台的底层工具链,为PaaS平台提供稳定的底层部署用场景 在百度内部,用的部署系统需要适用于以下场景: 各业线拥有各自的包规范,语言、框架不统,部署策略不致; 支持分级发布,及时拦截部署引入的线故障; 业的多地域部署; 多种网络环境及大包部署; 提高自动化效率,能够集成测试发布自动化流水线。 后面,我们将结合面场景,向大家介绍百度持续部署是如何实现的。 架构 整个系统由命令行工具、web、中转及单机agent+部署插件几部分组成(如图2所示)。用户过命令行工具触发次变更,在web端进行参数解析及任分发,对应执行机器agent过心跳获取任后,调用部署插件执行实际任。涉及大包及不同网络环境的部署会进行中转下载。 解决方案 各业线拥有各自的包规范,语言、框架不统,部署策略不致 为避免杂乱无章又不规范的代码及配置文件的目录结构,Archer规定了套既灵活又完整的包规范。
布****五 2018-07-10
如何执行命令
部署升级 DevOps的概念如今日趋流行,部署升级越发成为开发运维过程中重要的环,频繁的交互意味着频繁的部署。部署过程可以拆解为两个的步骤,是新软件包的传,二是进程的重新启动。进程的重新启动不必多说,软件包的传可能有多种方式,如sftp的集中式,p2p的点对点式等。 监控采集 软件运维过程需要时刻监控系统及业软件的运行状态,各种运维决策都是以这些数据为依据进行的。随着自动化运维的发展,很多运维动作都从人工执行变为了自动执行,自动执行的决策过程更是需要采集大量的实时信息(前期文章《百度大规模时序数据存储》中介绍的TSDB就是为了解决这些数据的存储问题而研发的)。监控数据的来源主要分两种,种是过业软件提供的接口直接读取状态数据,另种是过日志/进程状态/系统状态等(如使用grep提取日志,过ps查询进程状态,过df查询磁盘使用等)方式间接查询。 无论是配置管理、部署变更还是监控采集,都有个共同的目的:控制器。在现阶段,要想对器进行控制,离不开“在大量执行命令并收集结果”这基础能力,这也是今天我们的主题“如何执行命令”的意义所在。
s****7 2018-07-10
知著看技术误解——从裸光纤和NTPD谈起
我们很难成功调试NTPD,会装NTPD又没有会装LAMP可以拿去吹牛,时间长了NTPD就背黑锅了。 真有TOP10的互联网公司和亿国家级项目里用ntpdate+crond,代架构师为什么有这个误会无人深究,下代人将误会固化为偏见,新代人将偏见神化为迷信。 但无论误会、偏见还是迷信,时间跃变、回退和停滞对应用健壮性和业安全性的威胁始终存在,时间不仅仅是我玩游戏时用的魔法,忽视问题并不能掩埋问题。 六、见知著和防杜渐 我讲NTPD和裸纤并不是为卖弄知识,也不是为做偏科普,而是希望进阶工程师们多考虑下如何规避这类误会?我们在做技术工作时,是不是只关注客户和同事能提出的需求?客户永远不知道裸纤的物理特性,同事也不会知道时间也能错误和波动,他们能说清楚业逻辑就不错了。 把所有的精力都用到做业逻辑,你只是个编程语言翻译机而已;自己主动观测技术环境依赖,有资格有能力做出技术选型决策,才是给Coder群集做技术校准的人。即使你不想做技术决策人和管理者,多怀疑和观察环境,也能少些沟成本,少走些冤枉路,多份自信和自尊。
流****水 2018-07-11
度云企业级运维平台——NoahEE
对这些设备的运维操作,常都涉及不少的物理操作,比如说更换损坏的硬盘,增加内存等等。这里涉及到几个要解决的问题: 故障如何及时发现?发现后由谁来进行修复? 物理操作维护怎样反应到系统里? 不同角色(职责)的运维人员之间如何协同操作? 对于故障处理与修复,NoahEE过故障自动发现与工单流程解决了面的问题。系统自动探测故障放入故障池,并建立故障工单,由相应的人员进行操作。另外,NoahEE提供了不同的工单流程覆盖了日常机房运维中的操作,从设备采购入库、架、机架变更,直到设备下架、出库全生命周期覆盖,做到所有运维操作记录可追溯。有了资产管理,运维人员可以在器完成入库、架工单后即可在管理中看到该器并进行管理,无须任何其他操作。图胜千言,我们看看资产管理的特点: 图3 资产管理 部署管理 应用部署直是运维工作中的重点,般来说,我们面临的问题有: 批量部署难,怎样定位目标机器?如何快速部署? 灰度测试难,怎样过灵活的部署方式,先进行流量线测试,待效果达到预期后再扩大部署? 回滚难,发现问题后怎样回滚?
TOP