关于 全套服务师宗找妹子上门41435693】tzj 的搜索结果,共842
h****e 2018-07-10
程序:我从哪里来?
在BNS系统中,单元表示一个的实例集合,一般以三段式的结构表示,比如:server.noah.all,server表示名,noah表示产品线,all表示机房名称,单元的名字在系统中是唯一的。 使用场景 在程序员的日常工作,常常面临以下的场景: 场景 场景一:我是一名OP工程,负责几十个系统模块的运维,我常常需要登录部署的机器排查问题,但是只知道名,记不住那么多部署信息,怎么办? 场景二:我是一名RD工程,我负责的需要扩容,我的是很多下游的依赖,的扩容怎么通知给下游模块? 场景三:我的部署实例有一个出现故障了,我想对下游屏蔽该故障实例,怎么办? 下面以一个简单的例来说明,假设一个模块名是Server,它的游是Proxy,下游是Redis,当出现变更或者故障时,如何让游感知到呢? 当新增线实例、下线摘除实例或者实例发生故障时,BNS系统通过部署在机器的客户端实时感知到实例的状态变化,同时新增和删除实例的变更情况会立即同步到分布式的缓存系统中,这样用户通过一个BNS名字就可以感知到下游的实例变化。
疏****月 2018-07-09
一键线Archer | 百度持续部署的瑞士军刀
干货概览 业部署(熟称线)是运维领域最常见的业类型,主要涉及线代码变更、配置文件变更(数据变更由于其高频、大量的特点,我们已在数据传输文章《嗖的一下,让数据自动生效》中专讨论过)。一般的业线具有不定时操作、业部署情况复杂、单机启停策略复杂等特点。在手工运维时代,运维人员需要花费大量精力进行此类重复性工作,且易于出错。从公布的数据显示,Google 70%的生产事故由线变更触发,如何减少变更过程中人为误操作,提供一个灵活、稳定的部署系统是运维平台研发人员所亟需解决的问题。 基本介绍 在运维自动化的大潮下,百度运维管理平台Noah发布了一键线部署系统——Archer。Archer致力于提供一产品线过程的可迁移发布解决方案,实现一键完成机器初始化、部署、添加模块监控、添加CT任、动态数据文件的分发等过程的自动操作。在操作方面,Archer提供了命令行工具作为发起一次线的操作入口,这种设计模式也决定了其易于集成的特点。在DevOps流水线作业中,Archer可以作为一个环节结合进整条测试发布流水线中。
追****圣 2018-07-11
给书记省长讲清楚云计算
人不仅要住房还可以盖房,不仅会逛超市也会开菜市场。 政府和大型国企不仅能采购云计算,早晚也会走向发展云计算的路。 本文不谈任何技术细节和商业情怀,而是从政企的角度说明什么是云计算。 本文包含如下内容。 从大时代背景来看什么是云计算,云计算为什么会兴起。 云计算如何带动地方经济,这是个不需要物流就可以球的行业。 做云计算要满足哪些条件,如何才能筑巢引凤。 挑选合格的云计算合作厂商,每类厂商有哪些特点。 云计算不是万能药,它无法解决哪些问题。 什么是云计算 近20年来,互联网引爆了球的信息技术革命,我国借助这次技术革命的大好机会,已经追乃至领跑此次技术革命。 互联网技术深刻的改变着我们的生活,其行业生态也在逐步分化扩大,这一现状客观促进了云计算技术的发展。 世纪80年代,计算机仅应用于科研等少数行业,国计算机从业人员不超过万人,从业人员大都有很深的学术背景。 世纪90年代,户、论坛、邮件系统开始影响部分群众的生活,国内从业人员约为十万人,可以分为软件和硬件两类工程
s****7 2018-07-10
见微知著看技术误解——从裸光纤和NTPD谈起
几个业内好友都明确说一根裸光纤最多跑10G带宽,而于老板明确表示裸光纤任何一个波分(或者不做波分)都可以跑100G以。 后来我和于老板深究原因,不可能几个朋友都骗我或者都蠢,很可能前些年光纤波分机自己只能甩出10G口,或运营商租光纤餐里只有10G规格,给大家造成了裸光纤只能跑10G带宽的印象。同样固有的印象是光纤必须从运营商那里租,而且价格很贵还必须买波分设备等等;其实现在企业专线的市场竞争很充分,拉同城裸纤一公里也就小几百块钱,而且短距离裸纤也不值得波分设备,直接对接模块即可。 二、NTD是试金石 我对裸光纤是外汉,但同样的技术误解让我想到了NTP,我一直拿ntpd和ntpdate当做初中级系统工程的试金石,分不清就月薪五千,分得清就八千以(2014年市价)。但很多货真价实的IT专家也在此事跌倒,我也希望通过聊清楚一层误会,说明高级工程该少迷信多思考。 NTP是网络时间协议,它是多项传输、计算、加密技术的核心参数。
s****d 2018-07-11
亿元级云用户分析
IT决策人要重度考量IT部利益,这就是云销售和售前的工作重点了,售前和销售要安抚IT决策人的顾虑,尊重客户IT部的权益: 业方案的IT可行性 新架构带来的新责任 新项目带来的新权益 云迁移的隐性成本 技术锻炼的团队收益 新愿景带来的团队增效 工作量转移的减员压力 IT方案决策人明确项目的过程、执行人和验收标准,但从云供应商角度看,搞定方案决策人是项目正式启动,不代表项目能完成验收。 2.3 IT技术执行人 各类具体干活的工程架构,他们对云的过程程参与,从自身立场品味着云项目的利害关系和云产品的使用感受。每个公司环境都不相同,他们可能强力推进项目,也可能暗地里阻塞实施,大部分情况下是被动拖沓进度,但合理引导很容易积极配合。他们的诉求更简单直白: 操作的简便清晰不出错 建设和维护的劳累程度 云IT技能的个人稀缺含金量 云对旧有烂工作的解放 云对个人基础技能的替代 稳定故障清晰 汇报汇总展示方便 要想让IT技术执行人成为云厂商的好帮手,工程进度靠项目经理配合,资源协调靠销售配合,技术操作类诉求靠售前引导。
流****水 2018-07-11
度云企业级运维平台——NoahEE
在业规模发展到一定程度后,运维工作还停留在早期人工或脚本方式执行的阶段时,这样的差异非常频繁的发生。 在实际的运维中,还有更多的因素需要考虑,例如机器是否会分配给不同部(资源的隔离)?权限又该如何控制?随着规模变大,人力成本等管理成本升,然而效率低下、可用性不升反降等等都是非常可能出现的问题。百度对于这个问题给出的答案是,必须先要解决资源组织管理问题。简单的说,管理要解决的最核心问题就是如何对资源进行有效组织管理与定位: 图2 解决规模带来的问题 在管理这个地基打好后,我们再来回顾下面的例。这个例中,地图研发的同学就可以在运维平台中选中导航的模块进行升级,运维平台会通过管理来定位此次升级操作需要影响的机器并进行批量的操作。NoahEE中的所有运维系统,都以管理为基础来进行运维操作,例如在监控系统中,我们可以对导航模块(而不是单台机器进行操作)添加一些指标采集任,并在一定条件达成时报警。管理通过对资源合理的组织,极大的简化了运维操作,提升了运维效率。
无****禾 2018-07-11
云客户需求引导管理--实战型IT太极拳
云平台卖的都是,靠销售体系打下单来只是万里长征第一步。如果云厂商做不好,公有云没有消费额,私有云可以换别人家的软件授权;如果云厂商做好大客户的技术,完可以从备胎公有云变为主力公有云,私有云群集也月月有扩容。各位投标中标的CDN厂商已经领教过客户的切量神功了,而云主机等资源的切换也会越来越简单方便。 过去的案例 我们先看四个生产环境案例。 案例1.有外售型私有云客户要把虚拟机的内网带宽从1G扩充到4G,沟通后发现是最终用户要在单虚拟机跑大流量应用。我就劝客户技术工程,网卡改QoS不难,但宿主机网卡才10G,你们是愿意一台物理机只跑两台虚拟机,还是愿意停机扩容物理网卡。客户技术工程认同让最终用户学采用LB加多台虚拟机,比改QoS和停机加网卡更可靠。但最终用户宁愿纠缠客户技术人员也懒得学如何用LB,我给支招说我们的操作人日免费送,但硬件改造成本有20万,问这用户只是想试试还是改完网卡就能付费。最后该用户果然只是想试试,我们和客户技术部都躲过一场折腾。 案例2.有个IDC新线一外售型私有云,运营负责人第一次操盘公有云心里痒痒,总是提需求但总被我拒绝。
若****客 2018-07-10
IT架构的本质--我的五点感悟
2.群集设计通用规则 前端复制后端拆,实时改异步,三组件互换 前端复制后端拆,实时改异步,IO-算力-空间可互换——要做架构就要群集,而群集设计调优翻来覆去就是这三板斧: 前端是管道是逻辑,而后端是状态是数据,所以前端复制后端拆。前端器压力大了就多做水平复制扩容,在网站类应用,无状态-会话保持-弹性伸缩等技术应用纯熟。后端要群集化就是多做业拆分,常见的就是数据库拆库拆表拆键值,拆的越散微操作就越爽,但局操作开销更大更难控制。 实时改异步是我学的最后一IT技术,绝大部分“实时操作”都不是业需求,而是某应用无法看到后端和Peer状态,默认就要实时处理结果了。CS模式的实时操作会给支撑带来巨大压力,Peer合作的实时操作可能会让数据申请方等一宿。架构将一个无脑大事拆分成多个小事,这就是异步架构,但拆分事就跟拆分数据表一样,拆散的小事需要更高业层级局事保障。 在群集性能规划中,网络和硬盘IO+CPU算力+磁盘和内存空间是可以互换的,架构要完成补不足而损有余的选型。
小****君 2018-07-11
踏云落地--谈IT就业趋势
除了战时军队,历史没有过几千万人搞同一种高薪工作的情况。大家总说金融圈的收入高,但年薪过五十万的金融从业人员都凑不够五十万人,而更多金融从业人员是跪求式推销理财和保险的。很多人会辩解IT工作对整个公司很重要,但公司里就没有不重要的部。困在电梯里的员工会知道物业有多重要,食堂大妈可以让体员工食物中毒,即使关系安置岗都是重要岗位。IT人不要意淫自己对公司多重要了,岗位含金量看的是稀缺度而非重要性。IT从业者总认为IT细分行业很独特,每个细分行业都很稀缺,比如写js的人做不了数据库,推演AI模型的人做不了游戏引擎。但炮兵和扫雷兵的区别就很小吗,卖保险和做私募的有任何关联吗?云厂商和IT精英们都在努力降低IT入槛,让更多的新人入局,这些新人在不断的稀释熟练工程的稀缺度;至于那些抱着细分行业沾沾自喜的井底之蛙,知道水货DBA是被一块SSD轻松取代的吗?一个新软件新的诞生和优化,足以让你们的工作变得毫无疑义。企业有饕餮鲸吞般的IT人力需求,现在在用高薪低质的泡面人才充饥,云厂商看到商机正在加速下饺。一旦企业吃饱不饿了,或者云计算饺生产够多了,谁会在意泡面的死活哪?
w****0 2018-07-11
单机房故障自愈-黎明之战
本文主要介绍单机房故障自愈前需要进行的准备工作,具体包括: 单机房容灾能力建设中遇到的常见问题及解决方法 基于网络故障及业故障场景的面故障发现能力 百度统一前端(BFE)和百度名字(BNS)的流量调度能力 单机房容灾能力--常见问题 单机房故障场景下,流量调度是最简单且最有效的止损手段,但我们发现业线经常会遇到如下问题导致无法通过流量调度进行止损: 1.存在单点 描述:系统内只有一个实例或者多个实例部部署在同一物理机房的程序模块即为单点。 问题:单点所在机房或单点自身发生故障时,无法通过流量调度、主备切换等手段进行快速止损。 要求:浏览请求的处理,不能存在单点;提交请求的处理,若无法消除单点(如有序提交场景下的ID分配),则需要有完整的备份方案(热备或者冷备)保障单机房故障时,可快速切换至其他机房。 2.跨机房混联 描述:下游之间存在常态的跨机房混联。 问题:逻辑单元未隔离在独立的物理范围内,单机房故障会给产品线带来局性影响。同时流量调度也无法使得恢复正常。
金****洲 2018-07-10
混乱的集群遇见TA 从此岁月静好
第二天 工程们说:“这个系统必须运行稳定,性能卓越,支持跨平台(Linux、Windows、ARM)安装,要做到同时管理万台器,一点儿都不慌”。 第三天 工程们说:“这个系统不能像瑞士军刀,而应该重剑无锋、大巧不工,仅支持基础设施的维护管理,要能做到快速扩缩容!出现问题能立刻回滚,保障云环境的安和稳定。” 第四天 工程们说:“这个系统还要做到‘麻雀虽小,五脏俱’!要为基础设施提供虚拟化容器隔离,应用部署,应用拓扑搭建和集群控制的功能。为应用的整个生命周期保驾护航,提供一条龙。” 总之就是四个字,“轻”、“稳”、“专”、“”,对于这一切,工程们很满意。 于是百度云的工程们结合百度历年来云计算的经验与技术沉淀,潜心打磨,匠心打造,最终强势推出新一代私有云云基础设施管理引擎HALO。 Q:HALO是什么?
亚****啦 2018-07-11
IT断魂枪--闲聊Linux系统启动过程
看看各的启动优先级也是一个讲究多多的过程,iptables会比network先启动这类依存关系很好理解;但我也遇到过云平台的DHCP获取太慢,而云主机操作系统启动快、Network还没从DHCP那里获取到IP地址,然后Mysqld等需要监听端口的启动失败。 后记 以内容只能算精简科普版的Linux系统启动过程,正式版的启动过程可以写十万字,有兴趣的朋友可以自己查维基百科,或拿我说的关键字去百度搜索。 曾经我把这些技能当做资历,但现在大家都云了,它们就只是闲聊的谈资了。但客户云就能少招一个研究这事的工程云确实也很有意义啊。 夜静人稀,沙龙关好了小,一气把六十四枪刺下来;而后,拄着枪,望着天的群星,想起当年在野店荒林的威风。叹一口气,用手指慢慢摸着凉滑的枪身,又微微一笑,“不传!不传!”----老舍《断魂枪》
w****t 2018-07-10
AIOps中的四大金刚
但在复杂场景下的故障处理、变更管理、容量管理、资源过程中,仍需要人来掌控决策的过程,这阻碍了运维效率的进一步提升。而AI方法的引入,使得机器能够代替人来做出决策,从而让真正意义的实现完自动化成为了可能。 在AIOps的落地实施过程中,最关键的因素还是人,即AIOps的建设者们。 AIOps作为一个新的技术发展和应用方向,并不是简单地说具备某一种技能或招募一两个大牛就可以完成的,它需要不同角色、多个团队的配合才可以达成。根据近几年来整个业界对AIOps的理解和实践,AIOps参与角色的划分也越来越清晰。在百度4年的AIOps实践中,我们总结得出了如下四种不可或缺的角色: 运维工程 运维研发工程 平台研发工程 运维AI工程 可以看到,除了运维AI工程外,其他角色并不是AIOps产生之后才出现的,他们在传统运维中也发挥了重要作用。我们今天主要想和大家探讨一下,在AIOps时代,他们的职责究竟发生了哪些变化。为了方便大家理解,我们会基于百度AIOps的实践案例,来进行具体说明。 单机房故障自愈场景 单机房故障自愈是一个典型的AIOps落地项目。
TOP