关于 拍肩型迷魂真的的【V信;799.196.362】蚊 的搜索结果,共1621
若****客 2018-07-10
IT架构本质--我五点感悟
在生僻业务规划实施过程中,没人告诉我们该有哪些服务,我们只能靠摸透一个又一个访问逻辑图和数据生命周期,来摸索群集内有哪些角色和依赖关系。 架构师核心技能包括画好访问逻辑和数据流量图,因为问题现状描述清楚了,问题就解决了一多半了。一个好业务访问逻辑图,不仅仅是几个圈圈几条线连起来,其息量大到包罗访问过程所有元素,也要详略得当高亮关键点。 5. 各环节都不可盲 容灾设计中都尽人事和听天命 整个IT系统中就没有可靠组件,架构师既不能盲目任撞大运,又不能无限冗余吓唬自己,而是在尽人事和听天命之间做好权衡。比如TCP就是要建立可靠链接,而现在做性能优化时候,大家又嫌TCP太过笨重了。 业务应用不可靠,如果该应用能快速重建也不阻塞其他应用,月级偶发内存泄漏和意外崩溃都是可以接受。 支撑性服务不可靠,对于大部分业务,预估一年都不丢一次数据,SLA能到99.95%就可以了。 操作系统故障崩溃,现在商用系统内核都很稳定,一般故障都出在硬件驱动兼容性上,或者有些照本宣科傻瓜乱改默认参数。
嘟****y 2018-07-11
企业适用云平台账户体系
e.平台代操作授权角色,这不是一个恒定角色,而是前文查看客户没有操作能力,那就需要进行临时操作授权。 以上各个角色登陆和操作过程都要有详细步骤日志记录。 第四.平台通知和管理机制 前文将各种资源和权限进行了区分,那接下来要区分就是平台通知机制。 单账户大通铺模式下,所有平台短和邮件都往一个账户发就行了,但现在要重新设计。我一线技术工作经历并不依赖第三方(如云平台)通知机制,对通知功能研究较少,所以我只能提出通用性设计建议: a.别把平台维护通知当做甩锅通知,大客户会因此忙到鸡飞狗跳。 b.员工正常操作不要通知到管理员,自然人收到息太多会麻木。 c.员工执行摧毁核心资源等高危操作要及时通知管理员。 d.这些操作日志可以通过API等方式对接到企业自身平台。 e.合规和安全风险发送平台管理员和资源池管理员。 云平台有通知机制就要有管理权限,比如说某IP存在合规隐患,管理员要能查看和操作该IP;否则平台管理员只能组织各部门领导开会,平台管理员一般不是公司高管,其处理速度和处理效果就很慢也很扰民了。
双****4 2018-07-11
【杂谈】猎场没那么精彩--还原猎头
当遭遇面试失败,资深猎头能要到实失败原因通报给候选人,而新手猎头不关注面试失败原因,用人部门给失败原因都是敷衍套话。 也有一部分猎头会和优质候选人保持长时间关系,但这太费时间了,猎头五年内给同一个候选人介绍两次工作几率实在是太小了。 我这里没提诸如JD介绍、简历优化一类基础内容,合格候选人会认专业分析职位需求,不需要猎头来催。 用人单位评估猎头水平就更简单了,就是写推荐说明。新手猎头是写不出干货实锤推荐,而资深猎头推荐不仅是对候选人简历解析,也会包含简历之外大量建议说明。
y****i 2018-07-11
做容器云最佳用户
文末总结 以前我看到虚拟机套单容器事情,因为不任他们老套宣传话述,狠狠嘲笑了这些容器云从业者。 但我和一个值得高手聊天时,他反问我,这种架构除了看起来不够优雅,有没有什么逻辑上致命问题? 如果有一些服务就是要业务进程包在容器里,但数据文件就是要落在硬盘上,这时候用容器加云主机可以说是一种取长补短嫁接,总好过拿pod本地存储做冒险。 我也是因为这次会面而想写本文,开始更正态度看容器,有问题人用过工具一样可以是好工具。 想想自己曾经也对云计算不屑一顾,人生循环是有趣。 备注 1.本文中运维指是业务服务运维,不是资源支撑运维。 2.很多人会跟我说容器比虚拟机启动快,但容器应该跟虚拟机里进程比重启速度啊,虚拟机重启进程也不用重启系统啊。 3.我一般说docker纯粹指是它容器部分,不包括swarm等部分。 4.在我看来容器对系统运行环境封装就是像个jvm,我知道容器封装更多更彻底,但这只是五十步和一百步区别。 5.我知道文中没把docker和k8s分太清楚,但这是给客户看,不是内部考核用,请大家脑补时往好处想。
思****来 2018-07-11
重磅:构建AIOpsMNIST
一文中提到,运维操作一般可以分为感知、决策、执行三部分,而在感知阶段我们通过识别服务指标数据中不符合预期模式来发现服务异常,即监控数据异常检测。 很多时候,大家手中异常检测是一条脑袋想出来规则,或者根据经验大致估算阈值。这样异常检测常常存在较多误报、漏报、效果不佳情况。而上线前基于标注数据效果评估是提高效果最重要手段。为了获取大量、准确标注数据来评估算法效果,我们进行了一系列探索。 本文将主要介绍在监控数据异常标注实践中遇到问题和解决方案,并给出一个当前由百度智能运维团队与清华大学Netman实验室合作研发辅助标注工具原https://github.com/baidu/Curve,欢迎大家一起探讨。 时序数据异常标注 在监测服务收入、流量、可用性、性能等指标时,通常会对数据进行流式采集和汇聚,每个数据点反映是某段时间内服务状态,这些时间序列数据简称时序数据。 在异常检测方面大家或多或少都有过类似经历:针对一次故障设置了报警规则,其中阈值根据这次故障设置。上线后不断发生误报,因此调低阈值。阈值调低后误报减少,但在一次新故障发生时发生漏报,又调高阈值。
w****t 2018-07-10
AIOps中四大金刚
在百度4年AIOps实践中,我们总结得出了如下四种不可或缺角色: 运维工程师 运维研发工程师 平台研发工程师 运维AI工程师 可以看到,除了运维AI工程师外,其他角色并不是AIOps产生之后才出现,他们在传统运维中也发挥了重要作用。我们今天主要想和大家探讨一下,在AIOps时代,他们职责究竟发生了哪些变化。为了方便大家理解,我们会基于百度AIOps实践案例,来进行具体说明。 单机房故障自愈场景 单机房故障自愈是一个典AIOps落地项目。该方案主要解决问题场景如下:某个业务由于网络、设备、变更、程序Bug、容量等原因造成故障,但故障范围仅局限在单个机房或单个Region内部。那么,我们可以基于流量调度等手段,将访问流量调度到非故障机房或Region,实现该类故障自动止损。 在这个过程中,需要AIOps四种角色分工明确、紧密配合,来完成整个AIOps解决方案落地实现。
c****1 2018-07-10
数字签名会被撞破么?——安全 hash 攻与防
由于攻击者能控制 zzz 域,于是将 src.coll 进行实支付,获得支付平台 签名 sign,然后将其异步通知中订单号做简单修改,从 1704176438 改为 1704176439,作为伪造异步通知提交给商户服务器。由于 src.coll 和 dst.coll MD5 值是相等,所以他们在尾部附加上商户密钥之后做 MD5 值依然是相等(MD5 碰撞尾部附加性质)。因此伪造异步通知也是有效。如果商户服务器不 去查账而是相支付平台异步通知,那么攻击者成功用一个订单金额完成了两个订单。 此外,之前也出现过针对微软 msi 签名机制不完善/双签名机制攻击,构造具有“合 法签名”恶意代码。也发现了利用 CPC 攻击传播恶意代码实例。感兴趣 读者可以参考 [14]。 4.安全使用安全 hash 签名 首先为了抵抗 CPC 攻击,不能简单在待签字符串后面附加密钥,而是需要在待签字 符串前后均附加密钥,即计算:sign = hash(secret1 + string + secret2) 作为签名。
1****2 2018-07-09
百度安全:AI 是系统工程 需要正开放安全护航
而现在普遍应用TLS/SSL 方案 是基于非内存安全语言编写,容易被黑客利用内存安全漏洞攻击,而且未来也面临着被 量子计算机破解威胁。 而百度安全基于内存安全技术下一代可配置嵌入式安全通协议栈MesaLink, 在语言层面提供内存安全保障,算法层面提供后量子密码对抗能力。这就使得网络传输 可以避免OpenSSL“心脏流血”等高危漏洞隐患,并且能对抗量子密码学攻击,进一 步增强网络传输层安全。在MesaLink 保驾护航下,AI 系统有了内存安全 和抗量子破解双重保障,黑客很难再通过内存安全漏洞和量子计算机技术通过网络通 层攻击进入AI 系统。 云端安全 云安全都快成了老生常谈话题。不过现在云端防护引擎存在着一定缺陷,比如 它们大多依赖请求特征。一方面,要适应千差万别后端应用,以及它们对协议处理 方式,本身就很困难。另一方面,面临一些新攻击,防御引擎需要及时增添规则,较 为被动。最后,防护引擎只要看到符合特征请求,就会产生报警,并不知道黑客是否 攻击成功了,所以误报率比较高。 自从Gartner 提出自适应安全架构之后,得到了业界一致认可。
陈****1 2018-07-11
原始人创业——创业者核心竞争力
原始人是肉食者,吃羊肉不是生存,但吃羊肉是生存手段。成功创业公司不需要和鬣狗冲突,但都会随手死了一批羚羊,比如智能机死了PSP,打车软件死了黑车。 原始人不是跑最快生物,但可以活活累死羚羊,咱们不提人类发达汗腺和呼吸系统,单说人类还可以边跑边吃喝这个优点,就足以耗死一群鹿。创业者吃掉羚羊公司,本质上就是靠耐力和技巧来耗死对方。 创业团队是狼群,执行力度都远大于苟安小老板;创业公司可以放弃利润抢市场,而羚羊公司损失一分就是输;创业者还能精准挖人或者降维打击。资源羚羊可以靠资源、靠政策组建有效壁垒;细分领域羚羊靠夹缝市场食之无味;通用领域羚羊,只能赌自己运气好,合格创业者太少。 如果创业者收割不掉羚羊公司,应该反思自己是否能胜任羚羊公司普通职位?要做类似行业、做雷同客户,总要有一些常识级别了解。 5.失方向意外:远见 原始人比较淳朴,先民传说很多都是某人因为打猎、路、掉沟里了,然后开拓一片新天地,创建一个新民族。 面对创业成功者,很多无聊鸡汤编辑根据结果倒推原因,非要说对方有远见卓识,因为穿了红内裤绿袜子,所以就挣出了千亿身家。
p****d 2018-07-11
单机房故障自愈--运维春天
基于内网监控、基础监控、业务监控提供故障号;触发内网止损决策器进行止损决策;执行流量调度、主备切换、弹性降级等止损操作。 单机房故障自愈常见问题和解决方案 传统流量调度自动止损方案存在如下问题: 1容量风险控制能力不足 【问题描述】 传统流量调度模式有两种:固定比例模式与容量保护模式。 固定比例模式:按照预先设定固定预案,一个机房故障,该机房流量按照预先设定比例分配到其他机房。很可能某个机房容量或剩余机房总容量不足,切流量后导致多个机房发生故障。 容量保护模式:针对固定比例模式存在容量风险问题,改进流量调度方式为执行前判断容量是否充足,容量充足则进行流量调度,否则不进行调度并通知人工介入处理。但此种方案面对问题是: 1.容量仍有buffer可以进行部分止损。期望能够在不超过容量保护情况下进行尽可能调度,减少对用户影响。 2.即使按照容量进行调度,服务过载仍可能发生,容量数据本身存在一定误差,流量成分变化以及变更等导致容量退化,都可能导致原先容量无法完全可
TOP