关于 最准的快乐十分计划最准q群778 7878鳌nher们柯厍:w 的搜索结果,共1852
y****i 2018-07-11
做容器云佳用户
文末总结 以前我看到虚拟机套单容器事情,因为不信任他老套宣传话述,狠狠嘲笑了这些容器云从业者。 但我和一个值得信任高手聊天时,他反问我,这种架构除了看起来不够优雅,有没有什么逻辑上致命问题? 如果有一些服务就是要业务进程包在容器里,但数据文件就是要落在硬盘上,这时候用容器加云主机可以说是一种取长补短嫁接,总好过拿pod本地存储做冒险。 我也是因为这次会面而想写本文,开始更正态度看容器,有问题人用过工具一样可以是好工具。 想想自己曾经也对云算不屑一顾,人生循环真是有趣。 备注 1.本文中运维指是业务服务运维,不是资源支撑运维。 2.很多人会跟我说容器比虚拟机启动,但容器应该跟虚拟机里进程比重启速度啊,虚拟机重启进程也不用重启系统啊。 3.我一般说docker纯粹指是它容器部,不包括swarm等部。 4.在我看来容器对系统运行环境封装就是像个jvm,我知道容器封装更多更彻底,但这只是五步和一百步区别。 5.我知道文中没把docker和k8s太清楚,但这是给客户看,不是内部考核用,请大家脑补时往好处想。
Z****E 2018-07-09
产品迭代后一公里
然后由专门执行系统解析策略,并自动执行批量机器变更,如开源Ansible、SaltStack和百度内部CCS系统。整个执行过程自动进行,用户只需要查看执行进度即可。另一方面,执行系统也提供了干预能力,用户可以手动暂停乃至撤销一个部署任务执行。图2给出了自动化部署示意图。 2级发布 级发布是指将变更过程以实例组为单位成多个阶段,每个阶段引入自动化检查用例,只有检查通过才能执行下个阶段变更。级发布不能完全避免变更异常,但是可以有效限制异常影响范围。通过把变更版本管理和历史审级发布结合,可以有效增强对变更过程管控,降低异常影响,加异常恢复速度。整个级发布规范构成可以参考图3。 3智能变更策略 采用自动化部署和级发布之后,用户已经可以获得较好变更效率,并且能够在相当程度上提升变更安全性,但是使用更高标来审视,其中仍存在改进空间:变更模板需要人工配置,使用门槛较高,复用性低;变更效果检查强依赖人经验,可能出现异常没被及时检查出来问题。 得益于在AIOps上实践,我发现通过将智能策略引入到变更流程中,可以进一步提升变更效率和安全。
金****洲 2018-07-10
混乱遇见TA 从此岁月静好
Q新开发基础设施服务有问题,能立马回滚吗? Q可以做虚拟化资源限制基础设施不占用过多机器资源吗? Q如何先部署小批量机器,确认无误之后,再做全集部署?简而言之,灰度发布。 Q新到位10000机器,如何高效部署基础设施?使集中所有机器环境同质化? 管中窥豹,我可以发现如果在私有云或者混合云场景中还是通过人肉运维方式管理,那么管理效率将会低下,并且其中重复繁杂操作,难以保证云环境稳定性和安全性。急人之所急,需人之所需。百度云工程师便展开了一场头脑风暴...... 原始太初 私有云中存在大规模机器集,集中一片空虚混沌,渊面黑暗,仅有字节流在其间穿梭。为有效地管控体量庞大,合理配资源,降低运维成本,保障云上服务穿越狂风暴雨,工程师意识到:“必须要有一个优秀系统来管控这混沌世界!” 第一天 工程师说:”这个系统要代表操作系统意志!占用资源少!对外部系统零依赖!装机自带!要能自升级和自保活!“。
冰****蓝 2018-07-09
如何调节『控制参数』?
引言 控制模块目标是基于轨迹和当前车辆状态生成控制命令给车辆。这里我将为开发者讲述如何调节控制参数。 背景 一、输入/输出 输入 规轨迹 当前车辆状态 HMI驱动模式更改请求 监控系统 输出 输出控制命令管理canbus中转向、节流和制动等功能。 二、控制器介绍 控制器包括管理转向指令横向控制器和管理节气门和制动器命令纵向控制器。 横向控制器 横向控制器是基于LQR优控制器。该控制器动力学模型是个简单带有侧滑自行车模型。它被为两类,包括闭环和开环。 闭环提供具有4种状态离散反馈LQR控制器: 横向误差 横向误差率 航向误差 航向误差率 开环利用路径曲率信息消除恒定稳态航向误差。 纵向控制器 纵向控制器配置为级联PID+校表。它被为两类,包括闭环和开环。 闭环是一个级联PID(站PID +速度PID),它将以下数据作为控制器输入: 站误差 速度误差 开环提供了一个校表,将加速度映射到节气门/制动百比。 控制器调谐 一、实用工具 类似于诊断和realtime_plot可用于控制器调优,并且可以在apollo/modules/tools/中找到。
l****m 2018-07-10
五年前预言——2012年云算时代运维职位展望
生产领域公司因为运维涉及到实实在在钱,所以运维人员待遇高(都是专有技术难培养)、做事情少(自发做事多了会出错,不如找厂商技术支持),只是跳槽难度比通用运维要大一些(都是专有技术不通用) 4、彻底转型,做和算机无关工作;选这条路人一部是自己有大觉悟或巧机缘,但另一部人是真适应不了环境变化,希望各位不要被淘汰掉。 后总结一下,云算是不可阻挡历史趋势,它还给了运维五到时间去修正自己职场规,我可以顺势而为也可以激流勇进,但不可得过且过随波逐流终。 天行健,君子自强不息。
思****来 2018-07-11
重磅:构建AIOpsMNIST
如果用户每次载入曲线都要设置一次y轴区间,无疑是很麻烦。针对这种问题,我在工具中添加了离点自动判断功能,排除离点之后,我就能找到合适y值区间,让用户看到合理曲线形态。 默认Y轴取值范围 基于离点检测Y轴取值范围 大尺度数据采样 我标注时通常会先浏览数据来初步了解数据布,标注时也常常先寻找大致异常区间再仔细标注。这种浏览尺度比较大,由于屏幕辨率远低于数据点数,不可避免地要进行采样或聚合,常用均值方法会平滑周期内尖峰和低谷,降低异常幅度,影响标注工作。针对这种问题,我在工具中提供了大值、小值采样方法,可以适应上溢、下溢异常场景,在标注时暴露出完整异常幅度,解决采样带来失真问题。 辅助标注功能 在其他时序数据异常标注工具中,通常提供了天同比、周同比参考线或恒定阈值线,这些参考线在一定程度上满足了标定人员参照历史数据需求,但是面对单调上升指标(如用户数量)、预期内突增(如活动流量)等个性化场景提供帮助比较有限。针对这个问题,我开放了参考线生成功能,可以根据场景自行编写插件添加参考线。
不****主 2018-07-09
高精地图
高精地图,是Apollo定位、感知、规模块基础。 与普通地图不同,高精地图主要服务于自动驾驶车辆,通过一套独特导航体系,帮助自动驾驶解决系统性能问题,扩展传感器检测边界。目前 Apollo 内部高精地图主要应用在高精定位、环境感知、决策规、仿真运行四大场景,帮助解决林荫道路GPS信号弱、红绿灯是定位与感知以及字路口复杂等导航难题。 一、高精地图与传统地图 当我开车时,打开导航地图通常会给我推荐几条路线,甚至会显示道路是否拥堵以及每条路线将花费多长时间、是否有交通管制,有多少个交通信号灯或限速标志等,我会根据地图提供信息来决定是在行驶中直行、左转还是右转以及对周围驾驶环境评估。 而无人驾驶车缺乏人类驾驶员固有视觉和逻辑能力。如我可以利用所看到东西和GPS来确定自己位置,还可以轻松确地识别障碍物、车辆、行人、交通信号灯等,但要想让无人车变得和人类一样聪明,可是一项非常艰巨任务。 这时就需要高精地图了,高精地图是当前无人驾驶车技术不可或缺一部。它包含了大量驾驶辅助信息,重要是包含道路网精确三维表征,例如交叉路口布局和路标位置。
p****d 2018-07-11
单机房故障自愈--运维春天
【解决方案】 基于容量水位动态均衡 在流量调度时,对于容量不确存在风险,我两条容量警戒线。 安全水位线:流量处于在安全线以下则风险较小,可以一步进行切换。 水位上限:该水位线表明服务大承载能力,一旦流量超过故障水位线,很大概率会导致容量过载。 如果安全水位线提供容量不足以满足止损,那我期望使用上两条中间容量buffer,同时流量调度过程中进行步试探,避免一次性调度压垮服务。 基于速熔断过载保护 在流量调度时,建立熔断机制作为防止服务过载后屏障。一旦出现过载风险,则速停止流量调度,降低次生故障发生概率。 基于降级功能过载保护 在流量调度前,如果已经出现对应机房容量过载情况,则动态联动对应机房降级功能,实现故障恢复。 2业务线止损策略需求差异大 【问题描述】 我实现了基础单机房故障流量调度止损算法,但在部业务线中仍存在较大需求差异,比如: 步动态调度需求:业务存在充Cache情况,过程中服务能力降低,需要控制切换速度。
小****园 2018-07-10
让PB级云存储不再神秘
考察案例真实性方法主要靠听对方能否自圆其说,甚至让多个厂商当面质疑,能逻辑自治厂商终归还是靠谱一些。 大客户对云端数据处理要求比中小客户更简单,因为复杂业务功能可以自己做,还可以要求厂商为自己做定制开发。 大客户数据一般都是存在于旧系统,其迁移方案比小客户复杂,拉专线、寄设备、追增量、切业务等等方面都要考虑到。一般迁移方案是现有数百T数据,规未来3年到10PB,数个轻量应用对接代理网关继续使用,几个核心高负载应用改成直接访问存储。为了更好发挥对象存储优势,厂商还要诱导客户使用云平台各种新功能。迁移方案要靠谱必须说清楚所依赖环境、操作时间规、各步风险评估、验证验收标等信息。 大客户同样在于云平台职业操守,但其反击能力要强于中小客户,因为他不会用云平台合同,而是自己订制合同内容。法律合同上能震慑平台一部小动作,但费统数据云平台还是会拿到,客户可以考虑多几个供应商多做几个存储池。
M****H 2018-07-11
故障定位场景下数据可视化实践
干货概览 百度拥有上百条产品线,数服务,每个服务时时刻刻都在产生着海量监控数据,形成监控项规模总数已达数亿。面对如此海量数据,在日常运维(如故障诊断、成本析、性能优化等场景)过程中,传统图表难以有效直观地展示如此庞大数据。因此,优秀监控数据可视化产品就呼之欲出,他既要数据确、全面、时效性高,也需要提升用户使用体验,使其能在茫茫数据中一眼就能发现想要观察数据。 那么怎么做才能适应用户需求、完成精展示,同时又能挖掘数据价值呢?下面我从故障诊断场景出发,来看百度智能监控平台是如何充利用数据可视化武器来解决实际业务问题。 故障定位可视化思路 在标故障处理流程中,故障定位一般可为两个阶段: 故障止损前:期望可以速获得可用于止损决策信息,做出相应止损操作使得服务恢复。比如通过确定故障范围,调度流量绕过故障机房或摘除故障实例等。 故障止损后:仍需要进一步找到导致故障深层次原因,确定故障根因,将线上环境恢复到正常状态。
TOP