医院信息化智能运维,没有专业DBA也能洞察IT异常
如何帮助企业最大程度地简化IT运维工作,把企业从耗时又容易出错的流程中解放出来,成为服务商获取客户的重要思路。

为了保证业务数据的稳定安全,像金融、医疗等有特殊需求的行业,往往花费重金采购品牌 数据库产品,然而,海量繁杂的数据也让企业的IT运维压力大大增加,需要投入具有高端专业资质的运维人员。这一现状为运维供应商带来机遇与挑战,供应商在熟稔市场上主流数据库产品的同时,还需要在技术上、知识储备上具备非常专业的运维服务资质。 某综合性三甲医院HIS系统采用了Oracle数据库产品,院方非常期待通过该数据库将 医院信息化水平抬升一个台阶,为了加速提升医院IT运维水平,充分挖掘数据价值,院方与东软云科技合作,为医院的Oracle数据库部署 OMC(智能运维解决方案),服务涵盖日志分析云、基础监控云、应用性能监控云、IT分析云等。

01  项目背景

建制完备、业务体系复杂的综合性三甲医院

该医院拥有70年历史,是集医疗、教学、科研、预防、保健、康复于一体的综合性三级甲等医院。医院占地面积6.08万平方米,建筑面积10.8万平方米,设有 33个疗区25个临床科室12个医技科室,拥有高精尖的医疗仪器设备,居地区领先地位。同时,该医院多个专项医疗中心获得国家认证,是多个行业系统的社会化保障定点医院,以及新冠疫情防控定点医疗机构。 该医院学科齐全,医疗业务繁多、复杂,在医疗信息化方面,一直使用Oracle数据库。随着业务需求日益提升和信息化技术对多项业务支撑的可能性增加,该医院希望尝试OMC对Oracle数据库的 可视化效果以及 日志分析功能(LA),及时洞察IT系统异常,提升系统效率。

02  项目挑战

因行业特殊要求致使不能直接部署agent

项目团队在了解了医院需求和具体设施情况之后,归结此次部署OMC需要克服的 主要困难有:

  • 根据院方对Oracle数据库使用的资费情况,可以用1个日志分析+ 1个实体监控(100个entities)标准版。由于医院工作的特殊性,数据库主机位于专网中,不允许部署agent,agent和gateway部署在DMZ区的虚机上(windows系统)。

     

  • 共2台部署Oracle数据主备的物理机(windows2008系统),需要读取两台主机系统日志、数据库日志。数据库执行查询语句处理缓慢,需要提高性能,减少工作人员查询等待时间。

     

  • 院方没有专门的DBA去针对数据库进行优化,平时的运维人员在数据库方面的技能力不高,导致遇到问题不能及时解决,数据的性能无法优化。

03  解决方案

利用第三方工具创建数据库分析器

围绕部署OMC(Oracle智能运维解决方案)制定整体解决方案,帮助医院提升数据库运维能力,在提升性能的同时也提高系统的技术水准。主要实施的工作包括:

  • 为应对医院专网不允许部署cloud agent的问题,采用第三方工具cwrsync 将要采集的日志信息传输到另一台可以安装cloud agent的主机上,将后者在OMC上进行数据分析。

     

  • 部署OMC套件,配置cwrsync,同步内网主机日志到DMZ区主机,创建OMC数据库分析器。本次项目中,由于内网主机的系统日志是导出的文本格式传输到DMZ(agent)上,所以默认的解析器模板不能读取,需要自行编写解析器。

  创建OMC数据库分析器 创建分析器模板

  • 为应对OMC读取该工具传输的windows日志出现重复读取的问题(重复读取日志会大量占用用户OMC存储空间),尝试多种解决方法,最后使用命令先切割日志,再开启cwrsync的断点续传功能,解决该问题。

     

  • 对医院数据库进行健康检查,收集syslog、alertlog进行分析,优化数据库执行的sql语句,缩减语句运行时间。

04  客户收益

省人增效,降低风险

本次项目为该医院部署OMC用时约一周左右,为客户带来的直接利益主要有:

  • 节约专业DBA 1人,可为医院节省人力成本约每年20万;

  • 查询性能提升15%;

  • 客户量增加5%;

  • 使用趋势图和告警降低风险30%。

本次项目还会对该院未来的医院信息化发展提供长久的有力支持。作为新一代AIOps智能运维解决方案,它将充分发挥人工智能和机器学习的作用,帮助IT系统运维部门应对日渐繁复的信息化系统,实现故障主动预警和准确定位,保障医疗信息系统稳定、可靠运行。 同时,OMC可以在提升医院信息化运维标准的基础上,兼顾成本,降低运维压力,有利于医院释放更多的资源投入到关键的医疗业务中。