中科院张文生:健康医疗大数据时代的认知计算

嗨,大家好。这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频——足够干货,足够新鲜!话不多说,快快看过来,希望这些优秀的青年学者、专家杰青的学术报告 ,能让您在业余时间的知识阅读更有价值。

 

 

人工智能论坛如今浩如烟海,有硬货、有干货的讲座却百里挑一。“AI未来说·青年学术论坛”系列讲座由中国科学院大学主办,百度全力支持,读芯术作为合作自媒体。承办单位为中国科学院大学学生会,协办单位为中国科学院计算所研究生会、网络中心研究生会、人工智能学院学生会、化学工程学院学生会、公共政策与管理学院学生会、微电子学院学生会。“AI未来说·青年学术论坛”第六期“机器学习”专场已于2019年6月23日下午在中科院举行。中科院张文生研究员为大家带来报告《健康医疗大数据时代的认知计算》。

 

张文生,中国科学院自动化研究所研究员、博士生导师,中国科学院大学人工智能首席教授,历任科技处长、重大项目处长,副总工程师,中科麦迪人工智能创新研究院院长。主要从事人工智能、机器学习、大数据智能分析、视频图像理解等领域的研究。目前担任国家“云计算和大数据”重点专项总体组专家、“物联网与智慧城市”重点专项实施专家组专家、国家自然科学基金委评审专家、中国科学技术奖评委,中国仪器仪表学会物联网工作委员会副理事长和中国人工智能学会智能服务专委会副主任。

 

报告内容:随着信息技术快速发展和临床检查设备的代际跃升,健康医疗大数据深度分析和临床应用面临着认知计算的瓶颈,而认知计算是当今人工智能、机器学习应用于行业大数据分析的核心。本次报告旨在从智能问医生角度剖析健康医疗大数据服务于医学科学研究和辅助于临床医生诊疗遇到的分析推理难题,思考和分析医疗认知计算理论、典型应用案例,讨论认知计算解决智能问医生的关键技术,提出认知计算应用于健康医疗产业值得关注的问题。报告的主要内容包括医生诊断的数学模型、数学模型不可计算性、认知计算与智能医生、大数据融入智能医生和认识计算的现在与未来五个部分。     

 

健康医疗大数据时代的认知计算

 

张文生研究员首先以几张医院排队挂号、拿药、等待看病的图片作为报告的开场,凸显了当今医院门诊看病量大、实体医院远远不能满足患者需求的问题,由此引发在互联网时代我们能对此问题做哪些方面努力的思考。

 

接着以医生诊疗过程引入,介绍了疾病诊断的数学模型。医生诊疗过程从挂号到最后分诊治疗,包括一系列流程,但可以被简化为由观测到结论的问题描述。其核心在于观测疾病的表型,即了解患者疾病的对外表现,进而根据表现对疾病进行确诊,但是由于仅仅通过表象,确诊往往很困难,容易造成同病异治、异病同治的现象。

 

利用贝叶斯准则可以对疾病诊断问题进行数学模型的描述,即通过症状表现,获得将其诊断为某种疾病的可能性,同时,我们需要知道有多少种疾病、该种疾病出现的比率以及该种疾病会出现的症状。这些要素对于人类医生来说,是从书本、案例、规律摸索等过程不断学习积累的经验,积累越多,则诊断越准确,从而帮助人类医生从住院医师变成主任医师到最后成为专家。而对于机器来说,由于疾病种类不胜枚举,不能准确统计先验分布,且患者观测症状不可穷尽,大多数观测症状缺失,更有甚者需要连续观测才能捕捉,因此利用贝叶斯准则获得疾病概率的精确计算难以实现。究其本身是一个NP难的非确定性问题,复杂度极高。由此,给出了医疗大数据分析的未来是在大规模语义知识库上的搜索与直观简单的推理融合的要点。

 

然后介绍了IBM给出的认知计算框架,以及将认知计算框架应用于医疗健康的智能医生模型。认知计算框架包括问题、答案库、证据库和答案四个要素,它通过问答得到问题并分解得到子问题,接着在答案库中搜索子问题,然后在证据库中找案例作为证据:若有证据支持,则给出结果;若无证据支持,则给出可能性结果,最后通过训练好的模型对多结果进行融合、排序,给出最终结果并检验,以获得答案。智能医生模型的起点是问答机器人,核心是搜索,它通过医生与患者的问答、患者检查结果等将问题分解成一个个子问题,并对每个子问题在答案库里面搜索规则,获得子问题的分类,进而在证据库里搜索实例,获得多个结果进行融合,并获得训练好的离线模型,交给第三方医生进行判断:若对了就给出诊断答案;否则继续训练调整模型。同时,结合上海第九人民医院按照上述方案获得看病量3倍提高的例子,说明了该方案对于医生的有效帮助。

 

接着介绍了健康诊疗行业的聚焦与布局。医疗专家系统MYCIN是首个帮助医生对住院的血液感染患者进行诊断和选用抗菌素类药物进行治疗的专家系统,它的成功在于其血液疾病诊断方面的表现比初级医生好,它的失败在于缺乏常识、知识库规模太小、知识获取困难、需手工构建等导致其普适性差。为将大数据融入智能医生,IBM的人工智能问答系统Watson诞生了,其框架正确,采用的认知计算模型符合人类医生诊断过程,但是又由于缺少迭代提升、数据滋养和新生技术从而遭到质疑。

 

分析了Watson的成败之后,张文生研究员提出了未来治疗生态:以大数据提升医疗智能,并介绍了融合语义交互的智能问医生的语义分析架构和智能问医生线上APP应用,以及他们团队所作的糖尿病视网膜病变辅助诊断的工作。

 

最后,张文生研究员展示了他们团队在医疗大数据应用落地方面所做的工作:中国心血管健康联盟、麦迪科技、中科院自动化所启动了心血管“HearVai”医生人工智能研究,三方将合力共同启动“基于大数据与深度学习的心血管临床辅助决策支持整体解决方案”。更多精彩内容请关注视频分享。