装饰杂志,《装饰》杂志社, 立足当代 关注本土 www.izhsh.com.cn

医疗行业大数据分析的应用初探

  • Update:2014-09-02
  • 刘 颖 英特尔(中国)有限公司
  • 来源: 《装饰》杂志第6期
内容摘要
本文初步探讨了大数据分析在医疗行业的应用。医疗行业是一个生态系统,它包含几个主要角色,每个行业角色都积累了一定的数据,这些数据为医疗大数据分析提供了可能性。医疗大数据分析是一种工具,其目的在于解决生态系统中的主要问题并为科学研究、社会以及商业模式创新带来价值。本文总结了医疗行业的主要角色以及其所拥有的数据集合。在此基础上,列举了大数据分析在医疗行业的21 个应用场景并对两个临床应用展开了进一步分析,指出了用户体验研究和设计在这些场景中应当发挥的作用。

1. 国内医疗系统主要角色和大数据举例

一、医疗大数据
2013 年5 月14 日,美国影星安吉丽娜•朱莉通过媒体发表了一篇题为《我的医疗选择》的文章[1]。文中她提到了自己携带一种名为BRCA1 的基因,该基因大幅度提高了朱莉患乳腺癌和卵巢癌的风险。通过和医生的沟通,她决定进行一个预防性的双乳腺切除手术以降低患癌风险。此外,她还会与医生一道计划其他预防性治疗方案以降低自己患卵巢癌的风险。朱莉的预防性治疗为其他携带同样基因的女性提供了一个有益的参考。值得一提的是,支撑预防性治疗的基因测序(Genomics sequencing)技术是大数据分析肇始的驱动学科之一。2003年,当人类首次对人体的基因密码进行破译时,30 亿对碱基的排序工作花费了10 年的时间。10 年之后,同样的基因测序只需要10 分钟就可以完成而且价格也降低到了1000 美元以下[2]。随着基因测序技术由研究逐渐转向临床应用,基因测序能够为医疗行业模式的演进带来更多助力,并为患者尤其罕见病患者带来更多福音。
医疗行业是一个生态系统。这个生态系统包含多个重要角色:作为医疗服务提供方的公私立医院、社区医院等医疗机构,作为医疗服务和产品的支付方的商业保险公司以及社会保险,还有作为医疗政策的制定和监管方的各级政府卫生部门,比如卫计委和地方各级卫生厅局,以及作为医药和医疗产品生产和销售方的各个相关企业,他们研发、生产或者销售各类药物以及医疗器械产品。除了以上传统角色,随着可穿戴技术的成熟和逐步市场化,目前医疗行业还出现很多面向消费者健康以及运动的产品和基于数据的服务。他们通过可穿戴设备记录和检测消费者的日常活动和生理指标,也成为医疗行业中不可或缺的一员,并逐步成长为大数据的拥有者。
医疗生态环境在其运转过程中产生了大量的数据。医疗机构如各级医院储存着病人的医疗档案。随着中国老龄化的加剧,病人相关的医疗数据会持续增加。如何利用已有病人的数据提高未来临床治疗的效率和质量,并支撑专业的医疗研究是医疗服务方所面临的重要挑战。作为医疗支付方的社保和商业保险公司积累了病种、医疗消费项目以及费用等相关数据。这些数据能够帮助医疗支付方了解医疗费用的使用情况,不同病种的花费情况以及不同医疗资源的使用情况。支付方希望通过大数据分析为新保险产品的设计提供更多信息。卫计委和各级卫生厅局通过自己的直报系统可以了解各地乃至全国流行病的情况,也可以了解医疗资源的分配和使用情况。市一级卫生局通过区域医疗信息平台(RHIN)可以实时掌握市内的医疗卫生状况。如何更加有效地整合和利用相关数据,为政府更好地履行政策制定和监管职能,是各级政府卫生部门所面临的重要问题之一。医药研发企业通常需要收集大量数据,比如生物基因数据以及药物测试数据来支撑新药的研发和上市流程。国内药物和医疗器械产品研发相对发达国家落后,导致我们在生物医学领域的数据积累不够。但随着可穿戴产品的出现,面向普通消费者的健康设备生产和服务提供方能够检测和记录用户的行为数据,包括日常活动数据、消费者购买行为数据等。这些数据的积累能够帮助行业更好地了解用户行为,并提供有针对性的服务和产品。
医疗行业的大数据的收集、分析和应用仍然面临很多的挑战。首先,医疗行业的大数据分属不同的行业角色。如何整合这些大数据是一个挑战。数据的分享和交换需要合理的政策并考虑各方合理的利益诉求。其次,医疗行业数据的电子化和数字化仍处于早期阶段,很多数据尚未数字化。比如,医疗行业仍然要求医疗机构将病人档案纸质化,这加大了医疗机构工作人员的工作量,从某种程度上抑制了医疗信息化系统的使用。国内仍然有很多医院包括基层医院并未购买和使用完善的信息化系统来支撑相关数据的数字化。例如,很多基层医院尚未建立基本的医院信息系统(HIS)。电子病历系统(EMR/EHR)在国内医院也未普及。再次,由于医疗信息系统的提供商非常多,不同医疗机构的需求千变万化,行业内部同类信息系统在数据结构和格式等解决方案上的同质性比较差,数据交换和分享在技术上存在阻力。尽管面临这么多的挑战,如果我们能够围绕医疗大数据制定合理的整合、分析和应用政策和策略,那么医疗大数据及其分析就能帮助提高整个医疗行业的运转效率乃至体验水平。

二、国内医疗行业所面临的挑战
大数据分析的发展为解决医疗行业所面临的问题提供了可能性。将相关的医疗数据整合并进行分析,有可能发现以往独立数据系统不可能发现的新模式。据咨询机构麦肯锡分析,大数据分析的合理应用能够帮助美国每年节省三千亿美元的医疗费用,将医疗费用所占GDP 的比例从17% 强降低到8% 左右,进而解决美国医疗系统的主要矛盾,也即尽管花费高,效率和结果并不优于其他发达国家[3]。
国内医疗生态系统同样面临诸多挑战。首先,国内医疗服务资源欠缺且分配不均衡。根据国际卫生组织2013 年的统计数字,国内每万人医生数为14.6 人,而每万人的护士数为15 人。这与美洲地区与欧洲发达地区都有不小的差距。美洲地区每万人医生数和护士数分别为20.4 人和71.5 人,而欧洲地区每万人医生数和护士数则分别达到33.3 人和84.2 人[4]。除此之外,国内的医疗服务资源分配不均衡。比如,优质的医疗服务资源主要集中在城市。虽然农村人口的比重大,但是农村的医疗资源却相对缺乏。此外,医疗服务资源在地域分布上也存在一定的不均衡。医疗资源相对集中于东部发达地区,西部欠发达地区的医疗资源相对匮乏。
其次,人口老龄化以及慢性病时代的到来对国内医疗行业带来新的挑战,也对医疗资源的分配提出了新的要求。老龄化是中国社会的一大趋势。按照目前的趋势,到2020 年和2050 年,中国60 岁以上老人将分别达到2.34 亿和4.37 亿,所占人口比例将分别超过16% 和30%[5]。在目前医疗资源有限的情况下,人口老龄化将给医疗系统带来更大的压力。另一个趋势是慢性病,比如糖尿病和癌症等的流行。跟急性病种比如细菌感染相比,慢性病需要更长的治疗恢复时间,并与人的生活方式以及习惯密切相关。慢性病的特点也给医疗系统带来新的要求,比如由于慢性病的预防和早期治疗会大大降低其危害和治疗费用,所以医疗资源也应该适当向慢性病的预防和早期发现倾斜。但就目前而言,我们国家还缺少针对慢性病预防和早期治疗的基层医疗(primary care)资源和体系。
再次,我们的医疗机构和病人之间缺乏信任,部分原因在于医疗过程缺乏一定的透明度。据报道,2010 年全国针对医务人员的暴力事件超过17,000 件[6]。要缓解医患矛盾,依靠数据更好地沟通医疗过程以及结果,提高诊断治疗的透明度是必要手段之一。
最后,也是所有的医疗系统所面临的挑战,即医疗系统是否具有结果和效率导向。在医疗行业这个生态系统里,结果和效率导向意味着病人得到更快、更有效的治疗,而且更有效的医疗手段、产品和治疗方法得到更好的奖励和刺激。但是判断一个医疗系统是否具有结果和效率导向并不是一个容易回答的问题,需要综合医疗系统的各类数据进行分析并加以回答。医疗大数据分析并不能单独解决所有上述医疗行业的系统性问题。我们更应当将大数据分析作为一种辅助手段、一种工具,并逐步建立使用大数据辅助决策以及问题解决的习惯,从不断积累的数据和系统分析中改进医疗系统。

表1. 大数据分析在医疗行业的应用场景

三、大数据分析在医疗行业的应用场景
基于上述分析,我们总结了大数据分析在医疗行业中潜在的应用场景以及主要用户。表1 列举了全部21个应用场景及主要生态系统角色大数据分析在医疗行业的应用场景其主要用户。我们选择了两个临床场景即临床决策支持并付诸临床路径优化以及个性化医疗,进行了深入的探讨。临床决策支持和临床路径优化在国外已经有成功的案例可以参考,而国内正处于发展阶段,他山之石可以攻玉,我们可以从中学到更多的东西。个性化医疗是现代医疗模式发展的大趋势之一,如何更好地将基因测序技术应用于临床,是医疗信息界(Medical Informatics)研究的热点和前沿。


2. SimulConsult :为医生提供快速诊断建议并按照相关度高低呈现


3. DiagnosisPro: 为医生设计的免费在线辅助诊断工具

医疗大数据分析的一个重要应用是辅助临床诊断和治疗,并辅助临床路径的优化。医疗服务行业是知识密集型行业,提高医疗质量和效果要求从业者具备研究和持续学习的能力。但是由于个人所接触的知识和病例是有限的,医务工作者经验的积累很大程度上受限于个人经历以及学习能力。大数据分析可以收集、处理和分析更多的临床病历和治疗路径,结合治疗结果和费用等数据来智能化计算相对有效的治疗手段和临床路径。这些都可以给医务人员的临床决策提供有益的参考。从信息处理的角度而言,这些基于以往知识和数据的分析在某种程度上弥补了个体信息加工能力的不足。但是完全依赖大数据分析进行临床决策也是不可取的。更可取的方式是视大数据分析结果为辅助决策的工具,从而将人的经验和直觉优势与计算机
分析的优势有效地结合并应用于临床。大数据分析也可以进一步应用于临床路径优化。建立合理的临床路径可以帮助基层医疗机构提高医疗水平,进而消除国内医疗资源分配不均所造成的影响。
电子病历是临床诊断治疗建议和临床路径优化分析的基础系统之一。我国从2011 年开始推进电子病历在医疗机构的使用。随着国内电子病历系统在三级医院的逐步普及,如何更好地利用该系统一直是业界讨论的热点。在国外,行业内关于电子病历的使用也一直争论不断。反方认为电子病历在跟病人争夺医生时间,并且有研究数据表明,电子病历的使用降低了医生的工作效率和满意度[7]。正方则认为电子病历本身是进步,医生通常不愿意回到纸质病历时代,但是电子病历的用户体验和深度应用需要进一步提高[8][9]。在用户体验方面,电子病历如何更好地与医务人员的工作流程相结合且提高医务人员的效率是需要重点解决的问题。在应用方面,如何通过对于系统数据的分析更好地帮助医务人员提高诊断和治疗的水平,进而提高医疗质量也是亟待解决的问题。从这个角度来讲,如何将病人客观健康数据与智能计算的结果共同且有差异地呈现在医生面前,也是未来的电子病历和临床决策辅助系统设计应当考虑的问题。
一个将数据分析、人工智能技术以及知识系统结合并应用于临床决策支持的产品形态为临床决策支持系统(Clinical Decision Support System, CDSS)。临床决策支持系统是将医学知识与临床观察数据相结合,并通过运算为医生提供决策支持的软件系统,其主旨在于辅助医生提高临床治疗效率和效果。也有学者提出,电子病历的最高形态是临床决策支持系统[10]。在国外,研究人员和医院信息化部门已经开发了很多临床决策支持系统并将这些系统应用于临床决策支持。图2 和图3 分别呈现了SimulConsult 和DiagnosisPro 两个CDSS 系统的界面[11][12]。20 世纪70 年代初,斯坦福大学的研究者开发了MYCIN 系统,用以辅助诊断细菌引起的重度感染疾病,该系统可以根据病人体重以及症状特点推荐抗菌药物的种类和计量。MYCIN 系统从未应用于临床,但作为较早的CDSS 系统之一,其设计以及产品形态对后续的CDSS 产生了巨大的影响[13]。它有效地促进了单病种CDSS 系统的广泛发展。此外,单病种CDSS 系统在临床应用上的有效性也得到很多数据的支持。比如1971 年在利兹大学医院运营的利兹腹痛系统诊断正确率达到91.8%。
单病种CDSS 系统的应用毕竟有限。更多研究和开发转向适合多病种甚至能够支持临床诊断之外其他决策过程的CDSS系统。这些系统通常都与临床过程紧密结合,并在临床过程中为多个环节提供决策支持。在交互过程中,这些系统也更加强调决策支持发生在正确的时间和地点,比如决策建议应该出现在住院医生检查病人的时候。这些系统也提供更为主动的提醒方式。HELP 系统是该类系统的一个代表。该系统由犹他州立大学医疗信息学系开发,后被犹他州的山间医疗医院(Hospital of Intermountain Healthcare)应用于医院信息系统(HIS)中。该系统中的决策支持功能贯穿整个医疗流程并可以提供警告和提醒,帮助解释数据,辅助疾病诊断并提供流程管理的建议。在一个完整的治疗流程中,两种机制能够触发决策支持系统自发地提供决策建议:一种触发机制为系统中数据的更新,比如病人的电子病历一旦有所更新,决策支持系统就将自动启动并为医生提供临床诊断相关的建议。第二种为时间或流程触发,比如当医疗流程走到一个新的阶段,决策支持系统就将自动启动并为医务人员提供更多流程方面的建议[14]。HELP 系统是在临床应用中取得一定成功的系统之一。除了技术层面的挑战,如何最大程度地发挥CDSS 等大数据分析系统在临床过程中的应用价值面临很大挑战。这个领域也是用户体验研究和设计所应当发挥重要作用的域。首先,临床过程非常复杂,它涉及多种角色,包括医生和护士以及多个部门急诊、门诊和实验室等,如何将大数据分析与临床过程有机地结合并提供情景化的决策支持是一个问题。目前较为成功的系统多数集中于针对单病种的临床决策支持,大范围覆盖多个病种并与医疗过程有机结合的成功案例还十分少见。其次,如何有效地评价大数据分析在临床诊断过程中的效果仍面临挑战。找到合适的评价框架和结构化指标将百利而无一害。有效的评价系统能帮助定义信息技术产品,还可以帮助医疗机构选择适合的系统并促进市场的成长。
2. 个性化医疗
个性化医疗也即英文中的personalized medicine/health care,是一个专用术语,它代表着现代医疗模式发展的重要趋势之一。传统的医学诊疗依赖于病人症状、以往的疾病和治疗、家族病史以及各种医学测试和影像的结果,其后续的诊断和治疗过程相对模式化。此外,传统医疗模式是被动的,只有当病人出现某些症状之后医疗过程才开始展开。个性化医疗则强调根据病人个体的具体情况包括基因信息开展个性化的治疗、用药等医疗诊断和治疗过程[15]。个性化医疗概念的出现即由基因测序技术的出现而触发。我们了解一个病人相关的基因序列,就有可能知道哪类药物及何种计量对治愈该病人更为有效。随着人们对于基因与疾病之间关系的深入了解,基因技术可以帮助个体预测疾病发生的可能性,从而促进整个医疗模式由被动且模式化到主动且个性化的改变。当然,个性化医疗已经不限于用药,还覆盖其他诊断和治疗过程,因此就中文翻译而言,个性化医疗比个性化用药更能体现该概念的内涵。此外,个性化医疗的概念仍然在演化过程中,在不久的未来随着可穿戴设备和传感器技术的发展和应用,更多用户数据将被纳入到数据分析的集合中来,以支撑个性化医疗模式的展开。
基因测序是个性化医疗的基础之一。基因测序技术被广泛应用于基因生物学和医学研究,并催生了生物信息学这门新的学科。但是基因测序技术在临床治疗上的应用还面临着几个主要的挑战。首先,基因测序技术仍然主要应用于生物医学研究,其临床应用的有效性还需要进一步的实践验证。其临床应用的有效性本身包含三个方面:一是基因测序技术本身的正确程度;二是基因测序对于疾病和健康状况评估的准确程度;三是基因测序对于临床诊疗指导的准确程度[16]。三个方面都需要更多的验证才能保证基因测序在临床上的应用不会风险大于好处。错误的基因信息及其解读有可能滋生许多社会问题,比如疾病风险导致的歧视以及性别选择等。例如,基因测序可能会导致某些患病概率较高的群体付出更高的医疗保险费甚至被商业保险排除在外。其次,基因测序在临床上的应用缺乏有效的伦理行为指导准则,在很多国家和地区也缺乏相应的医疗政策支持和监管流程。尽管国际卫生组织已经颁布了相关的伦理指导意见[17],但是在实践过程中这些规则还是很少得以有效应用。很多国家还在研究相应的政策来规范基因技术在临床上的应用。再次,在技术层面上,基因测序产生的数据和信息与电子医疗档案(EMR)整合是保留基因测序信息并进行二次或多次应用的方式之一。但是如何将有效的基因信息与其他医疗测试信息相结合呢?有人认为,由于基因信息所承载的高风险性,基因信息应当单独存储。另外一派则认为,为了更好地应用基因信息,基因信息应当与其他相关的测试信息有机地结合起来。不同的结合方式对于电子档案以及基因测序系统设计的要求是不同的。在这个领域,用户体验研究者应当与医疗机构合作,共同探索基因测序技术在临床应用上的合理方式,并为相关系统、政策以及流程的规划提供信息。

结语
大数据分析在医疗行业具有广泛的应用前景。首先,医疗行业各个主要角色已经或者开始积累大量数据并为大数据分析创造了条件。不同数据集合的整合和分析面临政策和利益诉求的挑战,但是也带来了新的机遇。其次,医疗行业是一个生态系统并面临诸多问题,大数据分析为解决这些系统性问题提供了新工具。
注释:
[1]Angelina Jolie.www.nytimes.com/2013/05/14 /opinion/my-medicalchoice.html. 2013
[2](英)维克托•迈尔-舍恩伯格:《大数据时代》,盛扬燕、周涛译,浙江人民出版社,杭州,2012 年12 月。
[3] James Manyika, et al., “ig Data: the next frontier for innovation, competition,and productivity” Report from McKinsey Global Institute, May 2011.
[4]World Health Organization, World Health Statistics 2013,2013.
[5] 国家应对人口老龄化战略研究http://baike.baidu.com/link?url=OK GviH46vGwJqmA4JajiO CCJf_DKBkZWax_doQ EcatlItsGgDpD5Yi5w5d dDqrKVHGefTDcMfB2c UtMPeZP8_K#5
[6] http://www.big5. ahradio.com.cn/news/ system/2011/10/01/001812381.shtml
[7]http://www.forerunsystems.com/news/bid/291374 /Making-or-Breaking-ED-Patient-Satisfaction-The-EMR
[8] William M. Tierney,J . Marc Overhage,Clement J. McDonald."Demonstrat ing thee ffects o f an IAIMS on health care quality and cost". Journal of the American Medical Informatics Association, 1997 Mar-Apr; 4(2),pp.41-46.
[9] Gilmer TP, O’onnor PJ, Sperl-Hillen JM, Rush WA, Johnson PE, Amundson GH, Asche SE, Ekstrom HL. "Cost-effectiveness of an electronic medical record based clinical decision support system". Health Serv Res. 2012 Dec; 47(6), pp.2137-2158.
[10] Rothman, Brian;Joan.C.Leonard ; Michael . M. Vigoda ( 2012 ) . “Future of electronic health records: implications for decision support” Mount Sinai Journal of Medicine79 (6), pp.757– 768.
[11]http://www .simulconsult.com/
[12]http://www .diagnosispro.com/
[13] Yu, V.L. et al. (1979).“ntimicrobial selection by a computer:ab l in dede valuation by infectious disease experts” Journal of the American Medical Association 242 (12),pp. 1279–282.
[ 1 4 ] G a r d n e r R M ,Pryor TA, Warner HR. "The HELP hospital information system: update 1998". Int J Med
Inf. 1999 Jun 54(3),pp.169-182.
[15] Ginsburg, G. S.; Staples, J.; Abernethy,A. P. (2011). "Academic Medical Centers: Ripe f o r Rapid-Lear ning Personalized Health C a r e " , S c i e n c e Translational Medicine 3(101): 101cm27.
[16]ShoenbillKL , Fost N, Tachinardi U, et al., "Genetic data and electronic health
records: a discussion of ethical, logistical and technological considerations". J Am
Med Inform Assoc 2014; 21, pp.171-180.
[17]Andermann A ,Blancquaert I , Beauchamp S,etal."Revisiting Wilson
and Jungner in the genomic age: a review of screening criteria over the past 40 years". Bull WHO 2008; 86,pp.317–19.