第三节 健康医疗大数据应用

健康医疗大数据的应用可以为患者、医务人员、卫生健康行政机构和产业发展等提供服务与协助,不仅有利于提高医院管理精细化水平,降低医生疾病诊断误判率,提升医院服务效率,还在增强医院综合竞争力、深化医改等方面起到了关键作用。

一、服务对象

健康医疗大数据应用服务对象包括社会公众、医院、基层医疗卫生机构、公共卫生机构、卫生健康行政部门、医疗卫生相关部门等6个核心应用对象。

1.社会公众

以社会公众为主体的大数据应用主要用于居民健康管理。随着移动医疗APP、可穿戴设备、远程医疗、家庭医生服务等基于移动技术的健康服务模式兴起,居民电子健康档案的逐步完善,已可以通过健康数据的整合、分析和应用为居民提供更为精确的健康管理服务。

社会公众应用主要包括3个方面:①通过对社会公众就医行为的大数据分析,优化诊疗服务流程,使就医流程更加通畅便捷;②在疾病预测和早期干预方面,特别是基因测序等新技术的发展促进了大数据应用,使对疾病或可能发病因素的预测和早期干预、治疗成为可能;③借助大数据手段对社会公众健康危险因素进行分析,提供个性化健康保健指导,使社会公众能够在社区或家庭得到连续性的健康服务。

2.医院

以医院为主体的大数据应用主要针对患者医疗服务、临床科研、医院管理、医务人员技能提升等。

患者医疗服务方面,随着电子病历不断完善,借助大数据分析相关的医疗数据,例如对患者特征进行分析、对多种诊疗方案进行比较,可为临床决策提供信息支撑,有效解决过度治疗或治疗不足问题。用药与医嘱自动提示能够减少处方误开的可能性,降低医疗纠纷的发生概率。

临床科研方面,可以利用电子病历数据在疾病诊断、治疗方案优化、专科疾病分析等方面进行临床科研,提升医学研究或医疗服务质量。

医院管理方面,通过大数据分析技术,可以全面掌握医疗质量存在的问题和医疗资源分配不合理的地方,协助管理层作出更准确的决策。

医务人员技能提升方面,例如通过对患者用药、检查、手术、治愈情况等数据分析,获得疾病、用药、治疗方法、检查检验信息、转归情况等关联信息,可有效提升医务人员诊疗水平。

3.基层医疗卫生机构

随着医联体、分级诊疗、远程医疗的开展,国家对基层医疗卫生机构的医疗水平要求将会逐步提高。以基层医疗卫生机构为主体的大数据应用主要包括2个方面:①利用电子健康档案数据分析完善居民健康管理服务,开展健康监测、慢病管理、疾病早期干预等大数据应用;②辅助诊断系统,借助大数据分析和人工智能技术进行疾病诊断。

4.公共卫生机构

大数据技术可以连续整合和分析公共卫生数据,提高疾病预报和预警能力,减缓疫情暴发。公共卫生机构可以通过区域全民健康信息平台和居民健康档案分析,进行传染病快速检测和疫情监测。通过提供准确和及时的公众健康咨询,提高公众健康风险意识,降低传染病感染风险。

5.卫生健康行政部门

卫生健康行政部门主要针对区域内医疗卫生机构各业务进行监管。主要包括:①医疗服务智能监管,根据医疗机构诊疗服务数据,对医疗服务行为、质量进行监管;②医改监测分析;③药品、耗材、费用、计划生育服务等监管;④全民健康信息平台大数据分析应用,例如疾病分析、流行病分析、慢性病分析、死因分析、用药分析等,辅助管理者进行决策以及政策制定。

6.医疗卫生相关部门

在医疗卫生服务过程中还涉及其他相关部门的数据资源共享与利用,包括人社、银行、保险、公安、民政、工商、教育、统计等相关部门。健康医疗大数据的应用将会为其他部门的发展提供便利。例如通过全省流动人口监测、人口数量分析等人口健康相关大数据分析,为人社部门进行就业状况与社会保障提供决策支持,为公安部门建立完善的人口监测提供数据支撑。提供居民诊疗数据及费用信息,便于医疗保险部门提供医疗保障服务。通过对职业病监测、危险因素分析等职业病相关大数据分析,可以为人社、安全监管、检验检疫等相关部门就业安全保障提供决策支持。

二、业务分类

健康医疗大数据应用主要依据公共卫生、医疗服务、医疗保障、药品管理、计划生育、综合管理等6大业务进行分类,同时整合“互联网+”、多部门数据联动分析、精准扶贫、产业发展等应用,以全员人口库、电子健康档案、电子病历3大基础数据库及卫生资源数据库为主要数据来源,分析目前已有业务系统或平台功能,根据健康医疗大数据应用现状及应用需求,进行健康医疗大数据应用场景分类。

1.公共卫生

主要针对健康管理、传染病监测、慢性非传染病监测、卫生计生监督、应急管理等方面的应用,数据来源主要包括:①健康数据,包括电子健康档案、个人体征监测、健康体检、康复医疗、健康知识等数据;②公共卫生数据,包括疾病预防控制、卫生计生监督、医疗救治、血液管理、卫生应急指挥、妇幼保健、精神卫生管理等数据;③其他行业数据,包括地理、气象、教育、农业等行业数据及互联网数据。

公共卫生方面主要有以下应用:①健康管理,对居民电子健康档案、体征监测、健康体检、生活行为等数据进行综合分析,可为居民提供个性化的精准健康管理服务;②慢病管理,以居民电子健康档案数据为基础,借助移动互联技术、大数据技术等对慢病患者的生活行为、生命特征等进行分析,给予患者实时的健康风险评估和智能预警,及时提出有效的干预措施;③疾病预防与控制,主要针对传染病、非传染病、职业病等疾病进行监测与预警,分析各类疾病发病原因、疾病特征、人群分布等,为疾病及时防治提供决策支持;④其他应用,包括健康教育、卫生应急、食源性疾病事件探测等。

2.医疗服务

医疗服务大数据应用主要包括就医服务、辅助诊疗、中医疾病诊疗、特殊疾病诊疗、医院业务监管等。数据来源包括:①临床诊疗数据,电子病历、医学影像、患者就诊、住院、用药记录、标准化临床路径等;②机构运营数据,成本核算数据、医药、耗材、器械采购与管理数据、医疗费用数据等;③医疗保险、制药行业、药械销售等相关行业大数据以及与健康医疗紧密相关的生命科学、人口学和环境科学等相关学科大数据。

医疗服务方面主要有以下应用:①就医服务,利用患者就医诊疗数据,分析疾病分布特征,为患者提供准确合适的就诊单位与医生,优化患者预约就诊流程;②辅助诊疗,医疗诊疗服务涉及疾病诊断、检验检查、治疗等,借助专家系统、人工智能诊断、知识库、数据挖掘等技术,为疾病诊断、病理诊断、影像识别、治疗方案优化等提供更精确的辅助决策;③中医疾病诊疗,主要分析中医证候与症状、中药配伍与疾病治疗、药物作用机制与疾病治疗等关联性分析,发现中医诊治疾病规律及治疗疾病的用药规律,有利于提高中医药治疗疾病的水平;④特殊疾病诊疗,分析特殊疾病的发病原因、智能诊断模型、发病模式、治疗方案有效性等,为专科疾病的诊疗优化与预后提供便利,为疾病的早期预防与及时诊疗提供辅助决策;⑤医院业务监管,包括医院业务数据、医院诊疗质量、药械流通使用、绩效考核、成本核算等方面的应用。

3.医疗保障

主要在医保费用控制、医保监控等两个方面开展应用,数据来源主要是电子病历诊疗数据、电子健康档案、医保监管系统等。构建基于大数据的医保基金风险防控体系,可以使医保工作人员及时转变传统的工作方式,以准确和科学的数据作为各项决策制定的参考依据,有利于全面提升医保基金监管能力;利用大数据辅助医保经办机构进行医保费用智能审核与监控,辅助医疗机构进行费用控制与绩效管理的专家型信息系统,实现事前提示、事中预警、事后审核的医保全流程审核管理和智能化监控。

4.药品管理

利用大数据技术对药物研发数据、药品使用数据、费用数据、疾病-药物关联数据等进行分析,可用于药物开发、药物疗效分析、药物不良反应分析、药品需求分析、合理用药等。

5.计划生育

主要应用于人口监测、计划生育服务监管、妇幼保健等方面。①人口监测:依托全员人口库、人口计生服务管理信息系统等,对出生人口信息、流动人口信息、贫困人口信息等进行管理,加强人口信息的监测评估和统计分析,为人口监管提供决策支持;②妇幼保健:基于妇幼保健服务管理信息系统的数据进行分析,针对接种服务、妇女保健、儿童保健等等工作开展情况进行监测。

6.综合管理

基于大数据技术对医院运营数据、卫生资源数据、卫生综合管理数据等进行分析,应用于医院运营管理、卫生综合管理决策等。①统计指标分析:针对医疗费用、单病种、疾病负担、医疗资源分配等进行分析和监管;②医疗服务智能监管:对电子病历、电子健康档案、全员人口、卫生资源等数据进行分析挖掘,应用于卫生计生各类业务应用监管,为区域内医疗资源分配、医改效果监测、诊疗质量监管、远程医疗服务、分级诊疗监测等提供决策支持;建立医疗服务质量智能监管系统,实现医疗服务实时监管、精准点评、分析决策等应用。

7.产业发展

产业发展是健康医疗大数据发展的重要环节,基于健康医疗业务与大数据技术的深度融合,构建健康医疗大数据产业链。通过健康医疗大数据与医药产业的深度融合,可用于医药市场需求量分析与预测、医药研发、医药精准销售等,带动医药产业链的发展。将健康医疗大数据与生物医学相结合,可为居民提供精准医疗服务,带动医学、生物医学等学科及相关产业链的发展。通过健康医疗大数据与养老、旅行、智能健康设备研发等产业相融合,可进一步培育市场新业态,带动产业发展。

8.互联网+

“互联网+”代表一种新的经济形态出现冲击着不同的行业。而对于医疗行业,互联网改变的不仅仅是健康产品和健康服务,也改变着医疗管理模式和医患沟通模式。通过综合互联网信息技术和相关扶贫政策,以大数据和云计算为技术支撑,将“互联网+”和精准扶贫战略有机结合,实现扶贫体系的完整性、扶贫政策的精确性和扶贫管理的动态性;通过将“互联网+”与健康管理相结合,实现个性化健康服务;通过将“互联网+”与健康医疗相结合,彻底颠覆传统医疗模式,使得医疗模式变得更为智能。

三、应用方向

1.医疗服务

随着我国城乡医疗服务体系信息化建设的不断推进,健康医疗大数据在医疗服务领域的应用也越来越广泛,包括循证医学、移动医疗、临床决策支持、人工智能诊断、诊疗方案成本效益分析、比较效果研究、临床质量分析、用药服务、药物不良反应分析、医疗不良事件分析、医疗器械安全性分析与评价、患者行为预测等。

国外的医疗服务主要包括疾病诊疗、风险评估与预后、临床决策支持、预测疾病发展、合理用药、诊疗方案成本效益分析等。例如Krajnak等结合机器学习和关键规则方法,都建立了以预测ICU死亡率为目标的算法模型,这些算法模型取得了比现有基于评分规则的APACHE和SAPS-Ⅱ等模型更好的评估效果,在疾病风险评估、病情恶化预警以及死亡率预警等领域具有广泛应用;Feldmann和Liebeskind等探索了神经血管成像的进展以及利用CT和MRI成像等对脑血管疾病进行评估,实现精准诊断;Kotfila等运用支持向量机算法对肥胖症、动脉粥样硬化、高脂血症、高血压、糖尿病等5个疾病数据集进行分类分析等。

目前医疗健康行业成本高昂的部分原因来自医疗失误和医疗浪费。根据1998年美国医疗协会的报告,仅仅在美国可以避免的医疗失误每年造成了98 000起死亡案例。美国花在医疗健康上的费用超过1 700亿美元,而中国每年花费在医疗健康上的费用超过30 000亿元人民币。在此背景下多国通过改革医疗系统以减少医疗失误及医疗浪费,最终削减医疗开支。美国于2011年通过的关于医疗健康信息技术的HITECH法案宣布:决定投入500亿美元在5年内使用信息技术解决医疗行业存在的问题。而中国在2009年宣布了花费1 200亿元人民币的10年医疗系统改革计划的第一部分。

澳大利亚分析了医疗保险行业,认为使用目前的验证技术无法有效发现医疗服务中存在的欺诈、滥用、浪费、错误等现象,原因在于旧的验证技术只关注单个病例,无法利用多个病例间的联系。以医疗账单为数据源,建立关于治疗费用、住院时间等数据的预测模型,使用数据挖掘技术发现账单中的异常数据;使用领域专家建立的规则库分析异常账单,发现其中可能存在的问题并给出警告。典型的应用环境包括医疗器材滥用、手术过程与病情诊断不符、过度收费等。提早检测出医疗过程中的问题将为国家保险机构、患者、私立保险机构节省大量花费。

2.健康管理

在我国智能健康管理实现的是区域化、多级、多中心的实时互动健康管理模式,将不同区域不同级别的信息传输到健康信息管理平台,对个人的健康状态进行实时监护,形成区域协同多级多中心的健康服务体系。健康医疗大数据是智能健康管理能够实现的坚实基础。健康医疗大数据在智能健康管理方面的应用包括患病风险预测、慢病管理、健康评估预警、康复跟踪、健康处方制定、健康异常提醒、远程健康监测设备研发等。

在国外对居民实时监测数据的集成、分析有助于临床医生和家庭医生提供远程医疗服务。人工胰腺项目应用数据挖掘技术对血糖数据和胰岛素之间关系进行研究设计,有助于糖尿病患者的自我健康监测管理,通过监控人的血糖数据并调控符合人体需要的胰岛素水平。可穿戴设备、无线通信、数据挖掘算法及工具等的联合应用,可以全面了解糖尿病患者的身体状况。研究表明,目前在智能设备(可穿戴式身体传感器、身体功能监视器)、生活方式数据监测(饮食、睡眠)、移动设备(智能手机、平板电脑)和临床数据等方面已开展了大量的工作,重点在于借助大数据技术将各类数据进行集成分析,不仅有助于建立对整体生活方式的理解,也有助于更好地预防保健。

3.疾病预防与控制

疾病预防与控制主要针对两类疾病:①流行病,通过全球定位系统信息和疾病流行数据,应用大数据技术在短时间内确定患者到过的场所、可能的感染者和传播途径,从而提高公共卫生人员对疾病追踪、早期预警等能力;②慢性病,通过对患病群体特征数据、地域数据、生活习惯数据等进行分析,掌握慢性病发病趋势并制定预防措施。国内主要应用包括传染病预警预报、舆情监测预警、病原体快速筛检、慢性病发病趋势、疾病干预效果模拟与分析等。

国外大数据技术将人口统计学信息、地理学、各种来源的疾病与危险因素数据整合起来进行实时分析,并可实现连续跟踪和处理,有效调度各种资源,提高疾病预报和预警能力,防止疫情暴发。麦肯锡公司认为大数据在公共卫生领域的应用包括:①分析流行病传播方式并全面监测疫情;②开展疫苗的精确研发;③将健康医疗大数据转化成可用消息,提供流行病预测服务。随着微博、Twitter等社交媒体作为支持健康医疗应用和政策发展的临床数据越来越多,专家开始利用地图结合网络健康数据进行分析,进行传染病监测。

2009年Google比美国疾病控制与预防中心提前1~2周预测到甲型H1N1流感暴发,此事件震惊了医学界和计算机领域的科学家,Google的研究报告发表在《Nature》杂志上。Google正是借助大数据技术从用户的相关搜索中预测到流感暴发。随后百度公司也上线“百度疾病预测”借助用户搜索预测疾病暴发。借助大数据预测流感暴发分为主动收集和被动收集,被动收集利用用户周期提交的数据分析流感的当前状况和趋势,而主动收集则是利用用户在微博的推文、搜索引擎的记录进行分析预测。Flu Near You借助用户周期提交的自我流感检测来预测流感的暴发。首先用户在Flu Near You的网站上注册,随后每个星期用户将收到一封电子邮件,指引用户登录Flu Near You网站,在网站上用户填写一份关于自己是否有流感症状的调查。最终Flu Near You收集信息并利用大数据技术生成目前流感疾病和未来流感疾病预测的可视化图表。流感暴发初期通常伴随着用户在搜索引擎搜索相关内容或在社交网络上发布相关内容,这些信息可以作为流行病暴发的初期预警。以用户在Twitter上的推文,以及英国健康保健局发布的城市流感样病例率为数据源,通过LASSO算法进行特征选择,选择推文关键字建立未来数天流感样病例率的预测模型,取得比较精确的结果。在疾病传播中长时间与病原体接触会增加感染的概率,因此追踪人口接触信息以及人口位置信息将有助于了解流行病的行为。设计了一套使用智能手机自动收集人口位置信息与接触信息的应用,将流行病数据源分为媒体(包括官方媒体)、移动设备、社交网络、Pro-Med邮件列表、实验室和医院数据,并根据不同数据来源设计了一套收集数据、分析数据、验证数据、数据可视化的系统,用以直观表现流行病的情况。

4.精准医疗与药物研发

精准医疗是以个体化医疗为基础,其本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对于大样本人群与特定疾病类型进行生物标记物的分析与鉴定、验证与应用,最终实现对于疾病和特定患者进行个性化精准治疗的目的,国内目前主要应用于疾病诊断、治疗及个性化用药。

国外大数据分析能够从已有的或是实时收集的医疗数据中提取有用信息,为患者个性化治疗提供参考,例如Jeffrey GK利用大数据挖掘方法从11 344份医嘱数据中抽取50个因素组成贝叶斯网络,实现了实时更新的个体化最优用药方案推荐,对帮助临床决策,实现慢病患者规范化、个体化治疗有十分重要的意义。而精准医疗则通过基因组学、蛋白质组学、转录组学、结构基因组学、功能基因组学等,科学地认知人体功能与疾病本质,主要应用于疾病诊断、精准治疗、药物研发等。

5.中医药领域

中医药数据具有整体性、关联性、相关性和多样性等特征,大数据技术同样可以应用于中医药领域。目前大数据在中医药领域主要应用于疾病特征分析、中药作用机制研究、方剂作用机制研究、中医诊疗规律分析等。

6.临床科研

利用电子病历数据在疾病诊断、治疗方案优化、专科疾病分析等方面进行临床科研,提升医学研究或医疗服务质量。例如IBM公司Watson通过使用文本挖掘,发现了活化酶之间的相似性模型,并利用认知计算大型非结构化数据集,找出了能使P53磷酸化的两种高度活化酶PKN1和NEK1,并进一步通过实验来测试这些活化酶在生物体内的活动。IBM沃森已经被应用于癌症激酶和药物的研究,此外还将用于预测基因或蛋白质组合在疾病发作或进展中的作用,通过组合结构化和非结构化数据来进一步增强预测模型,将有助于加速有关疾病起源、作用途径和药物靶标以及药物副作用的研究。