- 健康医疗大数据安全与管理
- 陈敏 周彬 肖树发主编
- 1981字
- 2025-03-14 19:13:21
第二节 健康医疗大数据平台架构及组成
一、平台架构
健康医疗大数据平台可通过多种方式实时/准实时、批量采集各种类型的健康医疗大数据,汇聚到上层存储空间,并对其进行数据清洗、脱敏、标准化、关联、融合等处理,整合汇聚为基础数据库、业务数据库和主题数据库等,并对健康医疗大数据分析与应用提供SQL、POSIX等多种访问接口。健康医疗大数据平台架构如图2-5所示。

图2-5 健康医疗大数据平台架构
二、平台组成
健康医疗大数据平台架构包括数据源层、数据采集层、大数据中心、应用层以及标准规范体系和安全认证体系。
1.数据源层
健康医疗大数据平台所涉及的数据主要来源于医疗卫生机构、相关医疗卫生机构以及相关行业机构。
(1)医疗卫生机构:
医院、疾病预防与控制中心、妇幼保健机构、基层医疗卫生机构等医疗卫生机构为健康医疗大数据的主要来源。随着医院信息化的不断深入,EMRS、PACS、LIS、RIS、CPOE等临床服务系统,门急诊收费系统、住院收费系统、护理管理系统、医务管理系统、病案管理系统等医疗管理系统以及人力资源管理系统、财务管理系统、预算管理系统、药品管理系统等运营管理系统积累了大量医疗数据,这些数据是健康医疗大数据资源的主要内容,例如血尿常规数据、CT图像、电子处方、门诊(住院)收费明细、病案首页数据等。此外,在公共卫生领域中,随着各类监测系统和网络直报平台的建立与完善,区域全民健康信息平台采集与存储了大量公共卫生大数据,例如结核病患者病案记录信息、细菌性痢疾监测报表、地氟病监测信息、PM2.5质量浓度分析记录信息等。另外,区域全民健康信息平台存储了大量居民电子健康档案,也是健康医疗大数据的重要来源之一。
(2)相关医疗卫生机构:
除了医院、疾病预防与控制中心等医疗卫生机构外,相关医疗机构也是健康医疗大数据的重要来源,例如基因测序公司产生的基因数据、互联网医疗公司产采集的在线问诊复诊网络大数据、健康监测设备运营商存储的自我量化大数据、互联网搜索数据等。
(3)相关行业机构:
人体健康、医保医药等不仅与健康医疗本行业有关,与银行、公安、气象、民政、农业其他行业也有密切联系,因此需尽量采集相关行业的数据为健康医疗大数据分析奠定基础。
2.数据采集
数据采集层针对多源异构、分布信息系统实现对目标数据源数据项的采集,支持多种标准的传输接口、多种格式的数据接入。该层采用Web Service、API接口、数据库直连、FTP拉取、Flume、Sqoop、Falcon、Kafka等技术,对离线数据批量采集、流式数据实时采集,将各种结构化、半结构化和非结构化的健康医疗大数据汇聚到上层存储空间中。
3.大数据中心
大数据中心为健康医疗大数据平台的核心技术层,用来处理健康医疗数据。通过数据采集层采集数据汇集到大数据中心形成业务数据湖,大数据中心对数据湖中数据进行处理,基本处理功能包括①数据整合:将从各个系统中获取的数据进行整合,实现数据综合利用;②数据自动化处理:处理过程可以实现自动处理,避免人工实时干预;③数据安全性:数据处理过程要保证数据安全性,做到数据保密性、数据完整性、数据可利用等。
4.应用层
健康医疗大数据应用广泛,例如个性化健康指导、临床辅助诊疗、传染病预测与管理等,对个人、医疗卫生机构、公共卫生机构、卫生健康行政机构、医药生产经营企业、医疗保险机构等均有不同应用。
5.标准规范体系
标准规范体系是健康医疗大数据平台的重要保障,平台搭建主要参照HL7 CDA文档、术语标准等相关标准,例如《中国卫生信息数据元值域代码》《电子病历基本数据集》《电子健康档案基本数据集》、LOINC等。
6.安全认证体系
安全认证体系贯穿于整个健康医疗大数据体系中,包括数据安全、应用服务安全、架构安全、认证鉴权和隐私安全等方面。
(1)数据安全:
数据安全是安全认证体系的重要组成部分。健康医疗大数据平台需要采取数据备份、数字水印、防火墙、数据加密等多种技术与方法来保证数据的机密性、完整性和可用性,从而保证健康医疗大数据在采集、传输、存储、管理、分析、发布、交易、使用和销毁过程中的安全。
(2)应用服务安全:
健康医疗大数据平台接入的应用服务较多,在分析设计和实现应用服务时需严格审查,避免安全漏洞,同时对各类应用服务提供管理控制和监控,确保应用服务使用可控和可查,确保应用服务安全。
(3)架构安全:
为保证健康医疗大数据平台网络结构、功能结构的安全性,供应商或者系统自身需要根据漏洞或补丁情况制定相应的维护操作规定。成立相应的运营团队负责日常运行工作,并具备紧急事件响应处理能力,提供应急预案。
(4)认证鉴权:
针对健康医疗大数据使用的相关单位、个人用户,应建立完备的用户、角色分级机制,不同等级的角色和用户分别具备不同的权限。平台相关使用单位和个人需要定期进行安全教育培训,以增强人员的安全意识,降低安全风险。
(5)隐私安全:
健康医疗大数据平台中涉及的隐私内容必须加以严密保护,对隐私数据进行脱敏处理,并不能通过多片段组合等方式回溯至原始数据。