第四节 健康医疗大数据安全管理

一、安全管理概念

健康医疗大数据安全管理是指在数据采集、传输、存储、管理、分析、发布、交易、使用、销毁等多个环节中的安全管理,涉及国家战略安全、群众生命、个人隐私的安全管理工作。结合国家有关大数据安全管理规范及指南,采取有效措施确保数据的保密性、完整性、真实性、可控性、可靠性和可核查性。

大数据已经逐步应用于产业发展、政府治理、民生改善等领域,大幅度提高了人们的生产效率和生活水平。适应、把握、引领大数据,将成为时代潮流。大数据是重要的战略资源,但数据资源的价值只有在流通和应用过程中才能够充分体现出来。这就要求打破传统垂直应用中所形成的数据孤岛,形成适应大数据时代的数据湖,并需要数据在不同应用之间流动,这难免会出现数据泄露和滥用问题。在发展大数据的同时,也容易出现政府重要数据、法人和其他组织商业机密、个人敏感数据泄露,给国家安全、社会秩序、公共利益以及个人安全造成威胁。大数据安全是发展大数据的前提,必须将它摆在更加重要的位置。大数据系统自身安全防护具有重要意义。从数据的层面来看,大数据自身安全涉及数据采集、数据传输、数据存储、数据管理、数据分析、数据交易、数据使用、数据发布以及数据销毁9个环节,每个环节都面临不同的威胁,需要采取不同的安全保障措施,这些工作都是保障大数据安全的重要内容。从系统的层面来看,保障大数据自身安全需要从大数据系统的各部分采取措施,建立坚固、缜密、健壮的防护体系,保障大数据系统正确、安全、可靠地运行,防止大数据系统被破坏、被渗透或被非法使用。从服务的层面来看,规范大数据安全服务内容,提高对大数据安全的风险识别能力,建立健全的大数据安全保障体系,降低大数据安全隐患和安全事件发生频率。未来在大数据应用的飞速发展过程中,大数据安全问题将始终伴随左右。针对大数据安全问题和安全风险,必须加大大数据安全技术的研究力度,必须以现有安全技术为依托,深入研究新型的大数据安全技术,例如同态加密技术等。确保大数据在存储、处理、传输等过程的安全性,在充分挖掘数据价值的同时保护用户隐私,从而避免因大数据安全问题而给用户的利益造成损失。需要进一步完善大数据安全相关法律体系建设,对数据权属界定、数据流动管理、个人信息保护等各种问题,给出明确规定。需要创新研制和推广大数据安全保护的产品和服务,基于大数据研制网络安全产品和服务,推动大数据安全市场发展,保障大数据时代的信息安全。

二、安全技术

安全管理中的技术要求体现了从外部到内部的纵深防御思想。对健康医疗大数据的安全防护应考虑从平台设施安全、接口安全、数据安全、应用系统安全,从内到外、从部分到整体的技术防护体系。级别较高的等级保护对象还需要考虑对分布在整个系统中的安全功能或安全组件的集中技术管理手段。本书涉及的安全技术主要是平台设施层安全技术、接口层安全技术、数据层安全技术、应用系统层安全技术等四个方面,平台设施层的安全技术主要是针对健康医疗大数据平台存储、运算资源及相关的功能的安全保障,包括存储安全、网络通信安全、系统边界安全、计算环境以及平台管理安全。接口层安全防护主要解决围绕健康医疗大数据平台有关各方之间的接口面临的安全问题,例如重要数据的隐私泄露、不明身份的入侵、数据损失等,进而采取一系列技术维护接口层安全技术。数据层安全技术主要是从数据的采集环节、数据存储环节、数据分析环节以及数据发布环节来介绍。在数据采集环节遇到的安全问题主要是数据汇聚过程中的传输安全问题;数据存储环节遇到的问题是数据的机密性和可用性,需要给数据提供隐私保护;数据分析环节要重点防止机密信息的泄露;数据发布环节需要进行安全审计,并保证可以对可能的机密泄露进行数据溯源,防止信息被滥用。应用系统层安全防护主要解决的是应用系统面临的安全问题,例如访问控制、僵尸攻击、平台攻击、运行干扰、远程操控、APT攻击、业务风险等。

三、安全管理

1.安全管理生命周期

从数据进入健康医疗大数据平台开始,以数据被销毁为结束,数据主要包含数据采集、数据传输、数据存储、数据管理、数据分析、数据交易、数据发布、数据使用以及数据销毁9个环节。

(1)采集:

采集活动包括数据获取或创建过程,数据收集方式包括但不限于:①网络数据采集。通过网络爬虫或公开API等方式获取数据;从其他组织获取数据;通过线上或线下等方式获得数据;通过传感器获取;传感器包括温度传感器、电视、汽车、摄像头等公共和个人的智能设备。②系统数据。医疗及其他单位内部的系统运行过程中产生的业务数据,以及各种系统、程序和服务运行产生的大量运维和日志数据等。

采集活动的主要操作包括:发现数据源、采集数据、生成数据、缓存数据、创建元数据、数据转换、数据验证、数据清理、数据聚合等。

(2)传输:

数据传输系统的输入输出设备为终端或计算机,统称数据终端设备,它所发出的数据信息一般都是字母、数字和符号的组合,传送这些信息需将每一个字母、数字或符号用二进制代码来表示。数据传输安全关注数据在传输过程中的机密性和完整性,包括数据共享管控风险、跨系统数据传输风险和跨境数据管控风险等问题。

(3)存储:

数据存储指将数据持久保存在大数据平台,存储的数据包括收集的数据、分析结果数据等。存储系统可以是关系数据库、非关系数据库等,应支持对不同数据类型和数据格式的数据存储,且提供多种数据访问接口,例如文件系统接口、数据库接口等。直到数据被删除之前,存储的数据均可被组织合规使用。在某些情况下,将使用第三方的数据存储平台保存数据,此时就失去对存储基础设施的部分控制权,因此应充分考虑这种方式存在的安全风险。

存储活动的主要操作包括:数据编解码、数据加解密、数据持久存储、数据备份、数据更新、数据访问等。

(4)管理:

数据在收集、传输和存储中管控是大数据管理安全的重要内容,对内部数据适用范围以及数据流转过程的规范化控制管理可以有效防止敏感数据信息被非法运用。数据管理环节中,会出现数据隐私、质量和安全机制方面的管理不当导致数据滥用和被窃取的问题。数据管理安全主要包括数据隐私问题、数据质量问题以及安全机制问题。

(5)分析:

数据通过分析才有价值,大数据处理中最核心的一步就是数据分析,大数据分析实质上是根据数据生成机制,对数据进行广泛的采集与处理,并对数据进行存储,以大数据分析模型为依据,在集成大数据分析平台的支撑下,运用云计算技术调度计算分析资源,最终分析出大数据背后的模式或规律的过程。

常用的大数据分析方法及技术有机器学习、预测分析、可视化分析、语义引擎等等。

(6)发布:

数据发布是通过特定的技术平台将健康医疗大数据在相关门户或者网站上发布,其安全性尤其重要。在现实生活中,有很多机构需要定期对外发布数据,例如国家卫生健康委定期发布的医疗统计数据等。

近年来随着网络技术、数据存储技术和高性能处理器技术的高速发展,海量数据的采集、传输、分析和发布变得越来越便利。与此同时也给数据的安全管理带来了威胁。数据发布中个体可能面临隐私威胁,容易遭受的攻击形式主要有连接攻击、同质攻击、背景知识攻击和近似攻击等。同时数据发布的前中后期也会出现安全隐患。

(7)交易:

针对大数据交易面临的安全威胁,有必要加强安全施工措施方面的政策、法规、管理系统、人员、大数据平台和技术事务,以有效地保护数据安全和隐私大数据事务和促进健康和可持续发展的大数据事务服务行业。加快制定数据交易安全相关标准,规范数据交易市场,规范数据交易服务在数据交易平台、交易主体、交易对象、交易流程等方面的安全。数据交易安全管理主要包括5个方面:①数据交易合法合规原则;②主体责任共担原则;③数据安全防护原则;④个人信息保护原则;⑤交易过程可控原则。

(8)使用:

数据使用活动包括利用数据预处理、数据分析和数据可视化等技术,从原始数据中提取信息,提炼出有用知识,支撑组织根据数据作出合理的决策等操作。数据使用环节安全防护的目标是保障数据在授权范围内被访问、处理,防止数据遭窃取、泄露、损毁。为实现这一目标,除了防火墙、入侵检测、防病毒、防DDoS、漏洞检测等网络安全防护技术措施外,数据使用环节还需注意的安全隐患包括:分布式处理安全、数据分析安全、数据加密处理、数据脱敏处理、数据溯源等问题。

(9)销毁:

销毁活动指销毁组织的大数据平台或租用的第3方大数据存储平台上的数据及其副本。如果数据来自外部实时数据流,还应断开与实时数据流的链接。数据需要被删除的原因包括但不限于:①为了减少数据泄露的风险,避免数据被不适当地分发或使用;②删除不相关或不正确的数据,数据与最初使用目的不再相关,或数据不正确;③满足客户要求删除其数据的要求。但可能存在法律法规需要保留数据,例如和健康相关的数据。

数据销毁活动的主要操作包括:删除元数据、删除原始数据及其副本、断开与外部实时数据流的链接。

2.安全管理原则

(1)职责明确:

健康医疗大数据的安全管理需根据数据规模、数据重要性、组织规模等因素,由相关机构成立安全管理团队。其目的在于为组织内部的数据及使用安全负责。机构应明确组织内部不同角色的数据安全管理职责,并且应按照健康医疗大数据生命周期各活动确定角色及其安全责任。

(2)意图合规:

对数据的收集、使用应该基于法律依据。在安全管理的过程中,相关单位应制定安全管理流程确保数据的收集和使用方式没有违反任何法律责任,包括法律法规、合同条款等。相关安全管理单位需要确保所有组织内数据集和数据流的安全,正确处理个人信息、重要信息的使用。管理人员需要理解数据相关的法律义务,并确保整个组织履行了这些义务。

(3)质量保障:

安全管理应确保数据的准确性、相关性、完整性和时效性。相关组织可建立控制机制定期检查收集和存储数据的质量。

(4)分级授权:

责任单位应当根据单位卫生、医疗大数据管理的要求,确定相应的管理部门和职务,按照国家授权实行“统一授权”的管理体系,对应用进行分类管理,并按照权利和职责进行统一管理。并建立相应的医疗卫生大数据信息系统作为技术和管理的支持。

(5)最小授权:

在保证组织业务功能完整实现的基础上,应赋予数据安全管理活动中各角色最小的操作权限,确保非法用户或异常操作所造成的损失最小。并且所有角色只能使用所授权范围内的数据,使用非授权范围内的数据前要进行授权审批。

(6)数据负责:

控制数据的组织应对数据负责,当数据转移给其他组织的时候,责任不随数据转移而转移。另外当组织在转移数据前,需对数据进行风险评估,确保数据转移后的风险可承受,方可转移数据,并对数据转移给其他组织所造成的数据安全事件承担安全责任。此外,需确保通过合同或其他措施明确界定了接收方接收的数据范围和要求,确保其提供同等或更高的数据保护水平。

(7)数据保护:

对数据的保护要做到分类分级管理,对不同安全级别的数据实施恰当的安全保护措施。可选派专人检查大数据处理平台及应用的安全控制措施的有效性,从而保护数据的完整性、保密性和可用性,确保数据在整个生命周期里,免遭例如未授权访问、破坏、篡改、泄露或丢失等风险。在安全事件发生之前,组织应评估在安全检查中所发现的风险和脆弱性,并对数据安全防护措施不当所造成的安全事件承担责任。

(8)数据可查:

对数据进行修改、查询、导出、删除等操作时,要记录相应的操作,做到可追溯可审查。

3.安全管理内容

在互联网+医疗的大背景下,健康医疗大数据呈现越来越快速的增长,健康医疗大数据面临一些新的安全风险,例如数据关联分析可能暴露个人隐私,健康医疗大数据的冗杂、异构使得传统的安全机制不能满足要求,恶意的使用可能会给公共利益、国家安全等带来严重损害。健康医疗大数据安全管理的主要目的在于实现和维护数据保密性、完整性、可用性、可核查性、真实性和可靠性。具体管理内容有:①确定组织的数据安全目标、战略和策略;②确定组织的数据安全要求;③识别并分析对组织数据的安全威胁;④识别并分析组织数据安全风险;⑤规定合适的防护措施;⑥监督防护措施的实施与运行;⑦检测并及时响应数据安全事件。

4.法规和标准

健康医疗大数据安全的法律法规和标准的制定是数据保护的重要基础。发达国家已搭建较为成熟的健康医疗大数据服务平台,并在有效管理和技术升级上展开激烈竞争,美国、欧盟、英国、日本等国家和地区先后颁布了众多的法律法规和标准。美国在大数据发展上走在世界前列,出台了一系列政策保障大数据安全。2012年3月美国白宫科技政策办公室发布《大数据研究和发展计划》启动了网络内部威胁计划、任务导向的弹性云项目等多项与大数据安全密切相关的研究项目,为提升本国大数据安全能力奠定基础。欧盟及其成员国已制定大数据相关政策与战略,主要包括:数据价值链战略计划、资助“大数据”和“开放数据”领域的研究和创新活动、实施开放数据政策、促进公共资助科研实验成果和数据的使用及再利用。英国陆续出台了一系列大数据政策以完善顶层设计、加快数据强国建设。2013年10月英国商务、创新和技能部发布《把握数据带来的机遇:英国数据能力战略规划》,提出了一系列措施,其中在数据资产方面,指出要重视数据安全和隐私保护,完善法律和制度建设,合理进行数据共享和信息公开。2017年3月英国政府发布《英国数字战略2017》,旨在促进英国脱欧后适应未来经济发展,对打造世界领先的数字经济和全面推进数字转型列出了7大目标和具体措施。2012年7月日本总务省发布“活跃ICT日本”新综合战略,将大数据作为重点发展领域。2013年6月安倍内阁正式公布新IT战略《创建最尖端IT国家宣言》,制定了以开放大数据为核心的IT国家战略,要把日本建设成为一个具有“世界最高水准的广泛运用信息产业技术的社会”。近年来我国中央政府和地方政府高度重视数据开放共享工作,相继出台数据开放共享相关法律法规与政策。2015年8月国务院印发《促进大数据发展行动纲要》,提出加快政府数据开放共享,推动资源整合,提升治理能力。2016年6月国务院办公厅发布的《关于促进和规范健康医疗大数据应用发展的指导意见》中指出要推动健康医疗大数据资源共享开放。2016年12月工信部印发《大数据产业发展规划(2016—2020年)》,提出推动制定公共信息资源保护和开放的制度性文件以及政府信息资源管理办法,逐步扩大开放数据的范围,提高开放数据的质量。2018年3月国务院办公厅发布《科学数据管理办法》,旨在进一步加强和规范科学数据管理,保障科学数据安全,提高开放共享水平。

健康医疗大数据安全标准主要包含卫生信息安全标准、通用大数据安全标准以及健康医疗大数据安全标准。卫生信息安全标准包括卫生信息、信息系统、信息技术、信息产品、管理等方面的安全与隐私标准。通用大数据安全标准包括数据安全相关标准、个人信息安全标准和其他大数据安全标准。目前我国健康医疗大数据安全标准没有出台,需要研究、制定。

5.安全管理组织和人员

健康医疗大数据安全管理角色包括组织内部的安全管理团队和职能部门。安全管理团队对内部的大数据安全全面负责。职能部门是根据具体的医疗业务需求对数据进行收集、分析或使用的部门,负责数据收集、分析或使用等的技术实现。职能部门对本部门收集或使用的数据安全负责,细化数据在收集、分析或使用等阶段的安全要求并推动落实。安全管理团队的大致职责有:①确定各种数据的分类分级初始值,制定数据分类分级指南;②综合考虑相关的法律法规、政策、标准、大数据分析技术当前水平、医疗行业特殊性等,综合评估数据安全分析,制定数据安全基本要求;③建立相应的数据安全管理监督机制,监视数据安全管理机制的有效性;④负责大数据安全管理过程的制定,并对外部相关方负责;⑤安全管理组织和人员,具体内容参见本书第十六章。