金融业机构开展金融数据安全防护工作过程中,越来越多的数据库数据通过网络进行存储和发布,这些数据往往包含有各类敏感信息,即使经过脱敏后仍然有巨大的社会价值与经济价值,一旦出现数据泄露,后果也是无法想象的。因此,需要使用数据水印技术在数据交换及数据使用中的分发共享、委托处理等环节标明数据的所有者、数据分发对象、分发时间、分发途径及使用范围等信息。
一、数据水印的定义
数据水印是指从原始环境向目标环境进行敏感数据交换时,通过一定的方法向数据中植入水印标记,从而使数据具有可识别分发者、分发对象、分发时间、分发目的等因素,同时保留目标环境业务所需的数据特性或内容的数据处理过程。
二、数据水印的特点
数据水印通过对原数据添加伪行、伪列、对原始敏感数据脱敏并植入标记等方式进行水印处理,保证分发数据正常使用,水印数据具有高可用性、高透明无感、高隐蔽性,不易被外部发现破解。一旦信息泄露第一时间从泄露的数据中提取水印标识,通过读取水印标识编码,追溯该泄露数据流转全流程,并精准定位泄露单位及责任人,实现数据泄露精准追责定责,提高了数据传递的安全性和可追溯能力。
三、为什么用数据水印
1.数据使用存在安全隐患
在当前信息化时代,数据通常蕴含有巨大的社会价值与经济价值,成为宝贵的资源。随着网络数据共享和数据交换需求的不断增多,如果不采取有效的安全控制和版权保护措施,常常会给攻击者以可乘之机。同时,如果缺乏数据完整性验证的有效措施,一旦出现数据数据泄露,后果很严重。
2.缺乏数据库版权保护措施
随着数据库技术的不断发展,数据库中存储的数据量急剧加大,在大量的数据背后隐藏着许多重要的信息,利用数据挖掘技术可以从看似无规律的数据中挖掘出有用的商业信息。因而,也需对这种隐含有重要商业信息的大型数据库进行版权保护,以防止不法分子从中获利。
3.数据泄露无法溯源定责
互联网的快速发展促使远程访问数据服务逐步开放,远程登录服务能为终端用户提供极大的方便,但数据供应商也同时面临数据被窃取的危险。如果不法分子将他从数据库里获取的大量数据转卖给他人,这些信息机构将会蒙受很大的经济损失。对于黑市上买卖的泄露文件,也没有办法溯源其泄露源,数据过程泄露无法对事件定责追溯。
四、数据水印技术
1.伪行水印
伪行水印指在对某些外发数据添加水印时,通过添加人为生成的若干整行信息,并从中挑选某些字段植入水印信息的技术。这些筛选的植入水印的字段一般常见于身份证、电话号、银行卡号、交易金额等字段。
2.伪列水印
伪列水印指通过对分发数据中,人为构造增加一列,并在其中植入水印的机制。
3.脱敏水印
脱敏水印指在增加行和列的情况下,通过对原始数据中某些字段按照一定的水印植入规则进行脱敏变形,产生的脱敏后数据植入了水印信息的技术。
4.水印溯源
水印溯源技术是指通过泄露数据中包含的水印数据识别其数据特征,并最终解析出水印信息的技术,一般包括识别水印类型、解析水印信息、回溯分发内容等三个步骤,
a)识别水印类型:指通过对泄露数据分析,判断其中哪些字段为植入的水印信息的字段。
b)解析水印信息:通过对植入水印字段的解析,从中获取到水印代码内容。
c)回溯分发内容:指通过解析出的水印代码,查询映射码表,并获取分发者、被分发者、分发时间、用途的关键信息的步骤。
五、数据水印使用场景
1.开发测试应用场景:金融行业所开发使用的业务系统中存在大量的客户敏感信息,如姓名、年龄、手机号、银行卡号、地址、工作信息等,在系统建设前期,往往需要使用上述信息进行开发测试,即使使用了数据脱敏技术去除了敏感信息,仍然需要使用水印技术向外发的数据中植入水印,标明分发者、分发目标、数据用途等信息。
2.生产应用场景:生产场景主要指各类业务场景,当涉及访问敏感数据时,需要对获取到的数据植入水印信息。
3.数据分享场景:数据分享应用场景在一些特定需求下,部分隐私数据需要提供给其他机构或企业,需要使用水印技术向外发的数据中植入水印,标明分发者、分发目标、数据用途等信息。
作者:孙绍伟
来源:51Testing软件测试网原创