起订:1
发货:1天内
为什么要使用数据水印
缺乏数据库版权保护措施随着数据库技术的不断发展,数据库中存储的数据量急剧加大,在大量的数据背后隐藏着许多重要的信息,利用数据挖掘技术可以从看似无规律的数据中挖掘出有用的商业信息。因而,也需对这种隐含有重要商业信息的大型数据库进行版权保护,以防止从中获利。
此外,一些数据库应用需要将数据库产品出售给客户(如地理信息系统中一般就包含价格不菲的空间数据库),一些数据库业务(如数据挖掘等)需要向合作伙伴提供完整的数据,这些都需要严格的数据库版权保护措施才可数据外发使用。
数据水印针对企业员工的泄露溯源
数据作为企业的重要资产,每天有大量数据在频繁交互,包括商业数据、财务报表用户和个人信息,它们以数据库(关系表)、Excel和CSV等形式存储和传输和处理。文件的频繁交互增加了数据泄露的风险,比如员工将的数据文件上传至互联网(比如公开网盘、论坛)、数据售卖给第三方,离职员工恶意数据等。
数据水印分类
伪行水印:系统先自动识别源数据的各项属性,根据其敏感类型进行规则适配,再对其符合敏感类型的一行或多行(行数定位随机)进行数据更改,更改后的数据仍然保持着与原数据同样的类型与格式。
伪列水印:新的属性列,包括数值属性列或类别属性列,生成的伪列应尽可能与该关系表的其他属性相关,不容易者察觉,然后将水印比特嵌入到的新列中。
数据水印评估指标
评估一个数据库查询水印优化算法的特性好坏通常关键由三个指标开展判断:也称之为不能感知性,包含主观性不能感知性和客观性不能感知性,前面一种就是指客户主观性的感受出不来数据库查询一些转变;后面一种由数学课指标开展界定,例如平均值和均方差的更改率,改变比越小,不能感知性/透光性越好。可扩展性。在追溯情景也称之为追溯通过率,就是指遭到各种进攻后依然能恰当获取水印的工作能力。根据多种多样水印进攻检测,融合获取水印比特的误码率或检验的关联性值开展综合性评估。嵌入容积。即数据库查询可以嵌入的水印比特信息内容总数,通常应用每一个元组可嵌入的水印比特数或总嵌入量指标开展评估。
数字库水印判定三个基本指标即透明性、鲁棒性和嵌入容量是相互矛盾、相互影响的关系,三者不可能同时达到更优,如图2所示。比如,设计一个鲁棒性强的数据库水印系统,意味着需要增强水印信号,那么同时也意味着将破坏更多原始数据库信号,透明性将减弱。
除此以外,在实际应用中,数据库水印还需要考虑以下两个指标:
1)安全性。攻击者在没有掌握密钥情况下,不能提取到隐藏的水印信息、不能破坏水印信息,且不能替换不法的水印信息。相比鲁棒性指标,安全性指标考虑范畴更大、要求更严。
2)实用性。是指算法的应用效果,包括嵌入/提取算法的执行效率,所需的内存空间。