多媒体数据的安全问题目前越来越受到广泛的关注,研究者们的努力探索也推动了该领域的不断发展。本文对三种主要的多媒体信息安全技术进行简要介绍。

数字隐写――信息的黑魔法

  隐写一词来源于希腊文στεγαυοζ + γραφειυ,原意为“covered writing”,是一种保密通信技术,通常解释为把秘密信息隐藏在其他信息当中,其中消息的存在形式较为隐秘。利用隐写传递秘密信息的实践古已有之。一个著名的例子是罗马人将机密信息刺在剃光头发的信使头上,等头发长长之后再将信使派往敌后,收信方为了读取隐写的信息需要重新将信使的头发剃去。在上世纪的两次世界大战中,交战双方普遍使用隐形墨水书写机密文件,以便将信息送达潜伏在敌后的特工人员。中国古代也有使用藏头诗来传递隐秘信息的记载,这些都属于古典隐写术范畴。古典隐写术与其说是一门技术,不如说是一门想象力丰富的艺术。随着近年来计算机和数字信号处理的发展,建立在现代通信、数字处理和编码技术基础上的当代隐写术,以及基于各种统计信号分析手段的隐写分析,与古典隐写术具有完全不同的内涵,它正以全新的面目出现,成为当前涉及信息安全研究和应用领域中一个重要内容而受到高度重视。
  隐写的目的是在信息交换双方之间建立一个隐蔽的通信,潜在的攻击者不知道这个通信的存在性。它利用人类感官对数字信号的感觉冗余,将保密信息嵌入另一非保密载体(如图像、视频、音频、信道甚至整个系统)中,以不引起第三方注意的方式通过公共信道,特别是互联网进行传递。隐写技术可以有多重含义:一是信息内容隐蔽,二是信息的存在性隐蔽,三是信息的发送方和接收方隐蔽,四是传输的信道隐蔽。
  作为反隐写技术,隐写分析的目的是检测数字载体中秘密信息的存在性,由于隐写者必须通过修改原始数据才能实现秘密信息的嵌入,因而载体数据的统计特性不可避免地会发生一些变化。虽然隐写分析者并不知道原始数据,但可以利用载体数据统计特性的异常来觉察到秘密信息的存在。一般来说,对隐写行为越敏感的统计量越有助于隐写分析,分析者的主要任务就是要准确地描述并利用这些统计量。尽管并未破解秘密信息的具体内容,信道监控者还是可以阻断隐蔽通信并追查秘密信息的收发双方,因而隐写行为已经失败。隐写分析是隐写技术的主要威胁,因为一旦隐写分析成功,隐写者不仅无法传送秘密信息,甚至有暴露身份的危险。

数字水印――版权的守护神

  数字通信技术的飞速发展使得信息的发布和传输实现了“数字化”和“网络化”,数字媒体很容易借助Internet或CD-ROM被复制、处理、传播和公开,这样就引发了数字信息传输的安全问题和数字产品的版权保护问题。当然,解决这个问题,人们可能首先想到的是利用加密和数字签名等技术。但是对数字媒体来说,加密具有挑战性,因为人们很难防止一个加密文件在解密时被“剪掉”。而使用数字签名呢?如果用于检验短信息的真实可靠性,它确实有效,但对于数据量很大的数字媒体信息,就需要在每一条消息上进行签名,这就要在原始数据中增加大量的签名信息。因此,人们要寻求另一种技术来对加密技术进行补充,数字水印就成为了这样一种补充技术,它在数字产品中嵌入的信息不会被常规处理操作去除,而且也能一次性嵌入大量的秘密信息。如果说数字隐写是一种保密通信技术,那么数字水印则主要用于数字产品的版权保护及其真实性和完整性认证。
  从数字水印的应用中我们可以看出,数字水印在认证、防盗版方面有重要的应用。然而,水印技术与密码技术一样,是在不断的“攻”与“防”中发展的。对数字水印的攻击一般是针对水印的稳健性提出的,而所谓的稳健性是指水印信号在经历多种无意或有意的信号处理后,仍能保持完整性或仍能被准确鉴别的特征。稳健性好的水印应该能够抵抗各种水印攻击行为。
  在网络信息技术迅速发展的今天,数字水印技术具有明显的实用价值。但我们也要意识到,仅靠水印技术来达到保护各种数字产品的版权并不可靠。正如军事理论中的多兵种协同作战一样,当前的数字水印技术需要结合密码学以及一些其他的认证技术等一起使用才能做到万无一失。一个实用的水印系统需要融合多种安全技术才能抵抗各种攻击,构成完善的数字产品版权保护解决方案。

数字取证技术――伪造者的照妖镜

  数字图像的广泛应用推动了数字图像处理学科的快速发展,很多十几年前需要专业摄影师在暗房中操作数日的图像处理工作,如今只需要打开图像处理软件轻松点击鼠标即可实现。科技是一把双刃剑,当我们在享受科技带给我们便利的同时,也带来了一个严峻的问题――照片内容可以轻易被篡改,图像内容和来源的真实性受到质疑。
  近年来国内外图片造假事件层出不穷,最引起轰动的事件莫过于2007年被炒作的沸沸扬扬的“华南虎”事件。事件起因是2007年10月陕西农民周正龙宣称拍到并提供一组绝迹多年的野生华南虎照片,当时即遭到多方质疑,但苦于取证技术不够先进,没有有效手段立即辨别真伪。直到2008年义乌年画印刷厂证实周正龙提供照片中的华南虎系依据该厂印刷的年画翻拍得到,本次事件最终被定性为“真照片、假老虎”。在这个眼见不再为实的时代,也催生了一门称为数字图像取证的技术。
  数字图像取证可以追述到1990年代初,当时研究学者主要考虑通过对原始图像加入认证信息来实现图像防伪认证,这类方法对作为图像版权方进行认证来说简单有效,也被称为主动认证。然而主动认证方法存在一个先天不足,即当第三方进行认证时不可能对认证图像进行预处理,在没有附加信息的前提下主动认证均失效。在多数场合下当检测者不具有图像的附加信息时,只能通过待检测图像自身特性来判断图像真伪或是否经过某项操作。相对于主动认证这种只通过图像自身信息进行真伪认证的方法称为数字图像被动认证,简称数字取证。
  理论上每对图像进行一次操作必然会留下痕迹,科研人员正试图采用不同方法检测这些操作。数字取证技术发展不到十年,目前尚处于起步阶段,尽管如此取证工作依然取得众多成果。2005年首届华赛摄影大赛金奖作品《广场鸽注射禽流感疫苗》涉嫌造假,通过检测发现照片背景中的几组广场鸽出现雷同现象,作者涉嫌通过复制原始照片中的鸽子黏贴到图像中其他部位以烘托整个照片氛围,然而这项操作明显违反新闻摄影比赛的章程。我们称这类篡改为复制-黏贴操作,由于这类操作会使图像中出现相同或相似块,我们可以对图像分块后提取特征进行逐块比对,当两个块特征的相似度大于一个阈值后则被认定为可疑区域。2007年《大庆晚报》摄影记者刘为强的CCTV新闻图片十佳铜奖作品《青藏铁路为野生动物开辟生命通道》亦被查出涉嫌造假,研究人员发现照片中的两个重要元素,即奔跑的藏羚羊和开行的火车系两幅画拼接而成。
  由于需要符合透视规律,篡改者拼接照片时必然需要对拼接块以不同倍率进行缩放,图像缩放引入插值操作,插值后图像中相邻像素的相关性必然增大,且和缩放倍率成正比关系,通过度量这种相关性大小可以估计缩放因子,当图像中检测出不同缩放因子即认定图像疑似拼接。2004年美国大选期间出现总统候选人克里和反越战影星的合影照片,科研人员分别对照片中两人的脸部特征进行建模估计入射光方向,事后证明此照片确系对立政党的诋毁之作。
  数字取证是一门融合图像处理、光学、信息论、计算机视觉、数理统计等多学科的交叉学科,因此需要科研人员具有深厚广博的背景知识。目前仍有很多难点尚待解决。更有甚者,甚至出现了一类反取证的研究,这类研究通过对篡改后图像进行掩饰以逃脱检测,这势必会增加取证的难度。路漫漫其修远兮,随着一个又一个问题的解决,我们必将有能力揭露包含虚假内容的伪造图像。

本文作者张新鹏来自上海大学通信与信息工程学院