等保测评2.0：应用的数据完整性 – 作者:起于凡而非于凡-安全小百科

1. 说明

本篇文章主要说一说应用系统测评时数据完整性相关的基础知识和内容，另外本片文章都是文字。

2. 测评项

a)应采用校验技术或密码技术保证重要数据在传输过程中的完整性，包括但不限千鉴别数据、重要业务数据、重要审计数据、重要配置数据、重要视频数据和重要个人信息等；

b)应采用校验技术或密码技术保证重要数据在存储过程中的完整性，包括但不限于鉴别数据、重要业务数据、重要审计数据、重要配置数据、重要视频数据和重要个人信息等。

3. 完整性

是指信息在传输、交换、存储和处理过程中，保持信息不被破坏或修改、不丢失和信息未经授权不能改变的特性，也是最基本的安全特征。

那么如果是传输过程中的完整性，也即当数据在传输过程中，接收方应该至少具备判断接收到的数据是否完整，如是否被篡改过，或是否因为网络等原因没有接收完整等。

4. 校验技术

校验技术我不怎么了解，实际测评中也没怎么遇到过，比如CRC循环校验等，这里就不多说了。

5. 密码技术

常用来实现数据的完整性判断的密码技术为“单向散列函数”，一般也叫Hash（哈希）算法、散列算法、杂凑算法，下文统称哈希算法。
实现数据完整性的判断，往往需要在原始数据里再附加一些额外数据，然后接收方接收到所有数据后，通过一些算法，实现完整性的判断。

那么为什么常用哈希算法来实现完整性判断呢？这里要先说说哈希算法。
哈希算法有一个输入与输出，输入任意长度的数据，会输出一个固定长度的值（哈希值）。且输入的数据不同，输出的哈希值也不同，哪怕只有1bit的不同，产生的哈希值也会完全不一样，且没有规律。
另外，这个算法是单向的，也就是说从哈希值无法推到出原文是什么。

用常用的哈希算法MD5算法举例来说，输入字符串1，则输出c4ca4238a0b923820dcc509a6f75849b，如果输入10，则输出d3d9446802a44259755d38e6d163e820。

当然，有一种方法可以反向推断出原文，但这不是算法本身的缺陷，比如你先把一些常见字符串的MD5值算出来，并将其和原文同时存储在数据库中，比如1的MD5是c4ca4238a0b923820dcc509a6f75849b，那么以后你碰见c4ca4238a0b923820dcc509a6f75849b这个MD5值时，你去数据库中搜索，就能得知MD5值对于的原文是1。

另外，由于输入的值的范围是无限的，而输出的值的范围确实固定的（长度固定了），所以一个MD5值实际上必然对应着无数的原文。
但一个合格的哈希算法中，会让这种情况出现的概率极低。

回到完整性来，利用哈希算法，比如MD5算法，可以轻松的实现一个基本的完整性校验方法。

当客户端向服务器端发送数据时，在数据原文后面附加上数据的MD5值，一并发送过去。

当服务器端收到数据后，使用MD5计算出数据原文的MD5值，再与附加的MD5值进行对比，即能得数据是否被篡改。

如别人修改了原文部分，则无法通过校验。或者修改了MD5值部分，那也无法通过校验。

不过这种简单的方法是还是有很大的漏洞的，因为你的输入值和输出值都是明文，别人经过尝试，可以很快的推断出你所使用的是哪一种哈希算法。

得知后，别人修改原文部分之后，再使用你约定使用的哈希算法，算出哈希值部分，这样就能够在篡改数据的情况下通过校验了。

所以可以再加上一些措施，对于原文A，计算出其哈希值B，然后使用某加密算法对哈希值B进行加密，得到C，最后传输“A+C”。

接收方收到数据后，对C进行解密，得到B，然后计算出A的哈希值D，对比B和D，即可得知结果。

这样情况下，别人就没办法得知你使用的哈希算法了，因为你对哈希值B进行了加密。一旦修改了A或者B部分，都无法通过校验。

当然，其实这还是有漏洞，因为没有使用随机值或者时间戳，每次传输原文A，最终传输的值都是“A+C”，对方重复几个流程，可得到“D+Z”、“V+M”等等数据。

然后，当传输A时，用“D+Z”整个替换“A+C”，也能通过校验，这叫做重放攻击。

6. 测评项a

a)应采用校验技术或密码技术保证重要数据在传输过程中的完整性，包括但不限千鉴别数据、重要业务数据、重要审计数据、重要配置数据、重要视频数据和重要个人信息等；

实际测评过程中，极少有自己编程实现这整个过程的，因为一般情况下没有必要自己造一个轮子，水平不够造的轮子还容易有很多的漏洞。
对于B/S类型的应用系统来说，一般都是使用HTTPS协议，HTTPS协议同时实现了保密性和完整性。

而对于C/S类型的应用系统来说，如果是直接连接数据库的那种，要看数据库是否配置了SSL，在连接的时候是否使用了SSL。

或者是否使用了其他的密码技术来实现完整性，比如在“等保测评2.0：Oracle身份鉴别（下）”中，Oracle在进行参数上的配置后，即可保证数据传输过程中的完整性。而如果是使用中间件（也即客户端不直接和数据库打交道）的C/S类型的应用系统，要看是否使用了SSL。

实际测评过程中还是很简单的，甚至你都不需要了解相关的密码知识。
不过最好还是要懂一些，万一真有自己编程实现这个过程的，你也不至于完全不明白。
另外，如果连密码算法都是自己实现的，且不属于国家密码部门核准的密码算法，一般顶多给部分符合。
因为这种自己造的轮子（密码算法），根本没有得到验证，其安全性很值得怀疑。