MD5的全称是Message-Digest Algorithm,是Hash算法中的一种重要算法,具有单项加密、加密结果唯一、安全性能好等特点。MD5以512位分组来处理输入的信息 ,且每一分组又被划分为16个 32位子分组,经过了一系列的处理后 ,算法的输出由四个32位分组组成,将这四个32位分组级联后将生成一个128位散列值。

MD5算法流程图

(1)信息填充

首先需要对明文信息进行填充,使其位长度对512求余的结果等于448。因此,信息的位长度(Bits Length)将被扩展至 N*512 + 448。然后,再在这个结果后面附加一个以64位二进制表示的填充前信息长度。经过这两步的处理 ,现在的信息字节长度为 N*512 + 448 + 64 = (N + 1) *512,即长度恰好是 512的整数倍。

(2)结构初始化

在处理过程中需要定义一个结构。该结构包含了每一次需要处理的一个明文块 (512bit)和计算出来的散列值 (128bit)。在散列的整个过程中,它的作用非常重要 ,各个明文块计算出来的散列值都是通过它来传递的。

(3)分组文件

将填充好的文件进行分组 ,每组 512位 ,共有N组。

(4)处理分组

使用算法处理每组数据。

MD5算法在计算时会用到四个32位被称作链接变量 (Chaining Variable)的整数参数 ,在使用之前要对它们赋初值 ,分别就为 :

A = 0x01234567,B = 0x89abcdef, C = 0xfedcba98,D =0x76543210。

当设置好这四个链接变量后,就开始进入算法的四轮循环运算。循环的次数是信息中512位信息分组的数目。

将上面四个链接变量复制到另外四个变量中 :A到 a,B到 b, C到 c,D到 d。

主循环有四轮,每轮循环都很相似。第一轮进行16次操作。每次操作对 a、b、c和 d中的其中三个作一次非线性函数运算 ,然后将所得结果加上第四个变量,一个子分组和一个常数。再将所得结果向右环移一个不定的数,并加上 a、b、c或 d中之一,最后用该结果取代 a、b、c或 d中之一。

(5)输出结果

当全部信息处理完成后 ,将分组处理的结果进行处理,输出计算结果。

所有这些完成之后 ,将 A、B、C、D分别加上 a、b、c、d。然后用下一分组数据继续运行算法 ,最后的输出是 A、B、C和 D的级联。当全部分组处理完成后,将结果级联 ,即得到了 MD5处理的结果。