JavaScript 中的 Base64 编码(一):Encode
时间:2010-07-23 10:16:00
除了IE浏览器,其他所有主流的浏览器均支持原生的 Base64 编码:
btoa(text) – base64 encodes text. atob(text) – base64 decodes text.
而对于 IE 我们可以根据已知的 Base64 编码原理进行编写:
Base64 编码将每三个 8Bit 的字节(注:由于要求输入的字符为 8Bit 字节,故范围应该在 ASCII 字符范围内,即:u0000-u00ff)转换为四个 6Bit 的字节(3*8 = 4*6 = 24),然后在每个 6Bit 字节前添两位高位 0,组成四个 8Bit 的字节,最后再将每个 8Bit 字节转换成十进制的数字,对应 Base64 编码表(为了保证所输出的编码为可读字符,Base64制定了一个编码表,以便进行统一转换,编码表的大小为 2^6=64,即 Base64 名称的由来)输出编码后的字符。
如果原字节不足 3 的倍数,则用 0 填充,输出字符使用“=”,因此编码后输出的文本末尾可能会出现 1 或 2 个“=”(余数 = 原文字节数 MOD 3 ,如果余数为 1,则要补 2 个“=”,为 2,则补 1 个“=”)。
Base64 编码表 Value Char Value Char Value Char Value Char 0 A 16 Q 32 g 48 w 1 B 17 R 33 h 49 x 2 C 18 S 34 i 50 y 3 D 19 T 35 j 51 z 4 E 20 U 36 k 52 0 5 F 21 V 37 l 53 1 6 G 22 W 38 m 54 2 7 H 23 X 39 n 55 3 8 I 24 Y 40 o 56 4 9 J 25 Z 41 p 57 5 10 K 26 a 42 q 58 6 11 L 27 b 43 r 59 7 12 M 28 c 44 s 60 8 13 N 29 d 45 t 61 9 14 O 30 e 46 u 62 + 15 P 31 f 47 v 63 /
比如:
字符: f 2 eASCII: 102 50 1013个8Bit字节: 01100110 00110010 011001014个6Bit字节: 011001 100011 001001 100101高位补0: 00011001 00100011 00001001 00100101十进制: 25 35 9 37对应码表值: Z j J l最终: btoa(f2e) = ZjJl
字符: b a s eASCII: 98 97 115 1013个8Bit字节: 01100010 01100001 01110011 01100101 00000000 000000004个6Bit字节: 011000 100110 000101 110011 011001 010000 000000 000000高位补0: 00011000 00100110 00000101 00110011 00011001 00010000 00000000 00000000十进制: 24 38 5 51 25 16对应码表值: Y m F z Z Q = =最终: btoa(base) = YmFzZQ==
如果将上面的 Base64 编码原理换成接近于编程的思维,过程大致如下(以f2e为例):
注:Base64 编码表我们可以简化为字符串,并通过其进行位置索引:
table = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/"
第一步:
第一个字符 f(102 -> 01100110)通过右移 2 位(first >> 2)获得第一个目标字符(00011001 -> 25),索引编码表中对应的目标字符 Z(table.charAt(first >> 2))。
第二步:
将第一个字符 f(102 -> 01100110)与 3(00000011)进行 AND 运算(first & 3)):
01100110AND 00000011------------00000010第一个字符运算后(00000010)再左移 4 位((first & 3) << 4),得:00100000。将第二个字符 2 (50 -> 00110010)右移 4 位(second >> 4),得:00000011。最后将运算后的两个字符进行 OR 运算((first & 3) <> 4):
00100000OR 00000011------------00100011
获得第二个目标字符(00100011 -> 35),索引编码表中对应的目标字符 j(table.charAt((first & 3) <> 4))。
第三步:
将第二个字符 2 (50 -> 00110010)与 15(00001111)进行 AND 运算(second & 0×0f):
00110010AND 00001111------------00000010第二个字符运算后(00000010)再左移 2 位((second & 0×0f) << 2),得:00001000。第三个字符 e(101 -> 01100101)右移 6 位(third >> 6),得:00000001。最后将运算后的两个字符进行 OR 运算((second & 0×0f) <> 6):
00001000OR 00000001------------00001001
即获得第三个目标字符(00001001 -> 9),索引编码表中对应的目标字符 J(table.charAt((second & 0×0f) <> 6))。
第四步:
取第三个字符 e(101 -> 01100101)的右 6 位(third & 63):
01100101AND 00111111------------00100101
获得第四个目标字符(00100101 -> 37),索引编码表中对应的目标字符 l(table.charAt(third & 63))。
异常情况:
当第二个字符不存在时(即:余数 = 原文字节数 MOD 3 ,余数为 1),截止至第二步的第 2 小步,然后在最终输出的目标字符后添加两个“=”。当第三个字符不存在时(即:余数 = 原文字节数 MOD 3 ,余数为 2),截止至第三步的第 2 小步,然后在最终输出的目标字符后添加两个“=”。
代码实现如下:
if(!window.btoa) {window.btoa = function(text) {if (/([^u0000-u00ff])/.test(text)) return;var table = "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789+/",i = 0,cur, prev, byteNum,result=[]; while(i > 2));break;case 2: //second byteresult.push(table.charAt((prev & 3) <> 4)));break;case 3: //third byteresult.push(table.charAt((prev & 0x0f) <> 6)));result.push(table.charAt(cur & 0x3f));break;}prev = cur;i++;}if (byteNum == 1){result.push(table.charAt((prev & 3) << 4));result.push("==");} else if (byteNum == 2){result.push(table.charAt((prev & 0x0f) << 2));result.push("=");}return result.join("");}}