Android基础之解压zip中文乱码处理

####乱码原因分析
一般我们使用的Windows系统外部文件默认都是GBK编码方式,Mac系统默认的好像是UTF-8(同事的电脑就是,不知道其他人的是不是),Linux的没验证过,这里我讨论的是Windows下打包的zip文件。

Java中自带的ZipEntry解压缩的编码方式是UTF-8,而且没有可以自定义编码方式的接口,所以当我们使用UTF-8编码去解压缩GBK编码的文件的时,解压缩出来的中文部分当然是乱码,所以Mac上打包的zip用Java的自带解压缩接口解压出来是没有问题的。

####解决方式
找到了问题所在,解决方式也就比较简单了,既然是编码方式不同导致的,那我们保证编码方式统一即可,压缩zip时系统编码很难改变,那我们就从解压缩的编码方式入手,自定义解压缩的编码。

Apache中是有完整的替代解决方式的,但是Apache的包相对于Android说有点偏大不适合于Android环境,我们只需要找到解压缩的那部分代码进行改造即可,我这里找到了一个改造好的解压缩替代包,测试可行。示例代码如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
import com.file.zip.ZipEntry;
import com.file.zip.ZipFile;
/**
* @param file 待解压文件
* @param dir 解压后文件的存放目录
* @throws IOException
*/
public void unzip(File file, String dir) throws IOException {
ZipFile zipFile = new ZipFile(file, "GBK");//设置压缩文件的编码方式为GBK
Enumeration<ZipEntry> entris = zipFile.getEntries();
ZipEntry zipEntry = null;
File tmpFile = null;
BufferedOutputStream bos = null;
InputStream is = null;
byte[] buf = new byte[1024];
int len = 0;
while (entris.hasMoreElements()) {
zipEntry = entris.nextElement();
// 不进行文件夹的处理,些为特殊处理
tmpFile = new File(dir + zipEntry.getName());
if (zipEntry.isDirectory()) {//当前文件为目录
if (!tmpFile.exists()) {
tmpFile.mkdir();
}
} else {
if (!tmpFile.exists()) {
tmpFile.createNewFile();
}
is = zipFile.getInputStream(zipEntry);
bos = new BufferedOutputStream(new FileOutputStream(tmpFile));
while ((len = is.read(buf)) > 0) {
bos.write(buf, 0, len);
}
bos.flush();
bos.close();
}
}
}

改造后的ZipEntry.jar包的下载地址:http://download.csdn.net/detail/huyongl1989/9120755


write by laohu
2015-09-26 21:34:09


原创文章,本文采用知识共享署名 2.5(中国大陆许可协议)进行许可,欢迎转载,但转载请注明来自ittiger.cn,并保证转载后文章内容的完整性。本人(laohu)保留所有版权相关权利。



评论