01 | /** |
02 | * 用getBytes(encoding):返回字符串的一个byte数组 |
03 | * 当b[0]为 63时,应该是转码错误 |
04 | * A、不乱码的汉字字符串: |
05 | * 1、encoding用GB2312时,每byte是负数; |
06 | * 2、encoding用ISO8859_1时,b[i]全是63。 |
07 | * B、乱码的汉字字符串: |
08 | * 1、encoding用ISO8859_1时,每byte也是负数; |
09 | * 2、encoding用GB2312时,b[i]大部分是63。 |
10 | * C、英文字符串 |
11 | * 1、encoding用ISO8859_1和GB2312时,每byte都大于0; |
12 | * 总结:给定一个字符串,用getBytes("iso8859_1") |
13 | * 1、如果b[i]有63,不用转码; A-2 |
14 | * 2、如果b[i]全大于0,那么为英文字符串,不用转码; B-1 |
15 | * 3、如果b[i]有小于0的,那么已经乱码,要转码。 C-1 |
16 | */ |
17 |
18 | |
19 | private static String toGb2312(String str) { |
20 | if (str == null ) return null ; |
21 | String retStr = str; |
22 | byte b[]; |
23 | try { |
24 | b = str.getBytes( "ISO8859_1" ); |
25 | for ( int i = 0 ; i < b.length; i++) { |
26 | byte b1 = b[i]; |
27 | if (b1 == 63 ) |
28 | break ; //1 |
29 | else if (b1 > 0 ) |
30 | continue ; //2 |
31 | else if (b1 < 0 ) { //不可能为0,0为字符串结束符 |
32 | //小于0乱码 |
33 | retStr = new String(b, "UTF-8" ); //或当前所用的编码形式 |
34 | break ; |
35 | } |
36 | } |
37 | } catch (UnsupportedEncodingException e) { |
38 | // e.printStackTrace(); |
39 | } |
40 | return retStr; |
41 | } |