当前位置: 首页 > news >正文

处理中文乱码和中文部分乱码

文章转自:http://book.51cto.com/art/201112/306309.htm

在网络操作中,关于中文乱码很多初学者都感到非常困难,如何解决乱码?不要没有目的胡乱转码,笔者访问了几个初学者,他们对于这个问题常用的方法就是一个一个编码去试直到找到为止,但有些情况即使一个一个地去试也不能解决问题。在网络标准接口内容中已经简单解释了一部分,下面用几个例子,对网络操作中的几个典型中文乱码进行讲解。

1.第一种情况

服务器和客户端编码不统一造成中文乱码,当服务器返回数据是UTF-8格式时,客户端在读取输入流时,需要将其转换成UTF-8格式,请看客户端部分代码:

………………..省略部分代码………………  
// 设置URL并且打开连接  
url = new URL("http://192.168.1.7:8080/exa/zh_cn");  
httpurlconnection = (HttpURLConnection) url.openConnection();  
//得到输入流并转换为字符串  
inputStream = httpurlconnection.getInputStream();  
String strResult="";  
byte[] b = new byte[1024];  
int i = 0;  
while ((i = inputStream.read(b)) != -1) {  strResult+=new String(b,"utf-8");  b = new byte[1024];  
}   
//显示到控件上  
textView_1.setText(strResult);  
………………省略部分代码………………  

代码中关键代码是,new String(b,"utf-8"),将byte数组转换成UTF-8格式的字符串,结果如图10-17所示。

当改成new String(b,"gb2312")时得到结果如图10-18所示。


如何避免中文乱码问题,首先,不要频繁转码和漫无目的转码,这样转来转去最后自己也不知道转到哪里去了,其次,尽量使客户端程序的编码和服务器编码统一,再次避免用字节的方式去读取中文和操作中文字符串,因为一个汉字占两个字节,稍不注意开发过程中就会出现读取一个字节,造成读取了半个字,就会出现乱码。

2.第二种情况

中文汉字中出现少部分中文乱码。这种现象看起来很怪异,往往在开发过程中,读者都有可能这样操作了,但没有发现。这种现象是怎么造成的呢?先看例子程序。

实例:

读取文件的核心代码如下(为了测试多一些的汉字,本例将把很多汉字写在test.txt里放在assets文件夹下):

………………..省略部分代码………………  
inputStream = this.getAssets().open("test.txt");  
byte buffer[] = new byte[100];  
StringBuffer sb = new StringBuffer();  
int i = 0;  
while ((i = inputStream.read(buffer)) != -1) {  sb.append(new String(buffer, 0, i));  
}  
textView_1.setText(sb.toString());  
………………..省略部分代码……………… 

由上述代码产生的效果如图10-19所示。

部分乱码的现象出现了,原因我先不讲,先改动代码再看看效果。把byte buffer[] = new byte[100]改成byte buffer[] = new byte[inputStream.available()],运行后得到的效果如图10-20所示。

思考一下:100和inputStream.available()的区别,就会出现中文部分乱码的问题?原因是有可能在读取100个字节的时候正好遇到一个汉字的前半个字节,后100个字节的第一位置的字节也是这个字的后半个字节,半个字节是汉字吗?这样当然会出现乱码了。把字节的数组直接设置成输入流的长度,在读取的时候,一次性读取,那么就不会出现所谓的半个字的现象,当然也不会出现乱码的问题了。


还有一个解决办法,就是不以字节的方式读取文件,以字符的方式读取,一个字符装一个汉字是合法的,看一下代码

………………..省略部分代码………………  
inputStream = this.getAssets().open("test.txt");  
StringBuffer sb = new StringBuffer();  
InputStreamReader isr=new InputStreamReader(inputStream);  
char buf[] = new char[20];  
int nBufLen = isr.read(buf);  
while(nBufLen!=-1){  sb.append(new String(buf, 0, nBufLen));  nBufLen = isr.read(buf);  
}  
textView_1.setText(sb.toString());  
………………..省略部分代码………………  

得到的结果当然是没有乱码的效果。读者在开发过程中遇到中文乱码问题,要认真分析和思考,总能解决问题的。






http://www.xdnf.cn/news/857017.html

相关文章:

  • 小程序电商“够货”完成A轮融资,BAI与龙湖资本联合领投...
  • VC编程——QQ连连看外挂
  • 不怕死就上这些网站
  • i.MX6ULL终结者进程基础 终止与回收
  • 2024年北京市安全员-B证证考试题库及北京市安全员-B证试题解析
  • asp毕业设计——基于asp+sqlserver的专利图像检索平台设计与实现(毕业论文+程序源码)——专利图像检索平台
  • 全网最全的Web自动化测试教程
  • NXP BLE SOC低功耗模式调试总结
  • JSON在线格式化
  • 支付通道及系统设计
  • 算法图解之递归
  • 电影资源格式说明
  • 运维工程师是干什么的?
  • SpringBoot 事件发布监听机制使用、分析、注意点 (一篇到位)
  • 数据挖掘:关联规则,异常检测,挖掘的标准流程,评估指标,误差,聚类,决策树
  • Cesium工具应用
  • skynet 简介
  • 转:三星安卓手机刷机包(ROM)刷机教程与ROOT教程总索引
  • oracle数据库中insert,从Oracle数据库中读取数据自动生成INSERT语句的方法
  • 快速使用Eolinker API接口管理工具
  • 【Java】通过调用阿里云短信服务给手机发短信
  • IvorySQL Operator | 一键部署IvorySQL集群,高效管理与个性化配置尽在掌控
  • css从入门到精通【超详细笔记】,技术详细介绍
  • 2011年好莱坞大片索引
  • 手动杀毒,SOLA病毒,也称之为worm.script.bat.Agent、Trojan.Win32.Sola病毒)
  • 学习炒股必读的10本书
  • 非理性的积极力量(转)
  • Win32时间类型FILETIME/SYSTEMTIME/WINDOWSTIME(FILETIME这个名字很奇怪,其实他跟FILE并没有直接关系,只是很多File的API中,都以这个为时间的类型)
  • 3DS烧录卡?ACE3DS PRO?这是个闹剧(关于此事的新闻集合)
  • Https网站如何申请免费的SSL证书及操作使用指南