PHP——json_encode中文编码问题
在PHP项目中会经常遇到中文乱码,这是一个比较恼人的问题。不过,当需要将内容输出到网页上的时候,我们遵照以下两个原则一般情况下是不会出现中文乱码的。
第一就是在html头部添加
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
第二点就是保证文件的编码和meta设置的编码一致。也就是说,如果我们第一条设置的charset为UTF-8,那我们的文件编码也要设置成UTF-8。二者保持一致即可。
当然上面是针对于网页的情况,但是现在随着Ajax在web应用中占得比重越来越大,json格式的数据在数据传输中应用也越来越广。因此在PHP中使用json_encode对数据进行json转换的时候也会遇到中文乱码或者是对中文进行编码的问题。
举个例子来说
$data = array('id'=>1,'name'=>'迹忆博客','parId'=>0);
echo json_encode($data);
上面代码的输出结果为
{"id":1,"name":"\u8ff9\u5fc6\u535a\u5ba2","parId":0}
我们看,函数对中文’迹忆博客’进行了16进制转码。这不能说是错误,因为16进制表示的就是正确的中文,我们拿到这个结果以后,在前端通过js同样也可以得到我们想要的结果。但是,这样使用起来还是比较麻烦的。当然情况也会根据PHP的版本的不同而有所变化。
对于PHP的一些版本其结果会是如下的情况
{"id":1,"name":null,"parId":0}
中文无法被正确的解析出来。
没有办法,中文问题就是这么麻烦。谁让计算机不是中国人发明的呢。当然这些是有解决方法的,下面我们就来了解两个解决的办法。
一、通过json_encode第二个参数来解决
针对上面问题,在PHP>=5.4.0 的版本已经可以直接通过json_encode函数本身来解决。那就是第二个参数加上JSON_UNESCAPED_UNICODE。
$data = array('id'=>1,'name'=>'迹忆博客','parId'=>0);
echo json_encode($data, JSON_UNESCAPED_UNICODE);
现在就能得到正确的结果
{"id":1,"name":"迹忆博客","parId":0}
结果是能正确的得到了。但是,对于PHP的版本总不能让大家都换成5.4及以上的版本吧。那对于5.4以下的版本应该怎么处理呢?
二、通过url编码解决中文问题
我们知道,在PHP中有两个函数 urlencode 和 urldecode。我们可以通过urlencode函数将中文进行url编码,这样在字符串中就不会再有中文,也就不会遇到中文编码的问题。
$str = “迹忆博客”;
echo urlencode($str);
对迹忆博客进行url编码,其结果如下
%E8%BF%B9%E5%BF%86%E5%8D%9A%E5%AE%A2
所以说,我们将上面数组的name的值用urlencode编码以后,再进行json格式转化,那中文编码的问题就不存在了。
$data = array('id'=>1,'name'=>urlencode('迹忆博客'),'parId'=>0);
$res = json_encode($data);
echo $res;
现在我们得到的结果就是name编码以后的json字符串
{"id":1,"name":"%E8%BF%B9%E5%BF%86%E5%8D%9A%E5%AE%A2","parId":0}
最后再通过urldecode对url编码的字符串进行解码。当然urldecode解码不用我们再去找对应的那一段编码的字符串进行解码。我们可以直接对整个字符串进行url解码。urldecode会自动去检测相应的url编码的字符串对其进行解码。
$data = array('id'=>1,'name'=>urlencode('迹忆博客'),'parId'=>0);
$res =urldecode(json_encode($data));
echo $res;
这样其结果就是正确的了
{"id":1,"name":"迹忆博客","parId":0}
这种方法是没有版本限制的,但是效率的话肯定会相对于第一种方法要慢一些。
针对第二个方法——通过url编码解决中文问题——的封装函数
现在问题来了,对于第二个方法,我们总不能在数组的每一个中文前面都加上urlencode函数吧!这也是不现实的。那我们可以通过自己封装json_encode函数来处理这样的问题。
代码如下
/**
* 作者:迹忆
* 个人博客:迹忆博客
* 博客url:www.onmpw.com
*/
function onmpw_json_encode($data){
if(is_object($data)) return false;
if(is_array($data)){
$data = deal_array($data);
}
return urldecode(json_encode($data));
}
function deal_array($data){
if (is_array($data)) {
foreach ($data as $key => $val) {
if (is_array($val)) {
//如果是多维数组,通过递归来处理多维数组
$data[$key] = deal_array($val);
} else {
//对值进行url编码
$data[$key] = urlencode($val);
}
}
} elseif (is_string($data)) {
$data = urlencode($data);
}
return $data;
}
下面我们来看一个使用示例
$data = array(
array('id'=>1,'name'=>'迹忆博客','parId'=>0),
array('id'=>2,'name'=>'学无止境','parId'=>1),
array('id'=>3,'name'=>'趣味杂谈','parId'=>1),
array('id'=>4,'name'=>'编程语言','parId'=>2),
array('id'=>5,'name'=>'网络','parId'=>2),
array('id'=>6,'name'=>'算法','parId'=>2),
array('id'=>7,'name'=>'操作系统','parId'=>2),
array('id'=>8,'name'=>'数据库','parId'=>2),
array('id'=>9,'name'=>'WEB前端','parId'=>2),
array('id'=>10,'name'=>'读书','parId'=>3),
array('id'=>11,'name'=>'观点与感想','parId'=>3)
);
$data = onmpw_json_encode($data);
echo $data;
现在我们得到了我们想要的结果
[{"id":"1","name":"迹忆博客","parId":"0"},{"id":"2","name":"学无止境","parId":"1"},{"id":"3","name":"趣味杂谈","parId":"1"},{"id":"4","name":"编程语言","parId":"2"},{"id":"5","name":"网络","parId":"2"},{"id":"6","name":"算法","parId":"2"},{"id":"7","name":"操作系统","parId":"2"},{"id":"8","name":"数据库","parId":"2"},{"id":"9","name":"WEB前端","parId":"2"}, {"id":"10","name":"读书","parId":"3"},{"id":"11","name":"观点与感想","parId":"3"}]
总结
中文编码的问题很常见,我们大家要在实际情况中多总结。在以后的开发中再遇到类似的问题就可以很容易的解决了。
对于上面自定义的json_encode函数,我会把它封装到一个公共类中。源代码都在github上,我会持续将一些常用函数封装到这个公共类中,网址:https://github.com/onmpw/PHPLibrary/blob/master/Code/Common/Common.php。希望这些对大家有所帮助。
相关文章
你必须知道的 PHP 中的内存管理知识
发布时间:2023/02/25 浏览次数:177 分类:编程语言
-
内存管理是 PHP 编程的一个重要方面,它可以极大地影响应用程序的性能和可伸缩性。 它涉及理解内存分配模型,通过高效的编程技术最大限度地减少内存使用,以及利用缓存和延迟加
PHP 通过引用与通过值传递变量
发布时间:2023/02/25 浏览次数:165 分类:编程语言
-
在 PHP 中,我们可以通过两种不同的方式将变量传递给函数:按值和按引用。 了解这两种传递变量的方法之间的区别对于编写高效且有效的 PHP 代码很重要。 按值传递变量 默认情况下,
详细介绍 PHP内存分配函数
发布时间:2023/02/25 浏览次数:164 分类:编程语言
-
PHP 是一种流行的服务器端脚本语言,广泛用于 Web 开发。 与大多数编程语言一样,PHP 需要分配内存来创建变量、数组、对象和其他数据结构。 PHP 提供了几个分配函数来动态分配内存。
PHP 内存分配类型:堆栈和堆
发布时间:2023/02/25 浏览次数:83 分类:编程语言
-
内存分配是编程的一个重要方面,它决定了程序如何管理和使用内存。 在 PHP 中,有两种主要的内存分配类型: 堆栈和堆 。 堆栈 堆栈是一种内存分配类型,用于存储局部变量和函数参
我们来看一下 PHP是如何分配内存的
发布时间:2023/02/25 浏览次数:195 分类:编程语言
-
PHP 使用内存管理系统,根据需要动态分配内存,并在不再使用时释放它。 这意味着您不需要在 PHP 脚本中手动分配或释放内存。 PHP 的内存管理系统基于 zend_mm_heap 的概念,它是一个内
PHP 有哪些内存优化技术
发布时间:2023/02/25 浏览次数:92 分类:编程语言
-
介绍 PHP 是一种流行的 Web 开发编程语言,但由于其动态特性和垃圾收集过程,它可能容易出现高内存使用率。 但是,我们可以使用多种技术来优化内存使用并提高 PHP 应用程序的性能。
我们看一下PHP内存泄漏的常见原因
发布时间:2023/02/25 浏览次数:74 分类:编程语言
-
在长时间运行的 PHP 应用程序中,内存泄漏可能是一个严重的问题。 随着时间的推移,内存泄漏会导致应用程序消耗越来越多的内存,直到它崩溃或变得无响应。 在本文档中,我们将探