最新消息:

GBK编码PHP脚本导致语法错误(Zend Multibyte)

PHP应用 admin 2948浏览 0评论

微薄上有同学问我:

     GBK环境下如下php代码:<?php echo("洪仁玕");?> 会引发php的语法错误,如何解决?

这个是因为, 在GBK环境下, “玕”的编码是”0xab 0x5c, 所以, 又是一个’5c’引发的问题..

一般来说, 还是建议大家用unicode作为代码文件的字符集, 如果要使用GBK, 再主动转换下.

不过, 就问题说问题, 如果你的脚本非要GBK编码, 那怎么避免这个问题呢?

从PHP5.3开始, PHP引入了Zend Multibyte来支持多字符集编码. 对于上面的代码, 我们修改如下:

<?php
declare(encoding="cp936");
echo("洪仁玕");
?>

然后, 在php.ini中配置:

mbstring.internal_encoding=cp936

或者通过如下命令运行PHP:

$php  -dmbstring.internal_encoding=cp936 test.php

这样, PHP就会以cp936编码方式来执行test.php了. 关于Zend Multibyte的更多信息请参看:PHP: what is –enable-zend-multibyte configure option for?, PHP declare

PS, 我在试验PHP5.4 RC1的时候, 发现了一个BUG, PHP 5.4 不能正确的转换GBK编码到UTF8编码, 不过现在我已经修复. 大家如果遇到这个问题, 请关注马上要发布的PHP5.4 RC2即可.. 谢谢


Comments

  • 2011/11/18, cute writes: mb_internal_encoding(“CP936”);
  • 2011/11/19, maifa writes: 我很想听下,又 一个 5C?
    又的解释。谢谢。
  • 2011/11/19, 雪候鸟 writes: @maifa http://www.laruence.com/2010/04/12/1396.html
  • 2011/11/23, taylor writes: 好诡异的bug啊
    最近碰到个因为转码的原因导致$_GET失败的问题,好诡异,最后是因为前段给的链接给urlencode了,纠结
  • 2011/11/23, eve writes: 我觉得是不是可以先用记事本打开代码,然后另存为utf-8编码,这样问题就解决了.您觉得呢
  • 2011/11/29, zhaiduo writes: 我在用mysql_real_escape_string的时候也遇到5c问题,用mysql_escape_string就不会有5c问题。
  • 2011/12/23, 荒野无灯 writes: 嗯,以前看过gbk字符集下mysql_escape函数的一个0x5c引起的bug~~

Related posts:


Copyright © 2010 风雪之隅 版权所有, 转载务必注明. 该Feed只供个人使用, 禁止未注明的转载或商业应用. 非法应用的, 一切法律后果自负. 如有问题, 可发E-mail至my at laruence.com.(Digital Fingerprint: 73540ba0a1738d7d07d4b6038d5615e2)

Related Posts:

转载请注明:爱开源 » GBK编码PHP脚本导致语法错误(Zend Multibyte)

您必须 登录 才能发表评论!