- 作者: Laruence( )
- 本文地址: http://www.laruence.com/2011/12/19/2399.html
- 转载请注明出处
PHP是一种弱类型语言, 这样的特性, 必然要求有无缝透明的隐式类型转换, PHP内部使用zval来保存任意类型的数值, zval的结构如下(5.2为例):
struct _zval_struct { /* Variable information */ zvalue_value value; /* value */ zend_uint refcount; zend_uchar type; /* active type */ zend_uchar is_ref; };
上面的结构中, 实际保存数值本身的是zvalue_value联合体:
typedef union _zvalue_value { long lval; /* long value */ double dval; /* double value */ struct { char *val; int len; } str; HashTable *ht; /* hash table value */ zend_object_value obj; } zvalue_value;
今天的话题, 我们只关注其中的俩个成员, lval和dval, 我们要意识到, long lval是随着编译器, OS的字长不同而不定长的, 它有可能是32bits或者64bits, 而double dval由IEEE 745规定, 是定长的, 一定是64bits.
请记住这一点, 造就了PHP的一些代码的”非平台无关性”. 我们接下来的讨论, 除了特别指明, 都是假设long为64bits
IEEE 745的浮点计数法, 我这里就不引用了, 大家有兴趣的可以自己查看, 关键的一点是, double的尾数采用52位bit来保存, 算上隐藏的1位有效位, 一共是53bits.
在这里, 引出一个很有意思的问题, 我们用c代码举例(假设long为64bits):
long a = x; assert(a == (long)(double)a);
请问, a的取值在什么范围内的时候, 上面的代码可以断言成功?(留在文章最后解答)
现在我们回归正题, PHP在执行一个脚本之前, 首先需要读入脚本, 分析脚本, 这个过程中也包含着, 对脚本中的字面量进行zval化, 比如对于如下脚本:
<?php $a = 9223372036854775807; //64位有符号数最大值 $b = 9223372036854775808; //最大值+1 var_dump($a); var_dump($b);
输出:
int(9223372036854775807) float(9.22337203685E+18)
也就说, PHP在词法分析阶段, 对于一个字面量的数值, 会去判断, 是否超出了当前系统的long的表值范围, 如果不是, 则用lval来保存, zval为IS_LONG, 否则就用dval表示, zval IS_FLOAT.
凡是大于最大的整数值的数值, 我们都要小心, 因为它可能会有精度损失:
<?php $a = 9223372036854775807; $b = 9223372036854775808; var_dump($a === ($b - 1));
输出是false.
现在接上开头的讨论, 之前说过, PHP的整数, 可能是32位, 也可能是64位, 那么就决定了, 一些在64位上可以运行正常的代码, 可能会因为隐形的类型转换, 发生精度丢失, 从而造成代码不能正常的运行在32位系统上.
所以, 我们一定要警惕这个临界值, 好在PHP中已经定义了这个临界值:
<?php echo PHP_INT_MAX; ?>
当然, 为了保险起见, 我们应该使用字符串来保存大整数, 并且采用比如bcmatch这样的数学函数库来进行计算.
另外, 还有一个关键的配置, 会让我们产生迷惑, 这个配置就是php.precision, 这配置决定了PHP再输出一个float值的时候, 输出多少有效位.
最后, 我们再来回头看上面提出的问题, 也就是一个long的整数, 最大的值是多少, 才能保证转到float以后再转回long不会发生精度丢失?
比如, 对于整数, 我们知道它的二进制表示是, 101, 现在, 让我们右移俩位, 变成1.01, 舍去高位的隐含有效位1, 我们得到在double中存储5的二进制数值为:
0/*符号位*/ 10000000001/*指数位*/ 0100000000000000000000000000000000000000000000000000
5的二进制表示, 丝毫未损的保存在了尾数部分, 这个情况下, 从double转会回long, 不会发生精度丢失.
我们知道double用52位表示尾数, 算上隐含的首位1, 一共是53位精度.. 那么也就可以得出, 如果一个long的整数, 值小于:
2^53 - 1 == 9007199254740991; //牢记, 我们现在假设是64bits的long
那么, 这个整数, 在发生long->double->long的数值转换时, 不会发生精度丢失.
Comments
- 2011/12/19, gguoyu writes: IEEE 745的浮点计数法 ==> 应该是IEEE 754 浮点计数法
– -!
- 2011/12/19, 关于PHP浮点数你应该知道的(All ‘bogus’ about the float in PHP) | 岭南六少 – 一朵在LAMP架构下挣扎的云 writes: […] 本文地址: http://www.laruence.com/2011/12/19/2399.html […]
- 2011/12/30, wclssdn writes: 前不久也发现了这个问题..
$n = pow(2, 64);
var_dump($n, $n – 1);
结果一样的- -.. 我用的32位测试机..
以为是PHP的bug呢…
Related posts:
- 三元式(ternary)性能优化
- CSS让你的IE浏览器崩溃(Crash your IE)
- 关于PHP你可能不知道的-PHP的事件驱动化设计
- 汉字和Unicode码(utf-8)之间的转换(Pack/Unpack)
- 深入理解PHP原理之Session Gc的一个小概率Notice
Copyright © 2010 风雪之隅 版权所有, 转载务必注明. 该Feed只供个人使用, 禁止未注明的转载或商业应用. 非法应用的, 一切法律后果自负. 如有问题, 可发E-mail至my at laruence.com.(Digital Fingerprint: 73540ba0a1738d7d07d4b6038d5615e2)
Random Posts:
转载请注明:爱开源 » 关于PHP浮点数你应该知道的(All ‘bogus’ about the float in PHP)