忘掉extended
extended很大(10字节,如果代码对齐就有12字节),读写运算都很慢,是优化的大敌。且Delphi2-4对extended的代码对齐有bug。因此,若非必要,不要用extended。
同时,在混合浮点类型的运算中,编译器为了不丢失精度,临时变量以extended类型存储,所以要避免混合浮点运算。
还有,用const定义的常量,如不加指明,则也默认为extended类型。解决办法是,配合$J指示字,定义指明类型常量(typed constand)。
改变FPU控制字
默认的FPU控制字令除法运算和PII/PIII上的平方根运算慢而精确,当无须得到这样的结果时,可用Set8087CW让FPU“偷懒”。
对于Single类型:Set8087CW(Default8087CW and $FCFF)
对于Double类型:Set8087CW((Default8087CW and $FCFF) or $0200)
对于extended类型:Set8087CW(Default8087CW or $0300)
多用Round
Trunc会读写FPU指令字,而Round不会,所以可以的话,尽量用Round。
传送实参
对于返回浮点值的函数,入口和出口处会有附加的压栈退栈,对形如:
function func(x : SomeType): SomeFloat;
不妨改写为:
procedure func(x : SomeType; var fp : SomeFloat);
对于在过程中未修改的浮点形参,没必要用const修饰,因为那除了增加一个编译期检查外,别无用处。相应的对策是用var修饰为实参,强制传址。
自己动手,丰衣足食
Delphi本身不对浮点运算作任何优化,因此很多时候,还得自己用汇编来解决。
值得注意的是,Delphi中浮点异常的触发,不是在出错之后,而是在下一条浮点指令之前。因此,通常的作法是,在一次浮点操作完毕后,加一条FWAIT指令。
减少除法
除法,即多次的减法,其代价是相当昂贵的,因而有必要减少除法的次数。
另外,对于简单除法(如:a/5),编译器不一定(?!)会将其变为乘法(a*0.2),比如:
fp:=fp*3*4/5+3*4/2;
在Delphi 4中,会被编译为:
fp:=fp*3*4/5+6;
而只有:
fp:=3*4/5*fp+3*4/2;
才会被编译为:
fp:=2.4*fp+6;
鉴于编译器的繁复规则,建议这一步优化自己完成。
浮点零的检查
检查一个浮点数是否为零,如果简单的“Afloat=0”,会把0转换为浮点零。而更好的办法是这样:
对于Single类型:(Dword(pointer(Asingle))shl 1) =0
对于Double类型:
type
DoubleData=record lo,hi:Dword end;
Var
ADouble:Double;
Dd:DoubleData absolute Adouble;
begin
…
if ((dd.hi shl 1)+dd.lo)=0 then …
end;
此法在PII上有30%-40%的效率提升。