64bits 除以 32 bits寄存器,延时为20-28个周期,每11-18个周期可发射1条指令
128bits 除以 64 bits寄存器,延时为30-94个周期,每22-76个周期可发射1条指令
我也知道除法比乘法慢,但没有想到会慢了这么多。难怪liangbch写的程序运行得很快,应该是把慢的指令抛弃了。
TO shines:
我提一点建议,你抽点时间写出一个实现的步骤,我写出一个程序试试看,如有伪代码更好。
另外,在你的博客中提到的除以常数(固定数)的原理,如果真的比机器做除法快,那就可以用在我在9#写的试商上。那个试商从循环开始到结束都是除以一个固定数字。 可以把这些成果整合进编译器吗? 现代编译器已经有这种优化了 http://blog.csdn.net/concreteham/article/details/4750740
页:
1
[2]