只是呼吸 发表于 2015-1-15 10:11:16

与之相对的,
64bits   除以 32 bits寄存器,延时为20-28个周期,每11-18个周期可发射1条指令
128bits 除以 64 bits寄存器,延时为30-94个周期,每22-76个周期可发射1条指令



我也知道除法比乘法慢,但没有想到会慢了这么多。难怪liangbch写的程序运行得很快,应该是把慢的指令抛弃了。


TO shines:
我提一点建议,你抽点时间写出一个实现的步骤,我写出一个程序试试看,如有伪代码更好。
另外,在你的博客中提到的除以常数(固定数)的原理,如果真的比机器做除法快,那就可以用在我在9#写的试商上。那个试商从循环开始到结束都是除以一个固定数字。

zeroieme 发表于 2015-1-15 10:21:23

可以把这些成果整合进编译器吗?

mathe 发表于 2015-1-15 13:04:40

现代编译器已经有这种优化了

sunwukong 发表于 2015-2-2 23:42:12

http://blog.csdn.net/concreteham/article/details/4750740
页: 1 [2]
查看完整版本: 对32位整数除法优化原理的整理