无心人
发表于 2008-7-14 11:38:37
呵呵,似乎还不如一次优化的呢
mathe
发表于 2008-7-14 12:06:33
很有可能。不知道这个代码编译器能否产生sse2的代码?我的机器重装gcc以后,原先安装的icc就用不了了。
无心人
发表于 2008-7-14 12:07:41
能的
是最新的10.1.017的
medie2005
发表于 2008-7-14 12:09:02
呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...
无心人
发表于 2008-7-14 12:44:17
我有个工作
你准备个千亿次机
帮我算几个问题
:lol
gxqcn
发表于 2008-7-14 13:05:33
原帖由 无心人 于 2008-7-14 11:16 发表 http://bbs.emath.ac.cn/images/common/back.gif
:lol
可能是你优化的不如icc彻底
反而让icc给优化倒了
你不用优化选项
光产生sse2代码试下
在 sumOfDigits_4 以上都存在可向量优化,甚至 sumOfDigits_3 也可以。
为了方便 SSE2 指令,我将数组前限定了 __declspec(align(16)),
并建议 LIMBS 设定为 4 的整数倍,以利于 16 字节对齐(已在原 96# 上将代码修改)。
可惜我的机器用 /fast 编译后无法运行。:M:
当然我可以直接内嵌 SSE2 汇编指令,但懒得去做了。
zgg___
发表于 2008-7-14 13:18:28
原帖由 medie2005 于 2008-7-14 12:09 发表 http://bbs.emath.ac.cn/images/common/back.gif
呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...
发生什么情况了呀?是要毕业了么?
大家基本上要逐步步入“养老”阶段,所以“清闲”呀。呵呵。
medie2005
发表于 2008-7-14 13:39:23
呵呵,已经毕业了,现在在深圳待业中。。。
无心人
发表于 2008-7-14 21:56:46
待业好阿
多自由阿
想干什么干什么
想去哪里去哪里
gxqcn
发表于 2008-7-15 07:40:54
昨晚,我回去后对 96# 代码分别用 VC6 及 ICC 编译,
结果 ICC 编译出的反而要慢 50% 以上(运行于 Intel CPU)!!:L
请大家测试一下这同段代码,何以会出现该结果?:Q:
(我编译时未更改默认编译设置;选 ICC 编译时也未新增或更改编译选项)