无心人 发表于 2008-7-14 11:38:37

呵呵,似乎还不如一次优化的呢

mathe 发表于 2008-7-14 12:06:33

很有可能。不知道这个代码编译器能否产生sse2的代码?我的机器重装gcc以后,原先安装的icc就用不了了。

无心人 发表于 2008-7-14 12:07:41

能的
是最新的10.1.017的

medie2005 发表于 2008-7-14 12:09:02

呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...

无心人 发表于 2008-7-14 12:44:17

我有个工作
你准备个千亿次机

帮我算几个问题

:lol

gxqcn 发表于 2008-7-14 13:05:33

原帖由 无心人 于 2008-7-14 11:16 发表 http://bbs.emath.ac.cn/images/common/back.gif
:lol

可能是你优化的不如icc彻底
反而让icc给优化倒了

你不用优化选项
光产生sse2代码试下

在 sumOfDigits_4 以上都存在可向量优化,甚至 sumOfDigits_3 也可以。
为了方便 SSE2 指令,我将数组前限定了 __declspec(align(16)),
并建议 LIMBS 设定为 4 的整数倍,以利于 16 字节对齐(已在原 96# 上将代码修改)。

可惜我的机器用 /fast 编译后无法运行。:M:
当然我可以直接内嵌 SSE2 汇编指令,但懒得去做了。

zgg___ 发表于 2008-7-14 13:18:28

原帖由 medie2005 于 2008-7-14 12:09 发表 http://bbs.emath.ac.cn/images/common/back.gif
呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...
发生什么情况了呀?是要毕业了么?

大家基本上要逐步步入“养老”阶段,所以“清闲”呀。呵呵。

medie2005 发表于 2008-7-14 13:39:23

呵呵,已经毕业了,现在在深圳待业中。。。

无心人 发表于 2008-7-14 21:56:46

待业好阿
多自由阿
想干什么干什么
想去哪里去哪里

gxqcn 发表于 2008-7-15 07:40:54

昨晚,我回去后对 96# 代码分别用 VC6 及 ICC 编译,
结果 ICC 编译出的反而要慢 50% 以上(运行于 Intel CPU)!!:L

请大家测试一下这同段代码,何以会出现该结果?:Q:
(我编译时未更改默认编译设置;选 ICC 编译时也未新增或更改编译选项)
页: 2 3 4 5 6 7 8 9 10 11 [12] 13 14 15 16 17 18
查看完整版本: 平方数数字和