找回密码
 欢迎注册
楼主: mathe

[擂台] 平方数数字和

[复制链接]
发表于 2008-7-14 11:38:37 | 显示全部楼层
呵呵,似乎还不如一次优化的呢
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
 楼主| 发表于 2008-7-14 12:06:33 | 显示全部楼层
很有可能。不知道这个代码编译器能否产生sse2的代码?我的机器重装gcc以后,原先安装的icc就用不了了。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 12:07:41 | 显示全部楼层
能的
是最新的10.1.017的
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 12:09:02 | 显示全部楼层
呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 12:44:17 | 显示全部楼层
我有个工作
你准备个千亿次机

帮我算几个问题

毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 13:05:33 | 显示全部楼层
原帖由 无心人 于 2008-7-14 11:16 发表


可能是你优化的不如icc彻底
反而让icc给优化倒了

你不用优化选项
光产生sse2代码试下


在 sumOfDigits_4 以上都存在可向量优化,甚至 sumOfDigits_3 也可以。
为了方便 SSE2 指令,我将数组前限定了 __declspec(align(16))
并建议 LIMBS 设定为 4 的整数倍,以利于 16 字节对齐(已在原 96# 上将代码修改)。

可惜我的机器用 /fast 编译后无法运行。
当然我可以直接内嵌 SSE2 汇编指令,但懒得去做了。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 13:18:28 | 显示全部楼层
原帖由 medie2005 于 2008-7-14 12:09 发表
呵呵,大家真清闲阿,我现在正为工作发愁呢,谁给介绍个工作啊.呵呵...

发生什么情况了呀?是要毕业了么?

大家基本上要逐步步入“养老”阶段,所以“清闲”呀。呵呵。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 13:39:23 | 显示全部楼层
呵呵,已经毕业了,现在在深圳待业中。。。
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-14 21:56:46 | 显示全部楼层
待业好阿
多自由阿
想干什么干什么
想去哪里去哪里
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
发表于 2008-7-15 07:40:54 | 显示全部楼层
昨晚,我回去后对 96# 代码分别用 VC6 及 ICC 编译,
结果 ICC 编译出的反而要慢 50% 以上(运行于 Intel CPU)!!

请大家测试一下这同段代码,何以会出现该结果?
(我编译时未更改默认编译设置;选 ICC 编译时也未新增或更改编译选项)
毋因群疑而阻独见  毋任己意而废人言
毋私小惠而伤大体  毋借公论以快私情
您需要登录后才可以回帖 登录 | 欢迎注册

本版积分规则

小黑屋|手机版|数学研发网 ( 苏ICP备07505100号 )

GMT+8, 2024-5-3 22:15 , Processed in 0.059851 second(s), 15 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表