英特尔推出全新 AVX10 指令集架构,为 E 核带来 AVX-512 功能
具体参见:https://www.ithome.com/0/707/905.htm我太落伍了,只用到SSE2 编程,
本期望跳到 AVX512 指令集的,可惜前不久被 intel 阉割,
现在又推出 AVX10,也不知哪年能出现在消费级 CPU 上。 对你有啥好处?
你为什么不搞个针对超级计算机或者工作站的hugecalc? 我记得你以前用过在阶乘计算器在工作站上面,好像是你同事给你用的工作站。
具体不是太清楚了。 是啊,当时双核的 CPU 才刚出来呢 gxqcn 发表于 2023-7-25 11:49
是啊,当时双核的 CPU 才刚出来呢
明年你就50大寿了,你还码代码吗?
我比你小十几岁,可是我现在都没激情码代码了 以前的我还沉迷于素数判定算法,想搞明白lucas伪素数判定算法的具体细节,虽然后来也搞明白了,但是却也浪费了很多时间 并行才是未来,考虑用显卡。 GPU 强项是浮点吧?不知整型计算能力如何?
比如最多支持多少 bit 的整型乘法?(对应的,在 CPU 上,可支持 U64xU64 --> U128) nvidia自己说的
https://developer.nvidia.com/zh-cn/blog/implementing-high-precision-decimal-arithmetic-with-cuda-int128/
介绍 CUDA __int128
在 NVIDIA CUDA 11.5 中, NVCC 离线编译器在主机编译器支持的平台上为有符号和无符号__int128数据类型添加了预览支持。nvrtc JIT 编译器还增加了对 128 位整数的支持,但需要一个命令行选项--device-int128来启用这种支持。算术、逻辑和位运算都支持 128 位整数。请注意, DWARF 调试对 128 位整数的支持目前还不可用,并将在后续的 CUDA 版本中提供。在 11.6 版本中, cuda gdb 和 Nsight Visual Studio Code Edition 增加了对检查这种新变量类型的支持。
NVIDIA GPU 以 32 位的数量计算整数,因此 128 位整数用四个 32 位无符号整数表示。加法、减法和乘法算法非常简单,使用内置的 PTX addc / madc 指令处理多个精度值。除法和余数使用简单的 O ( n ^ 2 )除法算法实现,类似于 Brent 和 Zimmermann 的书 现代计算机算法 中的算法 1.6 ,并进行了一些优化,以改进商选择步骤并最小化校正步骤。 128 位整数的一个令人振奋的用例是使用它们实现十进制定点算法。的 21.12 版本中包含 128 位十进制定点支持 RAPIDS libcudf .继续阅读,了解更多关于定点算法的信息,以及__int128如何用于实现高精度计算。 新的指令集,那可真是大工程啊!
页:
[1]
2