高精度除法中，试商法的 3/2 算法 - 第2页 - 算法交流 - 数学研发论坛

无心人 发表于 2022-1-6 11:35:01

当m+n很大时候，是用b倒数乘以a做的，所以，严格来说，m+n比较小的时候才是传统除法，这时候，不同的试商策略，对运算时间的影响是很大的。
所以这个问题其实还和m,n取值有关系

knate 发表于 2024-3-26 10:10:20

本帖最后由 knate 于 2024-3-26 10:12 编辑

这里有两个估商实现
//要求 iRadix <= 2^31,
//估商时除数 + 1 结果作为估算值.
uint32_t div_3_2_int_new(uint32_t a, uint32_t b, uint32_t c, uint32_t iDivsor_up, uint32_t iDivsor_down) {
//这个不是真正的除法,是估算.
//而且有个前提,结果一定是一位的.
if (a == 0) {
return ((__int64)b * cStatus.iRADIX + c) / ((__int64)iDivsor_up * cStatus.iRADIX + iDivsor_down + 1);
}

if (iDivsor_down == cStatus.iRADIX - 1) {
iDivsor_up += 1;
return (unsigned int)(((__int64)a * cStatus.iRADIX + b) / iDivsor_up);
}
{
uint64_t divsor = iDivsor_up; divsor *= cStatus.iRADIX;
divsor += iDivsor_down;
//aR^2 + bR+c / dR+f
// a*up * 2^32 + a * down + bR + c;
uint64_t first, second, third; //2^32
uint64_t up, down;
up = cStatus.iRADIX; up *= up; // R^2
down = up & 0XFFFFFFFF;
up >>= 32;

first = a; first *= up; //a *up

second = b; second *= cStatus.iRADIX;
down *= a;
second += down;
second += c;
//a * down + bR + c;

third = second & 0XFFFFFFFF;
second >>= 32;

first += second;

uint32_t val = first >> 32;
if (val) {
uint32_t num = asm_bsr(val);//查找first 最高位位置.
first <<= 31 - num;
first += third >> (num + 1);
divsor >>= num + 1;
divsor += 1;
return (uint32_t)(first / divsor);
}
first <<= 32;
first += third;
return (uint32_t)(first / (divsor + 1));
}
return 0;
}

uint32_t div_3_2_int_bin(uint32_t a, uint32_t b, uint32_t c, uint32_t iDivsor_up, uint32_t iDivsor_down) {
//这个不是真正的除法,是估算.
//而且有个前提,结果一定是一位的.
if (a == 0) {
return ((__int64)b * cStatus.iRADIX + c) / ((__int64)iDivsor_up * cStatus.iRADIX + iDivsor_down + 1);
}

if (iDivsor_down == cStatus.iRADIX - 1) {
iDivsor_up += 1;
return (unsigned int)(((__int64)a * cStatus.iRADIX + b) / iDivsor_up);
}
{
uint64_t divsor = iDivsor_up; divsor *= cStatus.iRADIX;
divsor += iDivsor_down + 1;
iDivsor_up = divsor >> 32; iDivsor_down = divsor & 0XFFFFFFFF;
//除数转换为2进制显示.

unsigned int iQuotient = 0;
uint64_t iRemainder_up, iRemainder_down;
uint32_t iMultiple;
// 2^64 / divsor商: multiple,余数高32位 iRemainder_up,余数低32位 iRemainder_down

uint64_t val;
val = 0XFFFFFFFF; val <<= 32; val += 0XFFFFFFFF;
iMultiple = val / divsor; val = val % divsor;
if (val + 1 == divsor) {
//2^64 mod divsor 商和余数
iMultiple += 1;
iRemainder_up = 0;
iRemainder_down = 0;
}
else {
val += 1;
iRemainder_up = val >> 32;
iRemainder_down = val & 0XFFFFFFFF;
}

__int64 up, down;// down 低32位,up 高64位, 合计96位.2进制表示.
val = cStatus.iRADIX; val *= val;
up = val >> 32;down = val & 0XFFFFFFFF;
up *= a;down *= a; //aR^2

val = cStatus.iRADIX; val *= b;
up += val >> 32;down += val & 0XFFFFFFFF;
//aR^2 + bR

down += c;
up += down >> 32; down &= 0XFFFFFFFF;

//down 低32位,up 高64位, 合计96位.2进制表示.
do {
//把 2^64拆分为商和余数.
uint32_t temp = up >> 32;
iQuotient += temp * iMultiple;
up &= 0XFFFFFFFF;
up += iRemainder_up * temp;
down += iRemainder_down * temp;

up += down >> 32;
down &= 0XFFFFFFFF;
} while (up >> 32);
up <<= 32; up += down;
iQuotient += up / divsor;
return iQuotient;
}
return 0;
}

页: 1 [2]

数学研发论坛's Archiver