4 năm trước cách đây · 9fb486b2ad
--- a/core/math/big/api.odin
+++ b/core/math/big/api.odin
@@ -9,9 +9,7 @@ package math_big
 
				 	The code started out as an idiomatic source port of libTomMath, which is in the public domain, with thanks.
			
 
				 
			
 
				 	This file collects public proc maps and their aliases.
			
 
				-/*
			
 
				 
			
 
				-*/
			
 
				 	=== === === === === === === === === === === === === === === === === === === === === === === ===
			
 
				 	                                    Basic arithmetic.
			
 
				 	                                    See `public.odin`.
			
--- a/core/math/big/build.bat
+++ b/core/math/big/build.bat
@@ -1,8 +1,8 @@
 
				 @echo off

			
 
				-odin run . -vet

			
 
				+:odin run . -vet

			
 
				 : -o:size

			
 
				-:odin build . -build-mode:shared -show-timings -o:minimal -no-bounds-check && python test.py -fast-tests

			
 
				-:odin build . -build-mode:shared -show-timings -o:size -no-bounds-check  && python test.py -fast-tests

			
 
				-:odin build . -build-mode:shared -show-timings -o:size  && python test.py -fast-tests

			
 
				-:odin build . -build-mode:shared -show-timings -o:speed -no-bounds-check && python test.py -fast-tests

			
 
				-:odin build . -build-mode:shared -show-timings -o:speed && python test.py -fast-tests
			
 
				+:odin build . -build-mode:shared -show-timings -o:minimal -no-bounds-check -define:MATH_BIG_EXE=false && python test.py -fast-tests

			
 
				+:odin build . -build-mode:shared -show-timings -o:size -no-bounds-check -define:MATH_BIG_EXE=false && python test.py -fast-tests

			
 
				+:odin build . -build-mode:shared -show-timings -o:size -define:MATH_BIG_EXE=false && python test.py -fast-tests

			
 
				+odin build . -build-mode:shared -show-timings -o:speed -no-bounds-check -define:MATH_BIG_EXE=false && python test.py -fast-tests

			
 
				+:odin build . -build-mode:shared -show-timings -o:speed -define:MATH_BIG_EXE=false && python test.py -fast-tests
			
--- a/core/math/big/common.odin
+++ b/core/math/big/common.odin
@@ -27,10 +27,22 @@ import "core:intrinsics"
 
				 	`initialize_constants` also replaces the other `_DEFAULT_*` cutoffs with custom compile-time values if so `#config`ured.
			
 
				 
			
 
				 */
			
 
				-MUL_KARATSUBA_CUTOFF := initialize_constants();
			
 
				-SQR_KARATSUBA_CUTOFF := _DEFAULT_SQR_KARATSUBA_CUTOFF;
			
 
				-MUL_TOOM_CUTOFF      := _DEFAULT_MUL_TOOM_CUTOFF;
			
 
				-SQR_TOOM_CUTOFF      := _DEFAULT_SQR_TOOM_CUTOFF;
			
 
				+
			
 
				+/*
			
 
				+	There is a bug with DLL globals. They don't get set.
			
 
				+	To allow tests to run we add `-define:MATH_BIG_EXE=false` to hardcode the cutoffs for now.
			
 
				+*/
			
 
				+when #config(MATH_BIG_EXE, true) {
			
 
				+	MUL_KARATSUBA_CUTOFF := initialize_constants();
			
 
				+	SQR_KARATSUBA_CUTOFF := _DEFAULT_SQR_KARATSUBA_CUTOFF;
			
 
				+	MUL_TOOM_CUTOFF      := _DEFAULT_MUL_TOOM_CUTOFF;
			
 
				+	SQR_TOOM_CUTOFF      := _DEFAULT_SQR_TOOM_CUTOFF;
			
 
				+} else {
			
 
				+	MUL_KARATSUBA_CUTOFF := _DEFAULT_MUL_KARATSUBA_CUTOFF;
			
 
				+	SQR_KARATSUBA_CUTOFF := _DEFAULT_SQR_KARATSUBA_CUTOFF;
			
 
				+	MUL_TOOM_CUTOFF      := _DEFAULT_MUL_TOOM_CUTOFF;
			
 
				+	SQR_TOOM_CUTOFF      := _DEFAULT_SQR_TOOM_CUTOFF;	
			
 
				+}
			
 
				 
			
 
				 /*
			
 
				 	These defaults were tuned on an AMD A8-6600K (64-bit) using libTomMath's `make tune`.
			
--- a/core/math/big/example.odin
+++ b/core/math/big/example.odin
@@ -206,19 +206,16 @@ demo :: proc() {
 
				 	a, b, c, d, e, f := &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{};
			
 
				 	defer destroy(a, b, c, d, e, f);
			
 
				 
			
 
				-	set(a, 64336);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				-	int_to_byte(a);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				-	int_to_byte_little(a);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				-
			
 
				-	set(b, -64336);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				-	int_to_byte(b);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				-	int_to_byte_little(b);
			
 
				-	fmt.println("--- --- --- ---");
			
 
				+	atoi(a, "12980742146337069150589594264770969721", 10);
			
 
				+	print("a: ", a, 10, true, true, true);
			
 
				+	atoi(b, "4611686018427387904", 10);
			
 
				+	print("b: ", b, 10, true, true, true);
			
 
				+
			
 
				+	if err := internal_divmod(c, d, a, b); err != nil {
			
 
				+		fmt.printf("Error: %v\n", err);
			
 
				+	}
			
 
				+	print("c: ", c);
			
 
				+	print("c: ", d);
			
 
				 }
			
 
				 
			
 
				 main :: proc() {
			
--- a/core/math/big/internal.odin
+++ b/core/math/big/internal.odin
@@ -36,6 +36,8 @@ import "core:mem"
 
				 import "core:intrinsics"
			
 
				 import rnd "core:math/rand"
			
 
				 
			
 
				+import "core:fmt"
			
 
				+
			
 
				 /*
			
 
				 	Low-level addition, unsigned. Handbook of Applied Cryptography, algorithm 14.7.
			
 
				 
			
@@ -260,6 +262,12 @@ internal_int_add_digit :: proc(dest, a: ^Int, digit: DIGIT, allocator := context
 
				 }
			
 
				 internal_add :: proc { internal_int_add_signed, internal_int_add_digit, };
			
 
				 
			
 
				+
			
 
				+internal_int_incr :: proc(dest: ^Int, allocator := context.allocator) -> (err: Error) {
			
 
				+	return #force_inline internal_add(dest, dest, 1);
			
 
				+}
			
 
				+internal_incr :: proc { internal_int_incr, };
			
 
				+
			
 
				 /*
			
 
				 	Low-level subtraction, dest = number - decrease. Assumes |number| > |decrease|.
			
 
				 	Handbook of Applied Cryptography, algorithm 14.9.
			
@@ -458,6 +466,11 @@ internal_int_sub_digit :: proc(dest, number: ^Int, digit: DIGIT, allocator := co
 
				 
			
 
				 internal_sub :: proc { internal_int_sub_signed, internal_int_sub_digit, };
			
 
				 
			
 
				+internal_int_decr :: proc(dest: ^Int, allocator := context.allocator) -> (err: Error) {
			
 
				+	return #force_inline internal_sub(dest, dest, 1);
			
 
				+}
			
 
				+internal_decr :: proc { internal_int_decr, };
			
 
				+
			
 
				 /*
			
 
				 	dest = src  / 2
			
 
				 	dest = src >> 1
			
@@ -703,7 +716,6 @@ internal_sqr :: proc (dest, src: ^Int, allocator := context.allocator) -> (res:
 
				 */
			
 
				 internal_int_divmod :: proc(quotient, remainder, numerator, denominator: ^Int, allocator := context.allocator) -> (err: Error) {
			
 
				 	context.allocator = allocator;
			
 
				-
			
 
				 	if denominator.used == 0 { return .Division_by_Zero; }
			
 
				 	/*
			
 
				 		If numerator < denominator then quotient = 0, remainder = numerator.
			
@@ -718,8 +730,10 @@ internal_int_divmod :: proc(quotient, remainder, numerator, denominator: ^Int, a
 
				 		return nil;
			
 
				 	}
			
 
				 
			
 
				-	if false && (denominator.used > 2 * MUL_KARATSUBA_CUTOFF) && (denominator.used <= (numerator.used/3) * 2) {
			
 
				-		// err = _int_div_recursive(quotient, remainder, numerator, denominator);
			
 
				+	if (denominator.used > 2 * MUL_KARATSUBA_CUTOFF) && (denominator.used <= (numerator.used / 3) * 2) {
			
 
				+		assert(denominator.used >= 160 && numerator.used >= 240, "MUL_KARATSUBA_CUTOFF global not properly set.");
			
 
				+		err = _private_int_div_recursive(quotient, remainder, numerator, denominator);
			
 
				+		// err = #force_inline _private_int_div_school(quotient, remainder, numerator, denominator);
			
 
				 	} else {
			
 
				 		when true {
			
 
				 			err = #force_inline _private_int_div_school(quotient, remainder, numerator, denominator);
			
@@ -1740,6 +1754,29 @@ internal_int_neg :: proc(dest, src: ^Int, allocator := context.allocator) -> (er
 
				 }
			
 
				 internal_neg :: proc { internal_int_neg, };
			
 
				 
			
 
				+/*
			
 
				+	hac 14.61, pp608.
			
 
				+*/
			
 
				+internal_int_inverse_modulo :: proc(dest, a, b: ^Int, allocator := context.allocator) -> (err: Error) {
			
 
				+	context.allocator = allocator;
			
 
				+	/*
			
 
				+		For all n in N and n > 0, n = 0 mod 1.
			
 
				+	*/
			
 
				+	if internal_is_positive(a) && internal_cmp(b, 1) == 0 { return internal_zero(dest);	}
			
 
				+
			
 
				+	/*
			
 
				+		`b` cannot be negative and has to be > 1
			
 
				+	*/
			
 
				+	if internal_is_negative(b) && internal_cmp(b, 1) != 1 { return .Invalid_Argument; }
			
 
				+
			
 
				+	/*
			
 
				+		If the modulus is odd we can use a faster routine instead.
			
 
				+	*/
			
 
				+	if internal_is_odd(b) { return _private_inverse_modulo_odd(dest, a, b); }
			
 
				+
			
 
				+	return _private_inverse_modulo(dest, a, b);
			
 
				+}
			
 
				+internal_invmod :: proc{ internal_int_inverse_modulo, };
			
 
				 
			
 
				 /*
			
 
				 	Helpers to extract values from the `Int`.
			
@@ -1991,7 +2028,11 @@ internal_int_get :: proc(a: ^Int, $T: typeid) -> (res: T, err: Error) where intr
 
				 internal_get :: proc { internal_int_get, };
			
 
				 
			
 
				 internal_int_get_float :: proc(a: ^Int) -> (res: f64, err: Error) {
			
 
				-	l   := min(a.used, 17); // log2(max(f64)) is approximately 1020, or 17 legs.
			
 
				+	/*
			
 
				+		log2(max(f64)) is approximately 1020, or 17 legs with the 64-bit storage.
			
 
				+	*/
			
 
				+	legs :: 1020 / _DIGIT_BITS;
			
 
				+	l   := min(a.used, legs);
			
 
				 	fac := f64(1 << _DIGIT_BITS);
			
 
				 	d   := 0.0;
			
 
				 
			
--- a/core/math/big/prime.odin
+++ b/core/math/big/prime.odin
@@ -31,3 +31,48 @@ int_prime_is_divisible :: proc(a: ^Int, allocator := context.allocator) -> (res:
 
				 	*/
			
 
				 	return false, nil;
			
 
				 }
			
 
				+
			
 
				+number_of_rabin_miller_trials :: proc(bit_size: int) -> (number_of_trials: int) {
			
 
				+	switch {
			
 
				+	case bit_size <=    80:
			
 
				+		return - 1;		/* Use deterministic algorithm for size <= 80 bits */
			
 
				+	case bit_size >=    81 && bit_size <     96:
			
 
				+		return 37;		/* max. error = 2^(-96)  */
			
 
				+	case bit_size >=    96 && bit_size <    128:
			
 
				+		return 32;		/* max. error = 2^(-96)  */
			
 
				+	case bit_size >=   128 && bit_size <    160:
			
 
				+		return 40;		/* max. error = 2^(-112) */
			
 
				+	case bit_size >=   160 && bit_size <    256:
			
 
				+		return 35;		/* max. error = 2^(-112) */
			
 
				+	case bit_size >=   256 && bit_size <    384:
			
 
				+		return 27;		/* max. error = 2^(-128) */
			
 
				+	case bit_size >=   384 && bit_size <    512:
			
 
				+		return 16;		/* max. error = 2^(-128) */
			
 
				+	case bit_size >=   512 && bit_size <    768:
			
 
				+		return 18;		/* max. error = 2^(-160) */
			
 
				+	case bit_size >=   768 && bit_size <    896:
			
 
				+		return 11;		/* max. error = 2^(-160) */
			
 
				+	case bit_size >=   896 && bit_size <  1_024:
			
 
				+		return 10;		/* max. error = 2^(-160) */
			
 
				+	case bit_size >= 1_024 && bit_size <  1_536:
			
 
				+		return 12;		/* max. error = 2^(-192) */
			
 
				+	case bit_size >= 1_536 && bit_size <  2_048:
			
 
				+		return  8;		/* max. error = 2^(-192) */
			
 
				+	case bit_size >= 2_048 && bit_size <  3_072:
			
 
				+		return  6;		/* max. error = 2^(-192) */
			
 
				+	case bit_size >= 3_072 && bit_size <  4_096:
			
 
				+		return  4;		/* max. error = 2^(-192) */
			
 
				+	case bit_size >= 4_096 && bit_size <  5_120:
			
 
				+		return  5;		/* max. error = 2^(-256) */
			
 
				+	case bit_size >= 5_120 && bit_size <  6_144:
			
 
				+		return  4;		/* max. error = 2^(-256) */
			
 
				+	case bit_size >= 6_144 && bit_size <  8_192:
			
 
				+		return  4;		/* max. error = 2^(-256) */
			
 
				+	case bit_size >= 8_192 && bit_size <  9_216:
			
 
				+		return  3;		/* max. error = 2^(-256) */
			
 
				+	case bit_size >= 9_216 && bit_size < 10_240:
			
 
				+		return  3;		/* max. error = 2^(-256) */
			
 
				+	case:
			
 
				+		return  2;		/* For keysizes bigger than 10_240 use always at least 2 Rounds */
			
 
				+	}
			
 
				+}
			
--- a/core/math/big/private.odin
+++ b/core/math/big/private.odin
@@ -430,7 +430,7 @@ _private_int_sqr_toom :: proc(dest, src: ^Int, allocator := context.allocator) -
 
				 	context.allocator = allocator;

			
 
				 

			
 
				 	S0, a0, a1, a2 := &Int{}, &Int{}, &Int{}, &Int{};

			
 
				-	defer destroy(S0, a0, a1, a2);

			
 
				+	defer internal_destroy(S0, a0, a1, a2);

			
 
				 

			
 
				 	/*

			
 
				 		Init temps.

			
@@ -752,6 +752,188 @@ _private_int_div_school :: proc(quotient, remainder, numerator, denominator: ^In
 
				 	return nil;

			
 
				 }

			
 
				 

			
 
				+/*

			
 
				+	Direct implementation of algorithms 1.8 "RecursiveDivRem" and 1.9 "UnbalancedDivision" from:

			
 
				+

			
 
				+		Brent, Richard P., and Paul Zimmermann. "Modern computer arithmetic"

			
 
				+		Vol. 18. Cambridge University Press, 2010

			
 
				+		Available online at https://arxiv.org/pdf/1004.4710

			
 
				+

			
 
				+	pages 19ff. in the above online document.

			
 
				+*/

			
 
				+_private_div_recursion :: proc(quotient, remainder, a, b: ^Int, allocator := context.allocator) -> (err: Error) {

			
 
				+	context.allocator = allocator;

			
 
				+

			
 
				+	A1, A2, B1, B0, Q1, Q0, R1, R0, t := &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{};

			
 
				+	defer internal_destroy(A1, A2, B1, B0, Q1, Q0, R1, R0, t);

			
 
				+

			
 
				+	m := a.used - b.used;

			
 
				+	k := m / 2;

			
 
				+

			
 
				+	if m < MUL_KARATSUBA_CUTOFF { return _private_int_div_school(quotient, remainder, a, b); }

			
 
				+

			
 
				+	if err = internal_init_multi(A1, A2, B1, B0, Q1, Q0, R1, R0, t); err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		`B1` = `b` / `beta`^`k`, `B0` = `b` % `beta`^`k`

			
 
				+	*/

			
 
				+	if err = internal_shrmod(B1, B0, b, k * _DIGIT_BITS);            err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		(Q1, R1) =  RecursiveDivRem(A / beta^(2k), B1)

			
 
				+	*/

			
 
				+	if err = internal_shrmod(A1, t, a, 2 * k * _DIGIT_BITS);         err != nil { return err; }

			
 
				+	if err = _private_div_recursion(Q1, R1, A1, B1);                 err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		A1 = (R1 * beta^(2k)) + (A % beta^(2k)) - (Q1 * B0 * beta^k)

			
 
				+	*/

			
 
				+	if err = internal_shl_digit(R1, 2 * k);                          err != nil { return err; }

			
 
				+	if err = internal_add(A1, R1, t);                                err != nil { return err; }

			
 
				+	if err = internal_mul(t, Q1, B0);                                err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		While A1 < 0 do Q1 = Q1 - 1, A1 = A1 + (beta^k * B)

			
 
				+	*/

			
 
				+	if internal_cmp(A1, 0) == -1 {

			
 
				+		if internal_shl(t, b, k * _DIGIT_BITS);                      err != nil { return err; }

			
 
				+

			
 
				+		for {

			
 
				+			if err = internal_decr(Q1);                              err != nil { return err; }

			
 
				+			if err = internal_add(A1, A1, t);                        err != nil { return err; }

			
 
				+			if internal_cmp(A1, 0) != -1 { break; }

			
 
				+		}

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		(Q0, R0) =  RecursiveDivRem(A1 / beta^(k), B1)

			
 
				+	*/

			
 
				+	if internal_shrmod(A1, t, A1, k * _DIGIT_BITS);                  err != nil { return err; }

			
 
				+	if _private_div_recursion(Q0, R0, A1, B1);                       err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		A2 = (R0*beta^k) +  (A1 % beta^k) - (Q0*B0)

			
 
				+	*/

			
 
				+	if err = internal_shl_digit(R0, k);                              err != nil { return err; }

			
 
				+	if err = internal_add(A2, R0, t);                                err != nil { return err; } 

			
 
				+	if err = internal_mul(t, Q0, B0);                                err != nil { return err; }

			
 
				+	if err = internal_sub(A2, A2, t);                                err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		While A2 < 0 do Q0 = Q0 - 1, A2 = A2 + B.

			
 
				+	*/

			
 
				+	for internal_cmp(A2, 0) == -1 {

			
 
				+		if err = internal_decr(Q0);                                  err != nil { return err; }

			
 
				+		if err = internal_add(A2, A2, b);                            err != nil { return err; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Return q = (Q1*beta^k) + Q0, r = A2.

			
 
				+	*/

			
 
				+	if err = internal_shl_digit(Q1, k);                              err != nil { return err; }

			
 
				+	if err = internal_add(quotient, Q1, Q0);                         err != nil { return err; }

			
 
				+

			
 
				+	return internal_copy(remainder, A2);

			
 
				+}

			
 
				+

			
 
				+_private_int_div_recursive :: proc(quotient, remainder, a, b: ^Int, allocator := context.allocator) -> (err: Error) {

			
 
				+	context.allocator = allocator;

			
 
				+

			
 
				+	A, B, Q, Q1, R, A_div, A_mod := &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{};

			
 
				+	defer internal_destroy(A, B, Q, Q1, R, A_div, A_mod);

			
 
				+

			
 
				+	if err = internal_init_multi(A, B, Q, Q1, R, A_div, A_mod);      err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		Most significant bit of a limb.

			
 
				+		Assumes  _DIGIT_MAX < (sizeof(DIGIT) * sizeof(u8)).

			
 
				+	*/

			
 
				+	msb := (_DIGIT_MAX + DIGIT(1)) >> 1;

			
 
				+	sigma := 0;

			
 
				+	msb_b := b.digit[b.used - 1];

			
 
				+	for msb_b < msb {

			
 
				+		sigma += 1;

			
 
				+		msb_b <<= 1;

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Use that sigma to normalize B.

			
 
				+	*/

			
 
				+	if err = internal_shl(B, b, sigma);                              err != nil { return err; }

			
 
				+	if err = internal_shl(A, a, sigma);                              err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		Fix the sign.

			
 
				+	*/

			
 
				+	neg := a.sign != b.sign;

			
 
				+	A.sign = .Zero_or_Positive; B.sign = .Zero_or_Positive;

			
 
				+

			
 
				+	/*

			
 
				+		If the magnitude of "A" is not more more than twice that of "B" we can work

			
 
				+		on them directly, otherwise we need to work at "A" in chunks.

			
 
				+	*/

			
 
				+	n := B.used;

			
 
				+	m := A.used - B.used;

			
 
				+

			
 
				+	/*

			
 
				+		Q = 0. We already ensured that when we called `internal_init_multi`.

			
 
				+	*/

			
 
				+	for m > n {

			
 
				+		/*

			
 
				+			(q, r) = RecursiveDivRem(A / (beta^(m-n)), B)

			
 
				+		*/

			
 
				+		j := (m - n) * _DIGIT_BITS;

			
 
				+		if err = internal_shrmod(A_div, A_mod, A, j);                err != nil { return err; }

			
 
				+		if err = _private_div_recursion(Q1, R, A_div, B);            err != nil { return err; }

			
 
				+

			
 
				+		/*

			
 
				+			Q = (Q*beta!(n)) + q

			
 
				+		*/

			
 
				+		if err = internal_shl(Q, Q, n * _DIGIT_BITS);                err != nil { return err; }

			
 
				+		if err = internal_add(Q, Q, Q1);                             err != nil { return err; }

			
 
				+

			
 
				+		/*

			
 
				+			A = (r * beta^(m-n)) + (A % beta^(m-n))

			
 
				+		*/

			
 
				+		if err = internal_shl(R, R, (m - n) * _DIGIT_BITS);          err != nil { return err; }

			
 
				+		if err = internal_add(A, R, A_mod);                          err != nil { return err; }

			
 
				+

			
 
				+		/*

			
 
				+			m = m - n

			
 
				+		*/

			
 
				+		m -= n;

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		(q, r) = RecursiveDivRem(A, B)

			
 
				+	*/

			
 
				+	if err = _private_div_recursion(Q1, R, A, B);                    err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		Q = (Q * beta^m) + q, R = r

			
 
				+	*/

			
 
				+	if err = internal_shl(Q, Q, m * _DIGIT_BITS);                    err != nil { return err; }

			
 
				+	if err = internal_add(Q, Q, Q1);                                 err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		Get sign before writing to dest.

			
 
				+	*/

			
 
				+	R.sign = .Zero_or_Positive if internal_is_zero(Q) else a.sign;

			
 
				+

			
 
				+	if quotient != nil {

			
 
				+		swap(quotient, Q);

			
 
				+		quotient.sign = .Negative if neg else .Zero_or_Positive;

			
 
				+	}

			
 
				+	if remainder != nil {

			
 
				+		/*

			
 
				+			De-normalize the remainder.

			
 
				+		*/

			
 
				+		if err = internal_shrmod(R, nil, R, sigma);                  err != nil { return err; }

			
 
				+		swap(remainder, R);

			
 
				+	}

			
 
				+	return nil;

			
 
				+}

			
 
				+

			
 
				 /*

			
 
				 	Slower bit-bang division... also smaller.

			
 
				 */

			
@@ -1040,7 +1222,7 @@ _private_int_gcd_lcm :: proc(res_gcd, res_lcm, a, b: ^Int, allocator := context.
 
				 */

			
 
				 _private_int_log :: proc(a: ^Int, base: DIGIT, allocator := context.allocator) -> (res: int, err: Error) {

			
 
				 	bracket_low, bracket_high, bracket_mid, t, bi_base := &Int{}, &Int{}, &Int{}, &Int{}, &Int{};

			
 
				-	defer destroy(bracket_low, bracket_high, bracket_mid, t, bi_base);

			
 
				+	defer internal_destroy(bracket_low, bracket_high, bracket_mid, t, bi_base);

			
 
				 

			
 
				 	ic := #force_inline internal_cmp(a, base);

			
 
				 	if ic == -1 || ic == 0 {

			
@@ -1100,6 +1282,300 @@ _private_int_log :: proc(a: ^Int, base: DIGIT, allocator := context.allocator) -
 
				 	return;

			
 
				 }

			
 
				 

			
 
				+

			
 
				+/*

			
 
				+	hac 14.61, pp608

			
 
				+*/

			
 
				+_private_inverse_modulo :: proc(dest, a, b: ^Int, allocator := context.allocator) -> (err: Error) {

			
 
				+	context.allocator = allocator;

			
 
				+	x, y, u, v, A, B, C, D := &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{};

			
 
				+	defer internal_destroy(x, y, u, v, A, B, C, D);

			
 
				+

			
 
				+	/*

			
 
				+		`b` cannot be negative.

			
 
				+	*/

			
 
				+	if b.sign == .Negative || internal_is_zero(b)                    { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		init temps.

			
 
				+	*/

			
 
				+	if err = internal_init_multi(x, y, u, v, A, B, C, D); err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		`x` = `a` % `b`, `y` = `b`

			
 
				+	*/

			
 
				+	if err = internal_mod(x, a, b);                       err != nil { return err; }

			
 
				+	if err = internal_copy(y, b);                         err != nil { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		2. [modified] if x,y are both even then return an error!

			
 
				+	*/

			
 
				+	if internal_is_even(x) && internal_is_even(y)                    { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		3. u=x, v=y, A=1, B=0, C=0, D=1

			
 
				+	*/

			
 
				+	if err = internal_copy(u, x);                         err != nil { return err; }

			
 
				+	if err = internal_copy(v, y);                         err != nil { return err; }

			
 
				+	if err = internal_one(A);                             err != nil { return err; }

			
 
				+	if err = internal_one(D);                             err != nil { return err; }

			
 
				+

			
 
				+	for {

			
 
				+		/*

			
 
				+			4.  while `u` is even do:

			
 
				+		*/

			
 
				+		for internal_is_even(u) {

			
 
				+			/*

			
 
				+				4.1 `u` = `u` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(u, u);             err != nil { return err; }

			
 
				+

			
 
				+			/*

			
 
				+				4.2 if `A` or `B` is odd then:

			
 
				+			*/

			
 
				+			if internal_is_odd(A) || internal_is_odd(B) {

			
 
				+				/*

			
 
				+					`A` = (`A`+`y`) / 2, `B` = (`B`-`x`) / 2

			
 
				+				*/

			
 
				+				if err = internal_add(A, A, y);           err != nil { return err; }

			
 
				+				if err = internal_add(B, B, x);           err != nil { return err; }

			
 
				+			}

			
 
				+			/*

			
 
				+				`A` = `A` / 2, `B` = `B` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(A, A);             err != nil { return err; }

			
 
				+			if err = internal_int_shr1(B, B);             err != nil { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			5.  while `v` is even do:

			
 
				+		*/

			
 
				+		for internal_is_even(v) {

			
 
				+			/*

			
 
				+				5.1 `v` = `v` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(v, v);             err != nil { return err; }

			
 
				+

			
 
				+			/*

			
 
				+				5.2 if `C` or `D` is odd then:

			
 
				+			*/

			
 
				+			if internal_is_odd(C) || internal_is_odd(D) {

			
 
				+				/*

			
 
				+					`C` = (`C`+`y`) / 2, `D` = (`D`-`x`) / 2

			
 
				+				*/

			
 
				+				if err = internal_add(C, C, y);           err != nil { return err; }

			
 
				+				if err = internal_add(D, D, x);           err != nil { return err; }

			
 
				+			}

			
 
				+			/*

			
 
				+				`C` = `C` / 2, `D` = `D` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(C, C);             err != nil { return err; }

			
 
				+			if err = internal_int_shr1(D, D);             err != nil { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			6.  if `u` >= `v` then:

			
 
				+		*/

			
 
				+		if internal_cmp(u, v) != -1 {

			
 
				+			/*

			
 
				+				`u` = `u` - `v`, `A` = `A` - `C`, `B` = `B` - `D`

			
 
				+			*/

			
 
				+			if err = internal_sub(u, u, v);               err != nil { return err; }

			
 
				+			if err = internal_sub(A, A, C);               err != nil { return err; }

			
 
				+			if err = internal_sub(B, B, D);               err != nil { return err; }

			
 
				+		} else {

			
 
				+			/* v - v - u, C = C - A, D = D - B */

			
 
				+			if err = internal_sub(v, v, u);               err != nil { return err; }

			
 
				+			if err = internal_sub(C, C, A);               err != nil { return err; }

			
 
				+			if err = internal_sub(D, D, B);               err != nil { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			If not zero goto step 4

			
 
				+		*/

			
 
				+		if internal_is_zero(u)                                       { break; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Now `a` = `C`, `b` = `D`, `gcd` == `g`*`v`

			
 
				+	*/

			
 
				+

			
 
				+	/*

			
 
				+		If `v` != `1` then there is no inverse.

			
 
				+	*/

			
 
				+	if internal_cmp(v, 1) !=  0                                      { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		If its too low.

			
 
				+	*/

			
 
				+	if internal_cmp(C, 0) == -1 {

			
 
				+		if err = internal_add(C, C, b); err != nil                   { return err; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Too big.

			
 
				+	*/

			
 
				+	if internal_cmp(C, 0) != -1 {

			
 
				+		if err = internal_sub(C, C, b); err != nil                   { return err; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		`C` is now the inverse.

			
 
				+	*/

			
 
				+	swap(dest, C);

			
 
				+

			
 
				+	return;

			
 
				+}

			
 
				+

			
 
				+/*

			
 
				+	Computes the modular inverse via binary extended Euclidean algorithm, that is `dest` = 1 / `a` mod `b`.

			
 
				+

			
 
				+	Based on slow invmod except this is optimized for the case where `b` is odd,

			
 
				+	as per HAC Note 14.64 on pp. 610.

			
 
				+*/

			
 
				+_private_inverse_modulo_odd :: proc(dest, a, b: ^Int, allocator := context.allocator) -> (err: Error) {

			
 
				+	context.allocator = allocator;

			
 
				+	x, y, u, v, B, D := &Int{}, &Int{}, &Int{}, &Int{}, &Int{}, &Int{};

			
 
				+	defer internal_destroy(x, y, u, v, B, D);

			
 
				+

			
 
				+	sign: Sign;

			
 
				+

			
 
				+	/*

			
 
				+		2. [modified] `b` must be odd.

			
 
				+	*/

			
 
				+	if internal_is_even(b)                                           { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		Init all our temps.

			
 
				+	*/

			
 
				+	if err = internal_init_multi(x, y, u, v, B, D); err != nil       { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		`x` == modulus, `y` == value to invert.

			
 
				+	*/

			
 
				+	if err = internal_copy(x, b);                   err != nil       { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		We need `y` = `|a|`.

			
 
				+	*/

			
 
				+	if err = internal_mod(y, a, b);                 err != nil       { return err; }

			
 
				+

			
 
				+	/*

			
 
				+		If one of `x`, `y` is zero return an error!

			
 
				+	*/

			
 
				+	if internal_is_zero(x) || internal_is_zero(y)                    { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		3. `u` = `x`, `v` = `y`, `A` = 1, `B` = 0, `C` = 0, `D` = 1

			
 
				+	*/

			
 
				+	if err = internal_copy(u, x);                   err != nil       { return err; }

			
 
				+	if err = internal_copy(v, y);                   err != nil       { return err; }

			
 
				+

			
 
				+	if err = internal_one(D);                       err != nil       { return err; }

			
 
				+

			
 
				+	for {

			
 
				+		/*

			
 
				+			4.  while `u` is even do.

			
 
				+		*/

			
 
				+		for internal_is_even(u) {

			
 
				+			/*

			
 
				+				4.1 `u` = `u` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(u, u);       err != nil       { return err; }

			
 
				+

			
 
				+			/*

			
 
				+				4.2 if `B` is odd then:

			
 
				+			*/

			
 
				+			if internal_is_odd(B) {

			
 
				+				/*

			
 
				+					`B` = (`B` - `x`) / 2

			
 
				+				*/

			
 
				+				if err = internal_sub(B, B, x);     err != nil       { return err; }

			
 
				+			}

			
 
				+

			
 
				+			/*

			
 
				+				`B` = `B` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(B, B);       err != nil       { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			5.  while `v` is even do:

			
 
				+		*/

			
 
				+		for internal_is_even(v) {

			
 
				+			/*

			
 
				+				5.1 `v` = `v` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(v, v);       err != nil       { return err; }

			
 
				+

			
 
				+			/*

			
 
				+				5.2 if `D` is odd then:

			
 
				+			*/

			
 
				+			if internal_is_odd(D) {

			
 
				+				/*

			
 
				+					`D` = (`D` - `x`) / 2

			
 
				+				*/

			
 
				+				if err = internal_sub(D, D, x);     err != nil       { return err; }

			
 
				+			}

			
 
				+			/*

			
 
				+				`D` = `D` / 2

			
 
				+			*/

			
 
				+			if err = internal_int_shr1(D, D);       err != nil       { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			6.  if `u` >= `v` then:

			
 
				+		*/

			
 
				+		if internal_cmp(u, v) != -1 {

			
 
				+			/*

			
 
				+				`u` = `u` - `v`, `B` = `B` - `D`

			
 
				+			*/

			
 
				+			if err = internal_sub(u, u, v);         err != nil       { return err; }

			
 
				+			if err = internal_sub(B, B, D);         err != nil       { return err; }

			
 
				+		} else {

			
 
				+			/*

			
 
				+				`v` - `v` - `u`, `D` = `D` - `B`

			
 
				+			*/

			
 
				+			if err = internal_sub(v, v, u);         err != nil       { return err; }

			
 
				+			if err = internal_sub(D, D, B);         err != nil       { return err; }

			
 
				+		}

			
 
				+

			
 
				+		/*

			
 
				+			If not zero goto step 4.

			
 
				+		*/

			
 
				+		if internal_is_zero(u)                                       { break; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Now `a` = C, `b` = D, gcd == g*v

			
 
				+	*/

			
 
				+

			
 
				+	/*

			
 
				+		if `v` != 1 then there is no inverse

			
 
				+	*/

			
 
				+	if internal_cmp(v, 1) != 0                                       { return .Invalid_Argument; }

			
 
				+

			
 
				+	/*

			
 
				+		`b` is now the inverse.

			
 
				+	*/

			
 
				+	sign = a.sign;

			
 
				+	for internal_int_is_negative(D) {

			
 
				+		if err = internal_add(D, D, b);             err != nil       { return err; }

			
 
				+	}

			
 
				+

			
 
				+	/*

			
 
				+		Too big.

			
 
				+	*/

			
 
				+	for internal_cmp_mag(D, b) != -1 {

			
 
				+		if err = internal_sub(D, D, b);             err != nil       { return err; }

			
 
				+	}

			
 
				+

			
 
				+	swap(dest, D);

			
 
				+	dest.sign = sign;

			
 
				+	return nil;

			
 
				+}

			
 
				+

			
 
				+

			
 
				 /*

			
 
				 	Returns the log2 of an `Int`.

			
 
				 	Assumes `a` not to be `nil` and to have been initialized.

			
--- a/core/math/big/test.odin
+++ b/core/math/big/test.odin
@@ -26,7 +26,9 @@ PyRes :: struct {
 
				 
			
 
				 @export test_initialize_constants :: proc "c" () -> (res: u64) {
			
 
				 	context = runtime.default_context();
			
 
				-	return u64(initialize_constants());
			
 
				+	res = u64(initialize_constants());
			
 
				+	//assert(MUL_KARATSUBA_CUTOFF >= 40);
			
 
				+	return res;
			
 
				 }
			
 
				 
			
 
				 @export test_error_string :: proc "c" (err: Error) -> (res: cstring) {
			
--- a/core/math/big/test.py
+++ b/core/math/big/test.py
@@ -66,6 +66,8 @@ timed_or_fast.add_argument(
 
				 

			
 
				 args = parser.parse_args()

			
 
				 

			
 
				+EXIT_ON_FAIL = args.exit_on_fail

			
 
				+

			
 
				 #

			
 
				 # How many iterations of each random test do we want to run?

			
 
				 #

			
@@ -153,7 +155,7 @@ class Res(Structure):
 
				 	_fields_ = [("res", c_char_p), ("err", c_uint64)]

			
 
				 

			
 
				 initialize_constants = load(l.test_initialize_constants, [], c_uint64)

			
 
				-initialize_constants()

			
 
				+print("initialize_constants: ", initialize_constants())

			
 
				 

			
 
				 error_string = load(l.test_error_string, [c_byte], c_char_p)

			
 
				 

			
@@ -211,7 +213,7 @@ def test(test_name: "", res: Res, param=[], expected_error = Error.Okay, expecte
 
				 			print(error, flush=True)

			
 
				 			passed = False

			
 
				 

			
 
				-	if args.exit_on_fail and not passed: exit(res.err)

			
 
				+	if EXIT_ON_FAIL and not passed: exit(res.err)

			
 
				 

			
 
				 	return passed

			
 
				 

			
@@ -257,7 +259,7 @@ def test_sqr(a = 0, b = 0, expected_error = Error.Okay):
 
				 	try:

			
 
				 		res  = sqr(*args)

			
 
				 	except OSError as e:

			
 
				-		print("{} while trying to square {} x {}.".format(e, a))

			
 
				+		print("{} while trying to square {}.".format(e, a))

			
 
				 		if EXIT_ON_FAIL: exit(3)

			
 
				 		return False

			
 
				 

			
@@ -268,7 +270,12 @@ def test_sqr(a = 0, b = 0, expected_error = Error.Okay):
 
				 

			
 
				 def test_div(a = 0, b = 0, expected_error = Error.Okay):

			
 
				 	args = [arg_to_odin(a), arg_to_odin(b)]

			
 
				-	res  = div(*args)

			
 
				+	try:

			
 
				+		res  = div(*args)

			
 
				+	except OSError as e:

			
 
				+		print("{} while trying divide to {} / {}.".format(e, a, b))

			
 
				+		if EXIT_ON_FAIL: exit(3)

			
 
				+		return False

			
 
				 	expected_result = None

			
 
				 	if expected_error == Error.Okay:

			
 
				 		#

			
--- a/core/math/big/tune.odin
+++ b/core/math/big/tune.odin
@@ -23,6 +23,7 @@ Category :: enum {
 
				 	ctz,
			
 
				 	sqr,
			
 
				 	bitfield_extract,
			
 
				+	rm_trials,
			
 
				 };
			
 
				 
			
 
				 Event :: struct {