2 years ago · 82c3f7d4f8
--- a/Jolt/Math/DVec3.inl
+++ b/Jolt/Math/DVec3.inl
@@ -797,7 +797,9 @@ bool DVec3::IsNormalized(double inTolerance) const
 
															 bool DVec3::IsNaN() const
														
 
															 {
														
 
															-#if defined(JPH_USE_AVX)
														
 
															+#if defined(JPH_USE_AVX512)
														
 
															+	return (_mm256_fpclass_pd_mask(mValue, 0b10000001) & 0x7) != 0;
														
 
															+#elif defined(JPH_USE_AVX)
														
 
															 	return (_mm256_movemask_pd(_mm256_cmp_pd(mValue, mValue, _CMP_UNORD_Q)) & 0x7) != 0;
														
 
															 #elif defined(JPH_USE_SSE)
														
 
															 	return ((_mm_movemask_pd(_mm_cmpunord_pd(mValue.mLow, mValue.mLow)) + (_mm_movemask_pd(_mm_cmpunord_pd(mValue.mHigh, mValue.mHigh)) << 2)) & 0x7) != 0;
														
@@ -808,7 +810,9 @@ bool DVec3::IsNaN() const
 
															 DVec3 DVec3::GetSign() const
														
 
															 {
														
 
															-#if defined(JPH_USE_AVX)
														
 
															+#if defined(JPH_USE_AVX512)
														
 
															+	return _mm256_fixupimm_pd(mValue, mValue, _mm256_set1_epi32(0xA9A90A00), 0);
														
 
															+#elif defined(JPH_USE_AVX)
														
 
															 	__m256d minus_one = _mm256_set1_pd(-1.0);
														
 
															 	__m256d one = _mm256_set1_pd(1.0);
														
 
															 	return _mm256_or_pd(_mm256_and_pd(mValue, minus_one), one);
														
@@ -854,7 +858,12 @@ DVec3 DVec3::PrepareRoundToInf() const
 
															 	// Float has 23 bit mantissa, double 52 bit mantissa => we lose 29 bits when converting from double to float
														
 
															 	constexpr uint64 cDoubleToFloatMantissaLoss = (1U << 29) - 1;
														
 
															-#if defined(JPH_USE_AVX)
														
 
															+#if defined(JPH_USE_AVX512)
														
 
															+	__m256i mantissa_loss = _mm256_set1_epi64x(cDoubleToFloatMantissaLoss);
														
 
															+	__mmask8 is_zero = _mm256_testn_epi64_mask(_mm256_castpd_si256(mValue), mantissa_loss);
														
 
															+	__m256d value_or_mantissa_loss = _mm256_or_pd(mValue, _mm256_castsi256_pd(mantissa_loss));
														
 
															+	return _mm256_mask_blend_pd(is_zero, value_or_mantissa_loss, mValue);
														
 
															+#elif defined(JPH_USE_AVX)
														
 
															 	__m256i mantissa_loss = _mm256_set1_epi64x(cDoubleToFloatMantissaLoss);
														
 
															 	__m256d value_and_mantissa_loss = _mm256_and_pd(mValue, _mm256_castsi256_pd(mantissa_loss));
														
 
															 	__m256d is_zero = _mm256_cmp_pd(value_and_mantissa_loss, _mm256_setzero_pd(), _CMP_EQ_OQ);