math.inl 22 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798991001011021031041051061071081091101111121131141151161171181191201211221231241251261271281291301311321331341351361371381391401411421431441451461471481491501511521531541551561571581591601611621631641651661671681691701711721731741751761771781791801811821831841851861871881891901911921931941951961971981992002012022032042052062072082092102112122132142152162172182192202212222232242252262272282292302312322332342352362372382392402412422432442452462472482492502512522532542552562572582592602612622632642652662672682692702712722732742752762772782792802812822832842852862872882892902912922932942952962972982993003013023033043053063073083093103113123133143153163173183193203213223233243253263273283293303313323333343353363373383393403413423433443453463473483493503513523533543553563573583593603613623633643653663673683693703713723733743753763773783793803813823833843853863873883893903913923933943953963973983994004014024034044054064074084094104114124134144154164174184194204214224234244254264274284294304314324334344354364374384394404414424434444454464474484494504514524534544554564574584594604614624634644654664674684694704714724734744754764774784794804814824834844854864874884894904914924934944954964974984995005015025035045055065075085095105115125135145155165175185195205215225235245255265275285295305315325335345355365375385395405415425435445455465475485495505515525535545555565575585595605615625635645655665675685695705715725735745755765775785795805815825835845855865875885895905915925935945955965975985996006016026036046056066076086096106116126136146156166176186196206216226236246256266276286296306316326336346356366376386396406416426436446456466476486496506516526536546556566576586596606616626636646656666676686696706716726736746756766776786796806816826836846856866876886896906916926936946956966976986997007017027037047057067077087097107117127137147157167177187197207217227237247257267277287297307317327337347357367377387397407417427437447457467477487497507517527537547557567577587597607617627637647657667677687697707717727737747757767777787797807817827837847857867877887897907917927937947957967977987998008018028038048058068078088098108118128138148158168178188198208218228238248258268278288298308318328338348358368378388398408418428438448458468478488498508518528538548558568578588598608618628638648658668678688698708718728738748758768778788798808818828838848858868878888898908918928938948958968978988999009019029039049059069079089099109119129139149159169179189199209219229239249259269279289299309319329339349359369379389399409419429439449459469479489499509519529539549559569579589599609619629639649659669679689699709719729739749759769779789799809819829839849859869879889899909919929939949959969979989991000100110021003100410051006100710081009101010111012101310141015101610171018101910201021102210231024102510261027102810291030103110321033103410351036103710381039104010411042104310441045104610471048104910501051105210531054105510561057
  1. /*
  2. * Copyright 2011-2018 Branimir Karadzic. All rights reserved.
  3. * License: https://github.com/bkaradzic/bx#license-bsd-2-clause
  4. */
  5. // FPU math lib
  6. #ifndef BX_MATH_H_HEADER_GUARD
  7. # error "Must be included from bx/math.h!"
  8. #endif // BX_MATH_H_HEADER_GUARD
  9. #include <bx/simd_t.h>
  10. namespace bx
  11. {
  12. inline BX_CONST_FUNC float toRad(float _deg)
  13. {
  14. return _deg * kPi / 180.0f;
  15. }
  16. inline BX_CONST_FUNC float toDeg(float _rad)
  17. {
  18. return _rad * 180.0f / kPi;
  19. }
  20. inline BX_CONST_FUNC uint32_t floatToBits(float _a)
  21. {
  22. union { float f; uint32_t ui; } u = { _a };
  23. return u.ui;
  24. }
  25. inline BX_CONST_FUNC float bitsToFloat(uint32_t _a)
  26. {
  27. union { uint32_t ui; float f; } u = { _a };
  28. return u.f;
  29. }
  30. inline BX_CONST_FUNC uint64_t doubleToBits(double _a)
  31. {
  32. union { double f; uint64_t ui; } u = { _a };
  33. return u.ui;
  34. }
  35. inline BX_CONST_FUNC double bitsToDouble(uint64_t _a)
  36. {
  37. union { uint64_t ui; double f; } u = { _a };
  38. return u.f;
  39. }
  40. inline BX_CONST_FUNC uint32_t floatFlip(uint32_t _value)
  41. {
  42. // Reference(s):
  43. // - http://archive.fo/2012.12.08-212402/http://stereopsis.com/radix.html
  44. //
  45. const uint32_t tmp0 = uint32_sra(_value, 31);
  46. const uint32_t tmp1 = uint32_neg(tmp0);
  47. const uint32_t mask = uint32_or(tmp1, 0x80000000);
  48. const uint32_t result = uint32_xor(_value, mask);
  49. return result;
  50. }
  51. inline BX_CONST_FUNC bool isNan(float _f)
  52. {
  53. const uint32_t tmp = floatToBits(_f) & INT32_MAX;
  54. return tmp > UINT32_C(0x7f800000);
  55. }
  56. inline BX_CONST_FUNC bool isNan(double _f)
  57. {
  58. const uint64_t tmp = doubleToBits(_f) & INT64_MAX;
  59. return tmp > UINT64_C(0x7ff0000000000000);
  60. }
  61. inline BX_CONST_FUNC bool isFinite(float _f)
  62. {
  63. const uint32_t tmp = floatToBits(_f) & INT32_MAX;
  64. return tmp < UINT32_C(0x7f800000);
  65. }
  66. inline BX_CONST_FUNC bool isFinite(double _f)
  67. {
  68. const uint64_t tmp = doubleToBits(_f) & INT64_MAX;
  69. return tmp < UINT64_C(0x7ff0000000000000);
  70. }
  71. inline BX_CONST_FUNC bool isInfinite(float _f)
  72. {
  73. const uint32_t tmp = floatToBits(_f) & INT32_MAX;
  74. return tmp == UINT32_C(0x7f800000);
  75. }
  76. inline BX_CONST_FUNC bool isInfinite(double _f)
  77. {
  78. const uint64_t tmp = doubleToBits(_f) & INT64_MAX;
  79. return tmp == UINT64_C(0x7ff0000000000000);
  80. }
  81. inline BX_CONSTEXPR_FUNC float floor(float _a)
  82. {
  83. if (_a < 0.0f)
  84. {
  85. const float fr = fract(-_a);
  86. const float result = -_a - fr;
  87. return -(0.0f != fr
  88. ? result + 1.0f
  89. : result)
  90. ;
  91. }
  92. return _a - fract(_a);
  93. }
  94. inline BX_CONSTEXPR_FUNC float ceil(float _a)
  95. {
  96. return -floor(-_a);
  97. }
  98. inline BX_CONSTEXPR_FUNC float round(float _f)
  99. {
  100. return floor(_f + 0.5f);
  101. }
  102. inline BX_CONSTEXPR_FUNC float lerp(float _a, float _b, float _t)
  103. {
  104. return _a + (_b - _a) * _t;
  105. }
  106. inline BX_CONSTEXPR_FUNC float sign(float _a)
  107. {
  108. return _a < 0.0f ? -1.0f : 1.0f;
  109. }
  110. inline BX_CONSTEXPR_FUNC float abs(float _a)
  111. {
  112. return _a < 0.0f ? -_a : _a;
  113. }
  114. inline BX_CONSTEXPR_FUNC float square(float _a)
  115. {
  116. return _a * _a;
  117. }
  118. inline BX_CONST_FUNC float sin(float _a)
  119. {
  120. return cos(_a - kPiHalf);
  121. }
  122. inline BX_CONST_FUNC float sinh(float _a)
  123. {
  124. return 0.5f*(exp(_a) - exp(-_a) );
  125. }
  126. inline BX_CONST_FUNC float asin(float _a)
  127. {
  128. return kPiHalf - acos(_a);
  129. }
  130. inline BX_CONST_FUNC float cosh(float _a)
  131. {
  132. return 0.5f*(exp(_a) + exp(-_a) );
  133. }
  134. inline BX_CONST_FUNC float tan(float _a)
  135. {
  136. return sin(_a) / cos(_a);
  137. }
  138. inline BX_CONST_FUNC float tanh(float _a)
  139. {
  140. const float tmp0 = exp(2.0f*_a);
  141. const float tmp1 = tmp0 - 1.0f;
  142. const float tmp2 = tmp0 + 1.0f;
  143. const float result = tmp1 / tmp2;
  144. return result;
  145. }
  146. inline BX_CONST_FUNC float atan(float _a)
  147. {
  148. return atan2(_a, 1.0f);
  149. }
  150. inline BX_CONST_FUNC float pow(float _a, float _b)
  151. {
  152. return exp(_b * log(_a) );
  153. }
  154. inline BX_CONST_FUNC float exp2(float _a)
  155. {
  156. return pow(2.0f, _a);
  157. }
  158. inline BX_CONST_FUNC float log2(float _a)
  159. {
  160. return log(_a) * kInvLogNat2;
  161. }
  162. inline BX_CONST_FUNC float rsqrtRef(float _a)
  163. {
  164. return pow(_a, -0.5f);
  165. }
  166. inline BX_CONST_FUNC float sqrtRef(float _a)
  167. {
  168. if (_a < kNearZero)
  169. {
  170. return 0.0f;
  171. }
  172. return 1.0f/rsqrtRef(_a);
  173. }
  174. inline BX_CONST_FUNC float sqrtSimd(float _a)
  175. {
  176. const simd128_t aa = simd_splat(_a);
  177. const simd128_t sqrta = simd_sqrt(aa);
  178. float result;
  179. simd_stx(&result, sqrta);
  180. return result;
  181. }
  182. inline BX_CONST_FUNC float sqrt(float _a)
  183. {
  184. #if BX_CONFIG_SUPPORTS_SIMD
  185. return sqrtSimd(_a);
  186. #else
  187. return sqrtRef(_a);
  188. #endif // BX_CONFIG_SUPPORTS_SIMD
  189. }
  190. inline BX_CONST_FUNC float rsqrtSimd(float _a)
  191. {
  192. if (_a < kNearZero)
  193. {
  194. return 0.0f;
  195. }
  196. const simd128_t aa = simd_splat(_a);
  197. const simd128_t rsqrta = simd_rsqrt_nr(aa);
  198. float result;
  199. simd_stx(&result, rsqrta);
  200. return result;
  201. }
  202. inline BX_CONST_FUNC float rsqrt(float _a)
  203. {
  204. #if BX_CONFIG_SUPPORTS_SIMD
  205. return rsqrtSimd(_a);
  206. #else
  207. return rsqrtRef(_a);
  208. #endif // BX_CONFIG_SUPPORTS_SIMD
  209. }
  210. inline BX_CONSTEXPR_FUNC float trunc(float _a)
  211. {
  212. return float(int(_a) );
  213. }
  214. inline BX_CONSTEXPR_FUNC float fract(float _a)
  215. {
  216. return _a - trunc(_a);
  217. }
  218. inline BX_CONSTEXPR_FUNC float mad(float _a, float _b, float _c)
  219. {
  220. return _a * _b + _c;
  221. }
  222. inline BX_CONST_FUNC float mod(float _a, float _b)
  223. {
  224. return _a - _b * floor(_a / _b);
  225. }
  226. inline BX_CONSTEXPR_FUNC bool equal(float _a, float _b, float _epsilon)
  227. {
  228. // Reference(s):
  229. // - https://web.archive.org/web/20181103180318/http://realtimecollisiondetection.net/blog/?p=89
  230. //
  231. const float lhs = abs(_a - _b);
  232. const float rhs = _epsilon * max(1.0f, abs(_a), abs(_b) );
  233. return lhs <= rhs;
  234. }
  235. inline BX_CONST_FUNC bool equal(const float* _a, const float* _b, uint32_t _num, float _epsilon)
  236. {
  237. bool result = equal(_a[0], _b[0], _epsilon);
  238. for (uint32_t ii = 1; result && ii < _num; ++ii)
  239. {
  240. result = equal(_a[ii], _b[ii], _epsilon);
  241. }
  242. return result;
  243. }
  244. inline BX_CONST_FUNC float wrap(float _a, float _wrap)
  245. {
  246. const float tmp0 = mod(_a, _wrap);
  247. const float result = tmp0 < 0.0f ? _wrap + tmp0 : tmp0;
  248. return result;
  249. }
  250. inline BX_CONSTEXPR_FUNC float step(float _edge, float _a)
  251. {
  252. return _a < _edge ? 0.0f : 1.0f;
  253. }
  254. inline BX_CONSTEXPR_FUNC float pulse(float _a, float _start, float _end)
  255. {
  256. return step(_a, _start) - step(_a, _end);
  257. }
  258. inline BX_CONSTEXPR_FUNC float smoothStep(float _a)
  259. {
  260. return square(_a)*(3.0f - 2.0f*_a);
  261. }
  262. inline BX_CONSTEXPR_FUNC float bias(float _time, float _bias)
  263. {
  264. return _time / ( ( (1.0f/_bias - 2.0f)*(1.0f - _time) ) + 1.0f);
  265. }
  266. inline BX_CONSTEXPR_FUNC float gain(float _time, float _gain)
  267. {
  268. // Reference(s):
  269. // - Bias And Gain Are Your Friend
  270. // https://web.archive.org/web/20181126040535/https://blog.demofox.org/2012/09/24/bias-and-gain-are-your-friend/
  271. // https://web.archive.org/web/20181126040558/http://demofox.org/biasgain.html
  272. //
  273. if (_time < 0.5f)
  274. {
  275. return bias(_time * 2.0f, _gain) * 0.5f;
  276. }
  277. return bias(_time * 2.0f - 1.0f, 1.0f - _gain) * 0.5f + 0.5f;
  278. }
  279. inline BX_CONST_FUNC float angleDiff(float _a, float _b)
  280. {
  281. const float dist = wrap(_b - _a, kPi2);
  282. return wrap(dist*2.0f, kPi2) - dist;
  283. }
  284. inline BX_CONST_FUNC float angleLerp(float _a, float _b, float _t)
  285. {
  286. return _a + angleDiff(_a, _b) * _t;
  287. }
  288. template<typename Ty>
  289. inline Ty load(const void* _ptr)
  290. {
  291. Ty result;
  292. memCopy(&result, _ptr, sizeof(Ty) );
  293. return result;
  294. }
  295. template<typename Ty>
  296. inline void store(void* _ptr, const Ty& _a)
  297. {
  298. memCopy(_ptr, &_a, sizeof(Ty) );
  299. }
  300. inline BX_CONSTEXPR_FUNC Vec3 round(const Vec3 _a)
  301. {
  302. return
  303. {
  304. round(_a.x),
  305. round(_a.y),
  306. round(_a.z),
  307. };
  308. }
  309. inline BX_CONSTEXPR_FUNC Vec3 abs(const Vec3 _a)
  310. {
  311. return
  312. {
  313. abs(_a.x),
  314. abs(_a.y),
  315. abs(_a.z),
  316. };
  317. }
  318. inline BX_CONSTEXPR_FUNC Vec3 neg(const Vec3 _a)
  319. {
  320. return
  321. {
  322. -_a.x,
  323. -_a.y,
  324. -_a.z,
  325. };
  326. }
  327. inline BX_CONSTEXPR_FUNC Vec3 add(const Vec3 _a, const Vec3 _b)
  328. {
  329. return
  330. {
  331. _a.x + _b.x,
  332. _a.y + _b.y,
  333. _a.z + _b.z,
  334. };
  335. }
  336. inline BX_CONSTEXPR_FUNC Vec3 add(const Vec3 _a, float _b)
  337. {
  338. return
  339. {
  340. _a.x + _b,
  341. _a.y + _b,
  342. _a.z + _b,
  343. };
  344. }
  345. inline BX_CONSTEXPR_FUNC Vec3 sub(const Vec3 _a, const Vec3 _b)
  346. {
  347. return
  348. {
  349. _a.x - _b.x,
  350. _a.y - _b.y,
  351. _a.z - _b.z,
  352. };
  353. }
  354. inline BX_CONSTEXPR_FUNC Vec3 sub(const Vec3 _a, float _b)
  355. {
  356. return
  357. {
  358. _a.x - _b,
  359. _a.y - _b,
  360. _a.z - _b,
  361. };
  362. }
  363. inline BX_CONSTEXPR_FUNC Vec3 mul(const Vec3 _a, const Vec3 _b)
  364. {
  365. return
  366. {
  367. _a.x * _b.x,
  368. _a.y * _b.y,
  369. _a.z * _b.z,
  370. };
  371. }
  372. inline BX_CONSTEXPR_FUNC Vec3 mul(const Vec3 _a, float _b)
  373. {
  374. return
  375. {
  376. _a.x * _b,
  377. _a.y * _b,
  378. _a.z * _b,
  379. };
  380. }
  381. inline BX_CONSTEXPR_FUNC Vec3 mad(const Vec3 _a, const float _b, const Vec3 _c)
  382. {
  383. return add(mul(_a, _b), _c);
  384. }
  385. inline BX_CONSTEXPR_FUNC Vec3 mad(const Vec3 _a, const Vec3 _b, const Vec3 _c)
  386. {
  387. return add(mul(_a, _b), _c);
  388. }
  389. inline BX_CONSTEXPR_FUNC float dot(const Vec3 _a, const Vec3 _b)
  390. {
  391. return _a.x*_b.x + _a.y*_b.y + _a.z*_b.z;
  392. }
  393. inline BX_CONSTEXPR_FUNC Vec3 cross(const Vec3 _a, const Vec3 _b)
  394. {
  395. return
  396. {
  397. _a.y*_b.z - _a.z*_b.y,
  398. _a.z*_b.x - _a.x*_b.z,
  399. _a.x*_b.y - _a.y*_b.x,
  400. };
  401. }
  402. inline BX_CONST_FUNC float length(const Vec3 _a)
  403. {
  404. return sqrt(dot(_a, _a) );
  405. }
  406. inline BX_CONSTEXPR_FUNC Vec3 lerp(const Vec3 _a, const Vec3 _b, float _t)
  407. {
  408. return
  409. {
  410. lerp(_a.x, _b.x, _t),
  411. lerp(_a.y, _b.y, _t),
  412. lerp(_a.z, _b.z, _t),
  413. };
  414. }
  415. inline BX_CONSTEXPR_FUNC Vec3 lerp(const Vec3 _a, const Vec3 _b, const Vec3 _t)
  416. {
  417. return
  418. {
  419. lerp(_a.x, _b.x, _t.x),
  420. lerp(_a.y, _b.y, _t.y),
  421. lerp(_a.z, _b.z, _t.z),
  422. };
  423. }
  424. inline BX_CONST_FUNC Vec3 normalize(const Vec3 _a)
  425. {
  426. const float invLen = 1.0f/length(_a);
  427. const Vec3 result = mul(_a, invLen);
  428. return result;
  429. }
  430. inline BX_CONSTEXPR_FUNC Vec3 min(const Vec3 _a, const Vec3 _b)
  431. {
  432. return
  433. {
  434. min(_a.x, _b.x),
  435. min(_a.y, _b.y),
  436. min(_a.z, _b.z),
  437. };
  438. }
  439. inline BX_CONSTEXPR_FUNC Vec3 max(const Vec3 _a, const Vec3 _b)
  440. {
  441. return
  442. {
  443. max(_a.x, _b.x),
  444. max(_a.y, _b.y),
  445. max(_a.z, _b.z),
  446. };
  447. }
  448. inline BX_CONSTEXPR_FUNC Vec3 rcp(const Vec3 _a)
  449. {
  450. return
  451. {
  452. 1.0f / _a.x,
  453. 1.0f / _a.y,
  454. 1.0f / _a.z,
  455. };
  456. }
  457. inline void calcTangentFrame(Vec3& _outT, Vec3& _outB, const Vec3 _n)
  458. {
  459. const float nx = _n.x;
  460. const float ny = _n.y;
  461. const float nz = _n.z;
  462. if (abs(nx) > abs(nz) )
  463. {
  464. float invLen = 1.0f / sqrt(nx*nx + nz*nz);
  465. _outT.x = -nz * invLen;
  466. _outT.y = 0.0f;
  467. _outT.z = nx * invLen;
  468. }
  469. else
  470. {
  471. float invLen = 1.0f / sqrt(ny*ny + nz*nz);
  472. _outT.x = 0.0f;
  473. _outT.y = nz * invLen;
  474. _outT.z = -ny * invLen;
  475. }
  476. _outB = cross(_n, _outT);
  477. }
  478. inline void calcTangentFrame(Vec3& _outT, Vec3& _outB, const Vec3 _n, float _angle)
  479. {
  480. calcTangentFrame(_outT, _outB, _n);
  481. const float sa = sin(_angle);
  482. const float ca = cos(_angle);
  483. _outT.x = -sa * _outB.x + ca * _outT.x;
  484. _outT.y = -sa * _outB.y + ca * _outT.y;
  485. _outT.z = -sa * _outB.z + ca * _outT.z;
  486. _outB = cross(_n, _outT);
  487. }
  488. inline BX_CONST_FUNC Vec3 fromLatLong(float _u, float _v)
  489. {
  490. Vec3 result;
  491. const float phi = _u * kPi2;
  492. const float theta = _v * kPi;
  493. const float st = sin(theta);
  494. const float sp = sin(phi);
  495. const float ct = cos(theta);
  496. const float cp = cos(phi);
  497. result.x = -st*sp;
  498. result.y = ct;
  499. result.z = -st*cp;
  500. return result;
  501. }
  502. inline void toLatLong(float* _outU, float* _outV, const Vec3 _dir)
  503. {
  504. const float phi = atan2(_dir.x, _dir.z);
  505. const float theta = acos(_dir.y);
  506. *_outU = (bx::kPi + phi)/bx::kPi2;
  507. *_outV = theta*bx::kInvPi;
  508. }
  509. inline BX_CONSTEXPR_FUNC Quaternion invert(const Quaternion _a)
  510. {
  511. return
  512. {
  513. -_a.x,
  514. -_a.y,
  515. -_a.z,
  516. _a.w,
  517. };
  518. }
  519. inline BX_CONSTEXPR_FUNC Vec3 mulXyz(const Quaternion _a, const Quaternion _b)
  520. {
  521. const float ax = _a.x;
  522. const float ay = _a.y;
  523. const float az = _a.z;
  524. const float aw = _a.w;
  525. const float bx = _b.x;
  526. const float by = _b.y;
  527. const float bz = _b.z;
  528. const float bw = _b.w;
  529. return
  530. {
  531. aw * bx + ax * bw + ay * bz - az * by,
  532. aw * by - ax * bz + ay * bw + az * bx,
  533. aw * bz + ax * by - ay * bx + az * bw,
  534. };
  535. }
  536. inline BX_CONSTEXPR_FUNC Quaternion mul(const Quaternion _a, const Quaternion _b)
  537. {
  538. const float ax = _a.x;
  539. const float ay = _a.y;
  540. const float az = _a.z;
  541. const float aw = _a.w;
  542. const float bx = _b.x;
  543. const float by = _b.y;
  544. const float bz = _b.z;
  545. const float bw = _b.w;
  546. return
  547. {
  548. aw * bx + ax * bw + ay * bz - az * by,
  549. aw * by - ax * bz + ay * bw + az * bx,
  550. aw * bz + ax * by - ay * bx + az * bw,
  551. aw * bw - ax * bx - ay * by - az * bz,
  552. };
  553. }
  554. namespace detail
  555. {
  556. inline BX_CONSTEXPR_FUNC Quaternion loadQ(const Vec3 _v)
  557. {
  558. return { _v.x, _v.y, _v.z, 0.0f };
  559. }
  560. }
  561. inline BX_CONSTEXPR_FUNC Vec3 mul(const Vec3 _v, const Quaternion _q)
  562. {
  563. const Quaternion tmp0 = invert(_q);
  564. const Quaternion qv = detail::loadQ(_v);
  565. const Quaternion tmp1 = mul(tmp0, qv);
  566. const Vec3 result = mulXyz(tmp1, _q);
  567. return result;
  568. }
  569. inline BX_CONSTEXPR_FUNC float dot(const Quaternion _a, const Quaternion _b)
  570. {
  571. return
  572. _a.x * _b.x
  573. + _a.y * _b.y
  574. + _a.z * _b.z
  575. + _a.w * _b.w
  576. ;
  577. }
  578. inline BX_CONSTEXPR_FUNC Quaternion normalize(const Quaternion _a)
  579. {
  580. const float norm = dot(_a, _a);
  581. if (0.0f < norm)
  582. {
  583. const float invNorm = 1.0f / sqrt(norm);
  584. return
  585. {
  586. _a.x * invNorm,
  587. _a.y * invNorm,
  588. _a.z * invNorm,
  589. _a.w * invNorm,
  590. };
  591. }
  592. return
  593. {
  594. 0.0f,
  595. 0.0f,
  596. 0.0f,
  597. 1.0f,
  598. };
  599. }
  600. inline BX_CONST_FUNC Vec3 toEuler(const Quaternion _a)
  601. {
  602. const float xx = _a.x;
  603. const float yy = _a.y;
  604. const float zz = _a.z;
  605. const float ww = _a.w;
  606. const float xsq = square(xx);
  607. const float ysq = square(yy);
  608. const float zsq = square(zz);
  609. return
  610. {
  611. atan2(2.0f * (xx * ww - yy * zz), 1.0f - 2.0f * (xsq + zsq) ),
  612. atan2(2.0f * (yy * ww + xx * zz), 1.0f - 2.0f * (ysq + zsq) ),
  613. asin( 2.0f * (xx * yy + zz * ww) ),
  614. };
  615. }
  616. inline BX_CONST_FUNC Quaternion rotateAxis(const Vec3 _axis, float _angle)
  617. {
  618. const float ha = _angle * 0.5f;
  619. const float sa = sin(ha);
  620. return
  621. {
  622. _axis.x * sa,
  623. _axis.y * sa,
  624. _axis.z * sa,
  625. cos(ha),
  626. };
  627. }
  628. inline BX_CONST_FUNC Quaternion rotateX(float _ax)
  629. {
  630. const float hx = _ax * 0.5f;
  631. return
  632. {
  633. sin(hx),
  634. 0.0f,
  635. 0.0f,
  636. cos(hx),
  637. };
  638. }
  639. inline BX_CONST_FUNC Quaternion rotateY(float _ay)
  640. {
  641. const float hy = _ay * 0.5f;
  642. return
  643. {
  644. 0.0f,
  645. sin(hy),
  646. 0.0f,
  647. cos(hy),
  648. };
  649. }
  650. inline BX_CONST_FUNC Quaternion rotateZ(float _az)
  651. {
  652. const float hz = _az * 0.5f;
  653. return
  654. {
  655. 0.0f,
  656. 0.0f,
  657. sin(hz),
  658. cos(hz),
  659. };
  660. }
  661. inline void mtxIdentity(float* _result)
  662. {
  663. memSet(_result, 0, sizeof(float)*16);
  664. _result[0] = _result[5] = _result[10] = _result[15] = 1.0f;
  665. }
  666. inline void mtxTranslate(float* _result, float _tx, float _ty, float _tz)
  667. {
  668. mtxIdentity(_result);
  669. _result[12] = _tx;
  670. _result[13] = _ty;
  671. _result[14] = _tz;
  672. }
  673. inline void mtxScale(float* _result, float _sx, float _sy, float _sz)
  674. {
  675. memSet(_result, 0, sizeof(float) * 16);
  676. _result[0] = _sx;
  677. _result[5] = _sy;
  678. _result[10] = _sz;
  679. _result[15] = 1.0f;
  680. }
  681. inline void mtxScale(float* _result, float _scale)
  682. {
  683. mtxScale(_result, _scale, _scale, _scale);
  684. }
  685. inline void mtxFromNormal(float* _result, const Vec3& _normal, float _scale, const Vec3& _pos)
  686. {
  687. Vec3 tangent;
  688. Vec3 bitangent;
  689. calcTangentFrame(tangent, bitangent, _normal);
  690. store(&_result[ 0], mul(bitangent, _scale) );
  691. store(&_result[ 4], mul(_normal, _scale) );
  692. store(&_result[ 8], mul(tangent, _scale) );
  693. _result[ 3] = 0.0f;
  694. _result[ 7] = 0.0f;
  695. _result[11] = 0.0f;
  696. _result[12] = _pos.x;
  697. _result[13] = _pos.y;
  698. _result[14] = _pos.z;
  699. _result[15] = 1.0f;
  700. }
  701. inline void mtxFromNormal(float* _result, const Vec3& _normal, float _scale, const Vec3& _pos, float _angle)
  702. {
  703. Vec3 tangent;
  704. Vec3 bitangent;
  705. calcTangentFrame(tangent, bitangent, _normal, _angle);
  706. store(&_result[0], mul(bitangent, _scale) );
  707. store(&_result[4], mul(_normal, _scale) );
  708. store(&_result[8], mul(tangent, _scale) );
  709. _result[ 3] = 0.0f;
  710. _result[ 7] = 0.0f;
  711. _result[11] = 0.0f;
  712. _result[12] = _pos.x;
  713. _result[13] = _pos.y;
  714. _result[14] = _pos.z;
  715. _result[15] = 1.0f;
  716. }
  717. inline void mtxQuat(float* _result, const Quaternion& _quat)
  718. {
  719. const float qx = _quat.x;
  720. const float qy = _quat.y;
  721. const float qz = _quat.z;
  722. const float qw = _quat.w;
  723. const float x2 = qx + qx;
  724. const float y2 = qy + qy;
  725. const float z2 = qz + qz;
  726. const float x2x = x2 * qx;
  727. const float x2y = x2 * qy;
  728. const float x2z = x2 * qz;
  729. const float x2w = x2 * qw;
  730. const float y2y = y2 * qy;
  731. const float y2z = y2 * qz;
  732. const float y2w = y2 * qw;
  733. const float z2z = z2 * qz;
  734. const float z2w = z2 * qw;
  735. _result[ 0] = 1.0f - (y2y + z2z);
  736. _result[ 1] = x2y - z2w;
  737. _result[ 2] = x2z + y2w;
  738. _result[ 3] = 0.0f;
  739. _result[ 4] = x2y + z2w;
  740. _result[ 5] = 1.0f - (x2x + z2z);
  741. _result[ 6] = y2z - x2w;
  742. _result[ 7] = 0.0f;
  743. _result[ 8] = x2z - y2w;
  744. _result[ 9] = y2z + x2w;
  745. _result[10] = 1.0f - (x2x + y2y);
  746. _result[11] = 0.0f;
  747. _result[12] = 0.0f;
  748. _result[13] = 0.0f;
  749. _result[14] = 0.0f;
  750. _result[15] = 1.0f;
  751. }
  752. inline void mtxQuatTranslation(float* _result, const Quaternion& _quat, const Vec3& _translation)
  753. {
  754. mtxQuat(_result, _quat);
  755. store(&_result[12], neg(mulXyz0(_translation, _result) ) );
  756. }
  757. inline void mtxQuatTranslationHMD(float* _result, const Quaternion& _quat, const Vec3& _translation)
  758. {
  759. const Quaternion quat =
  760. {
  761. -_quat.x,
  762. -_quat.y,
  763. _quat.z,
  764. _quat.w,
  765. };
  766. mtxQuatTranslation(_result, quat, _translation);
  767. }
  768. inline Vec3 mul(const Vec3& _vec, const float* _mat)
  769. {
  770. Vec3 result;
  771. result.x = _vec.x * _mat[0] + _vec.y * _mat[4] + _vec.z * _mat[ 8] + _mat[12];
  772. result.y = _vec.x * _mat[1] + _vec.y * _mat[5] + _vec.z * _mat[ 9] + _mat[13];
  773. result.z = _vec.x * _mat[2] + _vec.y * _mat[6] + _vec.z * _mat[10] + _mat[14];
  774. return result;
  775. }
  776. inline Vec3 mulXyz0(const Vec3& _vec, const float* _mat)
  777. {
  778. Vec3 result;
  779. result.x = _vec.x * _mat[0] + _vec.y * _mat[4] + _vec.z * _mat[ 8];
  780. result.y = _vec.x * _mat[1] + _vec.y * _mat[5] + _vec.z * _mat[ 9];
  781. result.z = _vec.x * _mat[2] + _vec.y * _mat[6] + _vec.z * _mat[10];
  782. return result;
  783. }
  784. inline Vec3 mulH(const Vec3& _vec, const float* _mat)
  785. {
  786. const float xx = _vec.x * _mat[0] + _vec.y * _mat[4] + _vec.z * _mat[ 8] + _mat[12];
  787. const float yy = _vec.x * _mat[1] + _vec.y * _mat[5] + _vec.z * _mat[ 9] + _mat[13];
  788. const float zz = _vec.x * _mat[2] + _vec.y * _mat[6] + _vec.z * _mat[10] + _mat[14];
  789. const float ww = _vec.x * _mat[3] + _vec.y * _mat[7] + _vec.z * _mat[11] + _mat[15];
  790. const float invW = sign(ww) / ww;
  791. Vec3 result =
  792. {
  793. xx * invW,
  794. yy * invW,
  795. zz * invW,
  796. };
  797. return result;
  798. }
  799. inline void vec4MulMtx(float* _result, const float* _vec, const float* _mat)
  800. {
  801. _result[0] = _vec[0] * _mat[ 0] + _vec[1] * _mat[4] + _vec[2] * _mat[ 8] + _vec[3] * _mat[12];
  802. _result[1] = _vec[0] * _mat[ 1] + _vec[1] * _mat[5] + _vec[2] * _mat[ 9] + _vec[3] * _mat[13];
  803. _result[2] = _vec[0] * _mat[ 2] + _vec[1] * _mat[6] + _vec[2] * _mat[10] + _vec[3] * _mat[14];
  804. _result[3] = _vec[0] * _mat[ 3] + _vec[1] * _mat[7] + _vec[2] * _mat[11] + _vec[3] * _mat[15];
  805. }
  806. inline void mtxMul(float* _result, const float* _a, const float* _b)
  807. {
  808. vec4MulMtx(&_result[ 0], &_a[ 0], _b);
  809. vec4MulMtx(&_result[ 4], &_a[ 4], _b);
  810. vec4MulMtx(&_result[ 8], &_a[ 8], _b);
  811. vec4MulMtx(&_result[12], &_a[12], _b);
  812. }
  813. inline void mtxTranspose(float* _result, const float* _a)
  814. {
  815. _result[ 0] = _a[ 0];
  816. _result[ 4] = _a[ 1];
  817. _result[ 8] = _a[ 2];
  818. _result[12] = _a[ 3];
  819. _result[ 1] = _a[ 4];
  820. _result[ 5] = _a[ 5];
  821. _result[ 9] = _a[ 6];
  822. _result[13] = _a[ 7];
  823. _result[ 2] = _a[ 8];
  824. _result[ 6] = _a[ 9];
  825. _result[10] = _a[10];
  826. _result[14] = _a[11];
  827. _result[ 3] = _a[12];
  828. _result[ 7] = _a[13];
  829. _result[11] = _a[14];
  830. _result[15] = _a[15];
  831. }
  832. /// Convert LH to RH projection matrix and vice versa.
  833. inline void mtxProjFlipHandedness(float* _dst, const float* _src)
  834. {
  835. _dst[ 0] = -_src[ 0];
  836. _dst[ 1] = -_src[ 1];
  837. _dst[ 2] = -_src[ 2];
  838. _dst[ 3] = -_src[ 3];
  839. _dst[ 4] = _src[ 4];
  840. _dst[ 5] = _src[ 5];
  841. _dst[ 6] = _src[ 6];
  842. _dst[ 7] = _src[ 7];
  843. _dst[ 8] = -_src[ 8];
  844. _dst[ 9] = -_src[ 9];
  845. _dst[10] = -_src[10];
  846. _dst[11] = -_src[11];
  847. _dst[12] = _src[12];
  848. _dst[13] = _src[13];
  849. _dst[14] = _src[14];
  850. _dst[15] = _src[15];
  851. }
  852. /// Convert LH to RH view matrix and vice versa.
  853. inline void mtxViewFlipHandedness(float* _dst, const float* _src)
  854. {
  855. _dst[ 0] = -_src[ 0];
  856. _dst[ 1] = _src[ 1];
  857. _dst[ 2] = -_src[ 2];
  858. _dst[ 3] = _src[ 3];
  859. _dst[ 4] = -_src[ 4];
  860. _dst[ 5] = _src[ 5];
  861. _dst[ 6] = -_src[ 6];
  862. _dst[ 7] = _src[ 7];
  863. _dst[ 8] = -_src[ 8];
  864. _dst[ 9] = _src[ 9];
  865. _dst[10] = -_src[10];
  866. _dst[11] = _src[11];
  867. _dst[12] = -_src[12];
  868. _dst[13] = _src[13];
  869. _dst[14] = -_src[14];
  870. _dst[15] = _src[15];
  871. }
  872. inline bx::Vec3 calcNormal(const bx::Vec3& _va, const bx::Vec3& _vb, const bx::Vec3& _vc)
  873. {
  874. const bx::Vec3 ba = sub(_vb, _va);
  875. const bx::Vec3 ca = sub(_vc, _va);
  876. const bx::Vec3 baxca = cross(ba, ca);
  877. return bx::normalize(baxca);
  878. }
  879. inline void calcPlane(Plane& _outPlane, const bx::Vec3& _va, const bx::Vec3& _vb, const bx::Vec3& _vc)
  880. {
  881. bx::Vec3 normal = calcNormal(_va, _vb, _vc);
  882. calcPlane(_outPlane, normal, _va);
  883. }
  884. inline void calcPlane(Plane& _outPlane, const bx::Vec3& _normal, const bx::Vec3& _pos)
  885. {
  886. _outPlane.normal = _normal;
  887. _outPlane.dist = -dot(_normal, _pos);
  888. }
  889. inline BX_CONST_FUNC float toLinear(float _a)
  890. {
  891. const float lo = _a / 12.92f;
  892. const float hi = pow( (_a + 0.055f) / 1.055f, 2.4f);
  893. const float result = lerp(hi, lo, _a <= 0.04045f);
  894. return result;
  895. }
  896. inline BX_CONST_FUNC float toGamma(float _a)
  897. {
  898. const float lo = _a * 12.92f;
  899. const float hi = pow(abs(_a), 1.0f/2.4f) * 1.055f - 0.055f;
  900. const float result = lerp(hi, lo, _a <= 0.0031308f);
  901. return result;
  902. }
  903. } // namespace bx