vboolf16_avx512.h 6.1 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153
  1. // Copyright 2009-2021 Intel Corporation
  2. // SPDX-License-Identifier: Apache-2.0
  3. #pragma once
  4. #define vboolf vboolf_impl
  5. #define vboold vboold_impl
  6. #define vint vint_impl
  7. #define vuint vuint_impl
  8. #define vllong vllong_impl
  9. #define vfloat vfloat_impl
  10. #define vdouble vdouble_impl
  11. namespace embree
  12. {
  13. /* 16-wide AVX-512 bool type */
  14. template<>
  15. struct vboolf<16>
  16. {
  17. typedef vboolf16 Bool;
  18. typedef vint16 Int;
  19. typedef vfloat16 Float;
  20. enum { size = 16 }; // number of SIMD elements
  21. __mmask16 v; // data
  22. ////////////////////////////////////////////////////////////////////////////////
  23. /// Constructors, Assignment & Cast Operators
  24. ////////////////////////////////////////////////////////////////////////////////
  25. __forceinline vboolf() {}
  26. __forceinline vboolf(const vboolf16& t) { v = t.v; }
  27. __forceinline vboolf16& operator =(const vboolf16& f) { v = f.v; return *this; }
  28. __forceinline vboolf(const __mmask16& t) { v = t; }
  29. __forceinline operator __mmask16() const { return v; }
  30. __forceinline vboolf(bool b) { v = b ? 0xFFFF : 0x0000; }
  31. __forceinline vboolf(int t) { v = (__mmask16)t; }
  32. __forceinline vboolf(unsigned int t) { v = (__mmask16)t; }
  33. /* return int8 mask */
  34. __forceinline __m128i mask8() const {
  35. return _mm_movm_epi8(v);
  36. }
  37. /* return int32 mask */
  38. __forceinline __m512i mask32() const {
  39. return _mm512_movm_epi32(v);
  40. }
  41. ////////////////////////////////////////////////////////////////////////////////
  42. /// Constants
  43. ////////////////////////////////////////////////////////////////////////////////
  44. __forceinline vboolf(FalseTy) : v(0x0000) {}
  45. __forceinline vboolf(TrueTy) : v(0xffff) {}
  46. ////////////////////////////////////////////////////////////////////////////////
  47. /// Array Access
  48. ////////////////////////////////////////////////////////////////////////////////
  49. __forceinline bool operator [](size_t index) const {
  50. assert(index < 16); return (mm512_mask2int(v) >> index) & 1;
  51. }
  52. };
  53. ////////////////////////////////////////////////////////////////////////////////
  54. /// Unary Operators
  55. ////////////////////////////////////////////////////////////////////////////////
  56. __forceinline vboolf16 operator !(const vboolf16& a) { return _mm512_knot(a); }
  57. ////////////////////////////////////////////////////////////////////////////////
  58. /// Binary Operators
  59. ////////////////////////////////////////////////////////////////////////////////
  60. __forceinline vboolf16 operator &(const vboolf16& a, const vboolf16& b) { return _mm512_kand(a,b); }
  61. __forceinline vboolf16 operator |(const vboolf16& a, const vboolf16& b) { return _mm512_kor(a,b); }
  62. __forceinline vboolf16 operator ^(const vboolf16& a, const vboolf16& b) { return _mm512_kxor(a,b); }
  63. __forceinline vboolf16 andn(const vboolf16& a, const vboolf16& b) { return _mm512_kandn(b,a); }
  64. ////////////////////////////////////////////////////////////////////////////////
  65. /// Assignment Operators
  66. ////////////////////////////////////////////////////////////////////////////////
  67. __forceinline vboolf16& operator &=(vboolf16& a, const vboolf16& b) { return a = a & b; }
  68. __forceinline vboolf16& operator |=(vboolf16& a, const vboolf16& b) { return a = a | b; }
  69. __forceinline vboolf16& operator ^=(vboolf16& a, const vboolf16& b) { return a = a ^ b; }
  70. ////////////////////////////////////////////////////////////////////////////////
  71. /// Comparison Operators + Select
  72. ////////////////////////////////////////////////////////////////////////////////
  73. __forceinline vboolf16 operator !=(const vboolf16& a, const vboolf16& b) { return _mm512_kxor(a, b); }
  74. __forceinline vboolf16 operator ==(const vboolf16& a, const vboolf16& b) { return _mm512_kxnor(a, b); }
  75. __forceinline vboolf16 select(const vboolf16& s, const vboolf16& a, const vboolf16& b) {
  76. return _mm512_kor(_mm512_kand(s,a),_mm512_kandn(s,b));
  77. }
  78. ////////////////////////////////////////////////////////////////////////////////
  79. /// Reduction Operations
  80. ////////////////////////////////////////////////////////////////////////////////
  81. __forceinline int all (const vboolf16& a) { return _mm512_kortestc(a,a) != 0; }
  82. __forceinline int any (const vboolf16& a) { return _mm512_kortestz(a,a) == 0; }
  83. __forceinline int none(const vboolf16& a) { return _mm512_kortestz(a,a) != 0; }
  84. __forceinline int all (const vboolf16& valid, const vboolf16& b) { return all((!valid) | b); }
  85. __forceinline int any (const vboolf16& valid, const vboolf16& b) { return any(valid & b); }
  86. __forceinline int none(const vboolf16& valid, const vboolf16& b) { return none(valid & b); }
  87. __forceinline size_t movemask(const vboolf16& a) { return _mm512_kmov(a); }
  88. __forceinline size_t popcnt (const vboolf16& a) { return popcnt(a.v); }
  89. ////////////////////////////////////////////////////////////////////////////////
  90. /// Convertion Operations
  91. ////////////////////////////////////////////////////////////////////////////////
  92. __forceinline unsigned int toInt (const vboolf16& a) { return mm512_mask2int(a); }
  93. __forceinline vboolf16 toMask(const int& a) { return mm512_int2mask(a); }
  94. ////////////////////////////////////////////////////////////////////////////////
  95. /// Get/Set Functions
  96. ////////////////////////////////////////////////////////////////////////////////
  97. __forceinline bool get(const vboolf16& a, size_t index) { assert(index < 16); return (toInt(a) >> index) & 1; }
  98. __forceinline void set(vboolf16& a, size_t index) { assert(index < 16); a |= 1 << index; }
  99. __forceinline void clear(vboolf16& a, size_t index) { assert(index < 16); a = andn(a, 1 << index); }
  100. ////////////////////////////////////////////////////////////////////////////////
  101. /// Output Operators
  102. ////////////////////////////////////////////////////////////////////////////////
  103. __forceinline embree_ostream operator <<(embree_ostream cout, const vboolf16& a)
  104. {
  105. cout << "<";
  106. for (size_t i=0; i<16; i++) {
  107. if ((a.v >> i) & 1) cout << "1"; else cout << "0";
  108. }
  109. return cout << ">";
  110. }
  111. }
  112. #undef vboolf
  113. #undef vboold
  114. #undef vint
  115. #undef vuint
  116. #undef vllong
  117. #undef vfloat
  118. #undef vdouble