vboolf8_avx512.h 6.3 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159
  1. // Copyright 2009-2021 Intel Corporation
  2. // SPDX-License-Identifier: Apache-2.0
  3. #pragma once
  4. #define vboolf vboolf_impl
  5. #define vboold vboold_impl
  6. #define vint vint_impl
  7. #define vuint vuint_impl
  8. #define vllong vllong_impl
  9. #define vfloat vfloat_impl
  10. #define vdouble vdouble_impl
  11. namespace embree
  12. {
  13. /* 8-wide AVX-512 bool type */
  14. template<>
  15. struct vboolf<8>
  16. {
  17. typedef vboolf8 Bool;
  18. typedef vint8 Int;
  19. enum { size = 8 }; // number of SIMD elements
  20. __mmask8 v; // data
  21. ////////////////////////////////////////////////////////////////////////////////
  22. /// Constructors, Assignment & Cast Operators
  23. ////////////////////////////////////////////////////////////////////////////////
  24. __forceinline vboolf() {}
  25. __forceinline vboolf(const vboolf8& t) { v = t.v; }
  26. __forceinline vboolf8& operator =(const vboolf8& f) { v = f.v; return *this; }
  27. __forceinline vboolf(const __mmask8 &t) { v = t; }
  28. __forceinline operator __mmask8() const { return v; }
  29. __forceinline vboolf(bool b) { v = b ? 0xff : 0x00; }
  30. __forceinline vboolf(int t) { v = (__mmask8)t; }
  31. __forceinline vboolf(unsigned int t) { v = (__mmask8)t; }
  32. __forceinline vboolf(bool a, bool b, bool c, bool d, bool e, bool f, bool g, bool h)
  33. : v((__mmask8)((int(h) << 7) | (int(g) << 6) | (int(f) << 5) | (int(e) << 4) | (int(d) << 3) | (int(c) << 2) | (int(b) << 1) | int(a))) {}
  34. /* return int8 mask */
  35. __forceinline __m128i mask8() const {
  36. return _mm_movm_epi8(v);
  37. }
  38. /* return int32 mask */
  39. __forceinline __m256i mask32() const {
  40. return _mm256_movm_epi32(v);
  41. }
  42. /* return int64 mask */
  43. __forceinline __m512i mask64() const {
  44. return _mm512_movm_epi64(v);
  45. }
  46. ////////////////////////////////////////////////////////////////////////////////
  47. /// Constants
  48. ////////////////////////////////////////////////////////////////////////////////
  49. __forceinline vboolf(FalseTy) : v(0x00) {}
  50. __forceinline vboolf(TrueTy) : v(0xff) {}
  51. ////////////////////////////////////////////////////////////////////////////////
  52. /// Array Access
  53. ////////////////////////////////////////////////////////////////////////////////
  54. __forceinline bool operator [](size_t index) const {
  55. assert(index < 8); return (mm512_mask2int(v) >> index) & 1;
  56. }
  57. };
  58. ////////////////////////////////////////////////////////////////////////////////
  59. /// Unary Operators
  60. ////////////////////////////////////////////////////////////////////////////////
  61. __forceinline vboolf8 operator !(const vboolf8& a) { return _mm512_knot(a); }
  62. ////////////////////////////////////////////////////////////////////////////////
  63. /// Binary Operators
  64. ////////////////////////////////////////////////////////////////////////////////
  65. __forceinline vboolf8 operator &(const vboolf8& a, const vboolf8& b) { return _mm512_kand(a, b); }
  66. __forceinline vboolf8 operator |(const vboolf8& a, const vboolf8& b) { return _mm512_kor(a, b); }
  67. __forceinline vboolf8 operator ^(const vboolf8& a, const vboolf8& b) { return _mm512_kxor(a, b); }
  68. __forceinline vboolf8 andn(const vboolf8& a, const vboolf8& b) { return _mm512_kandn(b, a); }
  69. ////////////////////////////////////////////////////////////////////////////////
  70. /// Assignment Operators
  71. ////////////////////////////////////////////////////////////////////////////////
  72. __forceinline vboolf8& operator &=(vboolf8& a, const vboolf8& b) { return a = a & b; }
  73. __forceinline vboolf8& operator |=(vboolf8& a, const vboolf8& b) { return a = a | b; }
  74. __forceinline vboolf8& operator ^=(vboolf8& a, const vboolf8& b) { return a = a ^ b; }
  75. ////////////////////////////////////////////////////////////////////////////////
  76. /// Comparison Operators + Select
  77. ////////////////////////////////////////////////////////////////////////////////
  78. __forceinline vboolf8 operator !=(const vboolf8& a, const vboolf8& b) { return _mm512_kxor(a, b); }
  79. __forceinline vboolf8 operator ==(const vboolf8& a, const vboolf8& b) { return _mm512_kxnor(a, b); }
  80. __forceinline vboolf8 select(const vboolf8& s, const vboolf8& a, const vboolf8& b) {
  81. return _mm512_kor(_mm512_kand(s, a), _mm512_kandn(s, b));
  82. }
  83. ////////////////////////////////////////////////////////////////////////////////
  84. /// Reduction Operations
  85. ////////////////////////////////////////////////////////////////////////////////
  86. __forceinline int all (const vboolf8& a) { return a.v == 0xff; }
  87. __forceinline int any (const vboolf8& a) { return _mm512_kortestz(a, a) == 0; }
  88. __forceinline int none(const vboolf8& a) { return _mm512_kortestz(a, a) != 0; }
  89. __forceinline int all (const vboolf8& valid, const vboolf8& b) { return all((!valid) | b); }
  90. __forceinline int any (const vboolf8& valid, const vboolf8& b) { return any(valid & b); }
  91. __forceinline int none(const vboolf8& valid, const vboolf8& b) { return none(valid & b); }
  92. __forceinline size_t movemask(const vboolf8& a) { return _mm512_kmov(a); }
  93. __forceinline size_t popcnt (const vboolf8& a) { return popcnt(a.v); }
  94. ////////////////////////////////////////////////////////////////////////////////
  95. /// Conversion Operations
  96. ////////////////////////////////////////////////////////////////////////////////
  97. __forceinline unsigned int toInt(const vboolf8& a) { return mm512_mask2int(a); }
  98. ////////////////////////////////////////////////////////////////////////////////
  99. /// Get/Set Functions
  100. ////////////////////////////////////////////////////////////////////////////////
  101. __forceinline bool get(const vboolf8& a, size_t index) { assert(index < 8); return (toInt(a) >> index) & 1; }
  102. __forceinline void set(vboolf8& a, size_t index) { assert(index < 8); a |= 1 << index; }
  103. __forceinline void clear(vboolf8& a, size_t index) { assert(index < 8); a = andn(a, 1 << index); }
  104. ////////////////////////////////////////////////////////////////////////////////
  105. /// Output Operators
  106. ////////////////////////////////////////////////////////////////////////////////
  107. __forceinline embree_ostream operator <<(embree_ostream cout, const vboolf8& a)
  108. {
  109. cout << "<";
  110. for (size_t i=0; i<8; i++) {
  111. if ((a.v >> i) & 1) cout << "1"; else cout << "0";
  112. }
  113. return cout << ">";
  114. }
  115. }
  116. #undef vboolf
  117. #undef vboold
  118. #undef vint
  119. #undef vuint
  120. #undef vllong
  121. #undef vfloat
  122. #undef vdouble