vboolf16_avx512.h 7.4 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163
  1. // ======================================================================== //
  2. // Copyright 2009-2017 Intel Corporation //
  3. // //
  4. // Licensed under the Apache License, Version 2.0 (the "License"); //
  5. // you may not use this file except in compliance with the License. //
  6. // You may obtain a copy of the License at //
  7. // //
  8. // http://www.apache.org/licenses/LICENSE-2.0 //
  9. // //
  10. // Unless required by applicable law or agreed to in writing, software //
  11. // distributed under the License is distributed on an "AS IS" BASIS, //
  12. // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. //
  13. // See the License for the specific language governing permissions and //
  14. // limitations under the License. //
  15. // ======================================================================== //
  16. #pragma once
  17. namespace embree
  18. {
  19. /* 16-wide AVX-512 bool type */
  20. template<>
  21. struct vboolf<16>
  22. {
  23. typedef vboolf16 Bool;
  24. typedef vint16 Int;
  25. typedef vfloat16 Float;
  26. enum { size = 16 }; // number of SIMD elements
  27. __mmask16 v; // data
  28. ////////////////////////////////////////////////////////////////////////////////
  29. /// Constructors, Assignment & Cast Operators
  30. ////////////////////////////////////////////////////////////////////////////////
  31. __forceinline vboolf() {}
  32. __forceinline vboolf(const vboolf16 &t) { v = t.v; }
  33. __forceinline vboolf16& operator=(const vboolf16 &f) { v = f.v; return *this; }
  34. __forceinline vboolf(const __mmask16 &t) { v = t; }
  35. __forceinline operator __mmask16 () const { return v; }
  36. __forceinline vboolf(bool b) { v = b ? 0xFFFF : 0x0000; }
  37. __forceinline vboolf(int t ) { v = (__mmask16)t; }
  38. __forceinline vboolf(unsigned int t ) { v = (__mmask16)t; }
  39. /* return int8 mask */
  40. __forceinline __m128i mask8() const {
  41. #if defined(__AVX512BW__)
  42. return _mm_movm_epi8(v);
  43. #else
  44. const __m512i f = _mm512_set1_epi32(0);
  45. const __m512i t = _mm512_set1_epi32(-1);
  46. const __m512i m = _mm512_mask_or_epi32(f,v,t,t);
  47. return _mm512_cvtepi32_epi8(m);
  48. #endif
  49. }
  50. /* return int32 mask */
  51. __forceinline __m512i mask32() const {
  52. #if defined(__AVX512DQ__)
  53. return _mm512_movm_epi32(v);
  54. #else
  55. const __m512i f = _mm512_set1_epi32(0);
  56. const __m512i t = _mm512_set1_epi32(-1);
  57. return _mm512_mask_or_epi32(f,v,t,t);
  58. #endif
  59. }
  60. ////////////////////////////////////////////////////////////////////////////////
  61. /// Constants
  62. ////////////////////////////////////////////////////////////////////////////////
  63. __forceinline vboolf( FalseTy ) : v(0x0000) {}
  64. __forceinline vboolf( TrueTy ) : v(0xffff) {}
  65. ////////////////////////////////////////////////////////////////////////////////
  66. /// Array Access
  67. ////////////////////////////////////////////////////////////////////////////////
  68. __forceinline bool operator []( const size_t index ) const {
  69. assert(index < 16); return (_mm512_mask2int(v) >> index) & 1;
  70. }
  71. };
  72. ////////////////////////////////////////////////////////////////////////////////
  73. /// Unary Operators
  74. ////////////////////////////////////////////////////////////////////////////////
  75. __forceinline vboolf16 operator!(const vboolf16 &a) { return _mm512_knot(a); }
  76. ////////////////////////////////////////////////////////////////////////////////
  77. /// Binary Operators
  78. ////////////////////////////////////////////////////////////////////////////////
  79. __forceinline vboolf16 operator&(const vboolf16 &a, const vboolf16 &b) { return _mm512_kand(a,b); }
  80. __forceinline vboolf16 operator|(const vboolf16 &a, const vboolf16 &b) { return _mm512_kor(a,b); }
  81. __forceinline vboolf16 operator^(const vboolf16 &a, const vboolf16 &b) { return _mm512_kxor(a,b); }
  82. __forceinline vboolf16 andn(const vboolf16 &a, const vboolf16 &b) { return _mm512_kandn(b,a); }
  83. ////////////////////////////////////////////////////////////////////////////////
  84. /// Assignment Operators
  85. ////////////////////////////////////////////////////////////////////////////////
  86. __forceinline const vboolf16 operator &=( vboolf16& a, const vboolf16& b ) { return a = a & b; }
  87. __forceinline const vboolf16 operator |=( vboolf16& a, const vboolf16& b ) { return a = a | b; }
  88. __forceinline const vboolf16 operator ^=( vboolf16& a, const vboolf16& b ) { return a = a ^ b; }
  89. ////////////////////////////////////////////////////////////////////////////////
  90. /// Comparison Operators + Select
  91. ////////////////////////////////////////////////////////////////////////////////
  92. __forceinline const vboolf16 operator !=( const vboolf16& a, const vboolf16& b ) { return _mm512_kxor(a, b); }
  93. __forceinline const vboolf16 operator ==( const vboolf16& a, const vboolf16& b ) { return _mm512_kxnor(a, b); }
  94. __forceinline vboolf16 select (const vboolf16 &s, const vboolf16 &a, const vboolf16 &b) {
  95. return _mm512_kor(_mm512_kand(s,a),_mm512_kandn(s,b));
  96. }
  97. ////////////////////////////////////////////////////////////////////////////////
  98. /// Reduction Operations
  99. ////////////////////////////////////////////////////////////////////////////////
  100. __forceinline int all (const vboolf16 &a) { return _mm512_kortestc(a,a) != 0; }
  101. __forceinline int any (const vboolf16 &a) { return _mm512_kortestz(a,a) == 0; }
  102. __forceinline int none(const vboolf16 &a) { return _mm512_kortestz(a,a) != 0; }
  103. __forceinline int all ( const vboolf16& valid, const vboolf16& b ) { return all((!valid) | b); }
  104. __forceinline int any ( const vboolf16& valid, const vboolf16& b ) { return any( valid & b); }
  105. __forceinline int none( const vboolf16& valid, const vboolf16& b ) { return none(valid & b); }
  106. __forceinline size_t movemask( const vboolf16& a ) { return _mm512_kmov(a); }
  107. __forceinline size_t popcnt ( const vboolf16& a ) { return __popcnt(a.v); }
  108. ////////////////////////////////////////////////////////////////////////////////
  109. /// Convertion Operations
  110. ////////////////////////////////////////////////////////////////////////////////
  111. __forceinline unsigned int toInt (const vboolf16 &a) { return _mm512_mask2int(a); }
  112. __forceinline vboolf16 toMask(const int &a) { return _mm512_int2mask(a); }
  113. ////////////////////////////////////////////////////////////////////////////////
  114. /// Get/Set Functions
  115. ////////////////////////////////////////////////////////////////////////////////
  116. __forceinline bool get(const vboolf16& a, size_t index) { assert(index < 16); return (toInt(a) >> index) & 1; }
  117. __forceinline void set(vboolf16& a, size_t index) { assert(index < 16); a |= 1 << index; }
  118. __forceinline void clear(vboolf16& a, size_t index) { assert(index < 16); a = andn(a, 1 << index); }
  119. ////////////////////////////////////////////////////////////////////////////////
  120. /// Output Operators
  121. ////////////////////////////////////////////////////////////////////////////////
  122. inline std::ostream& operator<<(std::ostream& cout, const vboolf16& a)
  123. {
  124. cout << "<";
  125. for (size_t i=0; i<16; i++) {
  126. if ((a.v >> i) & 1) cout << "1"; else cout << "0";
  127. }
  128. return cout << ">";
  129. }
  130. }