vboold8_avx512.h 6.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153
  1. // ======================================================================== //
  2. // Copyright 2009-2017 Intel Corporation //
  3. // //
  4. // Licensed under the Apache License, Version 2.0 (the "License"); //
  5. // you may not use this file except in compliance with the License. //
  6. // You may obtain a copy of the License at //
  7. // //
  8. // http://www.apache.org/licenses/LICENSE-2.0 //
  9. // //
  10. // Unless required by applicable law or agreed to in writing, software //
  11. // distributed under the License is distributed on an "AS IS" BASIS, //
  12. // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. //
  13. // See the License for the specific language governing permissions and //
  14. // limitations under the License. //
  15. // ======================================================================== //
  16. #pragma once
  17. namespace embree
  18. {
  19. /* 8-wide AVX-512 bool type */
  20. template<>
  21. struct vboold<8>
  22. {
  23. typedef vboold8 Bool;
  24. typedef vint8 Int;
  25. enum { size = 8 }; // number of SIMD elements
  26. __mmask8 v; // data
  27. ////////////////////////////////////////////////////////////////////////////////
  28. /// Constructors, Assignment & Cast Operators
  29. ////////////////////////////////////////////////////////////////////////////////
  30. __forceinline vboold() {}
  31. __forceinline vboold(const vboold8 &t) { v = t.v; }
  32. __forceinline vboold8& operator=(const vboold8 &f) { v = f.v; return *this; }
  33. __forceinline vboold(const __mmask8 &t) { v = t; }
  34. __forceinline operator __mmask8() const { return v; }
  35. __forceinline vboold(bool b) { v = b ? 0xff : 0x00; }
  36. __forceinline vboold(int t) { v = (__mmask8)t; }
  37. __forceinline vboold(unsigned int t) { v = (__mmask8)t; }
  38. /* return int8 mask */
  39. __forceinline __m128i mask8() const {
  40. #if defined(__AVX512BW__)
  41. return _mm_movm_epi8(v);
  42. #else
  43. const __m512i f = _mm512_set1_epi64(0);
  44. const __m512i t = _mm512_set1_epi64(-1);
  45. const __m512i m = _mm512_mask_or_epi64(f,v,t,t);
  46. return _mm512_cvtepi64_epi8(m);
  47. #endif
  48. }
  49. /* return int64 mask */
  50. __forceinline __m512i mask64() const {
  51. #if defined(__AVX512DQ__)
  52. return _mm512_movm_epi64(v);
  53. #else
  54. const __m512i f = _mm512_set1_epi64(0);
  55. const __m512i t = _mm512_set1_epi64(-1);
  56. return _mm512_mask_or_epi64(f,v,t,t);
  57. #endif
  58. }
  59. ////////////////////////////////////////////////////////////////////////////////
  60. /// Constants
  61. ////////////////////////////////////////////////////////////////////////////////
  62. __forceinline vboold( FalseTy ) : v(0x00) {}
  63. __forceinline vboold( TrueTy ) : v(0xff) {}
  64. };
  65. ////////////////////////////////////////////////////////////////////////////////
  66. /// Unary Operators
  67. ////////////////////////////////////////////////////////////////////////////////
  68. __forceinline vboold8 operator!(const vboold8 &a) { return _mm512_knot(a); }
  69. ////////////////////////////////////////////////////////////////////////////////
  70. /// Binary Operators
  71. ////////////////////////////////////////////////////////////////////////////////
  72. __forceinline vboold8 operator&(const vboold8 &a, const vboold8 &b) { return _mm512_kand(a, b); }
  73. __forceinline vboold8 operator|(const vboold8 &a, const vboold8 &b) { return _mm512_kor(a, b); }
  74. __forceinline vboold8 operator^(const vboold8 &a, const vboold8 &b) { return _mm512_kxor(a, b); }
  75. __forceinline vboold8 andn(const vboold8 &a, const vboold8 &b) { return _mm512_kandn(b, a); }
  76. ////////////////////////////////////////////////////////////////////////////////
  77. /// Assignment Operators
  78. ////////////////////////////////////////////////////////////////////////////////
  79. __forceinline const vboold8 operator &=( vboold8& a, const vboold8& b ) { return a = a & b; }
  80. __forceinline const vboold8 operator |=( vboold8& a, const vboold8& b ) { return a = a | b; }
  81. __forceinline const vboold8 operator ^=( vboold8& a, const vboold8& b ) { return a = a ^ b; }
  82. ////////////////////////////////////////////////////////////////////////////////
  83. /// Comparison Operators + Select
  84. ////////////////////////////////////////////////////////////////////////////////
  85. __forceinline const vboold8 operator !=( const vboold8& a, const vboold8& b ) { return _mm512_kxor(a, b); }
  86. __forceinline const vboold8 operator ==( const vboold8& a, const vboold8& b ) { return _mm512_kxnor(a, b); }
  87. __forceinline vboold8 select(const vboold8 &s, const vboold8 &a, const vboold8 &b) {
  88. return _mm512_kor(_mm512_kand(s, a), _mm512_kandn(s, b));
  89. }
  90. ////////////////////////////////////////////////////////////////////////////////
  91. /// Reduction Operations
  92. ////////////////////////////////////////////////////////////////////////////////
  93. __forceinline int all (const vboold8 &a) { return a.v == 0xff; }
  94. __forceinline int any (const vboold8 &a) { return _mm512_kortestz(a, a) == 0; }
  95. __forceinline int none(const vboold8 &a) { return _mm512_kortestz(a, a) != 0; }
  96. __forceinline int all ( const vboold8& valid, const vboold8& b ) { return all((!valid) | b); }
  97. __forceinline int any ( const vboold8& valid, const vboold8& b ) { return any( valid & b); }
  98. __forceinline int none( const vboold8& valid, const vboold8& b ) { return none(valid & b); }
  99. __forceinline size_t movemask( const vboold8& a ) { return _mm512_kmov(a); }
  100. __forceinline size_t popcnt ( const vboold8& a ) { return __popcnt(a.v); }
  101. ////////////////////////////////////////////////////////////////////////////////
  102. /// Conversion Operations
  103. ////////////////////////////////////////////////////////////////////////////////
  104. __forceinline unsigned int toInt(const vboold8 &a) { return _mm512_mask2int(a); }
  105. ////////////////////////////////////////////////////////////////////////////////
  106. /// Get/Set Functions
  107. ////////////////////////////////////////////////////////////////////////////////
  108. __forceinline bool get(const vboold8& a, size_t index) { assert(index < 8); return (toInt(a) >> index) & 1; }
  109. __forceinline void set(vboold8& a, size_t index) { assert(index < 8); a |= 1 << index; }
  110. __forceinline void clear(vboold8& a, size_t index) { assert(index < 8); a = andn(a, 1 << index); }
  111. ////////////////////////////////////////////////////////////////////////////////
  112. /// Output Operators
  113. ////////////////////////////////////////////////////////////////////////////////
  114. inline std::ostream& operator<<(std::ostream& cout, const vboold8& a)
  115. {
  116. cout << "<";
  117. for (size_t i=0; i<8; i++) {
  118. if ((a.v >> i) & 1) cout << "1"; else cout << "0";
  119. }
  120. return cout << ">";
  121. }
  122. }