phi-merge-gep.ll 6.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102
  1. ; RUN: opt < %s -S -instcombine > %t
  2. ; RUN: grep "= getelementptr" %t | count 20
  3. ; RUN: grep "= phi" %t | count 13
  4. ; Don't push the geps through these phis, because they would require
  5. ; two phis each, which burdens the loop with high register pressure.
  6. define void @foo(float* %Ar, float* %Ai, i64 %As, float* %Cr, float* %Ci, i64 %Cs, i64 %n) nounwind {
  7. entry:
  8. %0 = getelementptr inbounds float, float* %Ar, i64 0 ; <float*> [#uses=1]
  9. %1 = getelementptr inbounds float, float* %Ai, i64 0 ; <float*> [#uses=1]
  10. %2 = mul i64 %n, %As ; <i64> [#uses=1]
  11. %3 = getelementptr inbounds float, float* %Ar, i64 %2 ; <float*> [#uses=1]
  12. %4 = mul i64 %n, %As ; <i64> [#uses=1]
  13. %5 = getelementptr inbounds float, float* %Ai, i64 %4 ; <float*> [#uses=1]
  14. %6 = mul i64 %n, 2 ; <i64> [#uses=1]
  15. %7 = mul i64 %6, %As ; <i64> [#uses=1]
  16. %8 = getelementptr inbounds float, float* %Ar, i64 %7 ; <float*> [#uses=1]
  17. %9 = mul i64 %n, 2 ; <i64> [#uses=1]
  18. %10 = mul i64 %9, %As ; <i64> [#uses=1]
  19. %11 = getelementptr inbounds float, float* %Ai, i64 %10 ; <float*> [#uses=1]
  20. %12 = getelementptr inbounds float, float* %Cr, i64 0 ; <float*> [#uses=1]
  21. %13 = getelementptr inbounds float, float* %Ci, i64 0 ; <float*> [#uses=1]
  22. %14 = mul i64 %n, %Cs ; <i64> [#uses=1]
  23. %15 = getelementptr inbounds float, float* %Cr, i64 %14 ; <float*> [#uses=1]
  24. %16 = mul i64 %n, %Cs ; <i64> [#uses=1]
  25. %17 = getelementptr inbounds float, float* %Ci, i64 %16 ; <float*> [#uses=1]
  26. %18 = mul i64 %n, 2 ; <i64> [#uses=1]
  27. %19 = mul i64 %18, %Cs ; <i64> [#uses=1]
  28. %20 = getelementptr inbounds float, float* %Cr, i64 %19 ; <float*> [#uses=1]
  29. %21 = mul i64 %n, 2 ; <i64> [#uses=1]
  30. %22 = mul i64 %21, %Cs ; <i64> [#uses=1]
  31. %23 = getelementptr inbounds float, float* %Ci, i64 %22 ; <float*> [#uses=1]
  32. br label %bb13
  33. bb: ; preds = %bb13
  34. %24 = load float, float* %A0r.0, align 4 ; <float> [#uses=1]
  35. %25 = load float, float* %A0i.0, align 4 ; <float> [#uses=1]
  36. %26 = load float, float* %A1r.0, align 4 ; <float> [#uses=2]
  37. %27 = load float, float* %A1i.0, align 4 ; <float> [#uses=2]
  38. %28 = load float, float* %A2r.0, align 4 ; <float> [#uses=2]
  39. %29 = load float, float* %A2i.0, align 4 ; <float> [#uses=2]
  40. %30 = fadd float %26, %28 ; <float> [#uses=2]
  41. %31 = fadd float %27, %29 ; <float> [#uses=2]
  42. %32 = fsub float %26, %28 ; <float> [#uses=1]
  43. %33 = fsub float %27, %29 ; <float> [#uses=1]
  44. %34 = fadd float %24, %30 ; <float> [#uses=2]
  45. %35 = fadd float %25, %31 ; <float> [#uses=2]
  46. %36 = fmul float %30, -1.500000e+00 ; <float> [#uses=1]
  47. %37 = fmul float %31, -1.500000e+00 ; <float> [#uses=1]
  48. %38 = fadd float %34, %36 ; <float> [#uses=2]
  49. %39 = fadd float %35, %37 ; <float> [#uses=2]
  50. %40 = fmul float %32, 0x3FEBB67AE0000000 ; <float> [#uses=2]
  51. %41 = fmul float %33, 0x3FEBB67AE0000000 ; <float> [#uses=2]
  52. %42 = fadd float %38, %41 ; <float> [#uses=1]
  53. %43 = fsub float %39, %40 ; <float> [#uses=1]
  54. %44 = fsub float %38, %41 ; <float> [#uses=1]
  55. %45 = fadd float %39, %40 ; <float> [#uses=1]
  56. store float %34, float* %C0r.0, align 4
  57. store float %35, float* %C0i.0, align 4
  58. store float %42, float* %C1r.0, align 4
  59. store float %43, float* %C1i.0, align 4
  60. store float %44, float* %C2r.0, align 4
  61. store float %45, float* %C2i.0, align 4
  62. %46 = getelementptr inbounds float, float* %A0r.0, i64 %As ; <float*> [#uses=1]
  63. %47 = getelementptr inbounds float, float* %A0i.0, i64 %As ; <float*> [#uses=1]
  64. %48 = getelementptr inbounds float, float* %A1r.0, i64 %As ; <float*> [#uses=1]
  65. %49 = getelementptr inbounds float, float* %A1i.0, i64 %As ; <float*> [#uses=1]
  66. %50 = getelementptr inbounds float, float* %A2r.0, i64 %As ; <float*> [#uses=1]
  67. %51 = getelementptr inbounds float, float* %A2i.0, i64 %As ; <float*> [#uses=1]
  68. %52 = getelementptr inbounds float, float* %C0r.0, i64 %Cs ; <float*> [#uses=1]
  69. %53 = getelementptr inbounds float, float* %C0i.0, i64 %Cs ; <float*> [#uses=1]
  70. %54 = getelementptr inbounds float, float* %C1r.0, i64 %Cs ; <float*> [#uses=1]
  71. %55 = getelementptr inbounds float, float* %C1i.0, i64 %Cs ; <float*> [#uses=1]
  72. %56 = getelementptr inbounds float, float* %C2r.0, i64 %Cs ; <float*> [#uses=1]
  73. %57 = getelementptr inbounds float, float* %C2i.0, i64 %Cs ; <float*> [#uses=1]
  74. %58 = add nsw i64 %i.0, 1 ; <i64> [#uses=1]
  75. br label %bb13
  76. bb13: ; preds = %bb, %entry
  77. %i.0 = phi i64 [ 0, %entry ], [ %58, %bb ] ; <i64> [#uses=2]
  78. %C2i.0 = phi float* [ %23, %entry ], [ %57, %bb ] ; <float*> [#uses=2]
  79. %C2r.0 = phi float* [ %20, %entry ], [ %56, %bb ] ; <float*> [#uses=2]
  80. %C1i.0 = phi float* [ %17, %entry ], [ %55, %bb ] ; <float*> [#uses=2]
  81. %C1r.0 = phi float* [ %15, %entry ], [ %54, %bb ] ; <float*> [#uses=2]
  82. %C0i.0 = phi float* [ %13, %entry ], [ %53, %bb ] ; <float*> [#uses=2]
  83. %C0r.0 = phi float* [ %12, %entry ], [ %52, %bb ] ; <float*> [#uses=2]
  84. %A2i.0 = phi float* [ %11, %entry ], [ %51, %bb ] ; <float*> [#uses=2]
  85. %A2r.0 = phi float* [ %8, %entry ], [ %50, %bb ] ; <float*> [#uses=2]
  86. %A1i.0 = phi float* [ %5, %entry ], [ %49, %bb ] ; <float*> [#uses=2]
  87. %A1r.0 = phi float* [ %3, %entry ], [ %48, %bb ] ; <float*> [#uses=2]
  88. %A0i.0 = phi float* [ %1, %entry ], [ %47, %bb ] ; <float*> [#uses=2]
  89. %A0r.0 = phi float* [ %0, %entry ], [ %46, %bb ] ; <float*> [#uses=2]
  90. %59 = icmp slt i64 %i.0, %n ; <i1> [#uses=1]
  91. br i1 %59, label %bb, label %bb14
  92. bb14: ; preds = %bb13
  93. br label %return
  94. return: ; preds = %bb14
  95. ret void
  96. }