| OLD | NEW |
| 1 ; This checks support for insertelement and extractelement. | 1 ; This checks support for insertelement and extractelement. |
| 2 | 2 |
| 3 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -O2 \ | 3 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -O2 \ |
| 4 ; RUN: | FileCheck %s | 4 ; RUN: | FileCheck %s |
| 5 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -Om1 \ | 5 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -Om1 \ |
| 6 ; RUN: | FileCheck %s | 6 ; RUN: | FileCheck %s |
| 7 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -O2 -mattr=sse4.1 \ | 7 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -O2 -mattr=sse4.1 \ |
| 8 ; RUN: | FileCheck --check-prefix=SSE41 %s | 8 ; RUN: | FileCheck --check-prefix=SSE41 %s |
| 9 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -Om1 -mattr=sse4.1 \ | 9 ; RUN: %p2i -i %s --filetype=obj --disassemble --args -Om1 -mattr=sse4.1 \ |
| 10 ; RUN: | FileCheck --check-prefix=SSE41 %s | 10 ; RUN: | FileCheck --check-prefix=SSE41 %s |
| 11 | 11 |
| 12 ; insertelement operations | 12 ; insertelement operations |
| 13 | 13 |
| 14 define <4 x float> @insertelement_v4f32_0(<4 x float> %vec, float %elt) { | 14 define internal <4 x float> @insertelement_v4f32_0(<4 x float> %vec, |
| 15 float %elt) { |
| 15 entry: | 16 entry: |
| 16 %res = insertelement <4 x float> %vec, float %elt, i32 0 | 17 %res = insertelement <4 x float> %vec, float %elt, i32 0 |
| 17 ret <4 x float> %res | 18 ret <4 x float> %res |
| 18 ; CHECK-LABEL: insertelement_v4f32_0 | 19 ; CHECK-LABEL: insertelement_v4f32_0 |
| 19 ; CHECK: movss | 20 ; CHECK: movss |
| 20 | 21 |
| 21 ; SSE41-LABEL: insertelement_v4f32_0 | 22 ; SSE41-LABEL: insertelement_v4f32_0 |
| 22 ; SSE41: insertps {{.*}},{{.*}},0x0 | 23 ; SSE41: insertps {{.*}},{{.*}},0x0 |
| 23 } | 24 } |
| 24 | 25 |
| 25 define <4 x i32> @insertelement_v4i32_0(<4 x i32> %vec, i32 %elt) { | 26 define internal <4 x i32> @insertelement_v4i32_0(<4 x i32> %vec, i32 %elt) { |
| 26 entry: | 27 entry: |
| 27 %res = insertelement <4 x i32> %vec, i32 %elt, i32 0 | 28 %res = insertelement <4 x i32> %vec, i32 %elt, i32 0 |
| 28 ret <4 x i32> %res | 29 ret <4 x i32> %res |
| 29 ; CHECK-LABEL: insertelement_v4i32_0 | 30 ; CHECK-LABEL: insertelement_v4i32_0 |
| 30 ; CHECK: movd xmm{{.*}}, | 31 ; CHECK: movd xmm{{.*}}, |
| 31 ; CHECK: movss | 32 ; CHECK: movss |
| 32 | 33 |
| 33 ; SSE41-LABEL: insertelement_v4i32_0 | 34 ; SSE41-LABEL: insertelement_v4i32_0 |
| 34 ; SSE41: pinsrd {{.*}},{{.*}},0x0 | 35 ; SSE41: pinsrd {{.*}},{{.*}},0x0 |
| 35 } | 36 } |
| 36 | 37 |
| 37 | 38 |
| 38 define <4 x float> @insertelement_v4f32_1(<4 x float> %vec, float %elt) { | 39 define internal <4 x float> @insertelement_v4f32_1(<4 x float> %vec, |
| 40 float %elt) { |
| 39 entry: | 41 entry: |
| 40 %res = insertelement <4 x float> %vec, float %elt, i32 1 | 42 %res = insertelement <4 x float> %vec, float %elt, i32 1 |
| 41 ret <4 x float> %res | 43 ret <4 x float> %res |
| 42 ; CHECK-LABEL: insertelement_v4f32_1 | 44 ; CHECK-LABEL: insertelement_v4f32_1 |
| 43 ; CHECK: shufps | 45 ; CHECK: shufps |
| 44 ; CHECK: shufps | 46 ; CHECK: shufps |
| 45 | 47 |
| 46 ; SSE41-LABEL: insertelement_v4f32_1 | 48 ; SSE41-LABEL: insertelement_v4f32_1 |
| 47 ; SSE41: insertps {{.*}},{{.*}},0x10 | 49 ; SSE41: insertps {{.*}},{{.*}},0x10 |
| 48 } | 50 } |
| 49 | 51 |
| 50 define <4 x i32> @insertelement_v4i32_1(<4 x i32> %vec, i32 %elt) { | 52 define internal <4 x i32> @insertelement_v4i32_1(<4 x i32> %vec, i32 %elt) { |
| 51 entry: | 53 entry: |
| 52 %res = insertelement <4 x i32> %vec, i32 %elt, i32 1 | 54 %res = insertelement <4 x i32> %vec, i32 %elt, i32 1 |
| 53 ret <4 x i32> %res | 55 ret <4 x i32> %res |
| 54 ; CHECK-LABEL: insertelement_v4i32_1 | 56 ; CHECK-LABEL: insertelement_v4i32_1 |
| 55 ; CHECK: shufps | 57 ; CHECK: shufps |
| 56 ; CHECK: shufps | 58 ; CHECK: shufps |
| 57 | 59 |
| 58 ; SSE41-LABEL: insertelement_v4i32_1 | 60 ; SSE41-LABEL: insertelement_v4i32_1 |
| 59 ; SSE41: pinsrd {{.*}},{{.*}},0x1 | 61 ; SSE41: pinsrd {{.*}},{{.*}},0x1 |
| 60 } | 62 } |
| 61 | 63 |
| 62 define <8 x i16> @insertelement_v8i16(<8 x i16> %vec, i32 %elt.arg) { | 64 define internal <8 x i16> @insertelement_v8i16(<8 x i16> %vec, i32 %elt.arg) { |
| 63 entry: | 65 entry: |
| 64 %elt = trunc i32 %elt.arg to i16 | 66 %elt = trunc i32 %elt.arg to i16 |
| 65 %res = insertelement <8 x i16> %vec, i16 %elt, i32 1 | 67 %res = insertelement <8 x i16> %vec, i16 %elt, i32 1 |
| 66 ret <8 x i16> %res | 68 ret <8 x i16> %res |
| 67 ; CHECK-LABEL: insertelement_v8i16 | 69 ; CHECK-LABEL: insertelement_v8i16 |
| 68 ; CHECK: pinsrw | 70 ; CHECK: pinsrw |
| 69 | 71 |
| 70 ; SSE41-LABEL: insertelement_v8i16 | 72 ; SSE41-LABEL: insertelement_v8i16 |
| 71 ; SSE41: pinsrw | 73 ; SSE41: pinsrw |
| 72 } | 74 } |
| 73 | 75 |
| 74 define <16 x i8> @insertelement_v16i8(<16 x i8> %vec, i32 %elt.arg) { | 76 define internal <16 x i8> @insertelement_v16i8(<16 x i8> %vec, i32 %elt.arg) { |
| 75 entry: | 77 entry: |
| 76 %elt = trunc i32 %elt.arg to i8 | 78 %elt = trunc i32 %elt.arg to i8 |
| 77 %res = insertelement <16 x i8> %vec, i8 %elt, i32 1 | 79 %res = insertelement <16 x i8> %vec, i8 %elt, i32 1 |
| 78 ret <16 x i8> %res | 80 ret <16 x i8> %res |
| 79 ; CHECK-LABEL: insertelement_v16i8 | 81 ; CHECK-LABEL: insertelement_v16i8 |
| 80 ; CHECK: movups | 82 ; CHECK: movups |
| 81 ; CHECK: lea | 83 ; CHECK: lea |
| 82 ; CHECK: mov | 84 ; CHECK: mov |
| 83 | 85 |
| 84 ; SSE41-LABEL: insertelement_v16i8 | 86 ; SSE41-LABEL: insertelement_v16i8 |
| 85 ; SSE41: pinsrb | 87 ; SSE41: pinsrb |
| 86 } | 88 } |
| 87 | 89 |
| 88 define <4 x i1> @insertelement_v4i1_0(<4 x i1> %vec, i32 %elt.arg) { | 90 define internal <4 x i1> @insertelement_v4i1_0(<4 x i1> %vec, i32 %elt.arg) { |
| 89 entry: | 91 entry: |
| 90 %elt = trunc i32 %elt.arg to i1 | 92 %elt = trunc i32 %elt.arg to i1 |
| 91 %res = insertelement <4 x i1> %vec, i1 %elt, i32 0 | 93 %res = insertelement <4 x i1> %vec, i1 %elt, i32 0 |
| 92 ret <4 x i1> %res | 94 ret <4 x i1> %res |
| 93 ; CHECK-LABEL: insertelement_v4i1_0 | 95 ; CHECK-LABEL: insertelement_v4i1_0 |
| 94 ; CHECK: movss | 96 ; CHECK: movss |
| 95 | 97 |
| 96 ; SSE41-LABEL: insertelement_v4i1_0 | 98 ; SSE41-LABEL: insertelement_v4i1_0 |
| 97 ; SSE41: pinsrd {{.*}},{{.*}},0x0 | 99 ; SSE41: pinsrd {{.*}},{{.*}},0x0 |
| 98 } | 100 } |
| 99 | 101 |
| 100 define <4 x i1> @insertelement_v4i1_1(<4 x i1> %vec, i32 %elt.arg) { | 102 define internal <4 x i1> @insertelement_v4i1_1(<4 x i1> %vec, i32 %elt.arg) { |
| 101 entry: | 103 entry: |
| 102 %elt = trunc i32 %elt.arg to i1 | 104 %elt = trunc i32 %elt.arg to i1 |
| 103 %res = insertelement <4 x i1> %vec, i1 %elt, i32 1 | 105 %res = insertelement <4 x i1> %vec, i1 %elt, i32 1 |
| 104 ret <4 x i1> %res | 106 ret <4 x i1> %res |
| 105 ; CHECK-LABEL: insertelement_v4i1_1 | 107 ; CHECK-LABEL: insertelement_v4i1_1 |
| 106 ; CHECK: shufps | 108 ; CHECK: shufps |
| 107 ; CHECK: shufps | 109 ; CHECK: shufps |
| 108 | 110 |
| 109 ; SSE41-LABEL: insertelement_v4i1_1 | 111 ; SSE41-LABEL: insertelement_v4i1_1 |
| 110 ; SSE41: pinsrd {{.*}},{{.*}},0x1 | 112 ; SSE41: pinsrd {{.*}},{{.*}},0x1 |
| 111 } | 113 } |
| 112 | 114 |
| 113 define <8 x i1> @insertelement_v8i1(<8 x i1> %vec, i32 %elt.arg) { | 115 define internal <8 x i1> @insertelement_v8i1(<8 x i1> %vec, i32 %elt.arg) { |
| 114 entry: | 116 entry: |
| 115 %elt = trunc i32 %elt.arg to i1 | 117 %elt = trunc i32 %elt.arg to i1 |
| 116 %res = insertelement <8 x i1> %vec, i1 %elt, i32 1 | 118 %res = insertelement <8 x i1> %vec, i1 %elt, i32 1 |
| 117 ret <8 x i1> %res | 119 ret <8 x i1> %res |
| 118 ; CHECK-LABEL: insertelement_v8i1 | 120 ; CHECK-LABEL: insertelement_v8i1 |
| 119 ; CHECK: pinsrw | 121 ; CHECK: pinsrw |
| 120 | 122 |
| 121 ; SSE41-LABEL: insertelement_v8i1 | 123 ; SSE41-LABEL: insertelement_v8i1 |
| 122 ; SSE41: pinsrw | 124 ; SSE41: pinsrw |
| 123 } | 125 } |
| 124 | 126 |
| 125 define <16 x i1> @insertelement_v16i1(<16 x i1> %vec, i32 %elt.arg) { | 127 define internal <16 x i1> @insertelement_v16i1(<16 x i1> %vec, i32 %elt.arg) { |
| 126 entry: | 128 entry: |
| 127 %elt = trunc i32 %elt.arg to i1 | 129 %elt = trunc i32 %elt.arg to i1 |
| 128 %res = insertelement <16 x i1> %vec, i1 %elt, i32 1 | 130 %res = insertelement <16 x i1> %vec, i1 %elt, i32 1 |
| 129 ret <16 x i1> %res | 131 ret <16 x i1> %res |
| 130 ; CHECK-LABEL: insertelement_v16i1 | 132 ; CHECK-LABEL: insertelement_v16i1 |
| 131 ; CHECK: movups | 133 ; CHECK: movups |
| 132 ; CHECK: lea | 134 ; CHECK: lea |
| 133 ; CHECK: mov | 135 ; CHECK: mov |
| 134 | 136 |
| 135 ; SSE41-LABEL: insertelement_v16i1 | 137 ; SSE41-LABEL: insertelement_v16i1 |
| 136 ; SSE41: pinsrb | 138 ; SSE41: pinsrb |
| 137 } | 139 } |
| 138 | 140 |
| 139 ; extractelement operations | 141 ; extractelement operations |
| 140 | 142 |
| 141 define float @extractelement_v4f32(<4 x float> %vec) { | 143 define internal float @extractelement_v4f32(<4 x float> %vec) { |
| 142 entry: | 144 entry: |
| 143 %res = extractelement <4 x float> %vec, i32 1 | 145 %res = extractelement <4 x float> %vec, i32 1 |
| 144 ret float %res | 146 ret float %res |
| 145 ; CHECK-LABEL: extractelement_v4f32 | 147 ; CHECK-LABEL: extractelement_v4f32 |
| 146 ; CHECK: pshufd | 148 ; CHECK: pshufd |
| 147 | 149 |
| 148 ; SSE41-LABEL: extractelement_v4f32 | 150 ; SSE41-LABEL: extractelement_v4f32 |
| 149 ; SSE41: pshufd | 151 ; SSE41: pshufd |
| 150 } | 152 } |
| 151 | 153 |
| 152 define i32 @extractelement_v4i32(<4 x i32> %vec) { | 154 define internal i32 @extractelement_v4i32(<4 x i32> %vec) { |
| 153 entry: | 155 entry: |
| 154 %res = extractelement <4 x i32> %vec, i32 1 | 156 %res = extractelement <4 x i32> %vec, i32 1 |
| 155 ret i32 %res | 157 ret i32 %res |
| 156 ; CHECK-LABEL: extractelement_v4i32 | 158 ; CHECK-LABEL: extractelement_v4i32 |
| 157 ; CHECK: pshufd | 159 ; CHECK: pshufd |
| 158 ; CHECK: movd {{.*}},xmm | 160 ; CHECK: movd {{.*}},xmm |
| 159 | 161 |
| 160 ; SSE41-LABEL: extractelement_v4i32 | 162 ; SSE41-LABEL: extractelement_v4i32 |
| 161 ; SSE41: pextrd | 163 ; SSE41: pextrd |
| 162 } | 164 } |
| 163 | 165 |
| 164 define i32 @extractelement_v8i16(<8 x i16> %vec) { | 166 define internal i32 @extractelement_v8i16(<8 x i16> %vec) { |
| 165 entry: | 167 entry: |
| 166 %res = extractelement <8 x i16> %vec, i32 1 | 168 %res = extractelement <8 x i16> %vec, i32 1 |
| 167 %res.ext = zext i16 %res to i32 | 169 %res.ext = zext i16 %res to i32 |
| 168 ret i32 %res.ext | 170 ret i32 %res.ext |
| 169 ; CHECK-LABEL: extractelement_v8i16 | 171 ; CHECK-LABEL: extractelement_v8i16 |
| 170 ; CHECK: pextrw | 172 ; CHECK: pextrw |
| 171 | 173 |
| 172 ; SSE41-LABEL: extractelement_v8i16 | 174 ; SSE41-LABEL: extractelement_v8i16 |
| 173 ; SSE41: pextrw | 175 ; SSE41: pextrw |
| 174 } | 176 } |
| 175 | 177 |
| 176 define i32 @extractelement_v16i8(<16 x i8> %vec) { | 178 define internal i32 @extractelement_v16i8(<16 x i8> %vec) { |
| 177 entry: | 179 entry: |
| 178 %res = extractelement <16 x i8> %vec, i32 1 | 180 %res = extractelement <16 x i8> %vec, i32 1 |
| 179 %res.ext = zext i8 %res to i32 | 181 %res.ext = zext i8 %res to i32 |
| 180 ret i32 %res.ext | 182 ret i32 %res.ext |
| 181 ; CHECK-LABEL: extractelement_v16i8 | 183 ; CHECK-LABEL: extractelement_v16i8 |
| 182 ; CHECK: movups | 184 ; CHECK: movups |
| 183 ; CHECK: lea | 185 ; CHECK: lea |
| 184 ; CHECK: mov | 186 ; CHECK: mov |
| 185 | 187 |
| 186 ; SSE41-LABEL: extractelement_v16i8 | 188 ; SSE41-LABEL: extractelement_v16i8 |
| 187 ; SSE41: pextrb | 189 ; SSE41: pextrb |
| 188 } | 190 } |
| 189 | 191 |
| 190 define i32 @extractelement_v4i1(<4 x i1> %vec) { | 192 define internal i32 @extractelement_v4i1(<4 x i1> %vec) { |
| 191 entry: | 193 entry: |
| 192 %res = extractelement <4 x i1> %vec, i32 1 | 194 %res = extractelement <4 x i1> %vec, i32 1 |
| 193 %res.ext = zext i1 %res to i32 | 195 %res.ext = zext i1 %res to i32 |
| 194 ret i32 %res.ext | 196 ret i32 %res.ext |
| 195 ; CHECK-LABEL: extractelement_v4i1 | 197 ; CHECK-LABEL: extractelement_v4i1 |
| 196 ; CHECK: pshufd | 198 ; CHECK: pshufd |
| 197 | 199 |
| 198 ; SSE41-LABEL: extractelement_v4i1 | 200 ; SSE41-LABEL: extractelement_v4i1 |
| 199 ; SSE41: pextrd | 201 ; SSE41: pextrd |
| 200 } | 202 } |
| 201 | 203 |
| 202 define i32 @extractelement_v8i1(<8 x i1> %vec) { | 204 define internal i32 @extractelement_v8i1(<8 x i1> %vec) { |
| 203 entry: | 205 entry: |
| 204 %res = extractelement <8 x i1> %vec, i32 1 | 206 %res = extractelement <8 x i1> %vec, i32 1 |
| 205 %res.ext = zext i1 %res to i32 | 207 %res.ext = zext i1 %res to i32 |
| 206 ret i32 %res.ext | 208 ret i32 %res.ext |
| 207 ; CHECK-LABEL: extractelement_v8i1 | 209 ; CHECK-LABEL: extractelement_v8i1 |
| 208 ; CHECK: pextrw | 210 ; CHECK: pextrw |
| 209 | 211 |
| 210 ; SSE41-LABEL: extractelement_v8i1 | 212 ; SSE41-LABEL: extractelement_v8i1 |
| 211 ; SSE41: pextrw | 213 ; SSE41: pextrw |
| 212 } | 214 } |
| 213 | 215 |
| 214 define i32 @extractelement_v16i1(<16 x i1> %vec) { | 216 define internal i32 @extractelement_v16i1(<16 x i1> %vec) { |
| 215 entry: | 217 entry: |
| 216 %res = extractelement <16 x i1> %vec, i32 1 | 218 %res = extractelement <16 x i1> %vec, i32 1 |
| 217 %res.ext = zext i1 %res to i32 | 219 %res.ext = zext i1 %res to i32 |
| 218 ret i32 %res.ext | 220 ret i32 %res.ext |
| 219 ; CHECK-LABEL: extractelement_v16i1 | 221 ; CHECK-LABEL: extractelement_v16i1 |
| 220 ; CHECK: movups | 222 ; CHECK: movups |
| 221 ; CHECK: lea | 223 ; CHECK: lea |
| 222 ; CHECK: mov | 224 ; CHECK: mov |
| 223 | 225 |
| 224 ; SSE41-LABEL: extractelement_v16i1 | 226 ; SSE41-LABEL: extractelement_v16i1 |
| 225 ; SSE41: pextrb | 227 ; SSE41: pextrb |
| 226 } | 228 } |
| OLD | NEW |