| OLD | NEW |
| 1 ; This checks support for insertelement and extractelement. | 1 ; This checks support for insertelement and extractelement. |
| 2 | 2 |
| 3 ; RUN: %p2i -i %s --args -O2 --verbose none \ | 3 ; RUN: %p2i -i %s --assemble --disassemble --args -O2 --verbose none \ |
| 4 ; RUN: | llvm-mc -triple=i686-none-nacl -filetype=obj \ | 4 ; RUN: | FileCheck %s |
| 5 ; RUN: | llvm-objdump -d --symbolize -x86-asm-syntax=intel - | FileCheck %s | 5 ; RUN: %p2i -i %s --assemble --disassemble --args -Om1 --verbose none \ |
| 6 ; RUN: %p2i -i %s --args -Om1 --verbose none \ | 6 ; RUN: | FileCheck %s |
| 7 ; RUN: | llvm-mc -triple=i686-none-nacl -filetype=obj \ | 7 ; RUN: %p2i -i %s --assemble --disassemble --args -O2 -mattr=sse4.1 --verbose \ |
| 8 ; RUN: | llvm-objdump -d --symbolize -x86-asm-syntax=intel - | FileCheck %s | 8 ; RUN: none \ |
| 9 ; RUN: %p2i -i %s --args -O2 -mattr=sse4.1 --verbose none \ | |
| 10 ; RUN: | llvm-mc -triple=i686-none-nacl -filetype=obj \ | |
| 11 ; RUN: | llvm-objdump -d --symbolize -x86-asm-syntax=intel - \ | |
| 12 ; RUN: | FileCheck --check-prefix=SSE41 %s | 9 ; RUN: | FileCheck --check-prefix=SSE41 %s |
| 13 ; RUN: %p2i -i %s --args -Om1 -mattr=sse4.1 --verbose none \ | 10 ; RUN: %p2i -i %s --assemble --disassemble --args -Om1 -mattr=sse4.1 --verbose \ |
| 14 ; RUN: | llvm-mc -triple=i686-none-nacl -filetype=obj \ | 11 ; RUN: none \ |
| 15 ; RUN: | llvm-objdump -d --symbolize -x86-asm-syntax=intel - \ | |
| 16 ; RUN: | FileCheck --check-prefix=SSE41 %s | 12 ; RUN: | FileCheck --check-prefix=SSE41 %s |
| 17 | 13 |
| 18 ; insertelement operations | 14 ; insertelement operations |
| 19 | 15 |
| 20 define <4 x float> @insertelement_v4f32_0(<4 x float> %vec, float %elt) { | 16 define <4 x float> @insertelement_v4f32_0(<4 x float> %vec, float %elt) { |
| 21 entry: | 17 entry: |
| 22 %res = insertelement <4 x float> %vec, float %elt, i32 0 | 18 %res = insertelement <4 x float> %vec, float %elt, i32 0 |
| 23 ret <4 x float> %res | 19 ret <4 x float> %res |
| 24 ; CHECK-LABEL: insertelement_v4f32_0: | 20 ; CHECK-LABEL: insertelement_v4f32_0 |
| 25 ; CHECK: movss | 21 ; CHECK: movss |
| 26 | 22 |
| 27 ; SSE41-LABEL: insertelement_v4f32_0: | 23 ; SSE41-LABEL: insertelement_v4f32_0 |
| 28 ; SSE41: insertps {{.*}}, {{.*}}, 0 | 24 ; SSE41: insertps {{.*}}, {{.*}}, 0 |
| 29 } | 25 } |
| 30 | 26 |
| 31 define <4 x i32> @insertelement_v4i32_0(<4 x i32> %vec, i32 %elt) { | 27 define <4 x i32> @insertelement_v4i32_0(<4 x i32> %vec, i32 %elt) { |
| 32 entry: | 28 entry: |
| 33 %res = insertelement <4 x i32> %vec, i32 %elt, i32 0 | 29 %res = insertelement <4 x i32> %vec, i32 %elt, i32 0 |
| 34 ret <4 x i32> %res | 30 ret <4 x i32> %res |
| 35 ; CHECK-LABEL: insertelement_v4i32_0: | 31 ; CHECK-LABEL: insertelement_v4i32_0 |
| 36 ; CHECK: movd xmm{{.*}}, | 32 ; CHECK: movd xmm{{.*}}, |
| 37 ; CHECK: movss | 33 ; CHECK: movss |
| 38 | 34 |
| 39 ; SSE41-LABEL: insertelement_v4i32_0: | 35 ; SSE41-LABEL: insertelement_v4i32_0 |
| 40 ; SSE41: pinsrd {{.*}}, {{.*}}, 0 | 36 ; SSE41: pinsrd {{.*}}, {{.*}}, 0 |
| 41 } | 37 } |
| 42 | 38 |
| 43 | 39 |
| 44 define <4 x float> @insertelement_v4f32_1(<4 x float> %vec, float %elt) { | 40 define <4 x float> @insertelement_v4f32_1(<4 x float> %vec, float %elt) { |
| 45 entry: | 41 entry: |
| 46 %res = insertelement <4 x float> %vec, float %elt, i32 1 | 42 %res = insertelement <4 x float> %vec, float %elt, i32 1 |
| 47 ret <4 x float> %res | 43 ret <4 x float> %res |
| 48 ; CHECK-LABEL: insertelement_v4f32_1: | 44 ; CHECK-LABEL: insertelement_v4f32_1 |
| 49 ; CHECK: shufps | 45 ; CHECK: shufps |
| 50 ; CHECK: shufps | 46 ; CHECK: shufps |
| 51 | 47 |
| 52 ; SSE41-LABEL: insertelement_v4f32_1: | 48 ; SSE41-LABEL: insertelement_v4f32_1 |
| 53 ; SSE41: insertps {{.*}}, {{.*}}, 16 | 49 ; SSE41: insertps {{.*}}, {{.*}}, 16 |
| 54 } | 50 } |
| 55 | 51 |
| 56 define <4 x i32> @insertelement_v4i32_1(<4 x i32> %vec, i32 %elt) { | 52 define <4 x i32> @insertelement_v4i32_1(<4 x i32> %vec, i32 %elt) { |
| 57 entry: | 53 entry: |
| 58 %res = insertelement <4 x i32> %vec, i32 %elt, i32 1 | 54 %res = insertelement <4 x i32> %vec, i32 %elt, i32 1 |
| 59 ret <4 x i32> %res | 55 ret <4 x i32> %res |
| 60 ; CHECK-LABEL: insertelement_v4i32_1: | 56 ; CHECK-LABEL: insertelement_v4i32_1 |
| 61 ; CHECK: shufps | 57 ; CHECK: shufps |
| 62 ; CHECK: shufps | 58 ; CHECK: shufps |
| 63 | 59 |
| 64 ; SSE41-LABEL: insertelement_v4i32_1: | 60 ; SSE41-LABEL: insertelement_v4i32_1 |
| 65 ; SSE41: pinsrd {{.*}}, {{.*}}, 1 | 61 ; SSE41: pinsrd {{.*}}, {{.*}}, 1 |
| 66 } | 62 } |
| 67 | 63 |
| 68 define <8 x i16> @insertelement_v8i16(<8 x i16> %vec, i32 %elt.arg) { | 64 define <8 x i16> @insertelement_v8i16(<8 x i16> %vec, i32 %elt.arg) { |
| 69 entry: | 65 entry: |
| 70 %elt = trunc i32 %elt.arg to i16 | 66 %elt = trunc i32 %elt.arg to i16 |
| 71 %res = insertelement <8 x i16> %vec, i16 %elt, i32 1 | 67 %res = insertelement <8 x i16> %vec, i16 %elt, i32 1 |
| 72 ret <8 x i16> %res | 68 ret <8 x i16> %res |
| 73 ; CHECK-LABEL: insertelement_v8i16: | 69 ; CHECK-LABEL: insertelement_v8i16 |
| 74 ; CHECK: pinsrw | 70 ; CHECK: pinsrw |
| 75 | 71 |
| 76 ; SSE41-LABEL: insertelement_v8i16: | 72 ; SSE41-LABEL: insertelement_v8i16 |
| 77 ; SSE41: pinsrw | 73 ; SSE41: pinsrw |
| 78 } | 74 } |
| 79 | 75 |
| 80 define <16 x i8> @insertelement_v16i8(<16 x i8> %vec, i32 %elt.arg) { | 76 define <16 x i8> @insertelement_v16i8(<16 x i8> %vec, i32 %elt.arg) { |
| 81 entry: | 77 entry: |
| 82 %elt = trunc i32 %elt.arg to i8 | 78 %elt = trunc i32 %elt.arg to i8 |
| 83 %res = insertelement <16 x i8> %vec, i8 %elt, i32 1 | 79 %res = insertelement <16 x i8> %vec, i8 %elt, i32 1 |
| 84 ret <16 x i8> %res | 80 ret <16 x i8> %res |
| 85 ; CHECK-LABEL: insertelement_v16i8: | 81 ; CHECK-LABEL: insertelement_v16i8 |
| 86 ; CHECK: movups | 82 ; CHECK: movups |
| 87 ; CHECK: lea | 83 ; CHECK: lea |
| 88 ; CHECK: mov | 84 ; CHECK: mov |
| 89 | 85 |
| 90 ; SSE41-LABEL: insertelement_v16i8: | 86 ; SSE41-LABEL: insertelement_v16i8 |
| 91 ; SSE41: pinsrb | 87 ; SSE41: pinsrb |
| 92 } | 88 } |
| 93 | 89 |
| 94 define <4 x i1> @insertelement_v4i1_0(<4 x i1> %vec, i32 %elt.arg) { | 90 define <4 x i1> @insertelement_v4i1_0(<4 x i1> %vec, i32 %elt.arg) { |
| 95 entry: | 91 entry: |
| 96 %elt = trunc i32 %elt.arg to i1 | 92 %elt = trunc i32 %elt.arg to i1 |
| 97 %res = insertelement <4 x i1> %vec, i1 %elt, i32 0 | 93 %res = insertelement <4 x i1> %vec, i1 %elt, i32 0 |
| 98 ret <4 x i1> %res | 94 ret <4 x i1> %res |
| 99 ; CHECK-LABEL: insertelement_v4i1_0: | 95 ; CHECK-LABEL: insertelement_v4i1_0 |
| 100 ; CHECK: movss | 96 ; CHECK: movss |
| 101 | 97 |
| 102 ; SSE41-LABEL: insertelement_v4i1_0: | 98 ; SSE41-LABEL: insertelement_v4i1_0 |
| 103 ; SSE41: pinsrd {{.*}}, {{.*}}, 0 | 99 ; SSE41: pinsrd {{.*}}, {{.*}}, 0 |
| 104 } | 100 } |
| 105 | 101 |
| 106 define <4 x i1> @insertelement_v4i1_1(<4 x i1> %vec, i32 %elt.arg) { | 102 define <4 x i1> @insertelement_v4i1_1(<4 x i1> %vec, i32 %elt.arg) { |
| 107 entry: | 103 entry: |
| 108 %elt = trunc i32 %elt.arg to i1 | 104 %elt = trunc i32 %elt.arg to i1 |
| 109 %res = insertelement <4 x i1> %vec, i1 %elt, i32 1 | 105 %res = insertelement <4 x i1> %vec, i1 %elt, i32 1 |
| 110 ret <4 x i1> %res | 106 ret <4 x i1> %res |
| 111 ; CHECK-LABEL: insertelement_v4i1_1: | 107 ; CHECK-LABEL: insertelement_v4i1_1 |
| 112 ; CHECK: shufps | 108 ; CHECK: shufps |
| 113 ; CHECK: shufps | 109 ; CHECK: shufps |
| 114 | 110 |
| 115 ; SSE41-LABEL: insertelement_v4i1_1: | 111 ; SSE41-LABEL: insertelement_v4i1_1 |
| 116 ; SSE41: pinsrd {{.*}}, {{.*}}, 1 | 112 ; SSE41: pinsrd {{.*}}, {{.*}}, 1 |
| 117 } | 113 } |
| 118 | 114 |
| 119 define <8 x i1> @insertelement_v8i1(<8 x i1> %vec, i32 %elt.arg) { | 115 define <8 x i1> @insertelement_v8i1(<8 x i1> %vec, i32 %elt.arg) { |
| 120 entry: | 116 entry: |
| 121 %elt = trunc i32 %elt.arg to i1 | 117 %elt = trunc i32 %elt.arg to i1 |
| 122 %res = insertelement <8 x i1> %vec, i1 %elt, i32 1 | 118 %res = insertelement <8 x i1> %vec, i1 %elt, i32 1 |
| 123 ret <8 x i1> %res | 119 ret <8 x i1> %res |
| 124 ; CHECK-LABEL: insertelement_v8i1: | 120 ; CHECK-LABEL: insertelement_v8i1 |
| 125 ; CHECK: pinsrw | 121 ; CHECK: pinsrw |
| 126 | 122 |
| 127 ; SSE41-LABEL: insertelement_v8i1: | 123 ; SSE41-LABEL: insertelement_v8i1 |
| 128 ; SSE41: pinsrw | 124 ; SSE41: pinsrw |
| 129 } | 125 } |
| 130 | 126 |
| 131 define <16 x i1> @insertelement_v16i1(<16 x i1> %vec, i32 %elt.arg) { | 127 define <16 x i1> @insertelement_v16i1(<16 x i1> %vec, i32 %elt.arg) { |
| 132 entry: | 128 entry: |
| 133 %elt = trunc i32 %elt.arg to i1 | 129 %elt = trunc i32 %elt.arg to i1 |
| 134 %res = insertelement <16 x i1> %vec, i1 %elt, i32 1 | 130 %res = insertelement <16 x i1> %vec, i1 %elt, i32 1 |
| 135 ret <16 x i1> %res | 131 ret <16 x i1> %res |
| 136 ; CHECK-LABEL: insertelement_v16i1: | 132 ; CHECK-LABEL: insertelement_v16i1 |
| 137 ; CHECK: movups | 133 ; CHECK: movups |
| 138 ; CHECK: lea | 134 ; CHECK: lea |
| 139 ; CHECK: mov | 135 ; CHECK: mov |
| 140 | 136 |
| 141 ; SSE41-LABEL: insertelement_v16i1: | 137 ; SSE41-LABEL: insertelement_v16i1 |
| 142 ; SSE41: pinsrb | 138 ; SSE41: pinsrb |
| 143 } | 139 } |
| 144 | 140 |
| 145 ; extractelement operations | 141 ; extractelement operations |
| 146 | 142 |
| 147 define float @extractelement_v4f32(<4 x float> %vec) { | 143 define float @extractelement_v4f32(<4 x float> %vec) { |
| 148 entry: | 144 entry: |
| 149 %res = extractelement <4 x float> %vec, i32 1 | 145 %res = extractelement <4 x float> %vec, i32 1 |
| 150 ret float %res | 146 ret float %res |
| 151 ; CHECK-LABEL: extractelement_v4f32: | 147 ; CHECK-LABEL: extractelement_v4f32 |
| 152 ; CHECK: pshufd | 148 ; CHECK: pshufd |
| 153 | 149 |
| 154 ; SSE41-LABEL: extractelement_v4f32: | 150 ; SSE41-LABEL: extractelement_v4f32 |
| 155 ; SSE41: pshufd | 151 ; SSE41: pshufd |
| 156 } | 152 } |
| 157 | 153 |
| 158 define i32 @extractelement_v4i32(<4 x i32> %vec) { | 154 define i32 @extractelement_v4i32(<4 x i32> %vec) { |
| 159 entry: | 155 entry: |
| 160 %res = extractelement <4 x i32> %vec, i32 1 | 156 %res = extractelement <4 x i32> %vec, i32 1 |
| 161 ret i32 %res | 157 ret i32 %res |
| 162 ; CHECK-LABEL: extractelement_v4i32: | 158 ; CHECK-LABEL: extractelement_v4i32 |
| 163 ; CHECK: pshufd | 159 ; CHECK: pshufd |
| 164 ; CHECK: movd {{.*}}, xmm | 160 ; CHECK: movd {{.*}},xmm |
| 165 | 161 |
| 166 ; SSE41-LABEL: extractelement_v4i32: | 162 ; SSE41-LABEL: extractelement_v4i32 |
| 167 ; SSE41: pextrd | 163 ; SSE41: pextrd |
| 168 } | 164 } |
| 169 | 165 |
| 170 define i32 @extractelement_v8i16(<8 x i16> %vec) { | 166 define i32 @extractelement_v8i16(<8 x i16> %vec) { |
| 171 entry: | 167 entry: |
| 172 %res = extractelement <8 x i16> %vec, i32 1 | 168 %res = extractelement <8 x i16> %vec, i32 1 |
| 173 %res.ext = zext i16 %res to i32 | 169 %res.ext = zext i16 %res to i32 |
| 174 ret i32 %res.ext | 170 ret i32 %res.ext |
| 175 ; CHECK-LABEL: extractelement_v8i16: | 171 ; CHECK-LABEL: extractelement_v8i16 |
| 176 ; CHECK: pextrw | 172 ; CHECK: pextrw |
| 177 | 173 |
| 178 ; SSE41-LABEL: extractelement_v8i16: | 174 ; SSE41-LABEL: extractelement_v8i16 |
| 179 ; SSE41: pextrw | 175 ; SSE41: pextrw |
| 180 } | 176 } |
| 181 | 177 |
| 182 define i32 @extractelement_v16i8(<16 x i8> %vec) { | 178 define i32 @extractelement_v16i8(<16 x i8> %vec) { |
| 183 entry: | 179 entry: |
| 184 %res = extractelement <16 x i8> %vec, i32 1 | 180 %res = extractelement <16 x i8> %vec, i32 1 |
| 185 %res.ext = zext i8 %res to i32 | 181 %res.ext = zext i8 %res to i32 |
| 186 ret i32 %res.ext | 182 ret i32 %res.ext |
| 187 ; CHECK-LABEL: extractelement_v16i8: | 183 ; CHECK-LABEL: extractelement_v16i8 |
| 188 ; CHECK: movups | 184 ; CHECK: movups |
| 189 ; CHECK: lea | 185 ; CHECK: lea |
| 190 ; CHECK: mov | 186 ; CHECK: mov |
| 191 | 187 |
| 192 ; SSE41-LABEL: extractelement_v16i8: | 188 ; SSE41-LABEL: extractelement_v16i8 |
| 193 ; SSE41: pextrb | 189 ; SSE41: pextrb |
| 194 } | 190 } |
| 195 | 191 |
| 196 define i32 @extractelement_v4i1(<4 x i1> %vec) { | 192 define i32 @extractelement_v4i1(<4 x i1> %vec) { |
| 197 entry: | 193 entry: |
| 198 %res = extractelement <4 x i1> %vec, i32 1 | 194 %res = extractelement <4 x i1> %vec, i32 1 |
| 199 %res.ext = zext i1 %res to i32 | 195 %res.ext = zext i1 %res to i32 |
| 200 ret i32 %res.ext | 196 ret i32 %res.ext |
| 201 ; CHECK-LABEL: extractelement_v4i1: | 197 ; CHECK-LABEL: extractelement_v4i1 |
| 202 ; CHECK: pshufd | 198 ; CHECK: pshufd |
| 203 | 199 |
| 204 ; SSE41-LABEL: extractelement_v4i1: | 200 ; SSE41-LABEL: extractelement_v4i1 |
| 205 ; SSE41: pextrd | 201 ; SSE41: pextrd |
| 206 } | 202 } |
| 207 | 203 |
| 208 define i32 @extractelement_v8i1(<8 x i1> %vec) { | 204 define i32 @extractelement_v8i1(<8 x i1> %vec) { |
| 209 entry: | 205 entry: |
| 210 %res = extractelement <8 x i1> %vec, i32 1 | 206 %res = extractelement <8 x i1> %vec, i32 1 |
| 211 %res.ext = zext i1 %res to i32 | 207 %res.ext = zext i1 %res to i32 |
| 212 ret i32 %res.ext | 208 ret i32 %res.ext |
| 213 ; CHECK-LABEL: extractelement_v8i1: | 209 ; CHECK-LABEL: extractelement_v8i1 |
| 214 ; CHECK: pextrw | 210 ; CHECK: pextrw |
| 215 | 211 |
| 216 ; SSE41-LABEL: extractelement_v8i1: | 212 ; SSE41-LABEL: extractelement_v8i1 |
| 217 ; SSE41: pextrw | 213 ; SSE41: pextrw |
| 218 } | 214 } |
| 219 | 215 |
| 220 define i32 @extractelement_v16i1(<16 x i1> %vec) { | 216 define i32 @extractelement_v16i1(<16 x i1> %vec) { |
| 221 entry: | 217 entry: |
| 222 %res = extractelement <16 x i1> %vec, i32 1 | 218 %res = extractelement <16 x i1> %vec, i32 1 |
| 223 %res.ext = zext i1 %res to i32 | 219 %res.ext = zext i1 %res to i32 |
| 224 ret i32 %res.ext | 220 ret i32 %res.ext |
| 225 ; CHECK-LABEL: extractelement_v16i1: | 221 ; CHECK-LABEL: extractelement_v16i1 |
| 226 ; CHECK: movups | 222 ; CHECK: movups |
| 227 ; CHECK: lea | 223 ; CHECK: lea |
| 228 ; CHECK: mov | 224 ; CHECK: mov |
| 229 | 225 |
| 230 ; SSE41-LABEL: extractelement_v16i1: | 226 ; SSE41-LABEL: extractelement_v16i1 |
| 231 ; SSE41: pextrb | 227 ; SSE41: pextrb |
| 232 } | 228 } |
| OLD | NEW |