third_party/asan/asan_clang_Linux/lib/clang/3.0/include/arm_neon.h - Issue 8404033: New ASan binaries for Linux (r946)

Side by Side Diff: third_party/asan/asan_clang_Linux/lib/clang/3.0/include/arm_neon.h

Issue 8404033: New ASan binaries for Linux (r946) (Closed) Base URL: svn://svn.chromium.org/chrome/trunk/deps/

Patch Set: Created 9 years, 1 month ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View unified diff | Download patch | Annotate | Revision Log

« no previous file with comments | « third_party/asan/asan_clang_Linux/lib/clang/3.0/include/altivec.h ('k') | third_party/asan/asan_clang_Linux/lib/clang/3.0/include/avxintrin.h » ('j') | no next file with comments »
Toggle Intra-line Diffs ('i') | Expand Comments ('e') | Collapse Comments ('c') | Hide Comments ('s')

OLD	NEW
	(Empty)
1 /*===---- arm_neon.h - ARM Neon intrinsics ---------------------------------===

2 *

3 * Permission is hereby granted, free of charge, to any person obtaining a copy

4 * of this software and associated documentation files (the "Software"), to deal

5 * in the Software without restriction, including without limitation the rights

6 * to use, copy, modify, merge, publish, distribute, sublicense, and/or sell

7 * copies of the Software, and to permit persons to whom the Software is

8 * furnished to do so, subject to the following conditions:

9 *

10 * The above copyright notice and this permission notice shall be included in

11 * all copies or substantial portions of the Software.

12 *

13 * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR

14 * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,

15 * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE

16 * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER

17 * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,

18 * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN

19 * THE SOFTWARE.

20 *

21 *===-----------------------------------------------------------------------===

22 */

23

24 #ifndef __ARM_NEON_H

25 #define __ARM_NEON_H

26

27 #ifndef __ARM_NEON__

28 #error "NEON support not enabled"

29 #endif

30

31 #include <stdint.h>

32

33 typedef float float32_t;

34 typedef int8_t poly8_t;

35 typedef int16_t poly16_t;

36 typedef uint16_t float16_t;

37 typedef __attribute__((neon_vector_type(8))) int8_t int8x8_t;

38 typedef __attribute__((neon_vector_type(16))) int8_t int8x16_t;

39 typedef __attribute__((neon_vector_type(4))) int16_t int16x4_t;

40 typedef __attribute__((neon_vector_type(8))) int16_t int16x8_t;

41 typedef __attribute__((neon_vector_type(2))) int32_t int32x2_t;

42 typedef __attribute__((neon_vector_type(4))) int32_t int32x4_t;

43 typedef __attribute__((neon_vector_type(1))) int64_t int64x1_t;

44 typedef __attribute__((neon_vector_type(2))) int64_t int64x2_t;

45 typedef __attribute__((neon_vector_type(8))) uint8_t uint8x8_t;

46 typedef __attribute__((neon_vector_type(16))) uint8_t uint8x16_t;

47 typedef __attribute__((neon_vector_type(4))) uint16_t uint16x4_t;

48 typedef __attribute__((neon_vector_type(8))) uint16_t uint16x8_t;

49 typedef __attribute__((neon_vector_type(2))) uint32_t uint32x2_t;

50 typedef __attribute__((neon_vector_type(4))) uint32_t uint32x4_t;

51 typedef __attribute__((neon_vector_type(1))) uint64_t uint64x1_t;

52 typedef __attribute__((neon_vector_type(2))) uint64_t uint64x2_t;

53 typedef __attribute__((neon_vector_type(4))) float16_t float16x4_t;

54 typedef __attribute__((neon_vector_type(8))) float16_t float16x8_t;

55 typedef __attribute__((neon_vector_type(2))) float32_t float32x2_t;

56 typedef __attribute__((neon_vector_type(4))) float32_t float32x4_t;

57 typedef __attribute__((neon_polyvector_type(8))) poly8_t poly8x8_t;

58 typedef __attribute__((neon_polyvector_type(16))) poly8_t poly8x16_t;

59 typedef __attribute__((neon_polyvector_type(4))) poly16_t poly16x4_t;

60 typedef __attribute__((neon_polyvector_type(8))) poly16_t poly16x8_t;

61

62 typedef struct int8x8x2_t {

63 int8x8_t val[2];

64 } int8x8x2_t;

65

66 typedef struct int8x16x2_t {

67 int8x16_t val[2];

68 } int8x16x2_t;

69

70 typedef struct int16x4x2_t {

71 int16x4_t val[2];

72 } int16x4x2_t;

73

74 typedef struct int16x8x2_t {

75 int16x8_t val[2];

76 } int16x8x2_t;

77

78 typedef struct int32x2x2_t {

79 int32x2_t val[2];

80 } int32x2x2_t;

81

82 typedef struct int32x4x2_t {

83 int32x4_t val[2];

84 } int32x4x2_t;

85

86 typedef struct int64x1x2_t {

87 int64x1_t val[2];

88 } int64x1x2_t;

89

90 typedef struct int64x2x2_t {

91 int64x2_t val[2];

92 } int64x2x2_t;

93

94 typedef struct uint8x8x2_t {

95 uint8x8_t val[2];

96 } uint8x8x2_t;

97

98 typedef struct uint8x16x2_t {

99 uint8x16_t val[2];

100 } uint8x16x2_t;

101

102 typedef struct uint16x4x2_t {

103 uint16x4_t val[2];

104 } uint16x4x2_t;

105

106 typedef struct uint16x8x2_t {

107 uint16x8_t val[2];

108 } uint16x8x2_t;

109

110 typedef struct uint32x2x2_t {

111 uint32x2_t val[2];

112 } uint32x2x2_t;

113

114 typedef struct uint32x4x2_t {

115 uint32x4_t val[2];

116 } uint32x4x2_t;

117

118 typedef struct uint64x1x2_t {

119 uint64x1_t val[2];

120 } uint64x1x2_t;

121

122 typedef struct uint64x2x2_t {

123 uint64x2_t val[2];

124 } uint64x2x2_t;

125

126 typedef struct float16x4x2_t {

127 float16x4_t val[2];

128 } float16x4x2_t;

129

130 typedef struct float16x8x2_t {

131 float16x8_t val[2];

132 } float16x8x2_t;

133

134 typedef struct float32x2x2_t {

135 float32x2_t val[2];

136 } float32x2x2_t;

137

138 typedef struct float32x4x2_t {

139 float32x4_t val[2];

140 } float32x4x2_t;

141

142 typedef struct poly8x8x2_t {

143 poly8x8_t val[2];

144 } poly8x8x2_t;

145

146 typedef struct poly8x16x2_t {

147 poly8x16_t val[2];

148 } poly8x16x2_t;

149

150 typedef struct poly16x4x2_t {

151 poly16x4_t val[2];

152 } poly16x4x2_t;

153

154 typedef struct poly16x8x2_t {

155 poly16x8_t val[2];

156 } poly16x8x2_t;

157

158 typedef struct int8x8x3_t {

159 int8x8_t val[3];

160 } int8x8x3_t;

161

162 typedef struct int8x16x3_t {

163 int8x16_t val[3];

164 } int8x16x3_t;

165

166 typedef struct int16x4x3_t {

167 int16x4_t val[3];

168 } int16x4x3_t;

169

170 typedef struct int16x8x3_t {

171 int16x8_t val[3];

172 } int16x8x3_t;

173

174 typedef struct int32x2x3_t {

175 int32x2_t val[3];

176 } int32x2x3_t;

177

178 typedef struct int32x4x3_t {

179 int32x4_t val[3];

180 } int32x4x3_t;

181

182 typedef struct int64x1x3_t {

183 int64x1_t val[3];

184 } int64x1x3_t;

185

186 typedef struct int64x2x3_t {

187 int64x2_t val[3];

188 } int64x2x3_t;

189

190 typedef struct uint8x8x3_t {

191 uint8x8_t val[3];

192 } uint8x8x3_t;

193

194 typedef struct uint8x16x3_t {

195 uint8x16_t val[3];

196 } uint8x16x3_t;

197

198 typedef struct uint16x4x3_t {

199 uint16x4_t val[3];

200 } uint16x4x3_t;

201

202 typedef struct uint16x8x3_t {

203 uint16x8_t val[3];

204 } uint16x8x3_t;

205

206 typedef struct uint32x2x3_t {

207 uint32x2_t val[3];

208 } uint32x2x3_t;

209

210 typedef struct uint32x4x3_t {

211 uint32x4_t val[3];

212 } uint32x4x3_t;

213

214 typedef struct uint64x1x3_t {

215 uint64x1_t val[3];

216 } uint64x1x3_t;

217

218 typedef struct uint64x2x3_t {

219 uint64x2_t val[3];

220 } uint64x2x3_t;

221

222 typedef struct float16x4x3_t {

223 float16x4_t val[3];

224 } float16x4x3_t;

225

226 typedef struct float16x8x3_t {

227 float16x8_t val[3];

228 } float16x8x3_t;

229

230 typedef struct float32x2x3_t {

231 float32x2_t val[3];

232 } float32x2x3_t;

233

234 typedef struct float32x4x3_t {

235 float32x4_t val[3];

236 } float32x4x3_t;

237

238 typedef struct poly8x8x3_t {

239 poly8x8_t val[3];

240 } poly8x8x3_t;

241

242 typedef struct poly8x16x3_t {

243 poly8x16_t val[3];

244 } poly8x16x3_t;

245

246 typedef struct poly16x4x3_t {

247 poly16x4_t val[3];

248 } poly16x4x3_t;

249

250 typedef struct poly16x8x3_t {

251 poly16x8_t val[3];

252 } poly16x8x3_t;

253

254 typedef struct int8x8x4_t {

255 int8x8_t val[4];

256 } int8x8x4_t;

257

258 typedef struct int8x16x4_t {

259 int8x16_t val[4];

260 } int8x16x4_t;

261

262 typedef struct int16x4x4_t {

263 int16x4_t val[4];

264 } int16x4x4_t;

265

266 typedef struct int16x8x4_t {

267 int16x8_t val[4];

268 } int16x8x4_t;

269

270 typedef struct int32x2x4_t {

271 int32x2_t val[4];

272 } int32x2x4_t;

273

274 typedef struct int32x4x4_t {

275 int32x4_t val[4];

276 } int32x4x4_t;

277

278 typedef struct int64x1x4_t {

279 int64x1_t val[4];

280 } int64x1x4_t;

281

282 typedef struct int64x2x4_t {

283 int64x2_t val[4];

284 } int64x2x4_t;

285

286 typedef struct uint8x8x4_t {

287 uint8x8_t val[4];

288 } uint8x8x4_t;

289

290 typedef struct uint8x16x4_t {

291 uint8x16_t val[4];

292 } uint8x16x4_t;

293

294 typedef struct uint16x4x4_t {

295 uint16x4_t val[4];

296 } uint16x4x4_t;

297

298 typedef struct uint16x8x4_t {

299 uint16x8_t val[4];

300 } uint16x8x4_t;

301

302 typedef struct uint32x2x4_t {

303 uint32x2_t val[4];

304 } uint32x2x4_t;

305

306 typedef struct uint32x4x4_t {

307 uint32x4_t val[4];

308 } uint32x4x4_t;

309

310 typedef struct uint64x1x4_t {

311 uint64x1_t val[4];

312 } uint64x1x4_t;

313

314 typedef struct uint64x2x4_t {

315 uint64x2_t val[4];

316 } uint64x2x4_t;

317

318 typedef struct float16x4x4_t {

319 float16x4_t val[4];

320 } float16x4x4_t;

321

322 typedef struct float16x8x4_t {

323 float16x8_t val[4];

324 } float16x8x4_t;

325

326 typedef struct float32x2x4_t {

327 float32x2_t val[4];

328 } float32x2x4_t;

329

330 typedef struct float32x4x4_t {

331 float32x4_t val[4];

332 } float32x4x4_t;

333

334 typedef struct poly8x8x4_t {

335 poly8x8_t val[4];

336 } poly8x8x4_t;

337

338 typedef struct poly8x16x4_t {

339 poly8x16_t val[4];

340 } poly8x16x4_t;

341

342 typedef struct poly16x4x4_t {

343 poly16x4_t val[4];

344 } poly16x4x4_t;

345

346 typedef struct poly16x8x4_t {

347 poly16x8_t val[4];

348 } poly16x8x4_t;

349

350 #define __ai static __attribute__((__always_inline__))

351

352 __ai int16x8_t vmovl_s8(int8x8_t __a) { \

353 return (int16x8_t)__builtin_neon_vmovl_v(__a, 17); }

354 __ai int32x4_t vmovl_s16(int16x4_t __a) { \

355 return (int32x4_t)__builtin_neon_vmovl_v((int8x8_t)__a, 18); }

356 __ai int64x2_t vmovl_s32(int32x2_t __a) { \

357 return (int64x2_t)__builtin_neon_vmovl_v((int8x8_t)__a, 19); }

358 __ai uint16x8_t vmovl_u8(uint8x8_t __a) { \

359 return (uint16x8_t)__builtin_neon_vmovl_v((int8x8_t)__a, 25); }

360 __ai uint32x4_t vmovl_u16(uint16x4_t __a) { \

361 return (uint32x4_t)__builtin_neon_vmovl_v((int8x8_t)__a, 26); }

362 __ai uint64x2_t vmovl_u32(uint32x2_t __a) { \

363 return (uint64x2_t)__builtin_neon_vmovl_v((int8x8_t)__a, 27); }

364

365 __ai int16x8_t vmull_s8(int8x8_t __a, int8x8_t __b) { \

366 return (int16x8_t)__builtin_neon_vmull_v(__a, __b, 17); }

367 __ai int32x4_t vmull_s16(int16x4_t __a, int16x4_t __b) { \

368 return (int32x4_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 18); }

369 __ai int64x2_t vmull_s32(int32x2_t __a, int32x2_t __b) { \

370 return (int64x2_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 19); }

371 __ai uint16x8_t vmull_u8(uint8x8_t __a, uint8x8_t __b) { \

372 return (uint16x8_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 25); }

373 __ai uint32x4_t vmull_u16(uint16x4_t __a, uint16x4_t __b) { \

374 return (uint32x4_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 26); }

375 __ai uint64x2_t vmull_u32(uint32x2_t __a, uint32x2_t __b) { \

376 return (uint64x2_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 27); }

377 __ai poly16x8_t vmull_p8(poly8x8_t __a, poly8x8_t __b) { \

378 return (poly16x8_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)__b, 22); }

379

380 __ai int8x8_t vabd_s8(int8x8_t __a, int8x8_t __b) { \

381 return (int8x8_t)__builtin_neon_vabd_v(__a, __b, 0); }

382 __ai int16x4_t vabd_s16(int16x4_t __a, int16x4_t __b) { \

383 return (int16x4_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 1); }

384 __ai int32x2_t vabd_s32(int32x2_t __a, int32x2_t __b) { \

385 return (int32x2_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 2); }

386 __ai uint8x8_t vabd_u8(uint8x8_t __a, uint8x8_t __b) { \

387 return (uint8x8_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 8); }

388 __ai uint16x4_t vabd_u16(uint16x4_t __a, uint16x4_t __b) { \

389 return (uint16x4_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 9); }

390 __ai uint32x2_t vabd_u32(uint32x2_t __a, uint32x2_t __b) { \

391 return (uint32x2_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 10); }

392 __ai float32x2_t vabd_f32(float32x2_t __a, float32x2_t __b) { \

393 return (float32x2_t)__builtin_neon_vabd_v((int8x8_t)__a, (int8x8_t)__b, 4); }

394 __ai int8x16_t vabdq_s8(int8x16_t __a, int8x16_t __b) { \

395 return (int8x16_t)__builtin_neon_vabdq_v(__a, __b, 16); }

396 __ai int16x8_t vabdq_s16(int16x8_t __a, int16x8_t __b) { \

397 return (int16x8_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

398 __ai int32x4_t vabdq_s32(int32x4_t __a, int32x4_t __b) { \

399 return (int32x4_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

400 __ai uint8x16_t vabdq_u8(uint8x16_t __a, uint8x16_t __b) { \

401 return (uint8x16_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 24); }

402 __ai uint16x8_t vabdq_u16(uint16x8_t __a, uint16x8_t __b) { \

403 return (uint16x8_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

404 __ai uint32x4_t vabdq_u32(uint32x4_t __a, uint32x4_t __b) { \

405 return (uint32x4_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

406 __ai float32x4_t vabdq_f32(float32x4_t __a, float32x4_t __b) { \

407 return (float32x4_t)__builtin_neon_vabdq_v((int8x16_t)__a, (int8x16_t)__b, 20) ; }

408

409 __ai int8x8_t vaba_s8(int8x8_t __a, int8x8_t __b, int8x8_t __c) { \

410 return __a + vabd_s8(__b, __c); }

411 __ai int16x4_t vaba_s16(int16x4_t __a, int16x4_t __b, int16x4_t __c) { \

412 return __a + vabd_s16(__b, __c); }

413 __ai int32x2_t vaba_s32(int32x2_t __a, int32x2_t __b, int32x2_t __c) { \

414 return __a + vabd_s32(__b, __c); }

415 __ai uint8x8_t vaba_u8(uint8x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

416 return __a + vabd_u8(__b, __c); }

417 __ai uint16x4_t vaba_u16(uint16x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

418 return __a + vabd_u16(__b, __c); }

419 __ai uint32x2_t vaba_u32(uint32x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

420 return __a + vabd_u32(__b, __c); }

421 __ai int8x16_t vabaq_s8(int8x16_t __a, int8x16_t __b, int8x16_t __c) { \

422 return __a + vabdq_s8(__b, __c); }

423 __ai int16x8_t vabaq_s16(int16x8_t __a, int16x8_t __b, int16x8_t __c) { \

424 return __a + vabdq_s16(__b, __c); }

425 __ai int32x4_t vabaq_s32(int32x4_t __a, int32x4_t __b, int32x4_t __c) { \

426 return __a + vabdq_s32(__b, __c); }

427 __ai uint8x16_t vabaq_u8(uint8x16_t __a, uint8x16_t __b, uint8x16_t __c) { \

428 return __a + vabdq_u8(__b, __c); }

429 __ai uint16x8_t vabaq_u16(uint16x8_t __a, uint16x8_t __b, uint16x8_t __c) { \

430 return __a + vabdq_u16(__b, __c); }

431 __ai uint32x4_t vabaq_u32(uint32x4_t __a, uint32x4_t __b, uint32x4_t __c) { \

432 return __a + vabdq_u32(__b, __c); }

433

434 __ai int16x8_t vabal_s8(int16x8_t __a, int8x8_t __b, int8x8_t __c) { \

435 return __a + (int16x8_t)vmovl_u8((uint8x8_t)vabd_s8(__b, __c)); }

436 __ai int32x4_t vabal_s16(int32x4_t __a, int16x4_t __b, int16x4_t __c) { \

437 return __a + (int32x4_t)vmovl_u16((uint16x4_t)vabd_s16(__b, __c)); }

438 __ai int64x2_t vabal_s32(int64x2_t __a, int32x2_t __b, int32x2_t __c) { \

439 return __a + (int64x2_t)vmovl_u32((uint32x2_t)vabd_s32(__b, __c)); }

440 __ai uint16x8_t vabal_u8(uint16x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

441 return __a + vmovl_u8(vabd_u8(__b, __c)); }

442 __ai uint32x4_t vabal_u16(uint32x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

443 return __a + vmovl_u16(vabd_u16(__b, __c)); }

444 __ai uint64x2_t vabal_u32(uint64x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

445 return __a + vmovl_u32(vabd_u32(__b, __c)); }

446

447 __ai int16x8_t vabdl_s8(int8x8_t __a, int8x8_t __b) { \

448 return (int16x8_t)vmovl_u8((uint8x8_t)vabd_s8(__a, __b)); }

449 __ai int32x4_t vabdl_s16(int16x4_t __a, int16x4_t __b) { \

450 return (int32x4_t)vmovl_u16((uint16x4_t)vabd_s16(__a, __b)); }

451 __ai int64x2_t vabdl_s32(int32x2_t __a, int32x2_t __b) { \

452 return (int64x2_t)vmovl_u32((uint32x2_t)vabd_s32(__a, __b)); }

453 __ai uint16x8_t vabdl_u8(uint8x8_t __a, uint8x8_t __b) { \

454 return vmovl_u8(vabd_u8(__a, __b)); }

455 __ai uint32x4_t vabdl_u16(uint16x4_t __a, uint16x4_t __b) { \

456 return vmovl_u16(vabd_u16(__a, __b)); }

457 __ai uint64x2_t vabdl_u32(uint32x2_t __a, uint32x2_t __b) { \

458 return vmovl_u32(vabd_u32(__a, __b)); }

459

460 __ai int8x8_t vabs_s8(int8x8_t __a) { \

461 return (int8x8_t)__builtin_neon_vabs_v(__a, 0); }

462 __ai int16x4_t vabs_s16(int16x4_t __a) { \

463 return (int16x4_t)__builtin_neon_vabs_v((int8x8_t)__a, 1); }

464 __ai int32x2_t vabs_s32(int32x2_t __a) { \

465 return (int32x2_t)__builtin_neon_vabs_v((int8x8_t)__a, 2); }

466 __ai float32x2_t vabs_f32(float32x2_t __a) { \

467 return (float32x2_t)__builtin_neon_vabs_v((int8x8_t)__a, 4); }

468 __ai int8x16_t vabsq_s8(int8x16_t __a) { \

469 return (int8x16_t)__builtin_neon_vabsq_v(__a, 16); }

470 __ai int16x8_t vabsq_s16(int16x8_t __a) { \

471 return (int16x8_t)__builtin_neon_vabsq_v((int8x16_t)__a, 17); }

472 __ai int32x4_t vabsq_s32(int32x4_t __a) { \

473 return (int32x4_t)__builtin_neon_vabsq_v((int8x16_t)__a, 18); }

474 __ai float32x4_t vabsq_f32(float32x4_t __a) { \

475 return (float32x4_t)__builtin_neon_vabsq_v((int8x16_t)__a, 20); }

476

477 __ai int8x8_t vadd_s8(int8x8_t __a, int8x8_t __b) { \

478 return __a + __b; }

479 __ai int16x4_t vadd_s16(int16x4_t __a, int16x4_t __b) { \

480 return __a + __b; }

481 __ai int32x2_t vadd_s32(int32x2_t __a, int32x2_t __b) { \

482 return __a + __b; }

483 __ai int64x1_t vadd_s64(int64x1_t __a, int64x1_t __b) { \

484 return __a + __b; }

485 __ai float32x2_t vadd_f32(float32x2_t __a, float32x2_t __b) { \

486 return __a + __b; }

487 __ai uint8x8_t vadd_u8(uint8x8_t __a, uint8x8_t __b) { \

488 return __a + __b; }

489 __ai uint16x4_t vadd_u16(uint16x4_t __a, uint16x4_t __b) { \

490 return __a + __b; }

491 __ai uint32x2_t vadd_u32(uint32x2_t __a, uint32x2_t __b) { \

492 return __a + __b; }

493 __ai uint64x1_t vadd_u64(uint64x1_t __a, uint64x1_t __b) { \

494 return __a + __b; }

495 __ai int8x16_t vaddq_s8(int8x16_t __a, int8x16_t __b) { \

496 return __a + __b; }

497 __ai int16x8_t vaddq_s16(int16x8_t __a, int16x8_t __b) { \

498 return __a + __b; }

499 __ai int32x4_t vaddq_s32(int32x4_t __a, int32x4_t __b) { \

500 return __a + __b; }

501 __ai int64x2_t vaddq_s64(int64x2_t __a, int64x2_t __b) { \

502 return __a + __b; }

503 __ai float32x4_t vaddq_f32(float32x4_t __a, float32x4_t __b) { \

504 return __a + __b; }

505 __ai uint8x16_t vaddq_u8(uint8x16_t __a, uint8x16_t __b) { \

506 return __a + __b; }

507 __ai uint16x8_t vaddq_u16(uint16x8_t __a, uint16x8_t __b) { \

508 return __a + __b; }

509 __ai uint32x4_t vaddq_u32(uint32x4_t __a, uint32x4_t __b) { \

510 return __a + __b; }

511 __ai uint64x2_t vaddq_u64(uint64x2_t __a, uint64x2_t __b) { \

512 return __a + __b; }

513

514 __ai int8x8_t vaddhn_s16(int16x8_t __a, int16x8_t __b) { \

515 return (int8x8_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 0); }

516 __ai int16x4_t vaddhn_s32(int32x4_t __a, int32x4_t __b) { \

517 return (int16x4_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 1); }

518 __ai int32x2_t vaddhn_s64(int64x2_t __a, int64x2_t __b) { \

519 return (int32x2_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 2); }

520 __ai uint8x8_t vaddhn_u16(uint16x8_t __a, uint16x8_t __b) { \

521 return (uint8x8_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 8); }

522 __ai uint16x4_t vaddhn_u32(uint32x4_t __a, uint32x4_t __b) { \

523 return (uint16x4_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 9); }

524 __ai uint32x2_t vaddhn_u64(uint64x2_t __a, uint64x2_t __b) { \

525 return (uint32x2_t)__builtin_neon_vaddhn_v((int8x16_t)__a, (int8x16_t)__b, 10) ; }

526

527 __ai int16x8_t vaddl_s8(int8x8_t __a, int8x8_t __b) { \

528 return vmovl_s8(__a) + vmovl_s8(__b); }

529 __ai int32x4_t vaddl_s16(int16x4_t __a, int16x4_t __b) { \

530 return vmovl_s16(__a) + vmovl_s16(__b); }

531 __ai int64x2_t vaddl_s32(int32x2_t __a, int32x2_t __b) { \

532 return vmovl_s32(__a) + vmovl_s32(__b); }

533 __ai uint16x8_t vaddl_u8(uint8x8_t __a, uint8x8_t __b) { \

534 return vmovl_u8(__a) + vmovl_u8(__b); }

535 __ai uint32x4_t vaddl_u16(uint16x4_t __a, uint16x4_t __b) { \

536 return vmovl_u16(__a) + vmovl_u16(__b); }

537 __ai uint64x2_t vaddl_u32(uint32x2_t __a, uint32x2_t __b) { \

538 return vmovl_u32(__a) + vmovl_u32(__b); }

539

540 __ai int16x8_t vaddw_s8(int16x8_t __a, int8x8_t __b) { \

541 return __a + vmovl_s8(__b); }

542 __ai int32x4_t vaddw_s16(int32x4_t __a, int16x4_t __b) { \

543 return __a + vmovl_s16(__b); }

544 __ai int64x2_t vaddw_s32(int64x2_t __a, int32x2_t __b) { \

545 return __a + vmovl_s32(__b); }

546 __ai uint16x8_t vaddw_u8(uint16x8_t __a, uint8x8_t __b) { \

547 return __a + vmovl_u8(__b); }

548 __ai uint32x4_t vaddw_u16(uint32x4_t __a, uint16x4_t __b) { \

549 return __a + vmovl_u16(__b); }

550 __ai uint64x2_t vaddw_u32(uint64x2_t __a, uint32x2_t __b) { \

551 return __a + vmovl_u32(__b); }

552

553 __ai int8x8_t vand_s8(int8x8_t __a, int8x8_t __b) { \

554 return __a & __b; }

555 __ai int16x4_t vand_s16(int16x4_t __a, int16x4_t __b) { \

556 return __a & __b; }

557 __ai int32x2_t vand_s32(int32x2_t __a, int32x2_t __b) { \

558 return __a & __b; }

559 __ai int64x1_t vand_s64(int64x1_t __a, int64x1_t __b) { \

560 return __a & __b; }

561 __ai uint8x8_t vand_u8(uint8x8_t __a, uint8x8_t __b) { \

562 return __a & __b; }

563 __ai uint16x4_t vand_u16(uint16x4_t __a, uint16x4_t __b) { \

564 return __a & __b; }

565 __ai uint32x2_t vand_u32(uint32x2_t __a, uint32x2_t __b) { \

566 return __a & __b; }

567 __ai uint64x1_t vand_u64(uint64x1_t __a, uint64x1_t __b) { \

568 return __a & __b; }

569 __ai int8x16_t vandq_s8(int8x16_t __a, int8x16_t __b) { \

570 return __a & __b; }

571 __ai int16x8_t vandq_s16(int16x8_t __a, int16x8_t __b) { \

572 return __a & __b; }

573 __ai int32x4_t vandq_s32(int32x4_t __a, int32x4_t __b) { \

574 return __a & __b; }

575 __ai int64x2_t vandq_s64(int64x2_t __a, int64x2_t __b) { \

576 return __a & __b; }

577 __ai uint8x16_t vandq_u8(uint8x16_t __a, uint8x16_t __b) { \

578 return __a & __b; }

579 __ai uint16x8_t vandq_u16(uint16x8_t __a, uint16x8_t __b) { \

580 return __a & __b; }

581 __ai uint32x4_t vandq_u32(uint32x4_t __a, uint32x4_t __b) { \

582 return __a & __b; }

583 __ai uint64x2_t vandq_u64(uint64x2_t __a, uint64x2_t __b) { \

584 return __a & __b; }

585

586 __ai int8x8_t vbic_s8(int8x8_t __a, int8x8_t __b) { \

587 return __a & ~__b; }

588 __ai int16x4_t vbic_s16(int16x4_t __a, int16x4_t __b) { \

589 return __a & ~__b; }

590 __ai int32x2_t vbic_s32(int32x2_t __a, int32x2_t __b) { \

591 return __a & ~__b; }

592 __ai int64x1_t vbic_s64(int64x1_t __a, int64x1_t __b) { \

593 return __a & ~__b; }

594 __ai uint8x8_t vbic_u8(uint8x8_t __a, uint8x8_t __b) { \

595 return __a & ~__b; }

596 __ai uint16x4_t vbic_u16(uint16x4_t __a, uint16x4_t __b) { \

597 return __a & ~__b; }

598 __ai uint32x2_t vbic_u32(uint32x2_t __a, uint32x2_t __b) { \

599 return __a & ~__b; }

600 __ai uint64x1_t vbic_u64(uint64x1_t __a, uint64x1_t __b) { \

601 return __a & ~__b; }

602 __ai int8x16_t vbicq_s8(int8x16_t __a, int8x16_t __b) { \

603 return __a & ~__b; }

604 __ai int16x8_t vbicq_s16(int16x8_t __a, int16x8_t __b) { \

605 return __a & ~__b; }

606 __ai int32x4_t vbicq_s32(int32x4_t __a, int32x4_t __b) { \

607 return __a & ~__b; }

608 __ai int64x2_t vbicq_s64(int64x2_t __a, int64x2_t __b) { \

609 return __a & ~__b; }

610 __ai uint8x16_t vbicq_u8(uint8x16_t __a, uint8x16_t __b) { \

611 return __a & ~__b; }

612 __ai uint16x8_t vbicq_u16(uint16x8_t __a, uint16x8_t __b) { \

613 return __a & ~__b; }

614 __ai uint32x4_t vbicq_u32(uint32x4_t __a, uint32x4_t __b) { \

615 return __a & ~__b; }

616 __ai uint64x2_t vbicq_u64(uint64x2_t __a, uint64x2_t __b) { \

617 return __a & ~__b; }

618

619 __ai int8x8_t vbsl_s8(uint8x8_t __a, int8x8_t __b, int8x8_t __c) { \

620 return (int8x8_t)((__a & (uint8x8_t)__b) \| (~__a & (uint8x8_t)__c)); }

621 __ai int16x4_t vbsl_s16(uint16x4_t __a, int16x4_t __b, int16x4_t __c) { \

622 return (int16x4_t)((__a & (uint16x4_t)__b) \| (~__a & (uint16x4_t)__c)); }

623 __ai int32x2_t vbsl_s32(uint32x2_t __a, int32x2_t __b, int32x2_t __c) { \

624 return (int32x2_t)((__a & (uint32x2_t)__b) \| (~__a & (uint32x2_t)__c)); }

625 __ai int64x1_t vbsl_s64(uint64x1_t __a, int64x1_t __b, int64x1_t __c) { \

626 return (int64x1_t)((__a & (uint64x1_t)__b) \| (~__a & (uint64x1_t)__c)); }

627 __ai uint8x8_t vbsl_u8(uint8x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

628 return (uint8x8_t)((__a & (uint8x8_t)__b) \| (~__a & (uint8x8_t)__c)); }

629 __ai uint16x4_t vbsl_u16(uint16x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

630 return (uint16x4_t)((__a & (uint16x4_t)__b) \| (~__a & (uint16x4_t)__c)); }

631 __ai uint32x2_t vbsl_u32(uint32x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

632 return (uint32x2_t)((__a & (uint32x2_t)__b) \| (~__a & (uint32x2_t)__c)); }

633 __ai uint64x1_t vbsl_u64(uint64x1_t __a, uint64x1_t __b, uint64x1_t __c) { \

634 return (uint64x1_t)((__a & (uint64x1_t)__b) \| (~__a & (uint64x1_t)__c)); }

635 __ai float32x2_t vbsl_f32(uint32x2_t __a, float32x2_t __b, float32x2_t __c) { \

636 return (float32x2_t)((__a & (uint32x2_t)__b) \| (~__a & (uint32x2_t)__c)); }

637 __ai poly8x8_t vbsl_p8(uint8x8_t __a, poly8x8_t __b, poly8x8_t __c) { \

638 return (poly8x8_t)((__a & (uint8x8_t)__b) \| (~__a & (uint8x8_t)__c)); }

639 __ai poly16x4_t vbsl_p16(uint16x4_t __a, poly16x4_t __b, poly16x4_t __c) { \

640 return (poly16x4_t)((__a & (uint16x4_t)__b) \| (~__a & (uint16x4_t)__c)); }

641 __ai int8x16_t vbslq_s8(uint8x16_t __a, int8x16_t __b, int8x16_t __c) { \

642 return (int8x16_t)((__a & (uint8x16_t)__b) \| (~__a & (uint8x16_t)__c)); }

643 __ai int16x8_t vbslq_s16(uint16x8_t __a, int16x8_t __b, int16x8_t __c) { \

644 return (int16x8_t)((__a & (uint16x8_t)__b) \| (~__a & (uint16x8_t)__c)); }

645 __ai int32x4_t vbslq_s32(uint32x4_t __a, int32x4_t __b, int32x4_t __c) { \

646 return (int32x4_t)((__a & (uint32x4_t)__b) \| (~__a & (uint32x4_t)__c)); }

647 __ai int64x2_t vbslq_s64(uint64x2_t __a, int64x2_t __b, int64x2_t __c) { \

648 return (int64x2_t)((__a & (uint64x2_t)__b) \| (~__a & (uint64x2_t)__c)); }

649 __ai uint8x16_t vbslq_u8(uint8x16_t __a, uint8x16_t __b, uint8x16_t __c) { \

650 return (uint8x16_t)((__a & (uint8x16_t)__b) \| (~__a & (uint8x16_t)__c)); }

651 __ai uint16x8_t vbslq_u16(uint16x8_t __a, uint16x8_t __b, uint16x8_t __c) { \

652 return (uint16x8_t)((__a & (uint16x8_t)__b) \| (~__a & (uint16x8_t)__c)); }

653 __ai uint32x4_t vbslq_u32(uint32x4_t __a, uint32x4_t __b, uint32x4_t __c) { \

654 return (uint32x4_t)((__a & (uint32x4_t)__b) \| (~__a & (uint32x4_t)__c)); }

655 __ai uint64x2_t vbslq_u64(uint64x2_t __a, uint64x2_t __b, uint64x2_t __c) { \

656 return (uint64x2_t)((__a & (uint64x2_t)__b) \| (~__a & (uint64x2_t)__c)); }

657 __ai float32x4_t vbslq_f32(uint32x4_t __a, float32x4_t __b, float32x4_t __c) { \

658 return (float32x4_t)((__a & (uint32x4_t)__b) \| (~__a & (uint32x4_t)__c)); }

659 __ai poly8x16_t vbslq_p8(uint8x16_t __a, poly8x16_t __b, poly8x16_t __c) { \

660 return (poly8x16_t)((__a & (uint8x16_t)__b) \| (~__a & (uint8x16_t)__c)); }

661 __ai poly16x8_t vbslq_p16(uint16x8_t __a, poly16x8_t __b, poly16x8_t __c) { \

662 return (poly16x8_t)((__a & (uint16x8_t)__b) \| (~__a & (uint16x8_t)__c)); }

663

664 __ai uint32x2_t vcage_f32(float32x2_t __a, float32x2_t __b) { \

665 return (uint32x2_t)__builtin_neon_vcage_v((int8x8_t)__a, (int8x8_t)__b, 10); }

666 __ai uint32x4_t vcageq_f32(float32x4_t __a, float32x4_t __b) { \

667 return (uint32x4_t)__builtin_neon_vcageq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

668

669 __ai uint32x2_t vcagt_f32(float32x2_t __a, float32x2_t __b) { \

670 return (uint32x2_t)__builtin_neon_vcagt_v((int8x8_t)__a, (int8x8_t)__b, 10); }

671 __ai uint32x4_t vcagtq_f32(float32x4_t __a, float32x4_t __b) { \

672 return (uint32x4_t)__builtin_neon_vcagtq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

673

674 __ai uint32x2_t vcale_f32(float32x2_t __a, float32x2_t __b) { \

675 return (uint32x2_t)__builtin_neon_vcale_v((int8x8_t)__a, (int8x8_t)__b, 10); }

676 __ai uint32x4_t vcaleq_f32(float32x4_t __a, float32x4_t __b) { \

677 return (uint32x4_t)__builtin_neon_vcaleq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

678

679 __ai uint32x2_t vcalt_f32(float32x2_t __a, float32x2_t __b) { \

680 return (uint32x2_t)__builtin_neon_vcalt_v((int8x8_t)__a, (int8x8_t)__b, 10); }

681 __ai uint32x4_t vcaltq_f32(float32x4_t __a, float32x4_t __b) { \

682 return (uint32x4_t)__builtin_neon_vcaltq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

683

684 __ai uint8x8_t vceq_s8(int8x8_t __a, int8x8_t __b) { \

685 return (uint8x8_t)(__a == __b); }

686 __ai uint16x4_t vceq_s16(int16x4_t __a, int16x4_t __b) { \

687 return (uint16x4_t)(__a == __b); }

688 __ai uint32x2_t vceq_s32(int32x2_t __a, int32x2_t __b) { \

689 return (uint32x2_t)(__a == __b); }

690 __ai uint32x2_t vceq_f32(float32x2_t __a, float32x2_t __b) { \

691 return (uint32x2_t)(__a == __b); }

692 __ai uint8x8_t vceq_u8(uint8x8_t __a, uint8x8_t __b) { \

693 return (uint8x8_t)(__a == __b); }

694 __ai uint16x4_t vceq_u16(uint16x4_t __a, uint16x4_t __b) { \

695 return (uint16x4_t)(__a == __b); }

696 __ai uint32x2_t vceq_u32(uint32x2_t __a, uint32x2_t __b) { \

697 return (uint32x2_t)(__a == __b); }

698 __ai uint8x8_t vceq_p8(poly8x8_t __a, poly8x8_t __b) { \

699 return (uint8x8_t)(__a == __b); }

700 __ai uint8x16_t vceqq_s8(int8x16_t __a, int8x16_t __b) { \

701 return (uint8x16_t)(__a == __b); }

702 __ai uint16x8_t vceqq_s16(int16x8_t __a, int16x8_t __b) { \

703 return (uint16x8_t)(__a == __b); }

704 __ai uint32x4_t vceqq_s32(int32x4_t __a, int32x4_t __b) { \

705 return (uint32x4_t)(__a == __b); }

706 __ai uint32x4_t vceqq_f32(float32x4_t __a, float32x4_t __b) { \

707 return (uint32x4_t)(__a == __b); }

708 __ai uint8x16_t vceqq_u8(uint8x16_t __a, uint8x16_t __b) { \

709 return (uint8x16_t)(__a == __b); }

710 __ai uint16x8_t vceqq_u16(uint16x8_t __a, uint16x8_t __b) { \

711 return (uint16x8_t)(__a == __b); }

712 __ai uint32x4_t vceqq_u32(uint32x4_t __a, uint32x4_t __b) { \

713 return (uint32x4_t)(__a == __b); }

714 __ai uint8x16_t vceqq_p8(poly8x16_t __a, poly8x16_t __b) { \

715 return (uint8x16_t)(__a == __b); }

716

717 __ai uint8x8_t vcge_s8(int8x8_t __a, int8x8_t __b) { \

718 return (uint8x8_t)(__a >= __b); }

719 __ai uint16x4_t vcge_s16(int16x4_t __a, int16x4_t __b) { \

720 return (uint16x4_t)(__a >= __b); }

721 __ai uint32x2_t vcge_s32(int32x2_t __a, int32x2_t __b) { \

722 return (uint32x2_t)(__a >= __b); }

723 __ai uint32x2_t vcge_f32(float32x2_t __a, float32x2_t __b) { \

724 return (uint32x2_t)(__a >= __b); }

725 __ai uint8x8_t vcge_u8(uint8x8_t __a, uint8x8_t __b) { \

726 return (uint8x8_t)(__a >= __b); }

727 __ai uint16x4_t vcge_u16(uint16x4_t __a, uint16x4_t __b) { \

728 return (uint16x4_t)(__a >= __b); }

729 __ai uint32x2_t vcge_u32(uint32x2_t __a, uint32x2_t __b) { \

730 return (uint32x2_t)(__a >= __b); }

731 __ai uint8x16_t vcgeq_s8(int8x16_t __a, int8x16_t __b) { \

732 return (uint8x16_t)(__a >= __b); }

733 __ai uint16x8_t vcgeq_s16(int16x8_t __a, int16x8_t __b) { \

734 return (uint16x8_t)(__a >= __b); }

735 __ai uint32x4_t vcgeq_s32(int32x4_t __a, int32x4_t __b) { \

736 return (uint32x4_t)(__a >= __b); }

737 __ai uint32x4_t vcgeq_f32(float32x4_t __a, float32x4_t __b) { \

738 return (uint32x4_t)(__a >= __b); }

739 __ai uint8x16_t vcgeq_u8(uint8x16_t __a, uint8x16_t __b) { \

740 return (uint8x16_t)(__a >= __b); }

741 __ai uint16x8_t vcgeq_u16(uint16x8_t __a, uint16x8_t __b) { \

742 return (uint16x8_t)(__a >= __b); }

743 __ai uint32x4_t vcgeq_u32(uint32x4_t __a, uint32x4_t __b) { \

744 return (uint32x4_t)(__a >= __b); }

745

746 __ai uint8x8_t vcgt_s8(int8x8_t __a, int8x8_t __b) { \

747 return (uint8x8_t)(__a > __b); }

748 __ai uint16x4_t vcgt_s16(int16x4_t __a, int16x4_t __b) { \

749 return (uint16x4_t)(__a > __b); }

750 __ai uint32x2_t vcgt_s32(int32x2_t __a, int32x2_t __b) { \

751 return (uint32x2_t)(__a > __b); }

752 __ai uint32x2_t vcgt_f32(float32x2_t __a, float32x2_t __b) { \

753 return (uint32x2_t)(__a > __b); }

754 __ai uint8x8_t vcgt_u8(uint8x8_t __a, uint8x8_t __b) { \

755 return (uint8x8_t)(__a > __b); }

756 __ai uint16x4_t vcgt_u16(uint16x4_t __a, uint16x4_t __b) { \

757 return (uint16x4_t)(__a > __b); }

758 __ai uint32x2_t vcgt_u32(uint32x2_t __a, uint32x2_t __b) { \

759 return (uint32x2_t)(__a > __b); }

760 __ai uint8x16_t vcgtq_s8(int8x16_t __a, int8x16_t __b) { \

761 return (uint8x16_t)(__a > __b); }

762 __ai uint16x8_t vcgtq_s16(int16x8_t __a, int16x8_t __b) { \

763 return (uint16x8_t)(__a > __b); }

764 __ai uint32x4_t vcgtq_s32(int32x4_t __a, int32x4_t __b) { \

765 return (uint32x4_t)(__a > __b); }

766 __ai uint32x4_t vcgtq_f32(float32x4_t __a, float32x4_t __b) { \

767 return (uint32x4_t)(__a > __b); }

768 __ai uint8x16_t vcgtq_u8(uint8x16_t __a, uint8x16_t __b) { \

769 return (uint8x16_t)(__a > __b); }

770 __ai uint16x8_t vcgtq_u16(uint16x8_t __a, uint16x8_t __b) { \

771 return (uint16x8_t)(__a > __b); }

772 __ai uint32x4_t vcgtq_u32(uint32x4_t __a, uint32x4_t __b) { \

773 return (uint32x4_t)(__a > __b); }

774

775 __ai uint8x8_t vcle_s8(int8x8_t __a, int8x8_t __b) { \

776 return (uint8x8_t)(__a <= __b); }

777 __ai uint16x4_t vcle_s16(int16x4_t __a, int16x4_t __b) { \

778 return (uint16x4_t)(__a <= __b); }

779 __ai uint32x2_t vcle_s32(int32x2_t __a, int32x2_t __b) { \

780 return (uint32x2_t)(__a <= __b); }

781 __ai uint32x2_t vcle_f32(float32x2_t __a, float32x2_t __b) { \

782 return (uint32x2_t)(__a <= __b); }

783 __ai uint8x8_t vcle_u8(uint8x8_t __a, uint8x8_t __b) { \

784 return (uint8x8_t)(__a <= __b); }

785 __ai uint16x4_t vcle_u16(uint16x4_t __a, uint16x4_t __b) { \

786 return (uint16x4_t)(__a <= __b); }

787 __ai uint32x2_t vcle_u32(uint32x2_t __a, uint32x2_t __b) { \

788 return (uint32x2_t)(__a <= __b); }

789 __ai uint8x16_t vcleq_s8(int8x16_t __a, int8x16_t __b) { \

790 return (uint8x16_t)(__a <= __b); }

791 __ai uint16x8_t vcleq_s16(int16x8_t __a, int16x8_t __b) { \

792 return (uint16x8_t)(__a <= __b); }

793 __ai uint32x4_t vcleq_s32(int32x4_t __a, int32x4_t __b) { \

794 return (uint32x4_t)(__a <= __b); }

795 __ai uint32x4_t vcleq_f32(float32x4_t __a, float32x4_t __b) { \

796 return (uint32x4_t)(__a <= __b); }

797 __ai uint8x16_t vcleq_u8(uint8x16_t __a, uint8x16_t __b) { \

798 return (uint8x16_t)(__a <= __b); }

799 __ai uint16x8_t vcleq_u16(uint16x8_t __a, uint16x8_t __b) { \

800 return (uint16x8_t)(__a <= __b); }

801 __ai uint32x4_t vcleq_u32(uint32x4_t __a, uint32x4_t __b) { \

802 return (uint32x4_t)(__a <= __b); }

803

804 __ai int8x8_t vcls_s8(int8x8_t __a) { \

805 return (int8x8_t)__builtin_neon_vcls_v(__a, 0); }

806 __ai int16x4_t vcls_s16(int16x4_t __a) { \

807 return (int16x4_t)__builtin_neon_vcls_v((int8x8_t)__a, 1); }

808 __ai int32x2_t vcls_s32(int32x2_t __a) { \

809 return (int32x2_t)__builtin_neon_vcls_v((int8x8_t)__a, 2); }

810 __ai int8x16_t vclsq_s8(int8x16_t __a) { \

811 return (int8x16_t)__builtin_neon_vclsq_v(__a, 16); }

812 __ai int16x8_t vclsq_s16(int16x8_t __a) { \

813 return (int16x8_t)__builtin_neon_vclsq_v((int8x16_t)__a, 17); }

814 __ai int32x4_t vclsq_s32(int32x4_t __a) { \

815 return (int32x4_t)__builtin_neon_vclsq_v((int8x16_t)__a, 18); }

816

817 __ai uint8x8_t vclt_s8(int8x8_t __a, int8x8_t __b) { \

818 return (uint8x8_t)(__a < __b); }

819 __ai uint16x4_t vclt_s16(int16x4_t __a, int16x4_t __b) { \

820 return (uint16x4_t)(__a < __b); }

821 __ai uint32x2_t vclt_s32(int32x2_t __a, int32x2_t __b) { \

822 return (uint32x2_t)(__a < __b); }

823 __ai uint32x2_t vclt_f32(float32x2_t __a, float32x2_t __b) { \

824 return (uint32x2_t)(__a < __b); }

825 __ai uint8x8_t vclt_u8(uint8x8_t __a, uint8x8_t __b) { \

826 return (uint8x8_t)(__a < __b); }

827 __ai uint16x4_t vclt_u16(uint16x4_t __a, uint16x4_t __b) { \

828 return (uint16x4_t)(__a < __b); }

829 __ai uint32x2_t vclt_u32(uint32x2_t __a, uint32x2_t __b) { \

830 return (uint32x2_t)(__a < __b); }

831 __ai uint8x16_t vcltq_s8(int8x16_t __a, int8x16_t __b) { \

832 return (uint8x16_t)(__a < __b); }

833 __ai uint16x8_t vcltq_s16(int16x8_t __a, int16x8_t __b) { \

834 return (uint16x8_t)(__a < __b); }

835 __ai uint32x4_t vcltq_s32(int32x4_t __a, int32x4_t __b) { \

836 return (uint32x4_t)(__a < __b); }

837 __ai uint32x4_t vcltq_f32(float32x4_t __a, float32x4_t __b) { \

838 return (uint32x4_t)(__a < __b); }

839 __ai uint8x16_t vcltq_u8(uint8x16_t __a, uint8x16_t __b) { \

840 return (uint8x16_t)(__a < __b); }

841 __ai uint16x8_t vcltq_u16(uint16x8_t __a, uint16x8_t __b) { \

842 return (uint16x8_t)(__a < __b); }

843 __ai uint32x4_t vcltq_u32(uint32x4_t __a, uint32x4_t __b) { \

844 return (uint32x4_t)(__a < __b); }

845

846 __ai int8x8_t vclz_s8(int8x8_t __a) { \

847 return (int8x8_t)__builtin_neon_vclz_v(__a, 0); }

848 __ai int16x4_t vclz_s16(int16x4_t __a) { \

849 return (int16x4_t)__builtin_neon_vclz_v((int8x8_t)__a, 1); }

850 __ai int32x2_t vclz_s32(int32x2_t __a) { \

851 return (int32x2_t)__builtin_neon_vclz_v((int8x8_t)__a, 2); }

852 __ai uint8x8_t vclz_u8(uint8x8_t __a) { \

853 return (uint8x8_t)__builtin_neon_vclz_v((int8x8_t)__a, 8); }

854 __ai uint16x4_t vclz_u16(uint16x4_t __a) { \

855 return (uint16x4_t)__builtin_neon_vclz_v((int8x8_t)__a, 9); }

856 __ai uint32x2_t vclz_u32(uint32x2_t __a) { \

857 return (uint32x2_t)__builtin_neon_vclz_v((int8x8_t)__a, 10); }

858 __ai int8x16_t vclzq_s8(int8x16_t __a) { \

859 return (int8x16_t)__builtin_neon_vclzq_v(__a, 16); }

860 __ai int16x8_t vclzq_s16(int16x8_t __a) { \

861 return (int16x8_t)__builtin_neon_vclzq_v((int8x16_t)__a, 17); }

862 __ai int32x4_t vclzq_s32(int32x4_t __a) { \

863 return (int32x4_t)__builtin_neon_vclzq_v((int8x16_t)__a, 18); }

864 __ai uint8x16_t vclzq_u8(uint8x16_t __a) { \

865 return (uint8x16_t)__builtin_neon_vclzq_v((int8x16_t)__a, 24); }

866 __ai uint16x8_t vclzq_u16(uint16x8_t __a) { \

867 return (uint16x8_t)__builtin_neon_vclzq_v((int8x16_t)__a, 25); }

868 __ai uint32x4_t vclzq_u32(uint32x4_t __a) { \

869 return (uint32x4_t)__builtin_neon_vclzq_v((int8x16_t)__a, 26); }

870

871 __ai uint8x8_t vcnt_u8(uint8x8_t __a) { \

872 return (uint8x8_t)__builtin_neon_vcnt_v((int8x8_t)__a, 8); }

873 __ai int8x8_t vcnt_s8(int8x8_t __a) { \

874 return (int8x8_t)__builtin_neon_vcnt_v(__a, 0); }

875 __ai poly8x8_t vcnt_p8(poly8x8_t __a) { \

876 return (poly8x8_t)__builtin_neon_vcnt_v((int8x8_t)__a, 5); }

877 __ai uint8x16_t vcntq_u8(uint8x16_t __a) { \

878 return (uint8x16_t)__builtin_neon_vcntq_v((int8x16_t)__a, 24); }

879 __ai int8x16_t vcntq_s8(int8x16_t __a) { \

880 return (int8x16_t)__builtin_neon_vcntq_v(__a, 16); }

881 __ai poly8x16_t vcntq_p8(poly8x16_t __a) { \

882 return (poly8x16_t)__builtin_neon_vcntq_v((int8x16_t)__a, 21); }

883

884 __ai int8x16_t vcombine_s8(int8x8_t __a, int8x8_t __b) { \

885 return (int8x16_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1 ); }

886 __ai int16x8_t vcombine_s16(int16x4_t __a, int16x4_t __b) { \

887 return (int16x8_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1 ); }

888 __ai int32x4_t vcombine_s32(int32x2_t __a, int32x2_t __b) { \

889 return (int32x4_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1 ); }

890 __ai int64x2_t vcombine_s64(int64x1_t __a, int64x1_t __b) { \

891 return (int64x2_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1 ); }

892 __ai float16x8_t vcombine_f16(float16x4_t __a, float16x4_t __b) { \

893 return (float16x8_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

894 __ai float32x4_t vcombine_f32(float32x2_t __a, float32x2_t __b) { \

895 return (float32x4_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

896 __ai uint8x16_t vcombine_u8(uint8x8_t __a, uint8x8_t __b) { \

897 return (uint8x16_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

898 __ai uint16x8_t vcombine_u16(uint16x4_t __a, uint16x4_t __b) { \

899 return (uint16x8_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

900 __ai uint32x4_t vcombine_u32(uint32x2_t __a, uint32x2_t __b) { \

901 return (uint32x4_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

902 __ai uint64x2_t vcombine_u64(uint64x1_t __a, uint64x1_t __b) { \

903 return (uint64x2_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

904 __ai poly8x16_t vcombine_p8(poly8x8_t __a, poly8x8_t __b) { \

905 return (poly8x16_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

906 __ai poly16x8_t vcombine_p16(poly16x4_t __a, poly16x4_t __b) { \

907 return (poly16x8_t)__builtin_shufflevector((int64x1_t)__a, (int64x1_t)__b, 0, 1); }

908

909 __ai int8x8_t vcreate_s8(uint64_t __a) { \

910 return (int8x8_t)__a; }

911 __ai int16x4_t vcreate_s16(uint64_t __a) { \

912 return (int16x4_t)__a; }

913 __ai int32x2_t vcreate_s32(uint64_t __a) { \

914 return (int32x2_t)__a; }

915 __ai float16x4_t vcreate_f16(uint64_t __a) { \

916 return (float16x4_t)__a; }

917 __ai float32x2_t vcreate_f32(uint64_t __a) { \

918 return (float32x2_t)__a; }

919 __ai uint8x8_t vcreate_u8(uint64_t __a) { \

920 return (uint8x8_t)__a; }

921 __ai uint16x4_t vcreate_u16(uint64_t __a) { \

922 return (uint16x4_t)__a; }

923 __ai uint32x2_t vcreate_u32(uint64_t __a) { \

924 return (uint32x2_t)__a; }

925 __ai uint64x1_t vcreate_u64(uint64_t __a) { \

926 return (uint64x1_t)__a; }

927 __ai poly8x8_t vcreate_p8(uint64_t __a) { \

928 return (poly8x8_t)__a; }

929 __ai poly16x4_t vcreate_p16(uint64_t __a) { \

930 return (poly16x4_t)__a; }

931 __ai int64x1_t vcreate_s64(uint64_t __a) { \

932 return (int64x1_t)__a; }

933

934 __ai float16x4_t vcvt_f16_f32(float32x4_t __a) { \

935 return (float16x4_t)__builtin_neon_vcvt_f16_v((int8x16_t)__a, 7); }

936

937 __ai float32x2_t vcvt_f32_s32(int32x2_t __a) { \

938 return (float32x2_t)__builtin_neon_vcvt_f32_v((int8x8_t)__a, 2); }

939 __ai float32x2_t vcvt_f32_u32(uint32x2_t __a) { \

940 return (float32x2_t)__builtin_neon_vcvt_f32_v((int8x8_t)__a, 10); }

941 __ai float32x4_t vcvtq_f32_s32(int32x4_t __a) { \

942 return (float32x4_t)__builtin_neon_vcvtq_f32_v((int8x16_t)__a, 18); }

943 __ai float32x4_t vcvtq_f32_u32(uint32x4_t __a) { \

944 return (float32x4_t)__builtin_neon_vcvtq_f32_v((int8x16_t)__a, 26); }

945

946 __ai float32x4_t vcvt_f32_f16(float16x4_t __a) { \

947 return (float32x4_t)__builtin_neon_vcvt_f32_f16((int8x8_t)__a, 7); }

948

949 #define vcvt_n_f32_s32(a, __b) __extension__ ({ \

950 int32x2_t __a = (a); \

951 (float32x2_t)__builtin_neon_vcvt_n_f32_v((int8x8_t)__a, __b, 2); })

952 #define vcvt_n_f32_u32(a, __b) __extension__ ({ \

953 uint32x2_t __a = (a); \

954 (float32x2_t)__builtin_neon_vcvt_n_f32_v((int8x8_t)__a, __b, 10); })

955 #define vcvtq_n_f32_s32(a, __b) __extension__ ({ \

956 int32x4_t __a = (a); \

957 (float32x4_t)__builtin_neon_vcvtq_n_f32_v((int8x16_t)__a, __b, 18); })

958 #define vcvtq_n_f32_u32(a, __b) __extension__ ({ \

959 uint32x4_t __a = (a); \

960 (float32x4_t)__builtin_neon_vcvtq_n_f32_v((int8x16_t)__a, __b, 26); })

961

962 #define vcvt_n_s32_f32(a, __b) __extension__ ({ \

963 float32x2_t __a = (a); \

964 (int32x2_t)__builtin_neon_vcvt_n_s32_v((int8x8_t)__a, __b, 2); })

965 #define vcvtq_n_s32_f32(a, __b) __extension__ ({ \

966 float32x4_t __a = (a); \

967 (int32x4_t)__builtin_neon_vcvtq_n_s32_v((int8x16_t)__a, __b, 18); })

968

969 #define vcvt_n_u32_f32(a, __b) __extension__ ({ \

970 float32x2_t __a = (a); \

971 (uint32x2_t)__builtin_neon_vcvt_n_u32_v((int8x8_t)__a, __b, 10); })

972 #define vcvtq_n_u32_f32(a, __b) __extension__ ({ \

973 float32x4_t __a = (a); \

974 (uint32x4_t)__builtin_neon_vcvtq_n_u32_v((int8x16_t)__a, __b, 26); })

975

976 __ai int32x2_t vcvt_s32_f32(float32x2_t __a) { \

977 return (int32x2_t)__builtin_neon_vcvt_s32_v((int8x8_t)__a, 2); }

978 __ai int32x4_t vcvtq_s32_f32(float32x4_t __a) { \

979 return (int32x4_t)__builtin_neon_vcvtq_s32_v((int8x16_t)__a, 18); }

980

981 __ai uint32x2_t vcvt_u32_f32(float32x2_t __a) { \

982 return (uint32x2_t)__builtin_neon_vcvt_u32_v((int8x8_t)__a, 10); }

983 __ai uint32x4_t vcvtq_u32_f32(float32x4_t __a) { \

984 return (uint32x4_t)__builtin_neon_vcvtq_u32_v((int8x16_t)__a, 26); }

985

986 #define vdup_lane_u8(a, __b) __extension__ ({ \

987 uint8x8_t __a = (a); \

988 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

989 #define vdup_lane_u16(a, __b) __extension__ ({ \

990 uint16x4_t __a = (a); \

991 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

992 #define vdup_lane_u32(a, __b) __extension__ ({ \

993 uint32x2_t __a = (a); \

994 __builtin_shufflevector(__a, __a, __b, __b); })

995 #define vdup_lane_s8(a, __b) __extension__ ({ \

996 int8x8_t __a = (a); \

997 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

998 #define vdup_lane_s16(a, __b) __extension__ ({ \

999 int16x4_t __a = (a); \

1000 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

1001 #define vdup_lane_s32(a, __b) __extension__ ({ \

1002 int32x2_t __a = (a); \

1003 __builtin_shufflevector(__a, __a, __b, __b); })

1004 #define vdup_lane_p8(a, __b) __extension__ ({ \

1005 poly8x8_t __a = (a); \

1006 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

1007 #define vdup_lane_p16(a, __b) __extension__ ({ \

1008 poly16x4_t __a = (a); \

1009 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

1010 #define vdup_lane_f32(a, __b) __extension__ ({ \

1011 float32x2_t __a = (a); \

1012 __builtin_shufflevector(__a, __a, __b, __b); })

1013 #define vdupq_lane_u8(a, __b) __extension__ ({ \

1014 uint8x8_t __a = (a); \

1015 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b); })

1016 #define vdupq_lane_u16(a, __b) __extension__ ({ \

1017 uint16x4_t __a = (a); \

1018 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

1019 #define vdupq_lane_u32(a, __b) __extension__ ({ \

1020 uint32x2_t __a = (a); \

1021 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

1022 #define vdupq_lane_s8(a, __b) __extension__ ({ \

1023 int8x8_t __a = (a); \

1024 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b); })

1025 #define vdupq_lane_s16(a, __b) __extension__ ({ \

1026 int16x4_t __a = (a); \

1027 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

1028 #define vdupq_lane_s32(a, __b) __extension__ ({ \

1029 int32x2_t __a = (a); \

1030 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

1031 #define vdupq_lane_p8(a, __b) __extension__ ({ \

1032 poly8x8_t __a = (a); \

1033 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b, __b); })

1034 #define vdupq_lane_p16(a, __b) __extension__ ({ \

1035 poly16x4_t __a = (a); \

1036 __builtin_shufflevector(__a, __a, __b, __b, __b, __b, __b, __b, __b, __b); })

1037 #define vdupq_lane_f32(a, __b) __extension__ ({ \

1038 float32x2_t __a = (a); \

1039 __builtin_shufflevector(__a, __a, __b, __b, __b, __b); })

1040 #define vdup_lane_s64(a, __b) __extension__ ({ \

1041 int64x1_t __a = (a); \

1042 __builtin_shufflevector(__a, __a, __b); })

1043 #define vdup_lane_u64(a, __b) __extension__ ({ \

1044 uint64x1_t __a = (a); \

1045 __builtin_shufflevector(__a, __a, __b); })

1046 #define vdupq_lane_s64(a, __b) __extension__ ({ \

1047 int64x1_t __a = (a); \

1048 __builtin_shufflevector(__a, __a, __b, __b); })

1049 #define vdupq_lane_u64(a, __b) __extension__ ({ \

1050 uint64x1_t __a = (a); \

1051 __builtin_shufflevector(__a, __a, __b, __b); })

1052

1053 __ai uint8x8_t vdup_n_u8(uint8_t __a) { \

1054 return (uint8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1055 __ai uint16x4_t vdup_n_u16(uint16_t __a) { \

1056 return (uint16x4_t){ __a, __a, __a, __a }; }

1057 __ai uint32x2_t vdup_n_u32(uint32_t __a) { \

1058 return (uint32x2_t){ __a, __a }; }

1059 __ai int8x8_t vdup_n_s8(int8_t __a) { \

1060 return (int8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1061 __ai int16x4_t vdup_n_s16(int16_t __a) { \

1062 return (int16x4_t){ __a, __a, __a, __a }; }

1063 __ai int32x2_t vdup_n_s32(int32_t __a) { \

1064 return (int32x2_t){ __a, __a }; }

1065 __ai poly8x8_t vdup_n_p8(poly8_t __a) { \

1066 return (poly8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1067 __ai poly16x4_t vdup_n_p16(poly16_t __a) { \

1068 return (poly16x4_t){ __a, __a, __a, __a }; }

1069 __ai float32x2_t vdup_n_f32(float32_t __a) { \

1070 return (float32x2_t){ __a, __a }; }

1071 __ai uint8x16_t vdupq_n_u8(uint8_t __a) { \

1072 return (uint8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __ a, __a, __a, __a, __a }; }

1073 __ai uint16x8_t vdupq_n_u16(uint16_t __a) { \

1074 return (uint16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1075 __ai uint32x4_t vdupq_n_u32(uint32_t __a) { \

1076 return (uint32x4_t){ __a, __a, __a, __a }; }

1077 __ai int8x16_t vdupq_n_s8(int8_t __a) { \

1078 return (int8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a , __a, __a, __a, __a }; }

1079 __ai int16x8_t vdupq_n_s16(int16_t __a) { \

1080 return (int16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1081 __ai int32x4_t vdupq_n_s32(int32_t __a) { \

1082 return (int32x4_t){ __a, __a, __a, __a }; }

1083 __ai poly8x16_t vdupq_n_p8(poly8_t __a) { \

1084 return (poly8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __ a, __a, __a, __a, __a }; }

1085 __ai poly16x8_t vdupq_n_p16(poly16_t __a) { \

1086 return (poly16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

1087 __ai float32x4_t vdupq_n_f32(float32_t __a) { \

1088 return (float32x4_t){ __a, __a, __a, __a }; }

1089 __ai int64x1_t vdup_n_s64(int64_t __a) { \

1090 return (int64x1_t){ __a }; }

1091 __ai uint64x1_t vdup_n_u64(uint64_t __a) { \

1092 return (uint64x1_t){ __a }; }

1093 __ai int64x2_t vdupq_n_s64(int64_t __a) { \

1094 return (int64x2_t){ __a, __a }; }

1095 __ai uint64x2_t vdupq_n_u64(uint64_t __a) { \

1096 return (uint64x2_t){ __a, __a }; }

1097

1098 __ai int8x8_t veor_s8(int8x8_t __a, int8x8_t __b) { \

1099 return __a ^ __b; }

1100 __ai int16x4_t veor_s16(int16x4_t __a, int16x4_t __b) { \

1101 return __a ^ __b; }

1102 __ai int32x2_t veor_s32(int32x2_t __a, int32x2_t __b) { \

1103 return __a ^ __b; }

1104 __ai int64x1_t veor_s64(int64x1_t __a, int64x1_t __b) { \

1105 return __a ^ __b; }

1106 __ai uint8x8_t veor_u8(uint8x8_t __a, uint8x8_t __b) { \

1107 return __a ^ __b; }

1108 __ai uint16x4_t veor_u16(uint16x4_t __a, uint16x4_t __b) { \

1109 return __a ^ __b; }

1110 __ai uint32x2_t veor_u32(uint32x2_t __a, uint32x2_t __b) { \

1111 return __a ^ __b; }

1112 __ai uint64x1_t veor_u64(uint64x1_t __a, uint64x1_t __b) { \

1113 return __a ^ __b; }

1114 __ai int8x16_t veorq_s8(int8x16_t __a, int8x16_t __b) { \

1115 return __a ^ __b; }

1116 __ai int16x8_t veorq_s16(int16x8_t __a, int16x8_t __b) { \

1117 return __a ^ __b; }

1118 __ai int32x4_t veorq_s32(int32x4_t __a, int32x4_t __b) { \

1119 return __a ^ __b; }

1120 __ai int64x2_t veorq_s64(int64x2_t __a, int64x2_t __b) { \

1121 return __a ^ __b; }

1122 __ai uint8x16_t veorq_u8(uint8x16_t __a, uint8x16_t __b) { \

1123 return __a ^ __b; }

1124 __ai uint16x8_t veorq_u16(uint16x8_t __a, uint16x8_t __b) { \

1125 return __a ^ __b; }

1126 __ai uint32x4_t veorq_u32(uint32x4_t __a, uint32x4_t __b) { \

1127 return __a ^ __b; }

1128 __ai uint64x2_t veorq_u64(uint64x2_t __a, uint64x2_t __b) { \

1129 return __a ^ __b; }

1130

1131 #define vext_s8(a, b, __c) __extension__ ({ \

1132 int8x8_t __a = (a); int8x8_t __b = (b); \

1133 (int8x8_t)__builtin_neon_vext_v(__a, __b, __c, 0); })

1134 #define vext_u8(a, b, __c) __extension__ ({ \

1135 uint8x8_t __a = (a); uint8x8_t __b = (b); \

1136 (uint8x8_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 8); })

1137 #define vext_p8(a, b, __c) __extension__ ({ \

1138 poly8x8_t __a = (a); poly8x8_t __b = (b); \

1139 (poly8x8_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 5); })

1140 #define vext_s16(a, b, __c) __extension__ ({ \

1141 int16x4_t __a = (a); int16x4_t __b = (b); \

1142 (int16x4_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 1); })

1143 #define vext_u16(a, b, __c) __extension__ ({ \

1144 uint16x4_t __a = (a); uint16x4_t __b = (b); \

1145 (uint16x4_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 9); })

1146 #define vext_p16(a, b, __c) __extension__ ({ \

1147 poly16x4_t __a = (a); poly16x4_t __b = (b); \

1148 (poly16x4_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 6); })

1149 #define vext_s32(a, b, __c) __extension__ ({ \

1150 int32x2_t __a = (a); int32x2_t __b = (b); \

1151 (int32x2_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 2); })

1152 #define vext_u32(a, b, __c) __extension__ ({ \

1153 uint32x2_t __a = (a); uint32x2_t __b = (b); \

1154 (uint32x2_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 10); })

1155 #define vext_s64(a, b, __c) __extension__ ({ \

1156 int64x1_t __a = (a); int64x1_t __b = (b); \

1157 (int64x1_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 3); })

1158 #define vext_u64(a, b, __c) __extension__ ({ \

1159 uint64x1_t __a = (a); uint64x1_t __b = (b); \

1160 (uint64x1_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 11); })

1161 #define vext_f32(a, b, __c) __extension__ ({ \

1162 float32x2_t __a = (a); float32x2_t __b = (b); \

1163 (float32x2_t)__builtin_neon_vext_v((int8x8_t)__a, (int8x8_t)__b, __c, 4); })

1164 #define vextq_s8(a, b, __c) __extension__ ({ \

1165 int8x16_t __a = (a); int8x16_t __b = (b); \

1166 (int8x16_t)__builtin_neon_vextq_v(__a, __b, __c, 16); })

1167 #define vextq_u8(a, b, __c) __extension__ ({ \

1168 uint8x16_t __a = (a); uint8x16_t __b = (b); \

1169 (uint8x16_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 24); } )

1170 #define vextq_p8(a, b, __c) __extension__ ({ \

1171 poly8x16_t __a = (a); poly8x16_t __b = (b); \

1172 (poly8x16_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 21); } )

1173 #define vextq_s16(a, b, __c) __extension__ ({ \

1174 int16x8_t __a = (a); int16x8_t __b = (b); \

1175 (int16x8_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 17); })

1176 #define vextq_u16(a, b, __c) __extension__ ({ \

1177 uint16x8_t __a = (a); uint16x8_t __b = (b); \

1178 (uint16x8_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 25); } )

1179 #define vextq_p16(a, b, __c) __extension__ ({ \

1180 poly16x8_t __a = (a); poly16x8_t __b = (b); \

1181 (poly16x8_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 22); } )

1182 #define vextq_s32(a, b, __c) __extension__ ({ \

1183 int32x4_t __a = (a); int32x4_t __b = (b); \

1184 (int32x4_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 18); })

1185 #define vextq_u32(a, b, __c) __extension__ ({ \

1186 uint32x4_t __a = (a); uint32x4_t __b = (b); \

1187 (uint32x4_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 26); } )

1188 #define vextq_s64(a, b, __c) __extension__ ({ \

1189 int64x2_t __a = (a); int64x2_t __b = (b); \

1190 (int64x2_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 19); })

1191 #define vextq_u64(a, b, __c) __extension__ ({ \

1192 uint64x2_t __a = (a); uint64x2_t __b = (b); \

1193 (uint64x2_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 27); } )

1194 #define vextq_f32(a, b, __c) __extension__ ({ \

1195 float32x4_t __a = (a); float32x4_t __b = (b); \

1196 (float32x4_t)__builtin_neon_vextq_v((int8x16_t)__a, (int8x16_t)__b, __c, 20); })

1197

1198 __ai int8x8_t vget_high_s8(int8x16_t __a) { \

1199 return (int8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1200 __ai int16x4_t vget_high_s16(int16x8_t __a) { \

1201 return (int16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1202 __ai int32x2_t vget_high_s32(int32x4_t __a) { \

1203 return (int32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1204 __ai int64x1_t vget_high_s64(int64x2_t __a) { \

1205 return (int64x1_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1206 __ai float16x4_t vget_high_f16(float16x8_t __a) { \

1207 return (float16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1) ; }

1208 __ai float32x2_t vget_high_f32(float32x4_t __a) { \

1209 return (float32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1) ; }

1210 __ai uint8x8_t vget_high_u8(uint8x16_t __a) { \

1211 return (uint8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1212 __ai uint16x4_t vget_high_u16(uint16x8_t __a) { \

1213 return (uint16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1214 __ai uint32x2_t vget_high_u32(uint32x4_t __a) { \

1215 return (uint32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1216 __ai uint64x1_t vget_high_u64(uint64x2_t __a) { \

1217 return (uint64x1_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1218 __ai poly8x8_t vget_high_p8(poly8x16_t __a) { \

1219 return (poly8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1220 __ai poly16x4_t vget_high_p16(poly16x8_t __a) { \

1221 return (poly16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 1); }

1222

1223 #define vget_lane_u8(a, __b) __extension__ ({ \

1224 uint8x8_t __a = (a); \

1225 (uint8_t)__builtin_neon_vget_lane_i8((int8x8_t)__a, __b); })

1226 #define vget_lane_u16(a, __b) __extension__ ({ \

1227 uint16x4_t __a = (a); \

1228 (uint16_t)__builtin_neon_vget_lane_i16((int16x4_t)__a, __b); })

1229 #define vget_lane_u32(a, __b) __extension__ ({ \

1230 uint32x2_t __a = (a); \

1231 (uint32_t)__builtin_neon_vget_lane_i32((int32x2_t)__a, __b); })

1232 #define vget_lane_s8(a, __b) __extension__ ({ \

1233 int8x8_t __a = (a); \

1234 (int8_t)__builtin_neon_vget_lane_i8(__a, __b); })

1235 #define vget_lane_s16(a, __b) __extension__ ({ \

1236 int16x4_t __a = (a); \

1237 (int16_t)__builtin_neon_vget_lane_i16(__a, __b); })

1238 #define vget_lane_s32(a, __b) __extension__ ({ \

1239 int32x2_t __a = (a); \

1240 (int32_t)__builtin_neon_vget_lane_i32(__a, __b); })

1241 #define vget_lane_p8(a, __b) __extension__ ({ \

1242 poly8x8_t __a = (a); \

1243 (poly8_t)__builtin_neon_vget_lane_i8((int8x8_t)__a, __b); })

1244 #define vget_lane_p16(a, __b) __extension__ ({ \

1245 poly16x4_t __a = (a); \

1246 (poly16_t)__builtin_neon_vget_lane_i16((int16x4_t)__a, __b); })

1247 #define vget_lane_f32(a, __b) __extension__ ({ \

1248 float32x2_t __a = (a); \

1249 (float32_t)__builtin_neon_vget_lane_f32(__a, __b); })

1250 #define vgetq_lane_u8(a, __b) __extension__ ({ \

1251 uint8x16_t __a = (a); \

1252 (uint8_t)__builtin_neon_vgetq_lane_i8((int8x16_t)__a, __b); })

1253 #define vgetq_lane_u16(a, __b) __extension__ ({ \

1254 uint16x8_t __a = (a); \

1255 (uint16_t)__builtin_neon_vgetq_lane_i16((int16x8_t)__a, __b); })

1256 #define vgetq_lane_u32(a, __b) __extension__ ({ \

1257 uint32x4_t __a = (a); \

1258 (uint32_t)__builtin_neon_vgetq_lane_i32((int32x4_t)__a, __b); })

1259 #define vgetq_lane_s8(a, __b) __extension__ ({ \

1260 int8x16_t __a = (a); \

1261 (int8_t)__builtin_neon_vgetq_lane_i8(__a, __b); })

1262 #define vgetq_lane_s16(a, __b) __extension__ ({ \

1263 int16x8_t __a = (a); \

1264 (int16_t)__builtin_neon_vgetq_lane_i16(__a, __b); })

1265 #define vgetq_lane_s32(a, __b) __extension__ ({ \

1266 int32x4_t __a = (a); \

1267 (int32_t)__builtin_neon_vgetq_lane_i32(__a, __b); })

1268 #define vgetq_lane_p8(a, __b) __extension__ ({ \

1269 poly8x16_t __a = (a); \

1270 (poly8_t)__builtin_neon_vgetq_lane_i8((int8x16_t)__a, __b); })

1271 #define vgetq_lane_p16(a, __b) __extension__ ({ \

1272 poly16x8_t __a = (a); \

1273 (poly16_t)__builtin_neon_vgetq_lane_i16((int16x8_t)__a, __b); })

1274 #define vgetq_lane_f32(a, __b) __extension__ ({ \

1275 float32x4_t __a = (a); \

1276 (float32_t)__builtin_neon_vgetq_lane_f32(__a, __b); })

1277 #define vget_lane_s64(a, __b) __extension__ ({ \

1278 int64x1_t __a = (a); \

1279 (int64_t)__builtin_neon_vget_lane_i64(__a, __b); })

1280 #define vget_lane_u64(a, __b) __extension__ ({ \

1281 uint64x1_t __a = (a); \

1282 (uint64_t)__builtin_neon_vget_lane_i64((int64x1_t)__a, __b); })

1283 #define vgetq_lane_s64(a, __b) __extension__ ({ \

1284 int64x2_t __a = (a); \

1285 (int64_t)__builtin_neon_vgetq_lane_i64(__a, __b); })

1286 #define vgetq_lane_u64(a, __b) __extension__ ({ \

1287 uint64x2_t __a = (a); \

1288 (uint64_t)__builtin_neon_vgetq_lane_i64((int64x2_t)__a, __b); })

1289

1290 __ai int8x8_t vget_low_s8(int8x16_t __a) { \

1291 return (int8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1292 __ai int16x4_t vget_low_s16(int16x8_t __a) { \

1293 return (int16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1294 __ai int32x2_t vget_low_s32(int32x4_t __a) { \

1295 return (int32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1296 __ai int64x1_t vget_low_s64(int64x2_t __a) { \

1297 return (int64x1_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1298 __ai float16x4_t vget_low_f16(float16x8_t __a) { \

1299 return (float16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0) ; }

1300 __ai float32x2_t vget_low_f32(float32x4_t __a) { \

1301 return (float32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0) ; }

1302 __ai uint8x8_t vget_low_u8(uint8x16_t __a) { \

1303 return (uint8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1304 __ai uint16x4_t vget_low_u16(uint16x8_t __a) { \

1305 return (uint16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1306 __ai uint32x2_t vget_low_u32(uint32x4_t __a) { \

1307 return (uint32x2_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1308 __ai uint64x1_t vget_low_u64(uint64x2_t __a) { \

1309 return (uint64x1_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1310 __ai poly8x8_t vget_low_p8(poly8x16_t __a) { \

1311 return (poly8x8_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1312 __ai poly16x4_t vget_low_p16(poly16x8_t __a) { \

1313 return (poly16x4_t)__builtin_shufflevector((int64x2_t)__a, (int64x2_t)__a, 0); }

1314

1315 __ai int8x8_t vhadd_s8(int8x8_t __a, int8x8_t __b) { \

1316 return (int8x8_t)__builtin_neon_vhadd_v(__a, __b, 0); }

1317 __ai int16x4_t vhadd_s16(int16x4_t __a, int16x4_t __b) { \

1318 return (int16x4_t)__builtin_neon_vhadd_v((int8x8_t)__a, (int8x8_t)__b, 1); }

1319 __ai int32x2_t vhadd_s32(int32x2_t __a, int32x2_t __b) { \

1320 return (int32x2_t)__builtin_neon_vhadd_v((int8x8_t)__a, (int8x8_t)__b, 2); }

1321 __ai uint8x8_t vhadd_u8(uint8x8_t __a, uint8x8_t __b) { \

1322 return (uint8x8_t)__builtin_neon_vhadd_v((int8x8_t)__a, (int8x8_t)__b, 8); }

1323 __ai uint16x4_t vhadd_u16(uint16x4_t __a, uint16x4_t __b) { \

1324 return (uint16x4_t)__builtin_neon_vhadd_v((int8x8_t)__a, (int8x8_t)__b, 9); }

1325 __ai uint32x2_t vhadd_u32(uint32x2_t __a, uint32x2_t __b) { \

1326 return (uint32x2_t)__builtin_neon_vhadd_v((int8x8_t)__a, (int8x8_t)__b, 10); }

1327 __ai int8x16_t vhaddq_s8(int8x16_t __a, int8x16_t __b) { \

1328 return (int8x16_t)__builtin_neon_vhaddq_v(__a, __b, 16); }

1329 __ai int16x8_t vhaddq_s16(int16x8_t __a, int16x8_t __b) { \

1330 return (int16x8_t)__builtin_neon_vhaddq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

1331 __ai int32x4_t vhaddq_s32(int32x4_t __a, int32x4_t __b) { \

1332 return (int32x4_t)__builtin_neon_vhaddq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

1333 __ai uint8x16_t vhaddq_u8(uint8x16_t __a, uint8x16_t __b) { \

1334 return (uint8x16_t)__builtin_neon_vhaddq_v((int8x16_t)__a, (int8x16_t)__b, 24) ; }

1335 __ai uint16x8_t vhaddq_u16(uint16x8_t __a, uint16x8_t __b) { \

1336 return (uint16x8_t)__builtin_neon_vhaddq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

1337 __ai uint32x4_t vhaddq_u32(uint32x4_t __a, uint32x4_t __b) { \

1338 return (uint32x4_t)__builtin_neon_vhaddq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

1339

1340 __ai int8x8_t vhsub_s8(int8x8_t __a, int8x8_t __b) { \

1341 return (int8x8_t)__builtin_neon_vhsub_v(__a, __b, 0); }

1342 __ai int16x4_t vhsub_s16(int16x4_t __a, int16x4_t __b) { \

1343 return (int16x4_t)__builtin_neon_vhsub_v((int8x8_t)__a, (int8x8_t)__b, 1); }

1344 __ai int32x2_t vhsub_s32(int32x2_t __a, int32x2_t __b) { \

1345 return (int32x2_t)__builtin_neon_vhsub_v((int8x8_t)__a, (int8x8_t)__b, 2); }

1346 __ai uint8x8_t vhsub_u8(uint8x8_t __a, uint8x8_t __b) { \

1347 return (uint8x8_t)__builtin_neon_vhsub_v((int8x8_t)__a, (int8x8_t)__b, 8); }

1348 __ai uint16x4_t vhsub_u16(uint16x4_t __a, uint16x4_t __b) { \

1349 return (uint16x4_t)__builtin_neon_vhsub_v((int8x8_t)__a, (int8x8_t)__b, 9); }

1350 __ai uint32x2_t vhsub_u32(uint32x2_t __a, uint32x2_t __b) { \

1351 return (uint32x2_t)__builtin_neon_vhsub_v((int8x8_t)__a, (int8x8_t)__b, 10); }

1352 __ai int8x16_t vhsubq_s8(int8x16_t __a, int8x16_t __b) { \

1353 return (int8x16_t)__builtin_neon_vhsubq_v(__a, __b, 16); }

1354 __ai int16x8_t vhsubq_s16(int16x8_t __a, int16x8_t __b) { \

1355 return (int16x8_t)__builtin_neon_vhsubq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

1356 __ai int32x4_t vhsubq_s32(int32x4_t __a, int32x4_t __b) { \

1357 return (int32x4_t)__builtin_neon_vhsubq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

1358 __ai uint8x16_t vhsubq_u8(uint8x16_t __a, uint8x16_t __b) { \

1359 return (uint8x16_t)__builtin_neon_vhsubq_v((int8x16_t)__a, (int8x16_t)__b, 24) ; }

1360 __ai uint16x8_t vhsubq_u16(uint16x8_t __a, uint16x8_t __b) { \

1361 return (uint16x8_t)__builtin_neon_vhsubq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

1362 __ai uint32x4_t vhsubq_u32(uint32x4_t __a, uint32x4_t __b) { \

1363 return (uint32x4_t)__builtin_neon_vhsubq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

1364

1365 #define vld1q_u8(__a) __extension__ ({ \

1366 (uint8x16_t)__builtin_neon_vld1q_v(__a, 24); })

1367 #define vld1q_u16(__a) __extension__ ({ \

1368 (uint16x8_t)__builtin_neon_vld1q_v(__a, 25); })

1369 #define vld1q_u32(__a) __extension__ ({ \

1370 (uint32x4_t)__builtin_neon_vld1q_v(__a, 26); })

1371 #define vld1q_u64(__a) __extension__ ({ \

1372 (uint64x2_t)__builtin_neon_vld1q_v(__a, 27); })

1373 #define vld1q_s8(__a) __extension__ ({ \

1374 (int8x16_t)__builtin_neon_vld1q_v(__a, 16); })

1375 #define vld1q_s16(__a) __extension__ ({ \

1376 (int16x8_t)__builtin_neon_vld1q_v(__a, 17); })

1377 #define vld1q_s32(__a) __extension__ ({ \

1378 (int32x4_t)__builtin_neon_vld1q_v(__a, 18); })

1379 #define vld1q_s64(__a) __extension__ ({ \

1380 (int64x2_t)__builtin_neon_vld1q_v(__a, 19); })

1381 #define vld1q_f16(__a) __extension__ ({ \

1382 (float16x8_t)__builtin_neon_vld1q_v(__a, 23); })

1383 #define vld1q_f32(__a) __extension__ ({ \

1384 (float32x4_t)__builtin_neon_vld1q_v(__a, 20); })

1385 #define vld1q_p8(__a) __extension__ ({ \

1386 (poly8x16_t)__builtin_neon_vld1q_v(__a, 21); })

1387 #define vld1q_p16(__a) __extension__ ({ \

1388 (poly16x8_t)__builtin_neon_vld1q_v(__a, 22); })

1389 #define vld1_u8(__a) __extension__ ({ \

1390 (uint8x8_t)__builtin_neon_vld1_v(__a, 8); })

1391 #define vld1_u16(__a) __extension__ ({ \

1392 (uint16x4_t)__builtin_neon_vld1_v(__a, 9); })

1393 #define vld1_u32(__a) __extension__ ({ \

1394 (uint32x2_t)__builtin_neon_vld1_v(__a, 10); })

1395 #define vld1_u64(__a) __extension__ ({ \

1396 (uint64x1_t)__builtin_neon_vld1_v(__a, 11); })

1397 #define vld1_s8(__a) __extension__ ({ \

1398 (int8x8_t)__builtin_neon_vld1_v(__a, 0); })

1399 #define vld1_s16(__a) __extension__ ({ \

1400 (int16x4_t)__builtin_neon_vld1_v(__a, 1); })

1401 #define vld1_s32(__a) __extension__ ({ \

1402 (int32x2_t)__builtin_neon_vld1_v(__a, 2); })

1403 #define vld1_s64(__a) __extension__ ({ \

1404 (int64x1_t)__builtin_neon_vld1_v(__a, 3); })

1405 #define vld1_f16(__a) __extension__ ({ \

1406 (float16x4_t)__builtin_neon_vld1_v(__a, 7); })

1407 #define vld1_f32(__a) __extension__ ({ \

1408 (float32x2_t)__builtin_neon_vld1_v(__a, 4); })

1409 #define vld1_p8(__a) __extension__ ({ \

1410 (poly8x8_t)__builtin_neon_vld1_v(__a, 5); })

1411 #define vld1_p16(__a) __extension__ ({ \

1412 (poly16x4_t)__builtin_neon_vld1_v(__a, 6); })

1413

1414 #define vld1q_dup_u8(__a) __extension__ ({ \

1415 (uint8x16_t)__builtin_neon_vld1q_dup_v(__a, 24); })

1416 #define vld1q_dup_u16(__a) __extension__ ({ \

1417 (uint16x8_t)__builtin_neon_vld1q_dup_v(__a, 25); })

1418 #define vld1q_dup_u32(__a) __extension__ ({ \

1419 (uint32x4_t)__builtin_neon_vld1q_dup_v(__a, 26); })

1420 #define vld1q_dup_u64(__a) __extension__ ({ \

1421 (uint64x2_t)__builtin_neon_vld1q_dup_v(__a, 27); })

1422 #define vld1q_dup_s8(__a) __extension__ ({ \

1423 (int8x16_t)__builtin_neon_vld1q_dup_v(__a, 16); })

1424 #define vld1q_dup_s16(__a) __extension__ ({ \

1425 (int16x8_t)__builtin_neon_vld1q_dup_v(__a, 17); })

1426 #define vld1q_dup_s32(__a) __extension__ ({ \

1427 (int32x4_t)__builtin_neon_vld1q_dup_v(__a, 18); })

1428 #define vld1q_dup_s64(__a) __extension__ ({ \

1429 (int64x2_t)__builtin_neon_vld1q_dup_v(__a, 19); })

1430 #define vld1q_dup_f16(__a) __extension__ ({ \

1431 (float16x8_t)__builtin_neon_vld1q_dup_v(__a, 23); })

1432 #define vld1q_dup_f32(__a) __extension__ ({ \

1433 (float32x4_t)__builtin_neon_vld1q_dup_v(__a, 20); })

1434 #define vld1q_dup_p8(__a) __extension__ ({ \

1435 (poly8x16_t)__builtin_neon_vld1q_dup_v(__a, 21); })

1436 #define vld1q_dup_p16(__a) __extension__ ({ \

1437 (poly16x8_t)__builtin_neon_vld1q_dup_v(__a, 22); })

1438 #define vld1_dup_u8(__a) __extension__ ({ \

1439 (uint8x8_t)__builtin_neon_vld1_dup_v(__a, 8); })

1440 #define vld1_dup_u16(__a) __extension__ ({ \

1441 (uint16x4_t)__builtin_neon_vld1_dup_v(__a, 9); })

1442 #define vld1_dup_u32(__a) __extension__ ({ \

1443 (uint32x2_t)__builtin_neon_vld1_dup_v(__a, 10); })

1444 #define vld1_dup_u64(__a) __extension__ ({ \

1445 (uint64x1_t)__builtin_neon_vld1_dup_v(__a, 11); })

1446 #define vld1_dup_s8(__a) __extension__ ({ \

1447 (int8x8_t)__builtin_neon_vld1_dup_v(__a, 0); })

1448 #define vld1_dup_s16(__a) __extension__ ({ \

1449 (int16x4_t)__builtin_neon_vld1_dup_v(__a, 1); })

1450 #define vld1_dup_s32(__a) __extension__ ({ \

1451 (int32x2_t)__builtin_neon_vld1_dup_v(__a, 2); })

1452 #define vld1_dup_s64(__a) __extension__ ({ \

1453 (int64x1_t)__builtin_neon_vld1_dup_v(__a, 3); })

1454 #define vld1_dup_f16(__a) __extension__ ({ \

1455 (float16x4_t)__builtin_neon_vld1_dup_v(__a, 7); })

1456 #define vld1_dup_f32(__a) __extension__ ({ \

1457 (float32x2_t)__builtin_neon_vld1_dup_v(__a, 4); })

1458 #define vld1_dup_p8(__a) __extension__ ({ \

1459 (poly8x8_t)__builtin_neon_vld1_dup_v(__a, 5); })

1460 #define vld1_dup_p16(__a) __extension__ ({ \

1461 (poly16x4_t)__builtin_neon_vld1_dup_v(__a, 6); })

1462

1463 #define vld1q_lane_u8(__a, b, __c) __extension__ ({ \

1464 uint8x16_t __b = (b); \

1465 (uint8x16_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 24); })

1466 #define vld1q_lane_u16(__a, b, __c) __extension__ ({ \

1467 uint16x8_t __b = (b); \

1468 (uint16x8_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 25); })

1469 #define vld1q_lane_u32(__a, b, __c) __extension__ ({ \

1470 uint32x4_t __b = (b); \

1471 (uint32x4_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 26); })

1472 #define vld1q_lane_u64(__a, b, __c) __extension__ ({ \

1473 uint64x2_t __b = (b); \

1474 (uint64x2_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 27); })

1475 #define vld1q_lane_s8(__a, b, __c) __extension__ ({ \

1476 int8x16_t __b = (b); \

1477 (int8x16_t)__builtin_neon_vld1q_lane_v(__a, __b, __c, 16); })

1478 #define vld1q_lane_s16(__a, b, __c) __extension__ ({ \

1479 int16x8_t __b = (b); \

1480 (int16x8_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 17); })

1481 #define vld1q_lane_s32(__a, b, __c) __extension__ ({ \

1482 int32x4_t __b = (b); \

1483 (int32x4_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 18); })

1484 #define vld1q_lane_s64(__a, b, __c) __extension__ ({ \

1485 int64x2_t __b = (b); \

1486 (int64x2_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 19); })

1487 #define vld1q_lane_f16(__a, b, __c) __extension__ ({ \

1488 float16x8_t __b = (b); \

1489 (float16x8_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 23); })

1490 #define vld1q_lane_f32(__a, b, __c) __extension__ ({ \

1491 float32x4_t __b = (b); \

1492 (float32x4_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 20); })

1493 #define vld1q_lane_p8(__a, b, __c) __extension__ ({ \

1494 poly8x16_t __b = (b); \

1495 (poly8x16_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 21); })

1496 #define vld1q_lane_p16(__a, b, __c) __extension__ ({ \

1497 poly16x8_t __b = (b); \

1498 (poly16x8_t)__builtin_neon_vld1q_lane_v(__a, (int8x16_t)__b, __c, 22); })

1499 #define vld1_lane_u8(__a, b, __c) __extension__ ({ \

1500 uint8x8_t __b = (b); \

1501 (uint8x8_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 8); })

1502 #define vld1_lane_u16(__a, b, __c) __extension__ ({ \

1503 uint16x4_t __b = (b); \

1504 (uint16x4_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 9); })

1505 #define vld1_lane_u32(__a, b, __c) __extension__ ({ \

1506 uint32x2_t __b = (b); \

1507 (uint32x2_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 10); })

1508 #define vld1_lane_u64(__a, b, __c) __extension__ ({ \

1509 uint64x1_t __b = (b); \

1510 (uint64x1_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 11); })

1511 #define vld1_lane_s8(__a, b, __c) __extension__ ({ \

1512 int8x8_t __b = (b); \

1513 (int8x8_t)__builtin_neon_vld1_lane_v(__a, __b, __c, 0); })

1514 #define vld1_lane_s16(__a, b, __c) __extension__ ({ \

1515 int16x4_t __b = (b); \

1516 (int16x4_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 1); })

1517 #define vld1_lane_s32(__a, b, __c) __extension__ ({ \

1518 int32x2_t __b = (b); \

1519 (int32x2_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 2); })

1520 #define vld1_lane_s64(__a, b, __c) __extension__ ({ \

1521 int64x1_t __b = (b); \

1522 (int64x1_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 3); })

1523 #define vld1_lane_f16(__a, b, __c) __extension__ ({ \

1524 float16x4_t __b = (b); \

1525 (float16x4_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 7); })

1526 #define vld1_lane_f32(__a, b, __c) __extension__ ({ \

1527 float32x2_t __b = (b); \

1528 (float32x2_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 4); })

1529 #define vld1_lane_p8(__a, b, __c) __extension__ ({ \

1530 poly8x8_t __b = (b); \

1531 (poly8x8_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 5); })

1532 #define vld1_lane_p16(__a, b, __c) __extension__ ({ \

1533 poly16x4_t __b = (b); \

1534 (poly16x4_t)__builtin_neon_vld1_lane_v(__a, (int8x8_t)__b, __c, 6); })

1535

1536 #define vld2q_u8(__a) __extension__ ({ \

1537 uint8x16x2_t r; __builtin_neon_vld2q_v(&r, __a, 24); r; })

1538 #define vld2q_u16(__a) __extension__ ({ \

1539 uint16x8x2_t r; __builtin_neon_vld2q_v(&r, __a, 25); r; })

1540 #define vld2q_u32(__a) __extension__ ({ \

1541 uint32x4x2_t r; __builtin_neon_vld2q_v(&r, __a, 26); r; })

1542 #define vld2q_s8(__a) __extension__ ({ \

1543 int8x16x2_t r; __builtin_neon_vld2q_v(&r, __a, 16); r; })

1544 #define vld2q_s16(__a) __extension__ ({ \

1545 int16x8x2_t r; __builtin_neon_vld2q_v(&r, __a, 17); r; })

1546 #define vld2q_s32(__a) __extension__ ({ \

1547 int32x4x2_t r; __builtin_neon_vld2q_v(&r, __a, 18); r; })

1548 #define vld2q_f16(__a) __extension__ ({ \

1549 float16x8x2_t r; __builtin_neon_vld2q_v(&r, __a, 23); r; })

1550 #define vld2q_f32(__a) __extension__ ({ \

1551 float32x4x2_t r; __builtin_neon_vld2q_v(&r, __a, 20); r; })

1552 #define vld2q_p8(__a) __extension__ ({ \

1553 poly8x16x2_t r; __builtin_neon_vld2q_v(&r, __a, 21); r; })

1554 #define vld2q_p16(__a) __extension__ ({ \

1555 poly16x8x2_t r; __builtin_neon_vld2q_v(&r, __a, 22); r; })

1556 #define vld2_u8(__a) __extension__ ({ \

1557 uint8x8x2_t r; __builtin_neon_vld2_v(&r, __a, 8); r; })

1558 #define vld2_u16(__a) __extension__ ({ \

1559 uint16x4x2_t r; __builtin_neon_vld2_v(&r, __a, 9); r; })

1560 #define vld2_u32(__a) __extension__ ({ \

1561 uint32x2x2_t r; __builtin_neon_vld2_v(&r, __a, 10); r; })

1562 #define vld2_u64(__a) __extension__ ({ \

1563 uint64x1x2_t r; __builtin_neon_vld2_v(&r, __a, 11); r; })

1564 #define vld2_s8(__a) __extension__ ({ \

1565 int8x8x2_t r; __builtin_neon_vld2_v(&r, __a, 0); r; })

1566 #define vld2_s16(__a) __extension__ ({ \

1567 int16x4x2_t r; __builtin_neon_vld2_v(&r, __a, 1); r; })

1568 #define vld2_s32(__a) __extension__ ({ \

1569 int32x2x2_t r; __builtin_neon_vld2_v(&r, __a, 2); r; })

1570 #define vld2_s64(__a) __extension__ ({ \

1571 int64x1x2_t r; __builtin_neon_vld2_v(&r, __a, 3); r; })

1572 #define vld2_f16(__a) __extension__ ({ \

1573 float16x4x2_t r; __builtin_neon_vld2_v(&r, __a, 7); r; })

1574 #define vld2_f32(__a) __extension__ ({ \

1575 float32x2x2_t r; __builtin_neon_vld2_v(&r, __a, 4); r; })

1576 #define vld2_p8(__a) __extension__ ({ \

1577 poly8x8x2_t r; __builtin_neon_vld2_v(&r, __a, 5); r; })

1578 #define vld2_p16(__a) __extension__ ({ \

1579 poly16x4x2_t r; __builtin_neon_vld2_v(&r, __a, 6); r; })

1580

1581 #define vld2_dup_u8(__a) __extension__ ({ \

1582 uint8x8x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 8); r; })

1583 #define vld2_dup_u16(__a) __extension__ ({ \

1584 uint16x4x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 9); r; })

1585 #define vld2_dup_u32(__a) __extension__ ({ \

1586 uint32x2x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 10); r; })

1587 #define vld2_dup_u64(__a) __extension__ ({ \

1588 uint64x1x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 11); r; })

1589 #define vld2_dup_s8(__a) __extension__ ({ \

1590 int8x8x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 0); r; })

1591 #define vld2_dup_s16(__a) __extension__ ({ \

1592 int16x4x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 1); r; })

1593 #define vld2_dup_s32(__a) __extension__ ({ \

1594 int32x2x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 2); r; })

1595 #define vld2_dup_s64(__a) __extension__ ({ \

1596 int64x1x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 3); r; })

1597 #define vld2_dup_f16(__a) __extension__ ({ \

1598 float16x4x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 7); r; })

1599 #define vld2_dup_f32(__a) __extension__ ({ \

1600 float32x2x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 4); r; })

1601 #define vld2_dup_p8(__a) __extension__ ({ \

1602 poly8x8x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 5); r; })

1603 #define vld2_dup_p16(__a) __extension__ ({ \

1604 poly16x4x2_t r; __builtin_neon_vld2_dup_v(&r, __a, 6); r; })

1605

1606 #define vld2q_lane_u16(__a, b, __c) __extension__ ({ \

1607 uint16x8x2_t __b = (b); \

1608 uint16x8x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], __c, 25); r; })

1609 #define vld2q_lane_u32(__a, b, __c) __extension__ ({ \

1610 uint32x4x2_t __b = (b); \

1611 uint32x4x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], __c, 26); r; })

1612 #define vld2q_lane_s16(__a, b, __c) __extension__ ({ \

1613 int16x8x2_t __b = (b); \

1614 int16x8x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], __c, 17); r; })

1615 #define vld2q_lane_s32(__a, b, __c) __extension__ ({ \

1616 int32x4x2_t __b = (b); \

1617 int32x4x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], __c, 18); r; })

1618 #define vld2q_lane_f16(__a, b, __c) __extension__ ({ \

1619 float16x8x2_t __b = (b); \

1620 float16x8x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], __c, 23); r; })

1621 #define vld2q_lane_f32(__a, b, __c) __extension__ ({ \

1622 float32x4x2_t __b = (b); \

1623 float32x4x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], __c, 20); r; })

1624 #define vld2q_lane_p16(__a, b, __c) __extension__ ({ \

1625 poly16x8x2_t __b = (b); \

1626 poly16x8x2_t r; __builtin_neon_vld2q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], __c, 22); r; })

1627 #define vld2_lane_u8(__a, b, __c) __extension__ ({ \

1628 uint8x8x2_t __b = (b); \

1629 uint8x8x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], __c, 8); r; })

1630 #define vld2_lane_u16(__a, b, __c) __extension__ ({ \

1631 uint16x4x2_t __b = (b); \

1632 uint16x4x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], __c, 9); r; })

1633 #define vld2_lane_u32(__a, b, __c) __extension__ ({ \

1634 uint32x2x2_t __b = (b); \

1635 uint32x2x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], __c, 10); r; })

1636 #define vld2_lane_s8(__a, b, __c) __extension__ ({ \

1637 int8x8x2_t __b = (b); \

1638 int8x8x2_t r; __builtin_neon_vld2_lane_v(&r, __a, __b.val[0], __b.val[1], __c, 0); r; })

1639 #define vld2_lane_s16(__a, b, __c) __extension__ ({ \

1640 int16x4x2_t __b = (b); \

1641 int16x4x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], __c, 1); r; })

1642 #define vld2_lane_s32(__a, b, __c) __extension__ ({ \

1643 int32x2x2_t __b = (b); \

1644 int32x2x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], __c, 2); r; })

1645 #define vld2_lane_f16(__a, b, __c) __extension__ ({ \

1646 float16x4x2_t __b = (b); \

1647 float16x4x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], __c, 7); r; })

1648 #define vld2_lane_f32(__a, b, __c) __extension__ ({ \

1649 float32x2x2_t __b = (b); \

1650 float32x2x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], __c, 4); r; })

1651 #define vld2_lane_p8(__a, b, __c) __extension__ ({ \

1652 poly8x8x2_t __b = (b); \

1653 poly8x8x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], __c, 5); r; })

1654 #define vld2_lane_p16(__a, b, __c) __extension__ ({ \

1655 poly16x4x2_t __b = (b); \

1656 poly16x4x2_t r; __builtin_neon_vld2_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], __c, 6); r; })

1657

1658 #define vld3q_u8(__a) __extension__ ({ \

1659 uint8x16x3_t r; __builtin_neon_vld3q_v(&r, __a, 24); r; })

1660 #define vld3q_u16(__a) __extension__ ({ \

1661 uint16x8x3_t r; __builtin_neon_vld3q_v(&r, __a, 25); r; })

1662 #define vld3q_u32(__a) __extension__ ({ \

1663 uint32x4x3_t r; __builtin_neon_vld3q_v(&r, __a, 26); r; })

1664 #define vld3q_s8(__a) __extension__ ({ \

1665 int8x16x3_t r; __builtin_neon_vld3q_v(&r, __a, 16); r; })

1666 #define vld3q_s16(__a) __extension__ ({ \

1667 int16x8x3_t r; __builtin_neon_vld3q_v(&r, __a, 17); r; })

1668 #define vld3q_s32(__a) __extension__ ({ \

1669 int32x4x3_t r; __builtin_neon_vld3q_v(&r, __a, 18); r; })

1670 #define vld3q_f16(__a) __extension__ ({ \

1671 float16x8x3_t r; __builtin_neon_vld3q_v(&r, __a, 23); r; })

1672 #define vld3q_f32(__a) __extension__ ({ \

1673 float32x4x3_t r; __builtin_neon_vld3q_v(&r, __a, 20); r; })

1674 #define vld3q_p8(__a) __extension__ ({ \

1675 poly8x16x3_t r; __builtin_neon_vld3q_v(&r, __a, 21); r; })

1676 #define vld3q_p16(__a) __extension__ ({ \

1677 poly16x8x3_t r; __builtin_neon_vld3q_v(&r, __a, 22); r; })

1678 #define vld3_u8(__a) __extension__ ({ \

1679 uint8x8x3_t r; __builtin_neon_vld3_v(&r, __a, 8); r; })

1680 #define vld3_u16(__a) __extension__ ({ \

1681 uint16x4x3_t r; __builtin_neon_vld3_v(&r, __a, 9); r; })

1682 #define vld3_u32(__a) __extension__ ({ \

1683 uint32x2x3_t r; __builtin_neon_vld3_v(&r, __a, 10); r; })

1684 #define vld3_u64(__a) __extension__ ({ \

1685 uint64x1x3_t r; __builtin_neon_vld3_v(&r, __a, 11); r; })

1686 #define vld3_s8(__a) __extension__ ({ \

1687 int8x8x3_t r; __builtin_neon_vld3_v(&r, __a, 0); r; })

1688 #define vld3_s16(__a) __extension__ ({ \

1689 int16x4x3_t r; __builtin_neon_vld3_v(&r, __a, 1); r; })

1690 #define vld3_s32(__a) __extension__ ({ \

1691 int32x2x3_t r; __builtin_neon_vld3_v(&r, __a, 2); r; })

1692 #define vld3_s64(__a) __extension__ ({ \

1693 int64x1x3_t r; __builtin_neon_vld3_v(&r, __a, 3); r; })

1694 #define vld3_f16(__a) __extension__ ({ \

1695 float16x4x3_t r; __builtin_neon_vld3_v(&r, __a, 7); r; })

1696 #define vld3_f32(__a) __extension__ ({ \

1697 float32x2x3_t r; __builtin_neon_vld3_v(&r, __a, 4); r; })

1698 #define vld3_p8(__a) __extension__ ({ \

1699 poly8x8x3_t r; __builtin_neon_vld3_v(&r, __a, 5); r; })

1700 #define vld3_p16(__a) __extension__ ({ \

1701 poly16x4x3_t r; __builtin_neon_vld3_v(&r, __a, 6); r; })

1702

1703 #define vld3_dup_u8(__a) __extension__ ({ \

1704 uint8x8x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 8); r; })

1705 #define vld3_dup_u16(__a) __extension__ ({ \

1706 uint16x4x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 9); r; })

1707 #define vld3_dup_u32(__a) __extension__ ({ \

1708 uint32x2x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 10); r; })

1709 #define vld3_dup_u64(__a) __extension__ ({ \

1710 uint64x1x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 11); r; })

1711 #define vld3_dup_s8(__a) __extension__ ({ \

1712 int8x8x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 0); r; })

1713 #define vld3_dup_s16(__a) __extension__ ({ \

1714 int16x4x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 1); r; })

1715 #define vld3_dup_s32(__a) __extension__ ({ \

1716 int32x2x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 2); r; })

1717 #define vld3_dup_s64(__a) __extension__ ({ \

1718 int64x1x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 3); r; })

1719 #define vld3_dup_f16(__a) __extension__ ({ \

1720 float16x4x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 7); r; })

1721 #define vld3_dup_f32(__a) __extension__ ({ \

1722 float32x2x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 4); r; })

1723 #define vld3_dup_p8(__a) __extension__ ({ \

1724 poly8x8x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 5); r; })

1725 #define vld3_dup_p16(__a) __extension__ ({ \

1726 poly16x4x3_t r; __builtin_neon_vld3_dup_v(&r, __a, 6); r; })

1727

1728 #define vld3q_lane_u16(__a, b, __c) __extension__ ({ \

1729 uint16x8x3_t __b = (b); \

1730 uint16x8x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 25); r; })

1731 #define vld3q_lane_u32(__a, b, __c) __extension__ ({ \

1732 uint32x4x3_t __b = (b); \

1733 uint32x4x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 26); r; })

1734 #define vld3q_lane_s16(__a, b, __c) __extension__ ({ \

1735 int16x8x3_t __b = (b); \

1736 int16x8x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 17); r; })

1737 #define vld3q_lane_s32(__a, b, __c) __extension__ ({ \

1738 int32x4x3_t __b = (b); \

1739 int32x4x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 18); r; })

1740 #define vld3q_lane_f16(__a, b, __c) __extension__ ({ \

1741 float16x8x3_t __b = (b); \

1742 float16x8x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 23); r; })

1743 #define vld3q_lane_f32(__a, b, __c) __extension__ ({ \

1744 float32x4x3_t __b = (b); \

1745 float32x4x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 20); r; })

1746 #define vld3q_lane_p16(__a, b, __c) __extension__ ({ \

1747 poly16x8x3_t __b = (b); \

1748 poly16x8x3_t r; __builtin_neon_vld3q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 22); r; })

1749 #define vld3_lane_u8(__a, b, __c) __extension__ ({ \

1750 uint8x8x3_t __b = (b); \

1751 uint8x8x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 8); r; })

1752 #define vld3_lane_u16(__a, b, __c) __extension__ ({ \

1753 uint16x4x3_t __b = (b); \

1754 uint16x4x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 9); r; })

1755 #define vld3_lane_u32(__a, b, __c) __extension__ ({ \

1756 uint32x2x3_t __b = (b); \

1757 uint32x2x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 10); r; })

1758 #define vld3_lane_s8(__a, b, __c) __extension__ ({ \

1759 int8x8x3_t __b = (b); \

1760 int8x8x3_t r; __builtin_neon_vld3_lane_v(&r, __a, __b.val[0], __b.val[1], __b. val[2], __c, 0); r; })

1761 #define vld3_lane_s16(__a, b, __c) __extension__ ({ \

1762 int16x4x3_t __b = (b); \

1763 int16x4x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 1); r; })

1764 #define vld3_lane_s32(__a, b, __c) __extension__ ({ \

1765 int32x2x3_t __b = (b); \

1766 int32x2x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 2); r; })

1767 #define vld3_lane_f16(__a, b, __c) __extension__ ({ \

1768 float16x4x3_t __b = (b); \

1769 float16x4x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 7); r; })

1770 #define vld3_lane_f32(__a, b, __c) __extension__ ({ \

1771 float32x2x3_t __b = (b); \

1772 float32x2x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 4); r; })

1773 #define vld3_lane_p8(__a, b, __c) __extension__ ({ \

1774 poly8x8x3_t __b = (b); \

1775 poly8x8x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 5); r; })

1776 #define vld3_lane_p16(__a, b, __c) __extension__ ({ \

1777 poly16x4x3_t __b = (b); \

1778 poly16x4x3_t r; __builtin_neon_vld3_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], __c, 6); r; })

1779

1780 #define vld4q_u8(__a) __extension__ ({ \

1781 uint8x16x4_t r; __builtin_neon_vld4q_v(&r, __a, 24); r; })

1782 #define vld4q_u16(__a) __extension__ ({ \

1783 uint16x8x4_t r; __builtin_neon_vld4q_v(&r, __a, 25); r; })

1784 #define vld4q_u32(__a) __extension__ ({ \

1785 uint32x4x4_t r; __builtin_neon_vld4q_v(&r, __a, 26); r; })

1786 #define vld4q_s8(__a) __extension__ ({ \

1787 int8x16x4_t r; __builtin_neon_vld4q_v(&r, __a, 16); r; })

1788 #define vld4q_s16(__a) __extension__ ({ \

1789 int16x8x4_t r; __builtin_neon_vld4q_v(&r, __a, 17); r; })

1790 #define vld4q_s32(__a) __extension__ ({ \

1791 int32x4x4_t r; __builtin_neon_vld4q_v(&r, __a, 18); r; })

1792 #define vld4q_f16(__a) __extension__ ({ \

1793 float16x8x4_t r; __builtin_neon_vld4q_v(&r, __a, 23); r; })

1794 #define vld4q_f32(__a) __extension__ ({ \

1795 float32x4x4_t r; __builtin_neon_vld4q_v(&r, __a, 20); r; })

1796 #define vld4q_p8(__a) __extension__ ({ \

1797 poly8x16x4_t r; __builtin_neon_vld4q_v(&r, __a, 21); r; })

1798 #define vld4q_p16(__a) __extension__ ({ \

1799 poly16x8x4_t r; __builtin_neon_vld4q_v(&r, __a, 22); r; })

1800 #define vld4_u8(__a) __extension__ ({ \

1801 uint8x8x4_t r; __builtin_neon_vld4_v(&r, __a, 8); r; })

1802 #define vld4_u16(__a) __extension__ ({ \

1803 uint16x4x4_t r; __builtin_neon_vld4_v(&r, __a, 9); r; })

1804 #define vld4_u32(__a) __extension__ ({ \

1805 uint32x2x4_t r; __builtin_neon_vld4_v(&r, __a, 10); r; })

1806 #define vld4_u64(__a) __extension__ ({ \

1807 uint64x1x4_t r; __builtin_neon_vld4_v(&r, __a, 11); r; })

1808 #define vld4_s8(__a) __extension__ ({ \

1809 int8x8x4_t r; __builtin_neon_vld4_v(&r, __a, 0); r; })

1810 #define vld4_s16(__a) __extension__ ({ \

1811 int16x4x4_t r; __builtin_neon_vld4_v(&r, __a, 1); r; })

1812 #define vld4_s32(__a) __extension__ ({ \

1813 int32x2x4_t r; __builtin_neon_vld4_v(&r, __a, 2); r; })

1814 #define vld4_s64(__a) __extension__ ({ \

1815 int64x1x4_t r; __builtin_neon_vld4_v(&r, __a, 3); r; })

1816 #define vld4_f16(__a) __extension__ ({ \

1817 float16x4x4_t r; __builtin_neon_vld4_v(&r, __a, 7); r; })

1818 #define vld4_f32(__a) __extension__ ({ \

1819 float32x2x4_t r; __builtin_neon_vld4_v(&r, __a, 4); r; })

1820 #define vld4_p8(__a) __extension__ ({ \

1821 poly8x8x4_t r; __builtin_neon_vld4_v(&r, __a, 5); r; })

1822 #define vld4_p16(__a) __extension__ ({ \

1823 poly16x4x4_t r; __builtin_neon_vld4_v(&r, __a, 6); r; })

1824

1825 #define vld4_dup_u8(__a) __extension__ ({ \

1826 uint8x8x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 8); r; })

1827 #define vld4_dup_u16(__a) __extension__ ({ \

1828 uint16x4x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 9); r; })

1829 #define vld4_dup_u32(__a) __extension__ ({ \

1830 uint32x2x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 10); r; })

1831 #define vld4_dup_u64(__a) __extension__ ({ \

1832 uint64x1x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 11); r; })

1833 #define vld4_dup_s8(__a) __extension__ ({ \

1834 int8x8x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 0); r; })

1835 #define vld4_dup_s16(__a) __extension__ ({ \

1836 int16x4x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 1); r; })

1837 #define vld4_dup_s32(__a) __extension__ ({ \

1838 int32x2x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 2); r; })

1839 #define vld4_dup_s64(__a) __extension__ ({ \

1840 int64x1x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 3); r; })

1841 #define vld4_dup_f16(__a) __extension__ ({ \

1842 float16x4x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 7); r; })

1843 #define vld4_dup_f32(__a) __extension__ ({ \

1844 float32x2x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 4); r; })

1845 #define vld4_dup_p8(__a) __extension__ ({ \

1846 poly8x8x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 5); r; })

1847 #define vld4_dup_p16(__a) __extension__ ({ \

1848 poly16x4x4_t r; __builtin_neon_vld4_dup_v(&r, __a, 6); r; })

1849

1850 #define vld4q_lane_u16(__a, b, __c) __extension__ ({ \

1851 uint16x8x4_t __b = (b); \

1852 uint16x8x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 25); r; })

1853 #define vld4q_lane_u32(__a, b, __c) __extension__ ({ \

1854 uint32x4x4_t __b = (b); \

1855 uint32x4x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 26); r; })

1856 #define vld4q_lane_s16(__a, b, __c) __extension__ ({ \

1857 int16x8x4_t __b = (b); \

1858 int16x8x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 17); r; } )

1859 #define vld4q_lane_s32(__a, b, __c) __extension__ ({ \

1860 int32x4x4_t __b = (b); \

1861 int32x4x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], (in t8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 18); r; } )

1862 #define vld4q_lane_f16(__a, b, __c) __extension__ ({ \

1863 float16x8x4_t __b = (b); \

1864 float16x8x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 23); r; })

1865 #define vld4q_lane_f32(__a, b, __c) __extension__ ({ \

1866 float32x4x4_t __b = (b); \

1867 float32x4x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], ( int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 20); r; })

1868 #define vld4q_lane_p16(__a, b, __c) __extension__ ({ \

1869 poly16x8x4_t __b = (b); \

1870 poly16x8x4_t r; __builtin_neon_vld4q_lane_v(&r, __a, (int8x16_t)__b.val[0], (i nt8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 22); r; })

1871 #define vld4_lane_u8(__a, b, __c) __extension__ ({ \

1872 uint8x8x4_t __b = (b); \

1873 uint8x8x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 8); r; })

1874 #define vld4_lane_u16(__a, b, __c) __extension__ ({ \

1875 uint16x4x4_t __b = (b); \

1876 uint16x4x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 9); r; })

1877 #define vld4_lane_u32(__a, b, __c) __extension__ ({ \

1878 uint32x2x4_t __b = (b); \

1879 uint32x2x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 10); r; })

1880 #define vld4_lane_s8(__a, b, __c) __extension__ ({ \

1881 int8x8x4_t __b = (b); \

1882 int8x8x4_t r; __builtin_neon_vld4_lane_v(&r, __a, __b.val[0], __b.val[1], __b. val[2], __b.val[3], __c, 0); r; })

1883 #define vld4_lane_s16(__a, b, __c) __extension__ ({ \

1884 int16x4x4_t __b = (b); \

1885 int16x4x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 1); r; })

1886 #define vld4_lane_s32(__a, b, __c) __extension__ ({ \

1887 int32x2x4_t __b = (b); \

1888 int32x2x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 2); r; })

1889 #define vld4_lane_f16(__a, b, __c) __extension__ ({ \

1890 float16x4x4_t __b = (b); \

1891 float16x4x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 7); r; })

1892 #define vld4_lane_f32(__a, b, __c) __extension__ ({ \

1893 float32x2x4_t __b = (b); \

1894 float32x2x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (in t8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 4); r; })

1895 #define vld4_lane_p8(__a, b, __c) __extension__ ({ \

1896 poly8x8x4_t __b = (b); \

1897 poly8x8x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int8 x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 5); r; })

1898 #define vld4_lane_p16(__a, b, __c) __extension__ ({ \

1899 poly16x4x4_t __b = (b); \

1900 poly16x4x4_t r; __builtin_neon_vld4_lane_v(&r, __a, (int8x8_t)__b.val[0], (int 8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 6); r; })

1901

1902 __ai int8x8_t vmax_s8(int8x8_t __a, int8x8_t __b) { \

1903 return (int8x8_t)__builtin_neon_vmax_v(__a, __b, 0); }

1904 __ai int16x4_t vmax_s16(int16x4_t __a, int16x4_t __b) { \

1905 return (int16x4_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 1); }

1906 __ai int32x2_t vmax_s32(int32x2_t __a, int32x2_t __b) { \

1907 return (int32x2_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 2); }

1908 __ai uint8x8_t vmax_u8(uint8x8_t __a, uint8x8_t __b) { \

1909 return (uint8x8_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 8); }

1910 __ai uint16x4_t vmax_u16(uint16x4_t __a, uint16x4_t __b) { \

1911 return (uint16x4_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 9); }

1912 __ai uint32x2_t vmax_u32(uint32x2_t __a, uint32x2_t __b) { \

1913 return (uint32x2_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 10); }

1914 __ai float32x2_t vmax_f32(float32x2_t __a, float32x2_t __b) { \

1915 return (float32x2_t)__builtin_neon_vmax_v((int8x8_t)__a, (int8x8_t)__b, 4); }

1916 __ai int8x16_t vmaxq_s8(int8x16_t __a, int8x16_t __b) { \

1917 return (int8x16_t)__builtin_neon_vmaxq_v(__a, __b, 16); }

1918 __ai int16x8_t vmaxq_s16(int16x8_t __a, int16x8_t __b) { \

1919 return (int16x8_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

1920 __ai int32x4_t vmaxq_s32(int32x4_t __a, int32x4_t __b) { \

1921 return (int32x4_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

1922 __ai uint8x16_t vmaxq_u8(uint8x16_t __a, uint8x16_t __b) { \

1923 return (uint8x16_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 24); }

1924 __ai uint16x8_t vmaxq_u16(uint16x8_t __a, uint16x8_t __b) { \

1925 return (uint16x8_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

1926 __ai uint32x4_t vmaxq_u32(uint32x4_t __a, uint32x4_t __b) { \

1927 return (uint32x4_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

1928 __ai float32x4_t vmaxq_f32(float32x4_t __a, float32x4_t __b) { \

1929 return (float32x4_t)__builtin_neon_vmaxq_v((int8x16_t)__a, (int8x16_t)__b, 20) ; }

1930

1931 __ai int8x8_t vmin_s8(int8x8_t __a, int8x8_t __b) { \

1932 return (int8x8_t)__builtin_neon_vmin_v(__a, __b, 0); }

1933 __ai int16x4_t vmin_s16(int16x4_t __a, int16x4_t __b) { \

1934 return (int16x4_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 1); }

1935 __ai int32x2_t vmin_s32(int32x2_t __a, int32x2_t __b) { \

1936 return (int32x2_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 2); }

1937 __ai uint8x8_t vmin_u8(uint8x8_t __a, uint8x8_t __b) { \

1938 return (uint8x8_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 8); }

1939 __ai uint16x4_t vmin_u16(uint16x4_t __a, uint16x4_t __b) { \

1940 return (uint16x4_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 9); }

1941 __ai uint32x2_t vmin_u32(uint32x2_t __a, uint32x2_t __b) { \

1942 return (uint32x2_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 10); }

1943 __ai float32x2_t vmin_f32(float32x2_t __a, float32x2_t __b) { \

1944 return (float32x2_t)__builtin_neon_vmin_v((int8x8_t)__a, (int8x8_t)__b, 4); }

1945 __ai int8x16_t vminq_s8(int8x16_t __a, int8x16_t __b) { \

1946 return (int8x16_t)__builtin_neon_vminq_v(__a, __b, 16); }

1947 __ai int16x8_t vminq_s16(int16x8_t __a, int16x8_t __b) { \

1948 return (int16x8_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

1949 __ai int32x4_t vminq_s32(int32x4_t __a, int32x4_t __b) { \

1950 return (int32x4_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

1951 __ai uint8x16_t vminq_u8(uint8x16_t __a, uint8x16_t __b) { \

1952 return (uint8x16_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 24); }

1953 __ai uint16x8_t vminq_u16(uint16x8_t __a, uint16x8_t __b) { \

1954 return (uint16x8_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

1955 __ai uint32x4_t vminq_u32(uint32x4_t __a, uint32x4_t __b) { \

1956 return (uint32x4_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

1957 __ai float32x4_t vminq_f32(float32x4_t __a, float32x4_t __b) { \

1958 return (float32x4_t)__builtin_neon_vminq_v((int8x16_t)__a, (int8x16_t)__b, 20) ; }

1959

1960 __ai int8x8_t vmla_s8(int8x8_t __a, int8x8_t __b, int8x8_t __c) { \

1961 return __a + (__b * __c); }

1962 __ai int16x4_t vmla_s16(int16x4_t __a, int16x4_t __b, int16x4_t __c) { \

1963 return __a + (__b * __c); }

1964 __ai int32x2_t vmla_s32(int32x2_t __a, int32x2_t __b, int32x2_t __c) { \

1965 return __a + (__b * __c); }

1966 __ai float32x2_t vmla_f32(float32x2_t __a, float32x2_t __b, float32x2_t __c) { \

1967 return __a + (__b * __c); }

1968 __ai uint8x8_t vmla_u8(uint8x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

1969 return __a + (__b * __c); }

1970 __ai uint16x4_t vmla_u16(uint16x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

1971 return __a + (__b * __c); }

1972 __ai uint32x2_t vmla_u32(uint32x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

1973 return __a + (__b * __c); }

1974 __ai int8x16_t vmlaq_s8(int8x16_t __a, int8x16_t __b, int8x16_t __c) { \

1975 return __a + (__b * __c); }

1976 __ai int16x8_t vmlaq_s16(int16x8_t __a, int16x8_t __b, int16x8_t __c) { \

1977 return __a + (__b * __c); }

1978 __ai int32x4_t vmlaq_s32(int32x4_t __a, int32x4_t __b, int32x4_t __c) { \

1979 return __a + (__b * __c); }

1980 __ai float32x4_t vmlaq_f32(float32x4_t __a, float32x4_t __b, float32x4_t __c) { \

1981 return __a + (__b * __c); }

1982 __ai uint8x16_t vmlaq_u8(uint8x16_t __a, uint8x16_t __b, uint8x16_t __c) { \

1983 return __a + (__b * __c); }

1984 __ai uint16x8_t vmlaq_u16(uint16x8_t __a, uint16x8_t __b, uint16x8_t __c) { \

1985 return __a + (__b * __c); }

1986 __ai uint32x4_t vmlaq_u32(uint32x4_t __a, uint32x4_t __b, uint32x4_t __c) { \

1987 return __a + (__b * __c); }

1988

1989 __ai int16x8_t vmlal_s8(int16x8_t __a, int8x8_t __b, int8x8_t __c) { \

1990 return __a + vmull_s8(__b, __c); }

1991 __ai int32x4_t vmlal_s16(int32x4_t __a, int16x4_t __b, int16x4_t __c) { \

1992 return __a + vmull_s16(__b, __c); }

1993 __ai int64x2_t vmlal_s32(int64x2_t __a, int32x2_t __b, int32x2_t __c) { \

1994 return __a + vmull_s32(__b, __c); }

1995 __ai uint16x8_t vmlal_u8(uint16x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

1996 return __a + vmull_u8(__b, __c); }

1997 __ai uint32x4_t vmlal_u16(uint32x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

1998 return __a + vmull_u16(__b, __c); }

1999 __ai uint64x2_t vmlal_u32(uint64x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

2000 return __a + vmull_u32(__b, __c); }

2001

2002 #define vmlal_lane_s16(a, b, c, __d) __extension__ ({ \

2003 int32x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2004 __a + vmull_s16(__b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); } )

2005 #define vmlal_lane_s32(a, b, c, __d) __extension__ ({ \

2006 int64x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2007 __a + vmull_s32(__b, __builtin_shufflevector(__c, __c, __d, __d)); })

2008 #define vmlal_lane_u16(a, b, c, __d) __extension__ ({ \

2009 uint32x4_t __a = (a); uint16x4_t __b = (b); uint16x4_t __c = (c); \

2010 __a + vmull_u16(__b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); } )

2011 #define vmlal_lane_u32(a, b, c, __d) __extension__ ({ \

2012 uint64x2_t __a = (a); uint32x2_t __b = (b); uint32x2_t __c = (c); \

2013 __a + vmull_u32(__b, __builtin_shufflevector(__c, __c, __d, __d)); })

2014

2015 __ai int32x4_t vmlal_n_s16(int32x4_t __a, int16x4_t __b, int16_t __c) { \

2016 return __a + vmull_s16(__b, (int16x4_t){ __c, __c, __c, __c }); }

2017 __ai int64x2_t vmlal_n_s32(int64x2_t __a, int32x2_t __b, int32_t __c) { \

2018 return __a + vmull_s32(__b, (int32x2_t){ __c, __c }); }

2019 __ai uint32x4_t vmlal_n_u16(uint32x4_t __a, uint16x4_t __b, uint16_t __c) { \

2020 return __a + vmull_u16(__b, (uint16x4_t){ __c, __c, __c, __c }); }

2021 __ai uint64x2_t vmlal_n_u32(uint64x2_t __a, uint32x2_t __b, uint32_t __c) { \

2022 return __a + vmull_u32(__b, (uint32x2_t){ __c, __c }); }

2023

2024 #define vmla_lane_s16(a, b, c, __d) __extension__ ({ \

2025 int16x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2026 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2027 #define vmla_lane_s32(a, b, c, __d) __extension__ ({ \

2028 int32x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2029 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2030 #define vmla_lane_u16(a, b, c, __d) __extension__ ({ \

2031 uint16x4_t __a = (a); uint16x4_t __b = (b); uint16x4_t __c = (c); \

2032 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2033 #define vmla_lane_u32(a, b, c, __d) __extension__ ({ \

2034 uint32x2_t __a = (a); uint32x2_t __b = (b); uint32x2_t __c = (c); \

2035 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2036 #define vmla_lane_f32(a, b, c, __d) __extension__ ({ \

2037 float32x2_t __a = (a); float32x2_t __b = (b); float32x2_t __c = (c); \

2038 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2039 #define vmlaq_lane_s16(a, b, c, __d) __extension__ ({ \

2040 int16x8_t __a = (a); int16x8_t __b = (b); int16x4_t __c = (c); \

2041 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d, __d, __d, _ _d, __d)); })

2042 #define vmlaq_lane_s32(a, b, c, __d) __extension__ ({ \

2043 int32x4_t __a = (a); int32x4_t __b = (b); int32x2_t __c = (c); \

2044 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2045 #define vmlaq_lane_u16(a, b, c, __d) __extension__ ({ \

2046 uint16x8_t __a = (a); uint16x8_t __b = (b); uint16x4_t __c = (c); \

2047 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d, __d, __d, _ _d, __d)); })

2048 #define vmlaq_lane_u32(a, b, c, __d) __extension__ ({ \

2049 uint32x4_t __a = (a); uint32x4_t __b = (b); uint32x2_t __c = (c); \

2050 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2051 #define vmlaq_lane_f32(a, b, c, __d) __extension__ ({ \

2052 float32x4_t __a = (a); float32x4_t __b = (b); float32x2_t __c = (c); \

2053 __a + (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2054

2055 __ai int16x4_t vmla_n_s16(int16x4_t __a, int16x4_t __b, int16_t __c) { \

2056 return __a + (__b * (int16x4_t){ __c, __c, __c, __c }); }

2057 __ai int32x2_t vmla_n_s32(int32x2_t __a, int32x2_t __b, int32_t __c) { \

2058 return __a + (__b * (int32x2_t){ __c, __c }); }

2059 __ai uint16x4_t vmla_n_u16(uint16x4_t __a, uint16x4_t __b, uint16_t __c) { \

2060 return __a + (__b * (uint16x4_t){ __c, __c, __c, __c }); }

2061 __ai uint32x2_t vmla_n_u32(uint32x2_t __a, uint32x2_t __b, uint32_t __c) { \

2062 return __a + (__b * (uint32x2_t){ __c, __c }); }

2063 __ai float32x2_t vmla_n_f32(float32x2_t __a, float32x2_t __b, float32_t __c) { \

2064 return __a + (__b * (float32x2_t){ __c, __c }); }

2065 __ai int16x8_t vmlaq_n_s16(int16x8_t __a, int16x8_t __b, int16_t __c) { \

2066 return __a + (__b * (int16x8_t){ __c, __c, __c, __c, __c, __c, __c, __c }); }

2067 __ai int32x4_t vmlaq_n_s32(int32x4_t __a, int32x4_t __b, int32_t __c) { \

2068 return __a + (__b * (int32x4_t){ __c, __c, __c, __c }); }

2069 __ai uint16x8_t vmlaq_n_u16(uint16x8_t __a, uint16x8_t __b, uint16_t __c) { \

2070 return __a + (__b * (uint16x8_t){ __c, __c, __c, __c, __c, __c, __c, __c }); }

2071 __ai uint32x4_t vmlaq_n_u32(uint32x4_t __a, uint32x4_t __b, uint32_t __c) { \

2072 return __a + (__b * (uint32x4_t){ __c, __c, __c, __c }); }

2073 __ai float32x4_t vmlaq_n_f32(float32x4_t __a, float32x4_t __b, float32_t __c) { \

2074 return __a + (__b * (float32x4_t){ __c, __c, __c, __c }); }

2075

2076 __ai int8x8_t vmls_s8(int8x8_t __a, int8x8_t __b, int8x8_t __c) { \

2077 return __a - (__b * __c); }

2078 __ai int16x4_t vmls_s16(int16x4_t __a, int16x4_t __b, int16x4_t __c) { \

2079 return __a - (__b * __c); }

2080 __ai int32x2_t vmls_s32(int32x2_t __a, int32x2_t __b, int32x2_t __c) { \

2081 return __a - (__b * __c); }

2082 __ai float32x2_t vmls_f32(float32x2_t __a, float32x2_t __b, float32x2_t __c) { \

2083 return __a - (__b * __c); }

2084 __ai uint8x8_t vmls_u8(uint8x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

2085 return __a - (__b * __c); }

2086 __ai uint16x4_t vmls_u16(uint16x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

2087 return __a - (__b * __c); }

2088 __ai uint32x2_t vmls_u32(uint32x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

2089 return __a - (__b * __c); }

2090 __ai int8x16_t vmlsq_s8(int8x16_t __a, int8x16_t __b, int8x16_t __c) { \

2091 return __a - (__b * __c); }

2092 __ai int16x8_t vmlsq_s16(int16x8_t __a, int16x8_t __b, int16x8_t __c) { \

2093 return __a - (__b * __c); }

2094 __ai int32x4_t vmlsq_s32(int32x4_t __a, int32x4_t __b, int32x4_t __c) { \

2095 return __a - (__b * __c); }

2096 __ai float32x4_t vmlsq_f32(float32x4_t __a, float32x4_t __b, float32x4_t __c) { \

2097 return __a - (__b * __c); }

2098 __ai uint8x16_t vmlsq_u8(uint8x16_t __a, uint8x16_t __b, uint8x16_t __c) { \

2099 return __a - (__b * __c); }

2100 __ai uint16x8_t vmlsq_u16(uint16x8_t __a, uint16x8_t __b, uint16x8_t __c) { \

2101 return __a - (__b * __c); }

2102 __ai uint32x4_t vmlsq_u32(uint32x4_t __a, uint32x4_t __b, uint32x4_t __c) { \

2103 return __a - (__b * __c); }

2104

2105 __ai int16x8_t vmlsl_s8(int16x8_t __a, int8x8_t __b, int8x8_t __c) { \

2106 return __a - vmull_s8(__b, __c); }

2107 __ai int32x4_t vmlsl_s16(int32x4_t __a, int16x4_t __b, int16x4_t __c) { \

2108 return __a - vmull_s16(__b, __c); }

2109 __ai int64x2_t vmlsl_s32(int64x2_t __a, int32x2_t __b, int32x2_t __c) { \

2110 return __a - vmull_s32(__b, __c); }

2111 __ai uint16x8_t vmlsl_u8(uint16x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

2112 return __a - vmull_u8(__b, __c); }

2113 __ai uint32x4_t vmlsl_u16(uint32x4_t __a, uint16x4_t __b, uint16x4_t __c) { \

2114 return __a - vmull_u16(__b, __c); }

2115 __ai uint64x2_t vmlsl_u32(uint64x2_t __a, uint32x2_t __b, uint32x2_t __c) { \

2116 return __a - vmull_u32(__b, __c); }

2117

2118 #define vmlsl_lane_s16(a, b, c, __d) __extension__ ({ \

2119 int32x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2120 __a - vmull_s16(__b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); } )

2121 #define vmlsl_lane_s32(a, b, c, __d) __extension__ ({ \

2122 int64x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2123 __a - vmull_s32(__b, __builtin_shufflevector(__c, __c, __d, __d)); })

2124 #define vmlsl_lane_u16(a, b, c, __d) __extension__ ({ \

2125 uint32x4_t __a = (a); uint16x4_t __b = (b); uint16x4_t __c = (c); \

2126 __a - vmull_u16(__b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); } )

2127 #define vmlsl_lane_u32(a, b, c, __d) __extension__ ({ \

2128 uint64x2_t __a = (a); uint32x2_t __b = (b); uint32x2_t __c = (c); \

2129 __a - vmull_u32(__b, __builtin_shufflevector(__c, __c, __d, __d)); })

2130

2131 __ai int32x4_t vmlsl_n_s16(int32x4_t __a, int16x4_t __b, int16_t __c) { \

2132 return __a - vmull_s16(__b, (int16x4_t){ __c, __c, __c, __c }); }

2133 __ai int64x2_t vmlsl_n_s32(int64x2_t __a, int32x2_t __b, int32_t __c) { \

2134 return __a - vmull_s32(__b, (int32x2_t){ __c, __c }); }

2135 __ai uint32x4_t vmlsl_n_u16(uint32x4_t __a, uint16x4_t __b, uint16_t __c) { \

2136 return __a - vmull_u16(__b, (uint16x4_t){ __c, __c, __c, __c }); }

2137 __ai uint64x2_t vmlsl_n_u32(uint64x2_t __a, uint32x2_t __b, uint32_t __c) { \

2138 return __a - vmull_u32(__b, (uint32x2_t){ __c, __c }); }

2139

2140 #define vmls_lane_s16(a, b, c, __d) __extension__ ({ \

2141 int16x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2142 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2143 #define vmls_lane_s32(a, b, c, __d) __extension__ ({ \

2144 int32x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2145 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2146 #define vmls_lane_u16(a, b, c, __d) __extension__ ({ \

2147 uint16x4_t __a = (a); uint16x4_t __b = (b); uint16x4_t __c = (c); \

2148 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2149 #define vmls_lane_u32(a, b, c, __d) __extension__ ({ \

2150 uint32x2_t __a = (a); uint32x2_t __b = (b); uint32x2_t __c = (c); \

2151 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2152 #define vmls_lane_f32(a, b, c, __d) __extension__ ({ \

2153 float32x2_t __a = (a); float32x2_t __b = (b); float32x2_t __c = (c); \

2154 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d)); })

2155 #define vmlsq_lane_s16(a, b, c, __d) __extension__ ({ \

2156 int16x8_t __a = (a); int16x8_t __b = (b); int16x4_t __c = (c); \

2157 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d, __d, __d, _ _d, __d)); })

2158 #define vmlsq_lane_s32(a, b, c, __d) __extension__ ({ \

2159 int32x4_t __a = (a); int32x4_t __b = (b); int32x2_t __c = (c); \

2160 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2161 #define vmlsq_lane_u16(a, b, c, __d) __extension__ ({ \

2162 uint16x8_t __a = (a); uint16x8_t __b = (b); uint16x4_t __c = (c); \

2163 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d, __d, __d, _ _d, __d)); })

2164 #define vmlsq_lane_u32(a, b, c, __d) __extension__ ({ \

2165 uint32x4_t __a = (a); uint32x4_t __b = (b); uint32x2_t __c = (c); \

2166 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2167 #define vmlsq_lane_f32(a, b, c, __d) __extension__ ({ \

2168 float32x4_t __a = (a); float32x4_t __b = (b); float32x2_t __c = (c); \

2169 __a - (__b * __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2170

2171 __ai int16x4_t vmls_n_s16(int16x4_t __a, int16x4_t __b, int16_t __c) { \

2172 return __a - (__b * (int16x4_t){ __c, __c, __c, __c }); }

2173 __ai int32x2_t vmls_n_s32(int32x2_t __a, int32x2_t __b, int32_t __c) { \

2174 return __a - (__b * (int32x2_t){ __c, __c }); }

2175 __ai uint16x4_t vmls_n_u16(uint16x4_t __a, uint16x4_t __b, uint16_t __c) { \

2176 return __a - (__b * (uint16x4_t){ __c, __c, __c, __c }); }

2177 __ai uint32x2_t vmls_n_u32(uint32x2_t __a, uint32x2_t __b, uint32_t __c) { \

2178 return __a - (__b * (uint32x2_t){ __c, __c }); }

2179 __ai float32x2_t vmls_n_f32(float32x2_t __a, float32x2_t __b, float32_t __c) { \

2180 return __a - (__b * (float32x2_t){ __c, __c }); }

2181 __ai int16x8_t vmlsq_n_s16(int16x8_t __a, int16x8_t __b, int16_t __c) { \

2182 return __a - (__b * (int16x8_t){ __c, __c, __c, __c, __c, __c, __c, __c }); }

2183 __ai int32x4_t vmlsq_n_s32(int32x4_t __a, int32x4_t __b, int32_t __c) { \

2184 return __a - (__b * (int32x4_t){ __c, __c, __c, __c }); }

2185 __ai uint16x8_t vmlsq_n_u16(uint16x8_t __a, uint16x8_t __b, uint16_t __c) { \

2186 return __a - (__b * (uint16x8_t){ __c, __c, __c, __c, __c, __c, __c, __c }); }

2187 __ai uint32x4_t vmlsq_n_u32(uint32x4_t __a, uint32x4_t __b, uint32_t __c) { \

2188 return __a - (__b * (uint32x4_t){ __c, __c, __c, __c }); }

2189 __ai float32x4_t vmlsq_n_f32(float32x4_t __a, float32x4_t __b, float32_t __c) { \

2190 return __a - (__b * (float32x4_t){ __c, __c, __c, __c }); }

2191

2192 __ai int8x8_t vmovn_s16(int16x8_t __a) { \

2193 return (int8x8_t)__builtin_neon_vmovn_v((int8x16_t)__a, 0); }

2194 __ai int16x4_t vmovn_s32(int32x4_t __a) { \

2195 return (int16x4_t)__builtin_neon_vmovn_v((int8x16_t)__a, 1); }

2196 __ai int32x2_t vmovn_s64(int64x2_t __a) { \

2197 return (int32x2_t)__builtin_neon_vmovn_v((int8x16_t)__a, 2); }

2198 __ai uint8x8_t vmovn_u16(uint16x8_t __a) { \

2199 return (uint8x8_t)__builtin_neon_vmovn_v((int8x16_t)__a, 8); }

2200 __ai uint16x4_t vmovn_u32(uint32x4_t __a) { \

2201 return (uint16x4_t)__builtin_neon_vmovn_v((int8x16_t)__a, 9); }

2202 __ai uint32x2_t vmovn_u64(uint64x2_t __a) { \

2203 return (uint32x2_t)__builtin_neon_vmovn_v((int8x16_t)__a, 10); }

2204

2205 __ai uint8x8_t vmov_n_u8(uint8_t __a) { \

2206 return (uint8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2207 __ai uint16x4_t vmov_n_u16(uint16_t __a) { \

2208 return (uint16x4_t){ __a, __a, __a, __a }; }

2209 __ai uint32x2_t vmov_n_u32(uint32_t __a) { \

2210 return (uint32x2_t){ __a, __a }; }

2211 __ai int8x8_t vmov_n_s8(int8_t __a) { \

2212 return (int8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2213 __ai int16x4_t vmov_n_s16(int16_t __a) { \

2214 return (int16x4_t){ __a, __a, __a, __a }; }

2215 __ai int32x2_t vmov_n_s32(int32_t __a) { \

2216 return (int32x2_t){ __a, __a }; }

2217 __ai poly8x8_t vmov_n_p8(poly8_t __a) { \

2218 return (poly8x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2219 __ai poly16x4_t vmov_n_p16(poly16_t __a) { \

2220 return (poly16x4_t){ __a, __a, __a, __a }; }

2221 __ai float32x2_t vmov_n_f32(float32_t __a) { \

2222 return (float32x2_t){ __a, __a }; }

2223 __ai uint8x16_t vmovq_n_u8(uint8_t __a) { \

2224 return (uint8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __ a, __a, __a, __a, __a }; }

2225 __ai uint16x8_t vmovq_n_u16(uint16_t __a) { \

2226 return (uint16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2227 __ai uint32x4_t vmovq_n_u32(uint32_t __a) { \

2228 return (uint32x4_t){ __a, __a, __a, __a }; }

2229 __ai int8x16_t vmovq_n_s8(int8_t __a) { \

2230 return (int8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a , __a, __a, __a, __a }; }

2231 __ai int16x8_t vmovq_n_s16(int16_t __a) { \

2232 return (int16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2233 __ai int32x4_t vmovq_n_s32(int32_t __a) { \

2234 return (int32x4_t){ __a, __a, __a, __a }; }

2235 __ai poly8x16_t vmovq_n_p8(poly8_t __a) { \

2236 return (poly8x16_t){ __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __a, __ a, __a, __a, __a, __a }; }

2237 __ai poly16x8_t vmovq_n_p16(poly16_t __a) { \

2238 return (poly16x8_t){ __a, __a, __a, __a, __a, __a, __a, __a }; }

2239 __ai float32x4_t vmovq_n_f32(float32_t __a) { \

2240 return (float32x4_t){ __a, __a, __a, __a }; }

2241 __ai int64x1_t vmov_n_s64(int64_t __a) { \

2242 return (int64x1_t){ __a }; }

2243 __ai uint64x1_t vmov_n_u64(uint64_t __a) { \

2244 return (uint64x1_t){ __a }; }

2245 __ai int64x2_t vmovq_n_s64(int64_t __a) { \

2246 return (int64x2_t){ __a, __a }; }

2247 __ai uint64x2_t vmovq_n_u64(uint64_t __a) { \

2248 return (uint64x2_t){ __a, __a }; }

2249

2250 __ai int8x8_t vmul_s8(int8x8_t __a, int8x8_t __b) { \

2251 return __a * __b; }

2252 __ai int16x4_t vmul_s16(int16x4_t __a, int16x4_t __b) { \

2253 return __a * __b; }

2254 __ai int32x2_t vmul_s32(int32x2_t __a, int32x2_t __b) { \

2255 return __a * __b; }

2256 __ai float32x2_t vmul_f32(float32x2_t __a, float32x2_t __b) { \

2257 return __a * __b; }

2258 __ai uint8x8_t vmul_u8(uint8x8_t __a, uint8x8_t __b) { \

2259 return __a * __b; }

2260 __ai uint16x4_t vmul_u16(uint16x4_t __a, uint16x4_t __b) { \

2261 return __a * __b; }

2262 __ai uint32x2_t vmul_u32(uint32x2_t __a, uint32x2_t __b) { \

2263 return __a * __b; }

2264 __ai int8x16_t vmulq_s8(int8x16_t __a, int8x16_t __b) { \

2265 return __a * __b; }

2266 __ai int16x8_t vmulq_s16(int16x8_t __a, int16x8_t __b) { \

2267 return __a * __b; }

2268 __ai int32x4_t vmulq_s32(int32x4_t __a, int32x4_t __b) { \

2269 return __a * __b; }

2270 __ai float32x4_t vmulq_f32(float32x4_t __a, float32x4_t __b) { \

2271 return __a * __b; }

2272 __ai uint8x16_t vmulq_u8(uint8x16_t __a, uint8x16_t __b) { \

2273 return __a * __b; }

2274 __ai uint16x8_t vmulq_u16(uint16x8_t __a, uint16x8_t __b) { \

2275 return __a * __b; }

2276 __ai uint32x4_t vmulq_u32(uint32x4_t __a, uint32x4_t __b) { \

2277 return __a * __b; }

2278

2279 #define vmull_lane_s16(a, b, __c) __extension__ ({ \

2280 int16x4_t __a = (a); int16x4_t __b = (b); \

2281 vmull_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2282 #define vmull_lane_s32(a, b, __c) __extension__ ({ \

2283 int32x2_t __a = (a); int32x2_t __b = (b); \

2284 vmull_s32(__a, __builtin_shufflevector(__b, __b, __c, __c)); })

2285 #define vmull_lane_u16(a, b, __c) __extension__ ({ \

2286 uint16x4_t __a = (a); uint16x4_t __b = (b); \

2287 vmull_u16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2288 #define vmull_lane_u32(a, b, __c) __extension__ ({ \

2289 uint32x2_t __a = (a); uint32x2_t __b = (b); \

2290 vmull_u32(__a, __builtin_shufflevector(__b, __b, __c, __c)); })

2291

2292 __ai int32x4_t vmull_n_s16(int16x4_t __a, int16_t __b) { \

2293 return (int32x4_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)(int16x4_t){ __b, __b, __b, __b }, 18); }

2294 __ai int64x2_t vmull_n_s32(int32x2_t __a, int32_t __b) { \

2295 return (int64x2_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)(int32x2_t){ __b, __b }, 19); }

2296 __ai uint32x4_t vmull_n_u16(uint16x4_t __a, uint16_t __b) { \

2297 return (uint32x4_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)(uint16x4_t ){ __b, __b, __b, __b }, 26); }

2298 __ai uint64x2_t vmull_n_u32(uint32x2_t __a, uint32_t __b) { \

2299 return (uint64x2_t)__builtin_neon_vmull_v((int8x8_t)__a, (int8x8_t)(uint32x2_t ){ __b, __b }, 27); }

2300

2301 __ai poly8x8_t vmul_p8(poly8x8_t __a, poly8x8_t __b) { \

2302 return (poly8x8_t)__builtin_neon_vmul_v((int8x8_t)__a, (int8x8_t)__b, 5); }

2303 __ai poly8x16_t vmulq_p8(poly8x16_t __a, poly8x16_t __b) { \

2304 return (poly8x16_t)__builtin_neon_vmulq_v((int8x16_t)__a, (int8x16_t)__b, 21); }

2305

2306 #define vmul_lane_s16(a, b, __c) __extension__ ({ \

2307 int16x4_t __a = (a); int16x4_t __b = (b); \

2308 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c); })

2309 #define vmul_lane_s32(a, b, __c) __extension__ ({ \

2310 int32x2_t __a = (a); int32x2_t __b = (b); \

2311 __a * __builtin_shufflevector(__b, __b, __c, __c); })

2312 #define vmul_lane_f32(a, b, __c) __extension__ ({ \

2313 float32x2_t __a = (a); float32x2_t __b = (b); \

2314 __a * __builtin_shufflevector(__b, __b, __c, __c); })

2315 #define vmul_lane_u16(a, b, __c) __extension__ ({ \

2316 uint16x4_t __a = (a); uint16x4_t __b = (b); \

2317 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c); })

2318 #define vmul_lane_u32(a, b, __c) __extension__ ({ \

2319 uint32x2_t __a = (a); uint32x2_t __b = (b); \

2320 __a * __builtin_shufflevector(__b, __b, __c, __c); })

2321 #define vmulq_lane_s16(a, b, __c) __extension__ ({ \

2322 int16x8_t __a = (a); int16x4_t __b = (b); \

2323 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c, __c, __c, __c, __c ); })

2324 #define vmulq_lane_s32(a, b, __c) __extension__ ({ \

2325 int32x4_t __a = (a); int32x2_t __b = (b); \

2326 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c); })

2327 #define vmulq_lane_f32(a, b, __c) __extension__ ({ \

2328 float32x4_t __a = (a); float32x2_t __b = (b); \

2329 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c); })

2330 #define vmulq_lane_u16(a, b, __c) __extension__ ({ \

2331 uint16x8_t __a = (a); uint16x4_t __b = (b); \

2332 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c, __c, __c, __c, __c ); })

2333 #define vmulq_lane_u32(a, b, __c) __extension__ ({ \

2334 uint32x4_t __a = (a); uint32x2_t __b = (b); \

2335 __a * __builtin_shufflevector(__b, __b, __c, __c, __c, __c); })

2336

2337 __ai int16x4_t vmul_n_s16(int16x4_t __a, int16_t __b) { \

2338 return __a * (int16x4_t){ __b, __b, __b, __b }; }

2339 __ai int32x2_t vmul_n_s32(int32x2_t __a, int32_t __b) { \

2340 return __a * (int32x2_t){ __b, __b }; }

2341 __ai float32x2_t vmul_n_f32(float32x2_t __a, float32_t __b) { \

2342 return __a * (float32x2_t){ __b, __b }; }

2343 __ai uint16x4_t vmul_n_u16(uint16x4_t __a, uint16_t __b) { \

2344 return __a * (uint16x4_t){ __b, __b, __b, __b }; }

2345 __ai uint32x2_t vmul_n_u32(uint32x2_t __a, uint32_t __b) { \

2346 return __a * (uint32x2_t){ __b, __b }; }

2347 __ai int16x8_t vmulq_n_s16(int16x8_t __a, int16_t __b) { \

2348 return __a * (int16x8_t){ __b, __b, __b, __b, __b, __b, __b, __b }; }

2349 __ai int32x4_t vmulq_n_s32(int32x4_t __a, int32_t __b) { \

2350 return __a * (int32x4_t){ __b, __b, __b, __b }; }

2351 __ai float32x4_t vmulq_n_f32(float32x4_t __a, float32_t __b) { \

2352 return __a * (float32x4_t){ __b, __b, __b, __b }; }

2353 __ai uint16x8_t vmulq_n_u16(uint16x8_t __a, uint16_t __b) { \

2354 return __a * (uint16x8_t){ __b, __b, __b, __b, __b, __b, __b, __b }; }

2355 __ai uint32x4_t vmulq_n_u32(uint32x4_t __a, uint32_t __b) { \

2356 return __a * (uint32x4_t){ __b, __b, __b, __b }; }

2357

2358 __ai int8x8_t vmvn_s8(int8x8_t __a) { \

2359 return ~__a; }

2360 __ai int16x4_t vmvn_s16(int16x4_t __a) { \

2361 return ~__a; }

2362 __ai int32x2_t vmvn_s32(int32x2_t __a) { \

2363 return ~__a; }

2364 __ai uint8x8_t vmvn_u8(uint8x8_t __a) { \

2365 return ~__a; }

2366 __ai uint16x4_t vmvn_u16(uint16x4_t __a) { \

2367 return ~__a; }

2368 __ai uint32x2_t vmvn_u32(uint32x2_t __a) { \

2369 return ~__a; }

2370 __ai poly8x8_t vmvn_p8(poly8x8_t __a) { \

2371 return ~__a; }

2372 __ai int8x16_t vmvnq_s8(int8x16_t __a) { \

2373 return ~__a; }

2374 __ai int16x8_t vmvnq_s16(int16x8_t __a) { \

2375 return ~__a; }

2376 __ai int32x4_t vmvnq_s32(int32x4_t __a) { \

2377 return ~__a; }

2378 __ai uint8x16_t vmvnq_u8(uint8x16_t __a) { \

2379 return ~__a; }

2380 __ai uint16x8_t vmvnq_u16(uint16x8_t __a) { \

2381 return ~__a; }

2382 __ai uint32x4_t vmvnq_u32(uint32x4_t __a) { \

2383 return ~__a; }

2384 __ai poly8x16_t vmvnq_p8(poly8x16_t __a) { \

2385 return ~__a; }

2386

2387 __ai int8x8_t vneg_s8(int8x8_t __a) { \

2388 return -__a; }

2389 __ai int16x4_t vneg_s16(int16x4_t __a) { \

2390 return -__a; }

2391 __ai int32x2_t vneg_s32(int32x2_t __a) { \

2392 return -__a; }

2393 __ai float32x2_t vneg_f32(float32x2_t __a) { \

2394 return -__a; }

2395 __ai int8x16_t vnegq_s8(int8x16_t __a) { \

2396 return -__a; }

2397 __ai int16x8_t vnegq_s16(int16x8_t __a) { \

2398 return -__a; }

2399 __ai int32x4_t vnegq_s32(int32x4_t __a) { \

2400 return -__a; }

2401 __ai float32x4_t vnegq_f32(float32x4_t __a) { \

2402 return -__a; }

2403

2404 __ai int8x8_t vorn_s8(int8x8_t __a, int8x8_t __b) { \

2405 return __a \| ~__b; }

2406 __ai int16x4_t vorn_s16(int16x4_t __a, int16x4_t __b) { \

2407 return __a \| ~__b; }

2408 __ai int32x2_t vorn_s32(int32x2_t __a, int32x2_t __b) { \

2409 return __a \| ~__b; }

2410 __ai int64x1_t vorn_s64(int64x1_t __a, int64x1_t __b) { \

2411 return __a \| ~__b; }

2412 __ai uint8x8_t vorn_u8(uint8x8_t __a, uint8x8_t __b) { \

2413 return __a \| ~__b; }

2414 __ai uint16x4_t vorn_u16(uint16x4_t __a, uint16x4_t __b) { \

2415 return __a \| ~__b; }

2416 __ai uint32x2_t vorn_u32(uint32x2_t __a, uint32x2_t __b) { \

2417 return __a \| ~__b; }

2418 __ai uint64x1_t vorn_u64(uint64x1_t __a, uint64x1_t __b) { \

2419 return __a \| ~__b; }

2420 __ai int8x16_t vornq_s8(int8x16_t __a, int8x16_t __b) { \

2421 return __a \| ~__b; }

2422 __ai int16x8_t vornq_s16(int16x8_t __a, int16x8_t __b) { \

2423 return __a \| ~__b; }

2424 __ai int32x4_t vornq_s32(int32x4_t __a, int32x4_t __b) { \

2425 return __a \| ~__b; }

2426 __ai int64x2_t vornq_s64(int64x2_t __a, int64x2_t __b) { \

2427 return __a \| ~__b; }

2428 __ai uint8x16_t vornq_u8(uint8x16_t __a, uint8x16_t __b) { \

2429 return __a \| ~__b; }

2430 __ai uint16x8_t vornq_u16(uint16x8_t __a, uint16x8_t __b) { \

2431 return __a \| ~__b; }

2432 __ai uint32x4_t vornq_u32(uint32x4_t __a, uint32x4_t __b) { \

2433 return __a \| ~__b; }

2434 __ai uint64x2_t vornq_u64(uint64x2_t __a, uint64x2_t __b) { \

2435 return __a \| ~__b; }

2436

2437 __ai int8x8_t vorr_s8(int8x8_t __a, int8x8_t __b) { \

2438 return __a \| __b; }

2439 __ai int16x4_t vorr_s16(int16x4_t __a, int16x4_t __b) { \

2440 return __a \| __b; }

2441 __ai int32x2_t vorr_s32(int32x2_t __a, int32x2_t __b) { \

2442 return __a \| __b; }

2443 __ai int64x1_t vorr_s64(int64x1_t __a, int64x1_t __b) { \

2444 return __a \| __b; }

2445 __ai uint8x8_t vorr_u8(uint8x8_t __a, uint8x8_t __b) { \

2446 return __a \| __b; }

2447 __ai uint16x4_t vorr_u16(uint16x4_t __a, uint16x4_t __b) { \

2448 return __a \| __b; }

2449 __ai uint32x2_t vorr_u32(uint32x2_t __a, uint32x2_t __b) { \

2450 return __a \| __b; }

2451 __ai uint64x1_t vorr_u64(uint64x1_t __a, uint64x1_t __b) { \

2452 return __a \| __b; }

2453 __ai int8x16_t vorrq_s8(int8x16_t __a, int8x16_t __b) { \

2454 return __a \| __b; }

2455 __ai int16x8_t vorrq_s16(int16x8_t __a, int16x8_t __b) { \

2456 return __a \| __b; }

2457 __ai int32x4_t vorrq_s32(int32x4_t __a, int32x4_t __b) { \

2458 return __a \| __b; }

2459 __ai int64x2_t vorrq_s64(int64x2_t __a, int64x2_t __b) { \

2460 return __a \| __b; }

2461 __ai uint8x16_t vorrq_u8(uint8x16_t __a, uint8x16_t __b) { \

2462 return __a \| __b; }

2463 __ai uint16x8_t vorrq_u16(uint16x8_t __a, uint16x8_t __b) { \

2464 return __a \| __b; }

2465 __ai uint32x4_t vorrq_u32(uint32x4_t __a, uint32x4_t __b) { \

2466 return __a \| __b; }

2467 __ai uint64x2_t vorrq_u64(uint64x2_t __a, uint64x2_t __b) { \

2468 return __a \| __b; }

2469

2470 __ai int16x4_t vpadal_s8(int16x4_t __a, int8x8_t __b) { \

2471 return (int16x4_t)__builtin_neon_vpadal_v((int8x8_t)__a, __b, 1); }

2472 __ai int32x2_t vpadal_s16(int32x2_t __a, int16x4_t __b) { \

2473 return (int32x2_t)__builtin_neon_vpadal_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2474 __ai int64x1_t vpadal_s32(int64x1_t __a, int32x2_t __b) { \

2475 return (int64x1_t)__builtin_neon_vpadal_v((int8x8_t)__a, (int8x8_t)__b, 3); }

2476 __ai uint16x4_t vpadal_u8(uint16x4_t __a, uint8x8_t __b) { \

2477 return (uint16x4_t)__builtin_neon_vpadal_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2478 __ai uint32x2_t vpadal_u16(uint32x2_t __a, uint16x4_t __b) { \

2479 return (uint32x2_t)__builtin_neon_vpadal_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2480 __ai uint64x1_t vpadal_u32(uint64x1_t __a, uint32x2_t __b) { \

2481 return (uint64x1_t)__builtin_neon_vpadal_v((int8x8_t)__a, (int8x8_t)__b, 11); }

2482 __ai int16x8_t vpadalq_s8(int16x8_t __a, int8x16_t __b) { \

2483 return (int16x8_t)__builtin_neon_vpadalq_v((int8x16_t)__a, __b, 17); }

2484 __ai int32x4_t vpadalq_s16(int32x4_t __a, int16x8_t __b) { \

2485 return (int32x4_t)__builtin_neon_vpadalq_v((int8x16_t)__a, (int8x16_t)__b, 18) ; }

2486 __ai int64x2_t vpadalq_s32(int64x2_t __a, int32x4_t __b) { \

2487 return (int64x2_t)__builtin_neon_vpadalq_v((int8x16_t)__a, (int8x16_t)__b, 19) ; }

2488 __ai uint16x8_t vpadalq_u8(uint16x8_t __a, uint8x16_t __b) { \

2489 return (uint16x8_t)__builtin_neon_vpadalq_v((int8x16_t)__a, (int8x16_t)__b, 25 ); }

2490 __ai uint32x4_t vpadalq_u16(uint32x4_t __a, uint16x8_t __b) { \

2491 return (uint32x4_t)__builtin_neon_vpadalq_v((int8x16_t)__a, (int8x16_t)__b, 26 ); }

2492 __ai uint64x2_t vpadalq_u32(uint64x2_t __a, uint32x4_t __b) { \

2493 return (uint64x2_t)__builtin_neon_vpadalq_v((int8x16_t)__a, (int8x16_t)__b, 27 ); }

2494

2495 __ai int8x8_t vpadd_s8(int8x8_t __a, int8x8_t __b) { \

2496 return (int8x8_t)__builtin_neon_vpadd_v(__a, __b, 0); }

2497 __ai int16x4_t vpadd_s16(int16x4_t __a, int16x4_t __b) { \

2498 return (int16x4_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2499 __ai int32x2_t vpadd_s32(int32x2_t __a, int32x2_t __b) { \

2500 return (int32x2_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2501 __ai uint8x8_t vpadd_u8(uint8x8_t __a, uint8x8_t __b) { \

2502 return (uint8x8_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 8); }

2503 __ai uint16x4_t vpadd_u16(uint16x4_t __a, uint16x4_t __b) { \

2504 return (uint16x4_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2505 __ai uint32x2_t vpadd_u32(uint32x2_t __a, uint32x2_t __b) { \

2506 return (uint32x2_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2507 __ai float32x2_t vpadd_f32(float32x2_t __a, float32x2_t __b) { \

2508 return (float32x2_t)__builtin_neon_vpadd_v((int8x8_t)__a, (int8x8_t)__b, 4); }

2509

2510 __ai int16x4_t vpaddl_s8(int8x8_t __a) { \

2511 return (int16x4_t)__builtin_neon_vpaddl_v(__a, 1); }

2512 __ai int32x2_t vpaddl_s16(int16x4_t __a) { \

2513 return (int32x2_t)__builtin_neon_vpaddl_v((int8x8_t)__a, 2); }

2514 __ai int64x1_t vpaddl_s32(int32x2_t __a) { \

2515 return (int64x1_t)__builtin_neon_vpaddl_v((int8x8_t)__a, 3); }

2516 __ai uint16x4_t vpaddl_u8(uint8x8_t __a) { \

2517 return (uint16x4_t)__builtin_neon_vpaddl_v((int8x8_t)__a, 9); }

2518 __ai uint32x2_t vpaddl_u16(uint16x4_t __a) { \

2519 return (uint32x2_t)__builtin_neon_vpaddl_v((int8x8_t)__a, 10); }

2520 __ai uint64x1_t vpaddl_u32(uint32x2_t __a) { \

2521 return (uint64x1_t)__builtin_neon_vpaddl_v((int8x8_t)__a, 11); }

2522 __ai int16x8_t vpaddlq_s8(int8x16_t __a) { \

2523 return (int16x8_t)__builtin_neon_vpaddlq_v(__a, 17); }

2524 __ai int32x4_t vpaddlq_s16(int16x8_t __a) { \

2525 return (int32x4_t)__builtin_neon_vpaddlq_v((int8x16_t)__a, 18); }

2526 __ai int64x2_t vpaddlq_s32(int32x4_t __a) { \

2527 return (int64x2_t)__builtin_neon_vpaddlq_v((int8x16_t)__a, 19); }

2528 __ai uint16x8_t vpaddlq_u8(uint8x16_t __a) { \

2529 return (uint16x8_t)__builtin_neon_vpaddlq_v((int8x16_t)__a, 25); }

2530 __ai uint32x4_t vpaddlq_u16(uint16x8_t __a) { \

2531 return (uint32x4_t)__builtin_neon_vpaddlq_v((int8x16_t)__a, 26); }

2532 __ai uint64x2_t vpaddlq_u32(uint32x4_t __a) { \

2533 return (uint64x2_t)__builtin_neon_vpaddlq_v((int8x16_t)__a, 27); }

2534

2535 __ai int8x8_t vpmax_s8(int8x8_t __a, int8x8_t __b) { \

2536 return (int8x8_t)__builtin_neon_vpmax_v(__a, __b, 0); }

2537 __ai int16x4_t vpmax_s16(int16x4_t __a, int16x4_t __b) { \

2538 return (int16x4_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2539 __ai int32x2_t vpmax_s32(int32x2_t __a, int32x2_t __b) { \

2540 return (int32x2_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2541 __ai uint8x8_t vpmax_u8(uint8x8_t __a, uint8x8_t __b) { \

2542 return (uint8x8_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 8); }

2543 __ai uint16x4_t vpmax_u16(uint16x4_t __a, uint16x4_t __b) { \

2544 return (uint16x4_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2545 __ai uint32x2_t vpmax_u32(uint32x2_t __a, uint32x2_t __b) { \

2546 return (uint32x2_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2547 __ai float32x2_t vpmax_f32(float32x2_t __a, float32x2_t __b) { \

2548 return (float32x2_t)__builtin_neon_vpmax_v((int8x8_t)__a, (int8x8_t)__b, 4); }

2549

2550 __ai int8x8_t vpmin_s8(int8x8_t __a, int8x8_t __b) { \

2551 return (int8x8_t)__builtin_neon_vpmin_v(__a, __b, 0); }

2552 __ai int16x4_t vpmin_s16(int16x4_t __a, int16x4_t __b) { \

2553 return (int16x4_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2554 __ai int32x2_t vpmin_s32(int32x2_t __a, int32x2_t __b) { \

2555 return (int32x2_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2556 __ai uint8x8_t vpmin_u8(uint8x8_t __a, uint8x8_t __b) { \

2557 return (uint8x8_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 8); }

2558 __ai uint16x4_t vpmin_u16(uint16x4_t __a, uint16x4_t __b) { \

2559 return (uint16x4_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2560 __ai uint32x2_t vpmin_u32(uint32x2_t __a, uint32x2_t __b) { \

2561 return (uint32x2_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2562 __ai float32x2_t vpmin_f32(float32x2_t __a, float32x2_t __b) { \

2563 return (float32x2_t)__builtin_neon_vpmin_v((int8x8_t)__a, (int8x8_t)__b, 4); }

2564

2565 __ai int8x8_t vqabs_s8(int8x8_t __a) { \

2566 return (int8x8_t)__builtin_neon_vqabs_v(__a, 0); }

2567 __ai int16x4_t vqabs_s16(int16x4_t __a) { \

2568 return (int16x4_t)__builtin_neon_vqabs_v((int8x8_t)__a, 1); }

2569 __ai int32x2_t vqabs_s32(int32x2_t __a) { \

2570 return (int32x2_t)__builtin_neon_vqabs_v((int8x8_t)__a, 2); }

2571 __ai int8x16_t vqabsq_s8(int8x16_t __a) { \

2572 return (int8x16_t)__builtin_neon_vqabsq_v(__a, 16); }

2573 __ai int16x8_t vqabsq_s16(int16x8_t __a) { \

2574 return (int16x8_t)__builtin_neon_vqabsq_v((int8x16_t)__a, 17); }

2575 __ai int32x4_t vqabsq_s32(int32x4_t __a) { \

2576 return (int32x4_t)__builtin_neon_vqabsq_v((int8x16_t)__a, 18); }

2577

2578 __ai int8x8_t vqadd_s8(int8x8_t __a, int8x8_t __b) { \

2579 return (int8x8_t)__builtin_neon_vqadd_v(__a, __b, 0); }

2580 __ai int16x4_t vqadd_s16(int16x4_t __a, int16x4_t __b) { \

2581 return (int16x4_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2582 __ai int32x2_t vqadd_s32(int32x2_t __a, int32x2_t __b) { \

2583 return (int32x2_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2584 __ai int64x1_t vqadd_s64(int64x1_t __a, int64x1_t __b) { \

2585 return (int64x1_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 3); }

2586 __ai uint8x8_t vqadd_u8(uint8x8_t __a, uint8x8_t __b) { \

2587 return (uint8x8_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 8); }

2588 __ai uint16x4_t vqadd_u16(uint16x4_t __a, uint16x4_t __b) { \

2589 return (uint16x4_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2590 __ai uint32x2_t vqadd_u32(uint32x2_t __a, uint32x2_t __b) { \

2591 return (uint32x2_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2592 __ai uint64x1_t vqadd_u64(uint64x1_t __a, uint64x1_t __b) { \

2593 return (uint64x1_t)__builtin_neon_vqadd_v((int8x8_t)__a, (int8x8_t)__b, 11); }

2594 __ai int8x16_t vqaddq_s8(int8x16_t __a, int8x16_t __b) { \

2595 return (int8x16_t)__builtin_neon_vqaddq_v(__a, __b, 16); }

2596 __ai int16x8_t vqaddq_s16(int16x8_t __a, int16x8_t __b) { \

2597 return (int16x8_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

2598 __ai int32x4_t vqaddq_s32(int32x4_t __a, int32x4_t __b) { \

2599 return (int32x4_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

2600 __ai int64x2_t vqaddq_s64(int64x2_t __a, int64x2_t __b) { \

2601 return (int64x2_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 19); }

2602 __ai uint8x16_t vqaddq_u8(uint8x16_t __a, uint8x16_t __b) { \

2603 return (uint8x16_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 24) ; }

2604 __ai uint16x8_t vqaddq_u16(uint16x8_t __a, uint16x8_t __b) { \

2605 return (uint16x8_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

2606 __ai uint32x4_t vqaddq_u32(uint32x4_t __a, uint32x4_t __b) { \

2607 return (uint32x4_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

2608 __ai uint64x2_t vqaddq_u64(uint64x2_t __a, uint64x2_t __b) { \

2609 return (uint64x2_t)__builtin_neon_vqaddq_v((int8x16_t)__a, (int8x16_t)__b, 27) ; }

2610

2611 __ai int32x4_t vqdmlal_s16(int32x4_t __a, int16x4_t __b, int16x4_t __c) { \

2612 return (int32x4_t)__builtin_neon_vqdmlal_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)__c, 18); }

2613 __ai int64x2_t vqdmlal_s32(int64x2_t __a, int32x2_t __b, int32x2_t __c) { \

2614 return (int64x2_t)__builtin_neon_vqdmlal_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)__c, 19); }

2615

2616 #define vqdmlal_lane_s16(a, b, c, __d) __extension__ ({ \

2617 int32x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2618 vqdmlal_s16(__a, __b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2619 #define vqdmlal_lane_s32(a, b, c, __d) __extension__ ({ \

2620 int64x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2621 vqdmlal_s32(__a, __b, __builtin_shufflevector(__c, __c, __d, __d)); })

2622

2623 __ai int32x4_t vqdmlal_n_s16(int32x4_t __a, int16x4_t __b, int16_t __c) { \

2624 return (int32x4_t)__builtin_neon_vqdmlal_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)(int16x4_t){ __c, __c, __c, __c }, 18); }

2625 __ai int64x2_t vqdmlal_n_s32(int64x2_t __a, int32x2_t __b, int32_t __c) { \

2626 return (int64x2_t)__builtin_neon_vqdmlal_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)(int32x2_t){ __c, __c }, 19); }

2627

2628 __ai int32x4_t vqdmlsl_s16(int32x4_t __a, int16x4_t __b, int16x4_t __c) { \

2629 return (int32x4_t)__builtin_neon_vqdmlsl_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)__c, 18); }

2630 __ai int64x2_t vqdmlsl_s32(int64x2_t __a, int32x2_t __b, int32x2_t __c) { \

2631 return (int64x2_t)__builtin_neon_vqdmlsl_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)__c, 19); }

2632

2633 #define vqdmlsl_lane_s16(a, b, c, __d) __extension__ ({ \

2634 int32x4_t __a = (a); int16x4_t __b = (b); int16x4_t __c = (c); \

2635 vqdmlsl_s16(__a, __b, __builtin_shufflevector(__c, __c, __d, __d, __d, __d)); })

2636 #define vqdmlsl_lane_s32(a, b, c, __d) __extension__ ({ \

2637 int64x2_t __a = (a); int32x2_t __b = (b); int32x2_t __c = (c); \

2638 vqdmlsl_s32(__a, __b, __builtin_shufflevector(__c, __c, __d, __d)); })

2639

2640 __ai int32x4_t vqdmlsl_n_s16(int32x4_t __a, int16x4_t __b, int16_t __c) { \

2641 return (int32x4_t)__builtin_neon_vqdmlsl_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)(int16x4_t){ __c, __c, __c, __c }, 18); }

2642 __ai int64x2_t vqdmlsl_n_s32(int64x2_t __a, int32x2_t __b, int32_t __c) { \

2643 return (int64x2_t)__builtin_neon_vqdmlsl_v((int8x16_t)__a, (int8x8_t)__b, (int 8x8_t)(int32x2_t){ __c, __c }, 19); }

2644

2645 __ai int16x4_t vqdmulh_s16(int16x4_t __a, int16x4_t __b) { \

2646 return (int16x4_t)__builtin_neon_vqdmulh_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2647 __ai int32x2_t vqdmulh_s32(int32x2_t __a, int32x2_t __b) { \

2648 return (int32x2_t)__builtin_neon_vqdmulh_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2649 __ai int16x8_t vqdmulhq_s16(int16x8_t __a, int16x8_t __b) { \

2650 return (int16x8_t)__builtin_neon_vqdmulhq_v((int8x16_t)__a, (int8x16_t)__b, 17 ); }

2651 __ai int32x4_t vqdmulhq_s32(int32x4_t __a, int32x4_t __b) { \

2652 return (int32x4_t)__builtin_neon_vqdmulhq_v((int8x16_t)__a, (int8x16_t)__b, 18 ); }

2653

2654 #define vqdmulh_lane_s16(a, b, __c) __extension__ ({ \

2655 int16x4_t __a = (a); int16x4_t __b = (b); \

2656 vqdmulh_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2657 #define vqdmulh_lane_s32(a, b, __c) __extension__ ({ \

2658 int32x2_t __a = (a); int32x2_t __b = (b); \

2659 vqdmulh_s32(__a, __builtin_shufflevector(__b, __b, __c, __c)); })

2660 #define vqdmulhq_lane_s16(a, b, __c) __extension__ ({ \

2661 int16x8_t __a = (a); int16x4_t __b = (b); \

2662 vqdmulhq_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c, __c, _ _c, __c, __c)); })

2663 #define vqdmulhq_lane_s32(a, b, __c) __extension__ ({ \

2664 int32x4_t __a = (a); int32x2_t __b = (b); \

2665 vqdmulhq_s32(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2666

2667 __ai int16x4_t vqdmulh_n_s16(int16x4_t __a, int16_t __b) { \

2668 return (int16x4_t)__builtin_neon_vqdmulh_v((int8x8_t)__a, (int8x8_t)(int16x4_t ){ __b, __b, __b, __b }, 1); }

2669 __ai int32x2_t vqdmulh_n_s32(int32x2_t __a, int32_t __b) { \

2670 return (int32x2_t)__builtin_neon_vqdmulh_v((int8x8_t)__a, (int8x8_t)(int32x2_t ){ __b, __b }, 2); }

2671 __ai int16x8_t vqdmulhq_n_s16(int16x8_t __a, int16_t __b) { \

2672 return (int16x8_t)__builtin_neon_vqdmulhq_v((int8x16_t)__a, (int8x16_t)(int16x 8_t){ __b, __b, __b, __b, __b, __b, __b, __b }, 17); }

2673 __ai int32x4_t vqdmulhq_n_s32(int32x4_t __a, int32_t __b) { \

2674 return (int32x4_t)__builtin_neon_vqdmulhq_v((int8x16_t)__a, (int8x16_t)(int32x 4_t){ __b, __b, __b, __b }, 18); }

2675

2676 __ai int32x4_t vqdmull_s16(int16x4_t __a, int16x4_t __b) { \

2677 return (int32x4_t)__builtin_neon_vqdmull_v((int8x8_t)__a, (int8x8_t)__b, 18); }

2678 __ai int64x2_t vqdmull_s32(int32x2_t __a, int32x2_t __b) { \

2679 return (int64x2_t)__builtin_neon_vqdmull_v((int8x8_t)__a, (int8x8_t)__b, 19); }

2680

2681 #define vqdmull_lane_s16(a, b, __c) __extension__ ({ \

2682 int16x4_t __a = (a); int16x4_t __b = (b); \

2683 vqdmull_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2684 #define vqdmull_lane_s32(a, b, __c) __extension__ ({ \

2685 int32x2_t __a = (a); int32x2_t __b = (b); \

2686 vqdmull_s32(__a, __builtin_shufflevector(__b, __b, __c, __c)); })

2687

2688 __ai int32x4_t vqdmull_n_s16(int16x4_t __a, int16_t __b) { \

2689 return (int32x4_t)__builtin_neon_vqdmull_v((int8x8_t)__a, (int8x8_t)(int16x4_t ){ __b, __b, __b, __b }, 18); }

2690 __ai int64x2_t vqdmull_n_s32(int32x2_t __a, int32_t __b) { \

2691 return (int64x2_t)__builtin_neon_vqdmull_v((int8x8_t)__a, (int8x8_t)(int32x2_t ){ __b, __b }, 19); }

2692

2693 __ai int8x8_t vqmovn_s16(int16x8_t __a) { \

2694 return (int8x8_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 0); }

2695 __ai int16x4_t vqmovn_s32(int32x4_t __a) { \

2696 return (int16x4_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 1); }

2697 __ai int32x2_t vqmovn_s64(int64x2_t __a) { \

2698 return (int32x2_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 2); }

2699 __ai uint8x8_t vqmovn_u16(uint16x8_t __a) { \

2700 return (uint8x8_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 8); }

2701 __ai uint16x4_t vqmovn_u32(uint32x4_t __a) { \

2702 return (uint16x4_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 9); }

2703 __ai uint32x2_t vqmovn_u64(uint64x2_t __a) { \

2704 return (uint32x2_t)__builtin_neon_vqmovn_v((int8x16_t)__a, 10); }

2705

2706 __ai uint8x8_t vqmovun_s16(int16x8_t __a) { \

2707 return (uint8x8_t)__builtin_neon_vqmovun_v((int8x16_t)__a, 8); }

2708 __ai uint16x4_t vqmovun_s32(int32x4_t __a) { \

2709 return (uint16x4_t)__builtin_neon_vqmovun_v((int8x16_t)__a, 9); }

2710 __ai uint32x2_t vqmovun_s64(int64x2_t __a) { \

2711 return (uint32x2_t)__builtin_neon_vqmovun_v((int8x16_t)__a, 10); }

2712

2713 __ai int8x8_t vqneg_s8(int8x8_t __a) { \

2714 return (int8x8_t)__builtin_neon_vqneg_v(__a, 0); }

2715 __ai int16x4_t vqneg_s16(int16x4_t __a) { \

2716 return (int16x4_t)__builtin_neon_vqneg_v((int8x8_t)__a, 1); }

2717 __ai int32x2_t vqneg_s32(int32x2_t __a) { \

2718 return (int32x2_t)__builtin_neon_vqneg_v((int8x8_t)__a, 2); }

2719 __ai int8x16_t vqnegq_s8(int8x16_t __a) { \

2720 return (int8x16_t)__builtin_neon_vqnegq_v(__a, 16); }

2721 __ai int16x8_t vqnegq_s16(int16x8_t __a) { \

2722 return (int16x8_t)__builtin_neon_vqnegq_v((int8x16_t)__a, 17); }

2723 __ai int32x4_t vqnegq_s32(int32x4_t __a) { \

2724 return (int32x4_t)__builtin_neon_vqnegq_v((int8x16_t)__a, 18); }

2725

2726 __ai int16x4_t vqrdmulh_s16(int16x4_t __a, int16x4_t __b) { \

2727 return (int16x4_t)__builtin_neon_vqrdmulh_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2728 __ai int32x2_t vqrdmulh_s32(int32x2_t __a, int32x2_t __b) { \

2729 return (int32x2_t)__builtin_neon_vqrdmulh_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2730 __ai int16x8_t vqrdmulhq_s16(int16x8_t __a, int16x8_t __b) { \

2731 return (int16x8_t)__builtin_neon_vqrdmulhq_v((int8x16_t)__a, (int8x16_t)__b, 1 7); }

2732 __ai int32x4_t vqrdmulhq_s32(int32x4_t __a, int32x4_t __b) { \

2733 return (int32x4_t)__builtin_neon_vqrdmulhq_v((int8x16_t)__a, (int8x16_t)__b, 1 8); }

2734

2735 #define vqrdmulh_lane_s16(a, b, __c) __extension__ ({ \

2736 int16x4_t __a = (a); int16x4_t __b = (b); \

2737 vqrdmulh_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2738 #define vqrdmulh_lane_s32(a, b, __c) __extension__ ({ \

2739 int32x2_t __a = (a); int32x2_t __b = (b); \

2740 vqrdmulh_s32(__a, __builtin_shufflevector(__b, __b, __c, __c)); })

2741 #define vqrdmulhq_lane_s16(a, b, __c) __extension__ ({ \

2742 int16x8_t __a = (a); int16x4_t __b = (b); \

2743 vqrdmulhq_s16(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c, __c, __c, __c, __c)); })

2744 #define vqrdmulhq_lane_s32(a, b, __c) __extension__ ({ \

2745 int32x4_t __a = (a); int32x2_t __b = (b); \

2746 vqrdmulhq_s32(__a, __builtin_shufflevector(__b, __b, __c, __c, __c, __c)); })

2747

2748 __ai int16x4_t vqrdmulh_n_s16(int16x4_t __a, int16_t __b) { \

2749 return (int16x4_t)__builtin_neon_vqrdmulh_v((int8x8_t)__a, (int8x8_t)(int16x4_ t){ __b, __b, __b, __b }, 1); }

2750 __ai int32x2_t vqrdmulh_n_s32(int32x2_t __a, int32_t __b) { \

2751 return (int32x2_t)__builtin_neon_vqrdmulh_v((int8x8_t)__a, (int8x8_t)(int32x2_ t){ __b, __b }, 2); }

2752 __ai int16x8_t vqrdmulhq_n_s16(int16x8_t __a, int16_t __b) { \

2753 return (int16x8_t)__builtin_neon_vqrdmulhq_v((int8x16_t)__a, (int8x16_t)(int16 x8_t){ __b, __b, __b, __b, __b, __b, __b, __b }, 17); }

2754 __ai int32x4_t vqrdmulhq_n_s32(int32x4_t __a, int32_t __b) { \

2755 return (int32x4_t)__builtin_neon_vqrdmulhq_v((int8x16_t)__a, (int8x16_t)(int32 x4_t){ __b, __b, __b, __b }, 18); }

2756

2757 __ai int8x8_t vqrshl_s8(int8x8_t __a, int8x8_t __b) { \

2758 return (int8x8_t)__builtin_neon_vqrshl_v(__a, __b, 0); }

2759 __ai int16x4_t vqrshl_s16(int16x4_t __a, int16x4_t __b) { \

2760 return (int16x4_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2761 __ai int32x2_t vqrshl_s32(int32x2_t __a, int32x2_t __b) { \

2762 return (int32x2_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2763 __ai int64x1_t vqrshl_s64(int64x1_t __a, int64x1_t __b) { \

2764 return (int64x1_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 3); }

2765 __ai uint8x8_t vqrshl_u8(uint8x8_t __a, int8x8_t __b) { \

2766 return (uint8x8_t)__builtin_neon_vqrshl_v((int8x8_t)__a, __b, 8); }

2767 __ai uint16x4_t vqrshl_u16(uint16x4_t __a, int16x4_t __b) { \

2768 return (uint16x4_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2769 __ai uint32x2_t vqrshl_u32(uint32x2_t __a, int32x2_t __b) { \

2770 return (uint32x2_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2771 __ai uint64x1_t vqrshl_u64(uint64x1_t __a, int64x1_t __b) { \

2772 return (uint64x1_t)__builtin_neon_vqrshl_v((int8x8_t)__a, (int8x8_t)__b, 11); }

2773 __ai int8x16_t vqrshlq_s8(int8x16_t __a, int8x16_t __b) { \

2774 return (int8x16_t)__builtin_neon_vqrshlq_v(__a, __b, 16); }

2775 __ai int16x8_t vqrshlq_s16(int16x8_t __a, int16x8_t __b) { \

2776 return (int16x8_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 17) ; }

2777 __ai int32x4_t vqrshlq_s32(int32x4_t __a, int32x4_t __b) { \

2778 return (int32x4_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 18) ; }

2779 __ai int64x2_t vqrshlq_s64(int64x2_t __a, int64x2_t __b) { \

2780 return (int64x2_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 19) ; }

2781 __ai uint8x16_t vqrshlq_u8(uint8x16_t __a, int8x16_t __b) { \

2782 return (uint8x16_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, __b, 24); }

2783 __ai uint16x8_t vqrshlq_u16(uint16x8_t __a, int16x8_t __b) { \

2784 return (uint16x8_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 25 ); }

2785 __ai uint32x4_t vqrshlq_u32(uint32x4_t __a, int32x4_t __b) { \

2786 return (uint32x4_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 26 ); }

2787 __ai uint64x2_t vqrshlq_u64(uint64x2_t __a, int64x2_t __b) { \

2788 return (uint64x2_t)__builtin_neon_vqrshlq_v((int8x16_t)__a, (int8x16_t)__b, 27 ); }

2789

2790 #define vqrshrn_n_s16(a, __b) __extension__ ({ \

2791 int16x8_t __a = (a); \

2792 (int8x8_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 0); })

2793 #define vqrshrn_n_s32(a, __b) __extension__ ({ \

2794 int32x4_t __a = (a); \

2795 (int16x4_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 1); })

2796 #define vqrshrn_n_s64(a, __b) __extension__ ({ \

2797 int64x2_t __a = (a); \

2798 (int32x2_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 2); })

2799 #define vqrshrn_n_u16(a, __b) __extension__ ({ \

2800 uint16x8_t __a = (a); \

2801 (uint8x8_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 8); })

2802 #define vqrshrn_n_u32(a, __b) __extension__ ({ \

2803 uint32x4_t __a = (a); \

2804 (uint16x4_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 9); })

2805 #define vqrshrn_n_u64(a, __b) __extension__ ({ \

2806 uint64x2_t __a = (a); \

2807 (uint32x2_t)__builtin_neon_vqrshrn_n_v((int8x16_t)__a, __b, 10); })

2808

2809 #define vqrshrun_n_s16(a, __b) __extension__ ({ \

2810 int16x8_t __a = (a); \

2811 (uint8x8_t)__builtin_neon_vqrshrun_n_v((int8x16_t)__a, __b, 8); })

2812 #define vqrshrun_n_s32(a, __b) __extension__ ({ \

2813 int32x4_t __a = (a); \

2814 (uint16x4_t)__builtin_neon_vqrshrun_n_v((int8x16_t)__a, __b, 9); })

2815 #define vqrshrun_n_s64(a, __b) __extension__ ({ \

2816 int64x2_t __a = (a); \

2817 (uint32x2_t)__builtin_neon_vqrshrun_n_v((int8x16_t)__a, __b, 10); })

2818

2819 __ai int8x8_t vqshl_s8(int8x8_t __a, int8x8_t __b) { \

2820 return (int8x8_t)__builtin_neon_vqshl_v(__a, __b, 0); }

2821 __ai int16x4_t vqshl_s16(int16x4_t __a, int16x4_t __b) { \

2822 return (int16x4_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2823 __ai int32x2_t vqshl_s32(int32x2_t __a, int32x2_t __b) { \

2824 return (int32x2_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2825 __ai int64x1_t vqshl_s64(int64x1_t __a, int64x1_t __b) { \

2826 return (int64x1_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 3); }

2827 __ai uint8x8_t vqshl_u8(uint8x8_t __a, int8x8_t __b) { \

2828 return (uint8x8_t)__builtin_neon_vqshl_v((int8x8_t)__a, __b, 8); }

2829 __ai uint16x4_t vqshl_u16(uint16x4_t __a, int16x4_t __b) { \

2830 return (uint16x4_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2831 __ai uint32x2_t vqshl_u32(uint32x2_t __a, int32x2_t __b) { \

2832 return (uint32x2_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2833 __ai uint64x1_t vqshl_u64(uint64x1_t __a, int64x1_t __b) { \

2834 return (uint64x1_t)__builtin_neon_vqshl_v((int8x8_t)__a, (int8x8_t)__b, 11); }

2835 __ai int8x16_t vqshlq_s8(int8x16_t __a, int8x16_t __b) { \

2836 return (int8x16_t)__builtin_neon_vqshlq_v(__a, __b, 16); }

2837 __ai int16x8_t vqshlq_s16(int16x8_t __a, int16x8_t __b) { \

2838 return (int16x8_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

2839 __ai int32x4_t vqshlq_s32(int32x4_t __a, int32x4_t __b) { \

2840 return (int32x4_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

2841 __ai int64x2_t vqshlq_s64(int64x2_t __a, int64x2_t __b) { \

2842 return (int64x2_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 19); }

2843 __ai uint8x16_t vqshlq_u8(uint8x16_t __a, int8x16_t __b) { \

2844 return (uint8x16_t)__builtin_neon_vqshlq_v((int8x16_t)__a, __b, 24); }

2845 __ai uint16x8_t vqshlq_u16(uint16x8_t __a, int16x8_t __b) { \

2846 return (uint16x8_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

2847 __ai uint32x4_t vqshlq_u32(uint32x4_t __a, int32x4_t __b) { \

2848 return (uint32x4_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

2849 __ai uint64x2_t vqshlq_u64(uint64x2_t __a, int64x2_t __b) { \

2850 return (uint64x2_t)__builtin_neon_vqshlq_v((int8x16_t)__a, (int8x16_t)__b, 27) ; }

2851

2852 #define vqshlu_n_s8(a, __b) __extension__ ({ \

2853 int8x8_t __a = (a); \

2854 (uint8x8_t)__builtin_neon_vqshlu_n_v(__a, __b, 8); })

2855 #define vqshlu_n_s16(a, __b) __extension__ ({ \

2856 int16x4_t __a = (a); \

2857 (uint16x4_t)__builtin_neon_vqshlu_n_v((int8x8_t)__a, __b, 9); })

2858 #define vqshlu_n_s32(a, __b) __extension__ ({ \

2859 int32x2_t __a = (a); \

2860 (uint32x2_t)__builtin_neon_vqshlu_n_v((int8x8_t)__a, __b, 10); })

2861 #define vqshlu_n_s64(a, __b) __extension__ ({ \

2862 int64x1_t __a = (a); \

2863 (uint64x1_t)__builtin_neon_vqshlu_n_v((int8x8_t)__a, __b, 11); })

2864 #define vqshluq_n_s8(a, __b) __extension__ ({ \

2865 int8x16_t __a = (a); \

2866 (uint8x16_t)__builtin_neon_vqshluq_n_v(__a, __b, 24); })

2867 #define vqshluq_n_s16(a, __b) __extension__ ({ \

2868 int16x8_t __a = (a); \

2869 (uint16x8_t)__builtin_neon_vqshluq_n_v((int8x16_t)__a, __b, 25); })

2870 #define vqshluq_n_s32(a, __b) __extension__ ({ \

2871 int32x4_t __a = (a); \

2872 (uint32x4_t)__builtin_neon_vqshluq_n_v((int8x16_t)__a, __b, 26); })

2873 #define vqshluq_n_s64(a, __b) __extension__ ({ \

2874 int64x2_t __a = (a); \

2875 (uint64x2_t)__builtin_neon_vqshluq_n_v((int8x16_t)__a, __b, 27); })

2876

2877 #define vqshl_n_s8(a, __b) __extension__ ({ \

2878 int8x8_t __a = (a); \

2879 (int8x8_t)__builtin_neon_vqshl_n_v(__a, __b, 0); })

2880 #define vqshl_n_s16(a, __b) __extension__ ({ \

2881 int16x4_t __a = (a); \

2882 (int16x4_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 1); })

2883 #define vqshl_n_s32(a, __b) __extension__ ({ \

2884 int32x2_t __a = (a); \

2885 (int32x2_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 2); })

2886 #define vqshl_n_s64(a, __b) __extension__ ({ \

2887 int64x1_t __a = (a); \

2888 (int64x1_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 3); })

2889 #define vqshl_n_u8(a, __b) __extension__ ({ \

2890 uint8x8_t __a = (a); \

2891 (uint8x8_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 8); })

2892 #define vqshl_n_u16(a, __b) __extension__ ({ \

2893 uint16x4_t __a = (a); \

2894 (uint16x4_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 9); })

2895 #define vqshl_n_u32(a, __b) __extension__ ({ \

2896 uint32x2_t __a = (a); \

2897 (uint32x2_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 10); })

2898 #define vqshl_n_u64(a, __b) __extension__ ({ \

2899 uint64x1_t __a = (a); \

2900 (uint64x1_t)__builtin_neon_vqshl_n_v((int8x8_t)__a, __b, 11); })

2901 #define vqshlq_n_s8(a, __b) __extension__ ({ \

2902 int8x16_t __a = (a); \

2903 (int8x16_t)__builtin_neon_vqshlq_n_v(__a, __b, 16); })

2904 #define vqshlq_n_s16(a, __b) __extension__ ({ \

2905 int16x8_t __a = (a); \

2906 (int16x8_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 17); })

2907 #define vqshlq_n_s32(a, __b) __extension__ ({ \

2908 int32x4_t __a = (a); \

2909 (int32x4_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 18); })

2910 #define vqshlq_n_s64(a, __b) __extension__ ({ \

2911 int64x2_t __a = (a); \

2912 (int64x2_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 19); })

2913 #define vqshlq_n_u8(a, __b) __extension__ ({ \

2914 uint8x16_t __a = (a); \

2915 (uint8x16_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 24); })

2916 #define vqshlq_n_u16(a, __b) __extension__ ({ \

2917 uint16x8_t __a = (a); \

2918 (uint16x8_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 25); })

2919 #define vqshlq_n_u32(a, __b) __extension__ ({ \

2920 uint32x4_t __a = (a); \

2921 (uint32x4_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 26); })

2922 #define vqshlq_n_u64(a, __b) __extension__ ({ \

2923 uint64x2_t __a = (a); \

2924 (uint64x2_t)__builtin_neon_vqshlq_n_v((int8x16_t)__a, __b, 27); })

2925

2926 #define vqshrn_n_s16(a, __b) __extension__ ({ \

2927 int16x8_t __a = (a); \

2928 (int8x8_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 0); })

2929 #define vqshrn_n_s32(a, __b) __extension__ ({ \

2930 int32x4_t __a = (a); \

2931 (int16x4_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 1); })

2932 #define vqshrn_n_s64(a, __b) __extension__ ({ \

2933 int64x2_t __a = (a); \

2934 (int32x2_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 2); })

2935 #define vqshrn_n_u16(a, __b) __extension__ ({ \

2936 uint16x8_t __a = (a); \

2937 (uint8x8_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 8); })

2938 #define vqshrn_n_u32(a, __b) __extension__ ({ \

2939 uint32x4_t __a = (a); \

2940 (uint16x4_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 9); })

2941 #define vqshrn_n_u64(a, __b) __extension__ ({ \

2942 uint64x2_t __a = (a); \

2943 (uint32x2_t)__builtin_neon_vqshrn_n_v((int8x16_t)__a, __b, 10); })

2944

2945 #define vqshrun_n_s16(a, __b) __extension__ ({ \

2946 int16x8_t __a = (a); \

2947 (uint8x8_t)__builtin_neon_vqshrun_n_v((int8x16_t)__a, __b, 8); })

2948 #define vqshrun_n_s32(a, __b) __extension__ ({ \

2949 int32x4_t __a = (a); \

2950 (uint16x4_t)__builtin_neon_vqshrun_n_v((int8x16_t)__a, __b, 9); })

2951 #define vqshrun_n_s64(a, __b) __extension__ ({ \

2952 int64x2_t __a = (a); \

2953 (uint32x2_t)__builtin_neon_vqshrun_n_v((int8x16_t)__a, __b, 10); })

2954

2955 __ai int8x8_t vqsub_s8(int8x8_t __a, int8x8_t __b) { \

2956 return (int8x8_t)__builtin_neon_vqsub_v(__a, __b, 0); }

2957 __ai int16x4_t vqsub_s16(int16x4_t __a, int16x4_t __b) { \

2958 return (int16x4_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 1); }

2959 __ai int32x2_t vqsub_s32(int32x2_t __a, int32x2_t __b) { \

2960 return (int32x2_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 2); }

2961 __ai int64x1_t vqsub_s64(int64x1_t __a, int64x1_t __b) { \

2962 return (int64x1_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 3); }

2963 __ai uint8x8_t vqsub_u8(uint8x8_t __a, uint8x8_t __b) { \

2964 return (uint8x8_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 8); }

2965 __ai uint16x4_t vqsub_u16(uint16x4_t __a, uint16x4_t __b) { \

2966 return (uint16x4_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 9); }

2967 __ai uint32x2_t vqsub_u32(uint32x2_t __a, uint32x2_t __b) { \

2968 return (uint32x2_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 10); }

2969 __ai uint64x1_t vqsub_u64(uint64x1_t __a, uint64x1_t __b) { \

2970 return (uint64x1_t)__builtin_neon_vqsub_v((int8x8_t)__a, (int8x8_t)__b, 11); }

2971 __ai int8x16_t vqsubq_s8(int8x16_t __a, int8x16_t __b) { \

2972 return (int8x16_t)__builtin_neon_vqsubq_v(__a, __b, 16); }

2973 __ai int16x8_t vqsubq_s16(int16x8_t __a, int16x8_t __b) { \

2974 return (int16x8_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

2975 __ai int32x4_t vqsubq_s32(int32x4_t __a, int32x4_t __b) { \

2976 return (int32x4_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

2977 __ai int64x2_t vqsubq_s64(int64x2_t __a, int64x2_t __b) { \

2978 return (int64x2_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 19); }

2979 __ai uint8x16_t vqsubq_u8(uint8x16_t __a, uint8x16_t __b) { \

2980 return (uint8x16_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 24) ; }

2981 __ai uint16x8_t vqsubq_u16(uint16x8_t __a, uint16x8_t __b) { \

2982 return (uint16x8_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

2983 __ai uint32x4_t vqsubq_u32(uint32x4_t __a, uint32x4_t __b) { \

2984 return (uint32x4_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

2985 __ai uint64x2_t vqsubq_u64(uint64x2_t __a, uint64x2_t __b) { \

2986 return (uint64x2_t)__builtin_neon_vqsubq_v((int8x16_t)__a, (int8x16_t)__b, 27) ; }

2987

2988 __ai int8x8_t vraddhn_s16(int16x8_t __a, int16x8_t __b) { \

2989 return (int8x8_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 0); }

2990 __ai int16x4_t vraddhn_s32(int32x4_t __a, int32x4_t __b) { \

2991 return (int16x4_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 1); }

2992 __ai int32x2_t vraddhn_s64(int64x2_t __a, int64x2_t __b) { \

2993 return (int32x2_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 2); }

2994 __ai uint8x8_t vraddhn_u16(uint16x8_t __a, uint16x8_t __b) { \

2995 return (uint8x8_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 8); }

2996 __ai uint16x4_t vraddhn_u32(uint32x4_t __a, uint32x4_t __b) { \

2997 return (uint16x4_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 9) ; }

2998 __ai uint32x2_t vraddhn_u64(uint64x2_t __a, uint64x2_t __b) { \

2999 return (uint32x2_t)__builtin_neon_vraddhn_v((int8x16_t)__a, (int8x16_t)__b, 10 ); }

3000

3001 __ai float32x2_t vrecpe_f32(float32x2_t __a) { \

3002 return (float32x2_t)__builtin_neon_vrecpe_v((int8x8_t)__a, 4); }

3003 __ai uint32x2_t vrecpe_u32(uint32x2_t __a) { \

3004 return (uint32x2_t)__builtin_neon_vrecpe_v((int8x8_t)__a, 10); }

3005 __ai float32x4_t vrecpeq_f32(float32x4_t __a) { \

3006 return (float32x4_t)__builtin_neon_vrecpeq_v((int8x16_t)__a, 20); }

3007 __ai uint32x4_t vrecpeq_u32(uint32x4_t __a) { \

3008 return (uint32x4_t)__builtin_neon_vrecpeq_v((int8x16_t)__a, 26); }

3009

3010 __ai float32x2_t vrecps_f32(float32x2_t __a, float32x2_t __b) { \

3011 return (float32x2_t)__builtin_neon_vrecps_v((int8x8_t)__a, (int8x8_t)__b, 4); }

3012 __ai float32x4_t vrecpsq_f32(float32x4_t __a, float32x4_t __b) { \

3013 return (float32x4_t)__builtin_neon_vrecpsq_v((int8x16_t)__a, (int8x16_t)__b, 2 0); }

3014

3015 __ai int8x8_t vreinterpret_s8_s16(int16x4_t __a) { \

3016 return (int8x8_t)__a; }

3017 __ai int8x8_t vreinterpret_s8_s32(int32x2_t __a) { \

3018 return (int8x8_t)__a; }

3019 __ai int8x8_t vreinterpret_s8_s64(int64x1_t __a) { \

3020 return (int8x8_t)__a; }

3021 __ai int8x8_t vreinterpret_s8_u8(uint8x8_t __a) { \

3022 return (int8x8_t)__a; }

3023 __ai int8x8_t vreinterpret_s8_u16(uint16x4_t __a) { \

3024 return (int8x8_t)__a; }

3025 __ai int8x8_t vreinterpret_s8_u32(uint32x2_t __a) { \

3026 return (int8x8_t)__a; }

3027 __ai int8x8_t vreinterpret_s8_u64(uint64x1_t __a) { \

3028 return (int8x8_t)__a; }

3029 __ai int8x8_t vreinterpret_s8_f16(float16x4_t __a) { \

3030 return (int8x8_t)__a; }

3031 __ai int8x8_t vreinterpret_s8_f32(float32x2_t __a) { \

3032 return (int8x8_t)__a; }

3033 __ai int8x8_t vreinterpret_s8_p8(poly8x8_t __a) { \

3034 return (int8x8_t)__a; }

3035 __ai int8x8_t vreinterpret_s8_p16(poly16x4_t __a) { \

3036 return (int8x8_t)__a; }

3037 __ai int16x4_t vreinterpret_s16_s8(int8x8_t __a) { \

3038 return (int16x4_t)__a; }

3039 __ai int16x4_t vreinterpret_s16_s32(int32x2_t __a) { \

3040 return (int16x4_t)__a; }

3041 __ai int16x4_t vreinterpret_s16_s64(int64x1_t __a) { \

3042 return (int16x4_t)__a; }

3043 __ai int16x4_t vreinterpret_s16_u8(uint8x8_t __a) { \

3044 return (int16x4_t)__a; }

3045 __ai int16x4_t vreinterpret_s16_u16(uint16x4_t __a) { \

3046 return (int16x4_t)__a; }

3047 __ai int16x4_t vreinterpret_s16_u32(uint32x2_t __a) { \

3048 return (int16x4_t)__a; }

3049 __ai int16x4_t vreinterpret_s16_u64(uint64x1_t __a) { \

3050 return (int16x4_t)__a; }

3051 __ai int16x4_t vreinterpret_s16_f16(float16x4_t __a) { \

3052 return (int16x4_t)__a; }

3053 __ai int16x4_t vreinterpret_s16_f32(float32x2_t __a) { \

3054 return (int16x4_t)__a; }

3055 __ai int16x4_t vreinterpret_s16_p8(poly8x8_t __a) { \

3056 return (int16x4_t)__a; }

3057 __ai int16x4_t vreinterpret_s16_p16(poly16x4_t __a) { \

3058 return (int16x4_t)__a; }

3059 __ai int32x2_t vreinterpret_s32_s8(int8x8_t __a) { \

3060 return (int32x2_t)__a; }

3061 __ai int32x2_t vreinterpret_s32_s16(int16x4_t __a) { \

3062 return (int32x2_t)__a; }

3063 __ai int32x2_t vreinterpret_s32_s64(int64x1_t __a) { \

3064 return (int32x2_t)__a; }

3065 __ai int32x2_t vreinterpret_s32_u8(uint8x8_t __a) { \

3066 return (int32x2_t)__a; }

3067 __ai int32x2_t vreinterpret_s32_u16(uint16x4_t __a) { \

3068 return (int32x2_t)__a; }

3069 __ai int32x2_t vreinterpret_s32_u32(uint32x2_t __a) { \

3070 return (int32x2_t)__a; }

3071 __ai int32x2_t vreinterpret_s32_u64(uint64x1_t __a) { \

3072 return (int32x2_t)__a; }

3073 __ai int32x2_t vreinterpret_s32_f16(float16x4_t __a) { \

3074 return (int32x2_t)__a; }

3075 __ai int32x2_t vreinterpret_s32_f32(float32x2_t __a) { \

3076 return (int32x2_t)__a; }

3077 __ai int32x2_t vreinterpret_s32_p8(poly8x8_t __a) { \

3078 return (int32x2_t)__a; }

3079 __ai int32x2_t vreinterpret_s32_p16(poly16x4_t __a) { \

3080 return (int32x2_t)__a; }

3081 __ai int64x1_t vreinterpret_s64_s8(int8x8_t __a) { \

3082 return (int64x1_t)__a; }

3083 __ai int64x1_t vreinterpret_s64_s16(int16x4_t __a) { \

3084 return (int64x1_t)__a; }

3085 __ai int64x1_t vreinterpret_s64_s32(int32x2_t __a) { \

3086 return (int64x1_t)__a; }

3087 __ai int64x1_t vreinterpret_s64_u8(uint8x8_t __a) { \

3088 return (int64x1_t)__a; }

3089 __ai int64x1_t vreinterpret_s64_u16(uint16x4_t __a) { \

3090 return (int64x1_t)__a; }

3091 __ai int64x1_t vreinterpret_s64_u32(uint32x2_t __a) { \

3092 return (int64x1_t)__a; }

3093 __ai int64x1_t vreinterpret_s64_u64(uint64x1_t __a) { \

3094 return (int64x1_t)__a; }

3095 __ai int64x1_t vreinterpret_s64_f16(float16x4_t __a) { \

3096 return (int64x1_t)__a; }

3097 __ai int64x1_t vreinterpret_s64_f32(float32x2_t __a) { \

3098 return (int64x1_t)__a; }

3099 __ai int64x1_t vreinterpret_s64_p8(poly8x8_t __a) { \

3100 return (int64x1_t)__a; }

3101 __ai int64x1_t vreinterpret_s64_p16(poly16x4_t __a) { \

3102 return (int64x1_t)__a; }

3103 __ai uint8x8_t vreinterpret_u8_s8(int8x8_t __a) { \

3104 return (uint8x8_t)__a; }

3105 __ai uint8x8_t vreinterpret_u8_s16(int16x4_t __a) { \

3106 return (uint8x8_t)__a; }

3107 __ai uint8x8_t vreinterpret_u8_s32(int32x2_t __a) { \

3108 return (uint8x8_t)__a; }

3109 __ai uint8x8_t vreinterpret_u8_s64(int64x1_t __a) { \

3110 return (uint8x8_t)__a; }

3111 __ai uint8x8_t vreinterpret_u8_u16(uint16x4_t __a) { \

3112 return (uint8x8_t)__a; }

3113 __ai uint8x8_t vreinterpret_u8_u32(uint32x2_t __a) { \

3114 return (uint8x8_t)__a; }

3115 __ai uint8x8_t vreinterpret_u8_u64(uint64x1_t __a) { \

3116 return (uint8x8_t)__a; }

3117 __ai uint8x8_t vreinterpret_u8_f16(float16x4_t __a) { \

3118 return (uint8x8_t)__a; }

3119 __ai uint8x8_t vreinterpret_u8_f32(float32x2_t __a) { \

3120 return (uint8x8_t)__a; }

3121 __ai uint8x8_t vreinterpret_u8_p8(poly8x8_t __a) { \

3122 return (uint8x8_t)__a; }

3123 __ai uint8x8_t vreinterpret_u8_p16(poly16x4_t __a) { \

3124 return (uint8x8_t)__a; }

3125 __ai uint16x4_t vreinterpret_u16_s8(int8x8_t __a) { \

3126 return (uint16x4_t)__a; }

3127 __ai uint16x4_t vreinterpret_u16_s16(int16x4_t __a) { \

3128 return (uint16x4_t)__a; }

3129 __ai uint16x4_t vreinterpret_u16_s32(int32x2_t __a) { \

3130 return (uint16x4_t)__a; }

3131 __ai uint16x4_t vreinterpret_u16_s64(int64x1_t __a) { \

3132 return (uint16x4_t)__a; }

3133 __ai uint16x4_t vreinterpret_u16_u8(uint8x8_t __a) { \

3134 return (uint16x4_t)__a; }

3135 __ai uint16x4_t vreinterpret_u16_u32(uint32x2_t __a) { \

3136 return (uint16x4_t)__a; }

3137 __ai uint16x4_t vreinterpret_u16_u64(uint64x1_t __a) { \

3138 return (uint16x4_t)__a; }

3139 __ai uint16x4_t vreinterpret_u16_f16(float16x4_t __a) { \

3140 return (uint16x4_t)__a; }

3141 __ai uint16x4_t vreinterpret_u16_f32(float32x2_t __a) { \

3142 return (uint16x4_t)__a; }

3143 __ai uint16x4_t vreinterpret_u16_p8(poly8x8_t __a) { \

3144 return (uint16x4_t)__a; }

3145 __ai uint16x4_t vreinterpret_u16_p16(poly16x4_t __a) { \

3146 return (uint16x4_t)__a; }

3147 __ai uint32x2_t vreinterpret_u32_s8(int8x8_t __a) { \

3148 return (uint32x2_t)__a; }

3149 __ai uint32x2_t vreinterpret_u32_s16(int16x4_t __a) { \

3150 return (uint32x2_t)__a; }

3151 __ai uint32x2_t vreinterpret_u32_s32(int32x2_t __a) { \

3152 return (uint32x2_t)__a; }

3153 __ai uint32x2_t vreinterpret_u32_s64(int64x1_t __a) { \

3154 return (uint32x2_t)__a; }

3155 __ai uint32x2_t vreinterpret_u32_u8(uint8x8_t __a) { \

3156 return (uint32x2_t)__a; }

3157 __ai uint32x2_t vreinterpret_u32_u16(uint16x4_t __a) { \

3158 return (uint32x2_t)__a; }

3159 __ai uint32x2_t vreinterpret_u32_u64(uint64x1_t __a) { \

3160 return (uint32x2_t)__a; }

3161 __ai uint32x2_t vreinterpret_u32_f16(float16x4_t __a) { \

3162 return (uint32x2_t)__a; }

3163 __ai uint32x2_t vreinterpret_u32_f32(float32x2_t __a) { \

3164 return (uint32x2_t)__a; }

3165 __ai uint32x2_t vreinterpret_u32_p8(poly8x8_t __a) { \

3166 return (uint32x2_t)__a; }

3167 __ai uint32x2_t vreinterpret_u32_p16(poly16x4_t __a) { \

3168 return (uint32x2_t)__a; }

3169 __ai uint64x1_t vreinterpret_u64_s8(int8x8_t __a) { \

3170 return (uint64x1_t)__a; }

3171 __ai uint64x1_t vreinterpret_u64_s16(int16x4_t __a) { \

3172 return (uint64x1_t)__a; }

3173 __ai uint64x1_t vreinterpret_u64_s32(int32x2_t __a) { \

3174 return (uint64x1_t)__a; }

3175 __ai uint64x1_t vreinterpret_u64_s64(int64x1_t __a) { \

3176 return (uint64x1_t)__a; }

3177 __ai uint64x1_t vreinterpret_u64_u8(uint8x8_t __a) { \

3178 return (uint64x1_t)__a; }

3179 __ai uint64x1_t vreinterpret_u64_u16(uint16x4_t __a) { \

3180 return (uint64x1_t)__a; }

3181 __ai uint64x1_t vreinterpret_u64_u32(uint32x2_t __a) { \

3182 return (uint64x1_t)__a; }

3183 __ai uint64x1_t vreinterpret_u64_f16(float16x4_t __a) { \

3184 return (uint64x1_t)__a; }

3185 __ai uint64x1_t vreinterpret_u64_f32(float32x2_t __a) { \

3186 return (uint64x1_t)__a; }

3187 __ai uint64x1_t vreinterpret_u64_p8(poly8x8_t __a) { \

3188 return (uint64x1_t)__a; }

3189 __ai uint64x1_t vreinterpret_u64_p16(poly16x4_t __a) { \

3190 return (uint64x1_t)__a; }

3191 __ai float16x4_t vreinterpret_f16_s8(int8x8_t __a) { \

3192 return (float16x4_t)__a; }

3193 __ai float16x4_t vreinterpret_f16_s16(int16x4_t __a) { \

3194 return (float16x4_t)__a; }

3195 __ai float16x4_t vreinterpret_f16_s32(int32x2_t __a) { \

3196 return (float16x4_t)__a; }

3197 __ai float16x4_t vreinterpret_f16_s64(int64x1_t __a) { \

3198 return (float16x4_t)__a; }

3199 __ai float16x4_t vreinterpret_f16_u8(uint8x8_t __a) { \

3200 return (float16x4_t)__a; }

3201 __ai float16x4_t vreinterpret_f16_u16(uint16x4_t __a) { \

3202 return (float16x4_t)__a; }

3203 __ai float16x4_t vreinterpret_f16_u32(uint32x2_t __a) { \

3204 return (float16x4_t)__a; }

3205 __ai float16x4_t vreinterpret_f16_u64(uint64x1_t __a) { \

3206 return (float16x4_t)__a; }

3207 __ai float16x4_t vreinterpret_f16_f32(float32x2_t __a) { \

3208 return (float16x4_t)__a; }

3209 __ai float16x4_t vreinterpret_f16_p8(poly8x8_t __a) { \

3210 return (float16x4_t)__a; }

3211 __ai float16x4_t vreinterpret_f16_p16(poly16x4_t __a) { \

3212 return (float16x4_t)__a; }

3213 __ai float32x2_t vreinterpret_f32_s8(int8x8_t __a) { \

3214 return (float32x2_t)__a; }

3215 __ai float32x2_t vreinterpret_f32_s16(int16x4_t __a) { \

3216 return (float32x2_t)__a; }

3217 __ai float32x2_t vreinterpret_f32_s32(int32x2_t __a) { \

3218 return (float32x2_t)__a; }

3219 __ai float32x2_t vreinterpret_f32_s64(int64x1_t __a) { \

3220 return (float32x2_t)__a; }

3221 __ai float32x2_t vreinterpret_f32_u8(uint8x8_t __a) { \

3222 return (float32x2_t)__a; }

3223 __ai float32x2_t vreinterpret_f32_u16(uint16x4_t __a) { \

3224 return (float32x2_t)__a; }

3225 __ai float32x2_t vreinterpret_f32_u32(uint32x2_t __a) { \

3226 return (float32x2_t)__a; }

3227 __ai float32x2_t vreinterpret_f32_u64(uint64x1_t __a) { \

3228 return (float32x2_t)__a; }

3229 __ai float32x2_t vreinterpret_f32_f16(float16x4_t __a) { \

3230 return (float32x2_t)__a; }

3231 __ai float32x2_t vreinterpret_f32_p8(poly8x8_t __a) { \

3232 return (float32x2_t)__a; }

3233 __ai float32x2_t vreinterpret_f32_p16(poly16x4_t __a) { \

3234 return (float32x2_t)__a; }

3235 __ai poly8x8_t vreinterpret_p8_s8(int8x8_t __a) { \

3236 return (poly8x8_t)__a; }

3237 __ai poly8x8_t vreinterpret_p8_s16(int16x4_t __a) { \

3238 return (poly8x8_t)__a; }

3239 __ai poly8x8_t vreinterpret_p8_s32(int32x2_t __a) { \

3240 return (poly8x8_t)__a; }

3241 __ai poly8x8_t vreinterpret_p8_s64(int64x1_t __a) { \

3242 return (poly8x8_t)__a; }

3243 __ai poly8x8_t vreinterpret_p8_u8(uint8x8_t __a) { \

3244 return (poly8x8_t)__a; }

3245 __ai poly8x8_t vreinterpret_p8_u16(uint16x4_t __a) { \

3246 return (poly8x8_t)__a; }

3247 __ai poly8x8_t vreinterpret_p8_u32(uint32x2_t __a) { \

3248 return (poly8x8_t)__a; }

3249 __ai poly8x8_t vreinterpret_p8_u64(uint64x1_t __a) { \

3250 return (poly8x8_t)__a; }

3251 __ai poly8x8_t vreinterpret_p8_f16(float16x4_t __a) { \

3252 return (poly8x8_t)__a; }

3253 __ai poly8x8_t vreinterpret_p8_f32(float32x2_t __a) { \

3254 return (poly8x8_t)__a; }

3255 __ai poly8x8_t vreinterpret_p8_p16(poly16x4_t __a) { \

3256 return (poly8x8_t)__a; }

3257 __ai poly16x4_t vreinterpret_p16_s8(int8x8_t __a) { \

3258 return (poly16x4_t)__a; }

3259 __ai poly16x4_t vreinterpret_p16_s16(int16x4_t __a) { \

3260 return (poly16x4_t)__a; }

3261 __ai poly16x4_t vreinterpret_p16_s32(int32x2_t __a) { \

3262 return (poly16x4_t)__a; }

3263 __ai poly16x4_t vreinterpret_p16_s64(int64x1_t __a) { \

3264 return (poly16x4_t)__a; }

3265 __ai poly16x4_t vreinterpret_p16_u8(uint8x8_t __a) { \

3266 return (poly16x4_t)__a; }

3267 __ai poly16x4_t vreinterpret_p16_u16(uint16x4_t __a) { \

3268 return (poly16x4_t)__a; }

3269 __ai poly16x4_t vreinterpret_p16_u32(uint32x2_t __a) { \

3270 return (poly16x4_t)__a; }

3271 __ai poly16x4_t vreinterpret_p16_u64(uint64x1_t __a) { \

3272 return (poly16x4_t)__a; }

3273 __ai poly16x4_t vreinterpret_p16_f16(float16x4_t __a) { \

3274 return (poly16x4_t)__a; }

3275 __ai poly16x4_t vreinterpret_p16_f32(float32x2_t __a) { \

3276 return (poly16x4_t)__a; }

3277 __ai poly16x4_t vreinterpret_p16_p8(poly8x8_t __a) { \

3278 return (poly16x4_t)__a; }

3279 __ai int8x16_t vreinterpretq_s8_s16(int16x8_t __a) { \

3280 return (int8x16_t)__a; }

3281 __ai int8x16_t vreinterpretq_s8_s32(int32x4_t __a) { \

3282 return (int8x16_t)__a; }

3283 __ai int8x16_t vreinterpretq_s8_s64(int64x2_t __a) { \

3284 return (int8x16_t)__a; }

3285 __ai int8x16_t vreinterpretq_s8_u8(uint8x16_t __a) { \

3286 return (int8x16_t)__a; }

3287 __ai int8x16_t vreinterpretq_s8_u16(uint16x8_t __a) { \

3288 return (int8x16_t)__a; }

3289 __ai int8x16_t vreinterpretq_s8_u32(uint32x4_t __a) { \

3290 return (int8x16_t)__a; }

3291 __ai int8x16_t vreinterpretq_s8_u64(uint64x2_t __a) { \

3292 return (int8x16_t)__a; }

3293 __ai int8x16_t vreinterpretq_s8_f16(float16x8_t __a) { \

3294 return (int8x16_t)__a; }

3295 __ai int8x16_t vreinterpretq_s8_f32(float32x4_t __a) { \

3296 return (int8x16_t)__a; }

3297 __ai int8x16_t vreinterpretq_s8_p8(poly8x16_t __a) { \

3298 return (int8x16_t)__a; }

3299 __ai int8x16_t vreinterpretq_s8_p16(poly16x8_t __a) { \

3300 return (int8x16_t)__a; }

3301 __ai int16x8_t vreinterpretq_s16_s8(int8x16_t __a) { \

3302 return (int16x8_t)__a; }

3303 __ai int16x8_t vreinterpretq_s16_s32(int32x4_t __a) { \

3304 return (int16x8_t)__a; }

3305 __ai int16x8_t vreinterpretq_s16_s64(int64x2_t __a) { \

3306 return (int16x8_t)__a; }

3307 __ai int16x8_t vreinterpretq_s16_u8(uint8x16_t __a) { \

3308 return (int16x8_t)__a; }

3309 __ai int16x8_t vreinterpretq_s16_u16(uint16x8_t __a) { \

3310 return (int16x8_t)__a; }

3311 __ai int16x8_t vreinterpretq_s16_u32(uint32x4_t __a) { \

3312 return (int16x8_t)__a; }

3313 __ai int16x8_t vreinterpretq_s16_u64(uint64x2_t __a) { \

3314 return (int16x8_t)__a; }

3315 __ai int16x8_t vreinterpretq_s16_f16(float16x8_t __a) { \

3316 return (int16x8_t)__a; }

3317 __ai int16x8_t vreinterpretq_s16_f32(float32x4_t __a) { \

3318 return (int16x8_t)__a; }

3319 __ai int16x8_t vreinterpretq_s16_p8(poly8x16_t __a) { \

3320 return (int16x8_t)__a; }

3321 __ai int16x8_t vreinterpretq_s16_p16(poly16x8_t __a) { \

3322 return (int16x8_t)__a; }

3323 __ai int32x4_t vreinterpretq_s32_s8(int8x16_t __a) { \

3324 return (int32x4_t)__a; }

3325 __ai int32x4_t vreinterpretq_s32_s16(int16x8_t __a) { \

3326 return (int32x4_t)__a; }

3327 __ai int32x4_t vreinterpretq_s32_s64(int64x2_t __a) { \

3328 return (int32x4_t)__a; }

3329 __ai int32x4_t vreinterpretq_s32_u8(uint8x16_t __a) { \

3330 return (int32x4_t)__a; }

3331 __ai int32x4_t vreinterpretq_s32_u16(uint16x8_t __a) { \

3332 return (int32x4_t)__a; }

3333 __ai int32x4_t vreinterpretq_s32_u32(uint32x4_t __a) { \

3334 return (int32x4_t)__a; }

3335 __ai int32x4_t vreinterpretq_s32_u64(uint64x2_t __a) { \

3336 return (int32x4_t)__a; }

3337 __ai int32x4_t vreinterpretq_s32_f16(float16x8_t __a) { \

3338 return (int32x4_t)__a; }

3339 __ai int32x4_t vreinterpretq_s32_f32(float32x4_t __a) { \

3340 return (int32x4_t)__a; }

3341 __ai int32x4_t vreinterpretq_s32_p8(poly8x16_t __a) { \

3342 return (int32x4_t)__a; }

3343 __ai int32x4_t vreinterpretq_s32_p16(poly16x8_t __a) { \

3344 return (int32x4_t)__a; }

3345 __ai int64x2_t vreinterpretq_s64_s8(int8x16_t __a) { \

3346 return (int64x2_t)__a; }

3347 __ai int64x2_t vreinterpretq_s64_s16(int16x8_t __a) { \

3348 return (int64x2_t)__a; }

3349 __ai int64x2_t vreinterpretq_s64_s32(int32x4_t __a) { \

3350 return (int64x2_t)__a; }

3351 __ai int64x2_t vreinterpretq_s64_u8(uint8x16_t __a) { \

3352 return (int64x2_t)__a; }

3353 __ai int64x2_t vreinterpretq_s64_u16(uint16x8_t __a) { \

3354 return (int64x2_t)__a; }

3355 __ai int64x2_t vreinterpretq_s64_u32(uint32x4_t __a) { \

3356 return (int64x2_t)__a; }

3357 __ai int64x2_t vreinterpretq_s64_u64(uint64x2_t __a) { \

3358 return (int64x2_t)__a; }

3359 __ai int64x2_t vreinterpretq_s64_f16(float16x8_t __a) { \

3360 return (int64x2_t)__a; }

3361 __ai int64x2_t vreinterpretq_s64_f32(float32x4_t __a) { \

3362 return (int64x2_t)__a; }

3363 __ai int64x2_t vreinterpretq_s64_p8(poly8x16_t __a) { \

3364 return (int64x2_t)__a; }

3365 __ai int64x2_t vreinterpretq_s64_p16(poly16x8_t __a) { \

3366 return (int64x2_t)__a; }

3367 __ai uint8x16_t vreinterpretq_u8_s8(int8x16_t __a) { \

3368 return (uint8x16_t)__a; }

3369 __ai uint8x16_t vreinterpretq_u8_s16(int16x8_t __a) { \

3370 return (uint8x16_t)__a; }

3371 __ai uint8x16_t vreinterpretq_u8_s32(int32x4_t __a) { \

3372 return (uint8x16_t)__a; }

3373 __ai uint8x16_t vreinterpretq_u8_s64(int64x2_t __a) { \

3374 return (uint8x16_t)__a; }

3375 __ai uint8x16_t vreinterpretq_u8_u16(uint16x8_t __a) { \

3376 return (uint8x16_t)__a; }

3377 __ai uint8x16_t vreinterpretq_u8_u32(uint32x4_t __a) { \

3378 return (uint8x16_t)__a; }

3379 __ai uint8x16_t vreinterpretq_u8_u64(uint64x2_t __a) { \

3380 return (uint8x16_t)__a; }

3381 __ai uint8x16_t vreinterpretq_u8_f16(float16x8_t __a) { \

3382 return (uint8x16_t)__a; }

3383 __ai uint8x16_t vreinterpretq_u8_f32(float32x4_t __a) { \

3384 return (uint8x16_t)__a; }

3385 __ai uint8x16_t vreinterpretq_u8_p8(poly8x16_t __a) { \

3386 return (uint8x16_t)__a; }

3387 __ai uint8x16_t vreinterpretq_u8_p16(poly16x8_t __a) { \

3388 return (uint8x16_t)__a; }

3389 __ai uint16x8_t vreinterpretq_u16_s8(int8x16_t __a) { \

3390 return (uint16x8_t)__a; }

3391 __ai uint16x8_t vreinterpretq_u16_s16(int16x8_t __a) { \

3392 return (uint16x8_t)__a; }

3393 __ai uint16x8_t vreinterpretq_u16_s32(int32x4_t __a) { \

3394 return (uint16x8_t)__a; }

3395 __ai uint16x8_t vreinterpretq_u16_s64(int64x2_t __a) { \

3396 return (uint16x8_t)__a; }

3397 __ai uint16x8_t vreinterpretq_u16_u8(uint8x16_t __a) { \

3398 return (uint16x8_t)__a; }

3399 __ai uint16x8_t vreinterpretq_u16_u32(uint32x4_t __a) { \

3400 return (uint16x8_t)__a; }

3401 __ai uint16x8_t vreinterpretq_u16_u64(uint64x2_t __a) { \

3402 return (uint16x8_t)__a; }

3403 __ai uint16x8_t vreinterpretq_u16_f16(float16x8_t __a) { \

3404 return (uint16x8_t)__a; }

3405 __ai uint16x8_t vreinterpretq_u16_f32(float32x4_t __a) { \

3406 return (uint16x8_t)__a; }

3407 __ai uint16x8_t vreinterpretq_u16_p8(poly8x16_t __a) { \

3408 return (uint16x8_t)__a; }

3409 __ai uint16x8_t vreinterpretq_u16_p16(poly16x8_t __a) { \

3410 return (uint16x8_t)__a; }

3411 __ai uint32x4_t vreinterpretq_u32_s8(int8x16_t __a) { \

3412 return (uint32x4_t)__a; }

3413 __ai uint32x4_t vreinterpretq_u32_s16(int16x8_t __a) { \

3414 return (uint32x4_t)__a; }

3415 __ai uint32x4_t vreinterpretq_u32_s32(int32x4_t __a) { \

3416 return (uint32x4_t)__a; }

3417 __ai uint32x4_t vreinterpretq_u32_s64(int64x2_t __a) { \

3418 return (uint32x4_t)__a; }

3419 __ai uint32x4_t vreinterpretq_u32_u8(uint8x16_t __a) { \

3420 return (uint32x4_t)__a; }

3421 __ai uint32x4_t vreinterpretq_u32_u16(uint16x8_t __a) { \

3422 return (uint32x4_t)__a; }

3423 __ai uint32x4_t vreinterpretq_u32_u64(uint64x2_t __a) { \

3424 return (uint32x4_t)__a; }

3425 __ai uint32x4_t vreinterpretq_u32_f16(float16x8_t __a) { \

3426 return (uint32x4_t)__a; }

3427 __ai uint32x4_t vreinterpretq_u32_f32(float32x4_t __a) { \

3428 return (uint32x4_t)__a; }

3429 __ai uint32x4_t vreinterpretq_u32_p8(poly8x16_t __a) { \

3430 return (uint32x4_t)__a; }

3431 __ai uint32x4_t vreinterpretq_u32_p16(poly16x8_t __a) { \

3432 return (uint32x4_t)__a; }

3433 __ai uint64x2_t vreinterpretq_u64_s8(int8x16_t __a) { \

3434 return (uint64x2_t)__a; }

3435 __ai uint64x2_t vreinterpretq_u64_s16(int16x8_t __a) { \

3436 return (uint64x2_t)__a; }

3437 __ai uint64x2_t vreinterpretq_u64_s32(int32x4_t __a) { \

3438 return (uint64x2_t)__a; }

3439 __ai uint64x2_t vreinterpretq_u64_s64(int64x2_t __a) { \

3440 return (uint64x2_t)__a; }

3441 __ai uint64x2_t vreinterpretq_u64_u8(uint8x16_t __a) { \

3442 return (uint64x2_t)__a; }

3443 __ai uint64x2_t vreinterpretq_u64_u16(uint16x8_t __a) { \

3444 return (uint64x2_t)__a; }

3445 __ai uint64x2_t vreinterpretq_u64_u32(uint32x4_t __a) { \

3446 return (uint64x2_t)__a; }

3447 __ai uint64x2_t vreinterpretq_u64_f16(float16x8_t __a) { \

3448 return (uint64x2_t)__a; }

3449 __ai uint64x2_t vreinterpretq_u64_f32(float32x4_t __a) { \

3450 return (uint64x2_t)__a; }

3451 __ai uint64x2_t vreinterpretq_u64_p8(poly8x16_t __a) { \

3452 return (uint64x2_t)__a; }

3453 __ai uint64x2_t vreinterpretq_u64_p16(poly16x8_t __a) { \

3454 return (uint64x2_t)__a; }

3455 __ai float16x8_t vreinterpretq_f16_s8(int8x16_t __a) { \

3456 return (float16x8_t)__a; }

3457 __ai float16x8_t vreinterpretq_f16_s16(int16x8_t __a) { \

3458 return (float16x8_t)__a; }

3459 __ai float16x8_t vreinterpretq_f16_s32(int32x4_t __a) { \

3460 return (float16x8_t)__a; }

3461 __ai float16x8_t vreinterpretq_f16_s64(int64x2_t __a) { \

3462 return (float16x8_t)__a; }

3463 __ai float16x8_t vreinterpretq_f16_u8(uint8x16_t __a) { \

3464 return (float16x8_t)__a; }

3465 __ai float16x8_t vreinterpretq_f16_u16(uint16x8_t __a) { \

3466 return (float16x8_t)__a; }

3467 __ai float16x8_t vreinterpretq_f16_u32(uint32x4_t __a) { \

3468 return (float16x8_t)__a; }

3469 __ai float16x8_t vreinterpretq_f16_u64(uint64x2_t __a) { \

3470 return (float16x8_t)__a; }

3471 __ai float16x8_t vreinterpretq_f16_f32(float32x4_t __a) { \

3472 return (float16x8_t)__a; }

3473 __ai float16x8_t vreinterpretq_f16_p8(poly8x16_t __a) { \

3474 return (float16x8_t)__a; }

3475 __ai float16x8_t vreinterpretq_f16_p16(poly16x8_t __a) { \

3476 return (float16x8_t)__a; }

3477 __ai float32x4_t vreinterpretq_f32_s8(int8x16_t __a) { \

3478 return (float32x4_t)__a; }

3479 __ai float32x4_t vreinterpretq_f32_s16(int16x8_t __a) { \

3480 return (float32x4_t)__a; }

3481 __ai float32x4_t vreinterpretq_f32_s32(int32x4_t __a) { \

3482 return (float32x4_t)__a; }

3483 __ai float32x4_t vreinterpretq_f32_s64(int64x2_t __a) { \

3484 return (float32x4_t)__a; }

3485 __ai float32x4_t vreinterpretq_f32_u8(uint8x16_t __a) { \

3486 return (float32x4_t)__a; }

3487 __ai float32x4_t vreinterpretq_f32_u16(uint16x8_t __a) { \

3488 return (float32x4_t)__a; }

3489 __ai float32x4_t vreinterpretq_f32_u32(uint32x4_t __a) { \

3490 return (float32x4_t)__a; }

3491 __ai float32x4_t vreinterpretq_f32_u64(uint64x2_t __a) { \

3492 return (float32x4_t)__a; }

3493 __ai float32x4_t vreinterpretq_f32_f16(float16x8_t __a) { \

3494 return (float32x4_t)__a; }

3495 __ai float32x4_t vreinterpretq_f32_p8(poly8x16_t __a) { \

3496 return (float32x4_t)__a; }

3497 __ai float32x4_t vreinterpretq_f32_p16(poly16x8_t __a) { \

3498 return (float32x4_t)__a; }

3499 __ai poly8x16_t vreinterpretq_p8_s8(int8x16_t __a) { \

3500 return (poly8x16_t)__a; }

3501 __ai poly8x16_t vreinterpretq_p8_s16(int16x8_t __a) { \

3502 return (poly8x16_t)__a; }

3503 __ai poly8x16_t vreinterpretq_p8_s32(int32x4_t __a) { \

3504 return (poly8x16_t)__a; }

3505 __ai poly8x16_t vreinterpretq_p8_s64(int64x2_t __a) { \

3506 return (poly8x16_t)__a; }

3507 __ai poly8x16_t vreinterpretq_p8_u8(uint8x16_t __a) { \

3508 return (poly8x16_t)__a; }

3509 __ai poly8x16_t vreinterpretq_p8_u16(uint16x8_t __a) { \

3510 return (poly8x16_t)__a; }

3511 __ai poly8x16_t vreinterpretq_p8_u32(uint32x4_t __a) { \

3512 return (poly8x16_t)__a; }

3513 __ai poly8x16_t vreinterpretq_p8_u64(uint64x2_t __a) { \

3514 return (poly8x16_t)__a; }

3515 __ai poly8x16_t vreinterpretq_p8_f16(float16x8_t __a) { \

3516 return (poly8x16_t)__a; }

3517 __ai poly8x16_t vreinterpretq_p8_f32(float32x4_t __a) { \

3518 return (poly8x16_t)__a; }

3519 __ai poly8x16_t vreinterpretq_p8_p16(poly16x8_t __a) { \

3520 return (poly8x16_t)__a; }

3521 __ai poly16x8_t vreinterpretq_p16_s8(int8x16_t __a) { \

3522 return (poly16x8_t)__a; }

3523 __ai poly16x8_t vreinterpretq_p16_s16(int16x8_t __a) { \

3524 return (poly16x8_t)__a; }

3525 __ai poly16x8_t vreinterpretq_p16_s32(int32x4_t __a) { \

3526 return (poly16x8_t)__a; }

3527 __ai poly16x8_t vreinterpretq_p16_s64(int64x2_t __a) { \

3528 return (poly16x8_t)__a; }

3529 __ai poly16x8_t vreinterpretq_p16_u8(uint8x16_t __a) { \

3530 return (poly16x8_t)__a; }

3531 __ai poly16x8_t vreinterpretq_p16_u16(uint16x8_t __a) { \

3532 return (poly16x8_t)__a; }

3533 __ai poly16x8_t vreinterpretq_p16_u32(uint32x4_t __a) { \

3534 return (poly16x8_t)__a; }

3535 __ai poly16x8_t vreinterpretq_p16_u64(uint64x2_t __a) { \

3536 return (poly16x8_t)__a; }

3537 __ai poly16x8_t vreinterpretq_p16_f16(float16x8_t __a) { \

3538 return (poly16x8_t)__a; }

3539 __ai poly16x8_t vreinterpretq_p16_f32(float32x4_t __a) { \

3540 return (poly16x8_t)__a; }

3541 __ai poly16x8_t vreinterpretq_p16_p8(poly8x16_t __a) { \

3542 return (poly16x8_t)__a; }

3543

3544 __ai int8x8_t vrev16_s8(int8x8_t __a) { \

3545 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3546 __ai uint8x8_t vrev16_u8(uint8x8_t __a) { \

3547 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3548 __ai poly8x8_t vrev16_p8(poly8x8_t __a) { \

3549 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3550 __ai int8x16_t vrev16q_s8(int8x16_t __a) { \

3551 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6, 9, 8, 11, 10, 13, 12, 15, 14); }

3552 __ai uint8x16_t vrev16q_u8(uint8x16_t __a) { \

3553 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6, 9, 8, 11, 10, 13, 12, 15, 14); }

3554 __ai poly8x16_t vrev16q_p8(poly8x16_t __a) { \

3555 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6, 9, 8, 11, 10, 13, 12, 15, 14); }

3556

3557 __ai int8x8_t vrev32_s8(int8x8_t __a) { \

3558 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3559 __ai int16x4_t vrev32_s16(int16x4_t __a) { \

3560 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3561 __ai uint8x8_t vrev32_u8(uint8x8_t __a) { \

3562 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3563 __ai uint16x4_t vrev32_u16(uint16x4_t __a) { \

3564 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3565 __ai poly8x8_t vrev32_p8(poly8x8_t __a) { \

3566 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3567 __ai poly16x4_t vrev32_p16(poly16x4_t __a) { \

3568 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3569 __ai int8x16_t vrev32q_s8(int8x16_t __a) { \

3570 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4, 11, 10, 9, 8, 15, 14, 13, 12); }

3571 __ai int16x8_t vrev32q_s16(int16x8_t __a) { \

3572 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3573 __ai uint8x16_t vrev32q_u8(uint8x16_t __a) { \

3574 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4, 11, 10, 9, 8, 15, 14, 13, 12); }

3575 __ai uint16x8_t vrev32q_u16(uint16x8_t __a) { \

3576 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3577 __ai poly8x16_t vrev32q_p8(poly8x16_t __a) { \

3578 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4, 11, 10, 9, 8, 15, 14, 13, 12); }

3579 __ai poly16x8_t vrev32q_p16(poly16x8_t __a) { \

3580 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2, 5, 4, 7, 6); }

3581

3582 __ai int8x8_t vrev64_s8(int8x8_t __a) { \

3583 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0); }

3584 __ai int16x4_t vrev64_s16(int16x4_t __a) { \

3585 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0); }

3586 __ai int32x2_t vrev64_s32(int32x2_t __a) { \

3587 return __builtin_shufflevector(__a, __a, 1, 0); }

3588 __ai uint8x8_t vrev64_u8(uint8x8_t __a) { \

3589 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0); }

3590 __ai uint16x4_t vrev64_u16(uint16x4_t __a) { \

3591 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0); }

3592 __ai uint32x2_t vrev64_u32(uint32x2_t __a) { \

3593 return __builtin_shufflevector(__a, __a, 1, 0); }

3594 __ai poly8x8_t vrev64_p8(poly8x8_t __a) { \

3595 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0); }

3596 __ai poly16x4_t vrev64_p16(poly16x4_t __a) { \

3597 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0); }

3598 __ai float32x2_t vrev64_f32(float32x2_t __a) { \

3599 return __builtin_shufflevector(__a, __a, 1, 0); }

3600 __ai int8x16_t vrev64q_s8(int8x16_t __a) { \

3601 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0, 15, 14, 13, 1 2, 11, 10, 9, 8); }

3602 __ai int16x8_t vrev64q_s16(int16x8_t __a) { \

3603 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3604 __ai int32x4_t vrev64q_s32(int32x4_t __a) { \

3605 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3606 __ai uint8x16_t vrev64q_u8(uint8x16_t __a) { \

3607 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0, 15, 14, 13, 1 2, 11, 10, 9, 8); }

3608 __ai uint16x8_t vrev64q_u16(uint16x8_t __a) { \

3609 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3610 __ai uint32x4_t vrev64q_u32(uint32x4_t __a) { \

3611 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3612 __ai poly8x16_t vrev64q_p8(poly8x16_t __a) { \

3613 return __builtin_shufflevector(__a, __a, 7, 6, 5, 4, 3, 2, 1, 0, 15, 14, 13, 1 2, 11, 10, 9, 8); }

3614 __ai poly16x8_t vrev64q_p16(poly16x8_t __a) { \

3615 return __builtin_shufflevector(__a, __a, 3, 2, 1, 0, 7, 6, 5, 4); }

3616 __ai float32x4_t vrev64q_f32(float32x4_t __a) { \

3617 return __builtin_shufflevector(__a, __a, 1, 0, 3, 2); }

3618

3619 __ai int8x8_t vrhadd_s8(int8x8_t __a, int8x8_t __b) { \

3620 return (int8x8_t)__builtin_neon_vrhadd_v(__a, __b, 0); }

3621 __ai int16x4_t vrhadd_s16(int16x4_t __a, int16x4_t __b) { \

3622 return (int16x4_t)__builtin_neon_vrhadd_v((int8x8_t)__a, (int8x8_t)__b, 1); }

3623 __ai int32x2_t vrhadd_s32(int32x2_t __a, int32x2_t __b) { \

3624 return (int32x2_t)__builtin_neon_vrhadd_v((int8x8_t)__a, (int8x8_t)__b, 2); }

3625 __ai uint8x8_t vrhadd_u8(uint8x8_t __a, uint8x8_t __b) { \

3626 return (uint8x8_t)__builtin_neon_vrhadd_v((int8x8_t)__a, (int8x8_t)__b, 8); }

3627 __ai uint16x4_t vrhadd_u16(uint16x4_t __a, uint16x4_t __b) { \

3628 return (uint16x4_t)__builtin_neon_vrhadd_v((int8x8_t)__a, (int8x8_t)__b, 9); }

3629 __ai uint32x2_t vrhadd_u32(uint32x2_t __a, uint32x2_t __b) { \

3630 return (uint32x2_t)__builtin_neon_vrhadd_v((int8x8_t)__a, (int8x8_t)__b, 10); }

3631 __ai int8x16_t vrhaddq_s8(int8x16_t __a, int8x16_t __b) { \

3632 return (int8x16_t)__builtin_neon_vrhaddq_v(__a, __b, 16); }

3633 __ai int16x8_t vrhaddq_s16(int16x8_t __a, int16x8_t __b) { \

3634 return (int16x8_t)__builtin_neon_vrhaddq_v((int8x16_t)__a, (int8x16_t)__b, 17) ; }

3635 __ai int32x4_t vrhaddq_s32(int32x4_t __a, int32x4_t __b) { \

3636 return (int32x4_t)__builtin_neon_vrhaddq_v((int8x16_t)__a, (int8x16_t)__b, 18) ; }

3637 __ai uint8x16_t vrhaddq_u8(uint8x16_t __a, uint8x16_t __b) { \

3638 return (uint8x16_t)__builtin_neon_vrhaddq_v((int8x16_t)__a, (int8x16_t)__b, 24 ); }

3639 __ai uint16x8_t vrhaddq_u16(uint16x8_t __a, uint16x8_t __b) { \

3640 return (uint16x8_t)__builtin_neon_vrhaddq_v((int8x16_t)__a, (int8x16_t)__b, 25 ); }

3641 __ai uint32x4_t vrhaddq_u32(uint32x4_t __a, uint32x4_t __b) { \

3642 return (uint32x4_t)__builtin_neon_vrhaddq_v((int8x16_t)__a, (int8x16_t)__b, 26 ); }

3643

3644 __ai int8x8_t vrshl_s8(int8x8_t __a, int8x8_t __b) { \

3645 return (int8x8_t)__builtin_neon_vrshl_v(__a, __b, 0); }

3646 __ai int16x4_t vrshl_s16(int16x4_t __a, int16x4_t __b) { \

3647 return (int16x4_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 1); }

3648 __ai int32x2_t vrshl_s32(int32x2_t __a, int32x2_t __b) { \

3649 return (int32x2_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 2); }

3650 __ai int64x1_t vrshl_s64(int64x1_t __a, int64x1_t __b) { \

3651 return (int64x1_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 3); }

3652 __ai uint8x8_t vrshl_u8(uint8x8_t __a, int8x8_t __b) { \

3653 return (uint8x8_t)__builtin_neon_vrshl_v((int8x8_t)__a, __b, 8); }

3654 __ai uint16x4_t vrshl_u16(uint16x4_t __a, int16x4_t __b) { \

3655 return (uint16x4_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 9); }

3656 __ai uint32x2_t vrshl_u32(uint32x2_t __a, int32x2_t __b) { \

3657 return (uint32x2_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 10); }

3658 __ai uint64x1_t vrshl_u64(uint64x1_t __a, int64x1_t __b) { \

3659 return (uint64x1_t)__builtin_neon_vrshl_v((int8x8_t)__a, (int8x8_t)__b, 11); }

3660 __ai int8x16_t vrshlq_s8(int8x16_t __a, int8x16_t __b) { \

3661 return (int8x16_t)__builtin_neon_vrshlq_v(__a, __b, 16); }

3662 __ai int16x8_t vrshlq_s16(int16x8_t __a, int16x8_t __b) { \

3663 return (int16x8_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

3664 __ai int32x4_t vrshlq_s32(int32x4_t __a, int32x4_t __b) { \

3665 return (int32x4_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

3666 __ai int64x2_t vrshlq_s64(int64x2_t __a, int64x2_t __b) { \

3667 return (int64x2_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 19); }

3668 __ai uint8x16_t vrshlq_u8(uint8x16_t __a, int8x16_t __b) { \

3669 return (uint8x16_t)__builtin_neon_vrshlq_v((int8x16_t)__a, __b, 24); }

3670 __ai uint16x8_t vrshlq_u16(uint16x8_t __a, int16x8_t __b) { \

3671 return (uint16x8_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 25) ; }

3672 __ai uint32x4_t vrshlq_u32(uint32x4_t __a, int32x4_t __b) { \

3673 return (uint32x4_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 26) ; }

3674 __ai uint64x2_t vrshlq_u64(uint64x2_t __a, int64x2_t __b) { \

3675 return (uint64x2_t)__builtin_neon_vrshlq_v((int8x16_t)__a, (int8x16_t)__b, 27) ; }

3676

3677 #define vrshrn_n_s16(a, __b) __extension__ ({ \

3678 int16x8_t __a = (a); \

3679 (int8x8_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 0); })

3680 #define vrshrn_n_s32(a, __b) __extension__ ({ \

3681 int32x4_t __a = (a); \

3682 (int16x4_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 1); })

3683 #define vrshrn_n_s64(a, __b) __extension__ ({ \

3684 int64x2_t __a = (a); \

3685 (int32x2_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 2); })

3686 #define vrshrn_n_u16(a, __b) __extension__ ({ \

3687 uint16x8_t __a = (a); \

3688 (uint8x8_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 8); })

3689 #define vrshrn_n_u32(a, __b) __extension__ ({ \

3690 uint32x4_t __a = (a); \

3691 (uint16x4_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 9); })

3692 #define vrshrn_n_u64(a, __b) __extension__ ({ \

3693 uint64x2_t __a = (a); \

3694 (uint32x2_t)__builtin_neon_vrshrn_n_v((int8x16_t)__a, __b, 10); })

3695

3696 #define vrshr_n_s8(a, __b) __extension__ ({ \

3697 int8x8_t __a = (a); \

3698 (int8x8_t)__builtin_neon_vrshr_n_v(__a, __b, 0); })

3699 #define vrshr_n_s16(a, __b) __extension__ ({ \

3700 int16x4_t __a = (a); \

3701 (int16x4_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 1); })

3702 #define vrshr_n_s32(a, __b) __extension__ ({ \

3703 int32x2_t __a = (a); \

3704 (int32x2_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 2); })

3705 #define vrshr_n_s64(a, __b) __extension__ ({ \

3706 int64x1_t __a = (a); \

3707 (int64x1_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 3); })

3708 #define vrshr_n_u8(a, __b) __extension__ ({ \

3709 uint8x8_t __a = (a); \

3710 (uint8x8_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 8); })

3711 #define vrshr_n_u16(a, __b) __extension__ ({ \

3712 uint16x4_t __a = (a); \

3713 (uint16x4_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 9); })

3714 #define vrshr_n_u32(a, __b) __extension__ ({ \

3715 uint32x2_t __a = (a); \

3716 (uint32x2_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 10); })

3717 #define vrshr_n_u64(a, __b) __extension__ ({ \

3718 uint64x1_t __a = (a); \

3719 (uint64x1_t)__builtin_neon_vrshr_n_v((int8x8_t)__a, __b, 11); })

3720 #define vrshrq_n_s8(a, __b) __extension__ ({ \

3721 int8x16_t __a = (a); \

3722 (int8x16_t)__builtin_neon_vrshrq_n_v(__a, __b, 16); })

3723 #define vrshrq_n_s16(a, __b) __extension__ ({ \

3724 int16x8_t __a = (a); \

3725 (int16x8_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 17); })

3726 #define vrshrq_n_s32(a, __b) __extension__ ({ \

3727 int32x4_t __a = (a); \

3728 (int32x4_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 18); })

3729 #define vrshrq_n_s64(a, __b) __extension__ ({ \

3730 int64x2_t __a = (a); \

3731 (int64x2_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 19); })

3732 #define vrshrq_n_u8(a, __b) __extension__ ({ \

3733 uint8x16_t __a = (a); \

3734 (uint8x16_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 24); })

3735 #define vrshrq_n_u16(a, __b) __extension__ ({ \

3736 uint16x8_t __a = (a); \

3737 (uint16x8_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 25); })

3738 #define vrshrq_n_u32(a, __b) __extension__ ({ \

3739 uint32x4_t __a = (a); \

3740 (uint32x4_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 26); })

3741 #define vrshrq_n_u64(a, __b) __extension__ ({ \

3742 uint64x2_t __a = (a); \

3743 (uint64x2_t)__builtin_neon_vrshrq_n_v((int8x16_t)__a, __b, 27); })

3744

3745 __ai float32x2_t vrsqrte_f32(float32x2_t __a) { \

3746 return (float32x2_t)__builtin_neon_vrsqrte_v((int8x8_t)__a, 4); }

3747 __ai uint32x2_t vrsqrte_u32(uint32x2_t __a) { \

3748 return (uint32x2_t)__builtin_neon_vrsqrte_v((int8x8_t)__a, 10); }

3749 __ai float32x4_t vrsqrteq_f32(float32x4_t __a) { \

3750 return (float32x4_t)__builtin_neon_vrsqrteq_v((int8x16_t)__a, 20); }

3751 __ai uint32x4_t vrsqrteq_u32(uint32x4_t __a) { \

3752 return (uint32x4_t)__builtin_neon_vrsqrteq_v((int8x16_t)__a, 26); }

3753

3754 __ai float32x2_t vrsqrts_f32(float32x2_t __a, float32x2_t __b) { \

3755 return (float32x2_t)__builtin_neon_vrsqrts_v((int8x8_t)__a, (int8x8_t)__b, 4); }

3756 __ai float32x4_t vrsqrtsq_f32(float32x4_t __a, float32x4_t __b) { \

3757 return (float32x4_t)__builtin_neon_vrsqrtsq_v((int8x16_t)__a, (int8x16_t)__b, 20); }

3758

3759 #define vrsra_n_s8(a, b, __c) __extension__ ({ \

3760 int8x8_t __a = (a); int8x8_t __b = (b); \

3761 (int8x8_t)__builtin_neon_vrsra_n_v(__a, __b, __c, 0); })

3762 #define vrsra_n_s16(a, b, __c) __extension__ ({ \

3763 int16x4_t __a = (a); int16x4_t __b = (b); \

3764 (int16x4_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 1); })

3765 #define vrsra_n_s32(a, b, __c) __extension__ ({ \

3766 int32x2_t __a = (a); int32x2_t __b = (b); \

3767 (int32x2_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 2); })

3768 #define vrsra_n_s64(a, b, __c) __extension__ ({ \

3769 int64x1_t __a = (a); int64x1_t __b = (b); \

3770 (int64x1_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 3); })

3771 #define vrsra_n_u8(a, b, __c) __extension__ ({ \

3772 uint8x8_t __a = (a); uint8x8_t __b = (b); \

3773 (uint8x8_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 8); })

3774 #define vrsra_n_u16(a, b, __c) __extension__ ({ \

3775 uint16x4_t __a = (a); uint16x4_t __b = (b); \

3776 (uint16x4_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 9); })

3777 #define vrsra_n_u32(a, b, __c) __extension__ ({ \

3778 uint32x2_t __a = (a); uint32x2_t __b = (b); \

3779 (uint32x2_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 10); } )

3780 #define vrsra_n_u64(a, b, __c) __extension__ ({ \

3781 uint64x1_t __a = (a); uint64x1_t __b = (b); \

3782 (uint64x1_t)__builtin_neon_vrsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 11); } )

3783 #define vrsraq_n_s8(a, b, __c) __extension__ ({ \

3784 int8x16_t __a = (a); int8x16_t __b = (b); \

3785 (int8x16_t)__builtin_neon_vrsraq_n_v(__a, __b, __c, 16); })

3786 #define vrsraq_n_s16(a, b, __c) __extension__ ({ \

3787 int16x8_t __a = (a); int16x8_t __b = (b); \

3788 (int16x8_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 17); })

3789 #define vrsraq_n_s32(a, b, __c) __extension__ ({ \

3790 int32x4_t __a = (a); int32x4_t __b = (b); \

3791 (int32x4_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 18); })

3792 #define vrsraq_n_s64(a, b, __c) __extension__ ({ \

3793 int64x2_t __a = (a); int64x2_t __b = (b); \

3794 (int64x2_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 19); })

3795 #define vrsraq_n_u8(a, b, __c) __extension__ ({ \

3796 uint8x16_t __a = (a); uint8x16_t __b = (b); \

3797 (uint8x16_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 24) ; })

3798 #define vrsraq_n_u16(a, b, __c) __extension__ ({ \

3799 uint16x8_t __a = (a); uint16x8_t __b = (b); \

3800 (uint16x8_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 25) ; })

3801 #define vrsraq_n_u32(a, b, __c) __extension__ ({ \

3802 uint32x4_t __a = (a); uint32x4_t __b = (b); \

3803 (uint32x4_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 26) ; })

3804 #define vrsraq_n_u64(a, b, __c) __extension__ ({ \

3805 uint64x2_t __a = (a); uint64x2_t __b = (b); \

3806 (uint64x2_t)__builtin_neon_vrsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 27) ; })

3807

3808 __ai int8x8_t vrsubhn_s16(int16x8_t __a, int16x8_t __b) { \

3809 return (int8x8_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 0); }

3810 __ai int16x4_t vrsubhn_s32(int32x4_t __a, int32x4_t __b) { \

3811 return (int16x4_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 1); }

3812 __ai int32x2_t vrsubhn_s64(int64x2_t __a, int64x2_t __b) { \

3813 return (int32x2_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 2); }

3814 __ai uint8x8_t vrsubhn_u16(uint16x8_t __a, uint16x8_t __b) { \

3815 return (uint8x8_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 8); }

3816 __ai uint16x4_t vrsubhn_u32(uint32x4_t __a, uint32x4_t __b) { \

3817 return (uint16x4_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 9) ; }

3818 __ai uint32x2_t vrsubhn_u64(uint64x2_t __a, uint64x2_t __b) { \

3819 return (uint32x2_t)__builtin_neon_vrsubhn_v((int8x16_t)__a, (int8x16_t)__b, 10 ); }

3820

3821 #define vset_lane_u8(a, b, __c) __extension__ ({ \

3822 uint8_t __a = (a); uint8x8_t __b = (b); \

3823 (uint8x8_t)__builtin_neon_vset_lane_i8(__a, (int8x8_t)__b, __c); })

3824 #define vset_lane_u16(a, b, __c) __extension__ ({ \

3825 uint16_t __a = (a); uint16x4_t __b = (b); \

3826 (uint16x4_t)__builtin_neon_vset_lane_i16(__a, (int16x4_t)__b, __c); })

3827 #define vset_lane_u32(a, b, __c) __extension__ ({ \

3828 uint32_t __a = (a); uint32x2_t __b = (b); \

3829 (uint32x2_t)__builtin_neon_vset_lane_i32(__a, (int32x2_t)__b, __c); })

3830 #define vset_lane_s8(a, b, __c) __extension__ ({ \

3831 int8_t __a = (a); int8x8_t __b = (b); \

3832 (int8x8_t)__builtin_neon_vset_lane_i8(__a, __b, __c); })

3833 #define vset_lane_s16(a, b, __c) __extension__ ({ \

3834 int16_t __a = (a); int16x4_t __b = (b); \

3835 (int16x4_t)__builtin_neon_vset_lane_i16(__a, __b, __c); })

3836 #define vset_lane_s32(a, b, __c) __extension__ ({ \

3837 int32_t __a = (a); int32x2_t __b = (b); \

3838 (int32x2_t)__builtin_neon_vset_lane_i32(__a, __b, __c); })

3839 #define vset_lane_p8(a, b, __c) __extension__ ({ \

3840 poly8_t __a = (a); poly8x8_t __b = (b); \

3841 (poly8x8_t)__builtin_neon_vset_lane_i8(__a, (int8x8_t)__b, __c); })

3842 #define vset_lane_p16(a, b, __c) __extension__ ({ \

3843 poly16_t __a = (a); poly16x4_t __b = (b); \

3844 (poly16x4_t)__builtin_neon_vset_lane_i16(__a, (int16x4_t)__b, __c); })

3845 #define vset_lane_f32(a, b, __c) __extension__ ({ \

3846 float32_t __a = (a); float32x2_t __b = (b); \

3847 (float32x2_t)__builtin_neon_vset_lane_f32(__a, __b, __c); })

3848 #define vsetq_lane_u8(a, b, __c) __extension__ ({ \

3849 uint8_t __a = (a); uint8x16_t __b = (b); \

3850 (uint8x16_t)__builtin_neon_vsetq_lane_i8(__a, (int8x16_t)__b, __c); })

3851 #define vsetq_lane_u16(a, b, __c) __extension__ ({ \

3852 uint16_t __a = (a); uint16x8_t __b = (b); \

3853 (uint16x8_t)__builtin_neon_vsetq_lane_i16(__a, (int16x8_t)__b, __c); })

3854 #define vsetq_lane_u32(a, b, __c) __extension__ ({ \

3855 uint32_t __a = (a); uint32x4_t __b = (b); \

3856 (uint32x4_t)__builtin_neon_vsetq_lane_i32(__a, (int32x4_t)__b, __c); })

3857 #define vsetq_lane_s8(a, b, __c) __extension__ ({ \

3858 int8_t __a = (a); int8x16_t __b = (b); \

3859 (int8x16_t)__builtin_neon_vsetq_lane_i8(__a, __b, __c); })

3860 #define vsetq_lane_s16(a, b, __c) __extension__ ({ \

3861 int16_t __a = (a); int16x8_t __b = (b); \

3862 (int16x8_t)__builtin_neon_vsetq_lane_i16(__a, __b, __c); })

3863 #define vsetq_lane_s32(a, b, __c) __extension__ ({ \

3864 int32_t __a = (a); int32x4_t __b = (b); \

3865 (int32x4_t)__builtin_neon_vsetq_lane_i32(__a, __b, __c); })

3866 #define vsetq_lane_p8(a, b, __c) __extension__ ({ \

3867 poly8_t __a = (a); poly8x16_t __b = (b); \

3868 (poly8x16_t)__builtin_neon_vsetq_lane_i8(__a, (int8x16_t)__b, __c); })

3869 #define vsetq_lane_p16(a, b, __c) __extension__ ({ \

3870 poly16_t __a = (a); poly16x8_t __b = (b); \

3871 (poly16x8_t)__builtin_neon_vsetq_lane_i16(__a, (int16x8_t)__b, __c); })

3872 #define vsetq_lane_f32(a, b, __c) __extension__ ({ \

3873 float32_t __a = (a); float32x4_t __b = (b); \

3874 (float32x4_t)__builtin_neon_vsetq_lane_f32(__a, __b, __c); })

3875 #define vset_lane_s64(a, b, __c) __extension__ ({ \

3876 int64_t __a = (a); int64x1_t __b = (b); \

3877 (int64x1_t)__builtin_neon_vset_lane_i64(__a, __b, __c); })

3878 #define vset_lane_u64(a, b, __c) __extension__ ({ \

3879 uint64_t __a = (a); uint64x1_t __b = (b); \

3880 (uint64x1_t)__builtin_neon_vset_lane_i64(__a, (int64x1_t)__b, __c); })

3881 #define vsetq_lane_s64(a, b, __c) __extension__ ({ \

3882 int64_t __a = (a); int64x2_t __b = (b); \

3883 (int64x2_t)__builtin_neon_vsetq_lane_i64(__a, __b, __c); })

3884 #define vsetq_lane_u64(a, b, __c) __extension__ ({ \

3885 uint64_t __a = (a); uint64x2_t __b = (b); \

3886 (uint64x2_t)__builtin_neon_vsetq_lane_i64(__a, (int64x2_t)__b, __c); })

3887

3888 __ai int8x8_t vshl_s8(int8x8_t __a, int8x8_t __b) { \

3889 return (int8x8_t)__builtin_neon_vshl_v(__a, __b, 0); }

3890 __ai int16x4_t vshl_s16(int16x4_t __a, int16x4_t __b) { \

3891 return (int16x4_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 1); }

3892 __ai int32x2_t vshl_s32(int32x2_t __a, int32x2_t __b) { \

3893 return (int32x2_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 2); }

3894 __ai int64x1_t vshl_s64(int64x1_t __a, int64x1_t __b) { \

3895 return (int64x1_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 3); }

3896 __ai uint8x8_t vshl_u8(uint8x8_t __a, int8x8_t __b) { \

3897 return (uint8x8_t)__builtin_neon_vshl_v((int8x8_t)__a, __b, 8); }

3898 __ai uint16x4_t vshl_u16(uint16x4_t __a, int16x4_t __b) { \

3899 return (uint16x4_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 9); }

3900 __ai uint32x2_t vshl_u32(uint32x2_t __a, int32x2_t __b) { \

3901 return (uint32x2_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 10); }

3902 __ai uint64x1_t vshl_u64(uint64x1_t __a, int64x1_t __b) { \

3903 return (uint64x1_t)__builtin_neon_vshl_v((int8x8_t)__a, (int8x8_t)__b, 11); }

3904 __ai int8x16_t vshlq_s8(int8x16_t __a, int8x16_t __b) { \

3905 return (int8x16_t)__builtin_neon_vshlq_v(__a, __b, 16); }

3906 __ai int16x8_t vshlq_s16(int16x8_t __a, int16x8_t __b) { \

3907 return (int16x8_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 17); }

3908 __ai int32x4_t vshlq_s32(int32x4_t __a, int32x4_t __b) { \

3909 return (int32x4_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 18); }

3910 __ai int64x2_t vshlq_s64(int64x2_t __a, int64x2_t __b) { \

3911 return (int64x2_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 19); }

3912 __ai uint8x16_t vshlq_u8(uint8x16_t __a, int8x16_t __b) { \

3913 return (uint8x16_t)__builtin_neon_vshlq_v((int8x16_t)__a, __b, 24); }

3914 __ai uint16x8_t vshlq_u16(uint16x8_t __a, int16x8_t __b) { \

3915 return (uint16x8_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

3916 __ai uint32x4_t vshlq_u32(uint32x4_t __a, int32x4_t __b) { \

3917 return (uint32x4_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

3918 __ai uint64x2_t vshlq_u64(uint64x2_t __a, int64x2_t __b) { \

3919 return (uint64x2_t)__builtin_neon_vshlq_v((int8x16_t)__a, (int8x16_t)__b, 27); }

3920

3921 #define vshll_n_s8(a, __b) __extension__ ({ \

3922 int8x8_t __a = (a); \

3923 (int16x8_t)__builtin_neon_vshll_n_v(__a, __b, 17); })

3924 #define vshll_n_s16(a, __b) __extension__ ({ \

3925 int16x4_t __a = (a); \

3926 (int32x4_t)__builtin_neon_vshll_n_v((int8x8_t)__a, __b, 18); })

3927 #define vshll_n_s32(a, __b) __extension__ ({ \

3928 int32x2_t __a = (a); \

3929 (int64x2_t)__builtin_neon_vshll_n_v((int8x8_t)__a, __b, 19); })

3930 #define vshll_n_u8(a, __b) __extension__ ({ \

3931 uint8x8_t __a = (a); \

3932 (uint16x8_t)__builtin_neon_vshll_n_v((int8x8_t)__a, __b, 25); })

3933 #define vshll_n_u16(a, __b) __extension__ ({ \

3934 uint16x4_t __a = (a); \

3935 (uint32x4_t)__builtin_neon_vshll_n_v((int8x8_t)__a, __b, 26); })

3936 #define vshll_n_u32(a, __b) __extension__ ({ \

3937 uint32x2_t __a = (a); \

3938 (uint64x2_t)__builtin_neon_vshll_n_v((int8x8_t)__a, __b, 27); })

3939

3940 #define vshl_n_s8(a, __b) __extension__ ({ \

3941 int8x8_t __a = (a); \

3942 (int8x8_t)__builtin_neon_vshl_n_v(__a, __b, 0); })

3943 #define vshl_n_s16(a, __b) __extension__ ({ \

3944 int16x4_t __a = (a); \

3945 (int16x4_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 1); })

3946 #define vshl_n_s32(a, __b) __extension__ ({ \

3947 int32x2_t __a = (a); \

3948 (int32x2_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 2); })

3949 #define vshl_n_s64(a, __b) __extension__ ({ \

3950 int64x1_t __a = (a); \

3951 (int64x1_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 3); })

3952 #define vshl_n_u8(a, __b) __extension__ ({ \

3953 uint8x8_t __a = (a); \

3954 (uint8x8_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 8); })

3955 #define vshl_n_u16(a, __b) __extension__ ({ \

3956 uint16x4_t __a = (a); \

3957 (uint16x4_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 9); })

3958 #define vshl_n_u32(a, __b) __extension__ ({ \

3959 uint32x2_t __a = (a); \

3960 (uint32x2_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 10); })

3961 #define vshl_n_u64(a, __b) __extension__ ({ \

3962 uint64x1_t __a = (a); \

3963 (uint64x1_t)__builtin_neon_vshl_n_v((int8x8_t)__a, __b, 11); })

3964 #define vshlq_n_s8(a, __b) __extension__ ({ \

3965 int8x16_t __a = (a); \

3966 (int8x16_t)__builtin_neon_vshlq_n_v(__a, __b, 16); })

3967 #define vshlq_n_s16(a, __b) __extension__ ({ \

3968 int16x8_t __a = (a); \

3969 (int16x8_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 17); })

3970 #define vshlq_n_s32(a, __b) __extension__ ({ \

3971 int32x4_t __a = (a); \

3972 (int32x4_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 18); })

3973 #define vshlq_n_s64(a, __b) __extension__ ({ \

3974 int64x2_t __a = (a); \

3975 (int64x2_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 19); })

3976 #define vshlq_n_u8(a, __b) __extension__ ({ \

3977 uint8x16_t __a = (a); \

3978 (uint8x16_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 24); })

3979 #define vshlq_n_u16(a, __b) __extension__ ({ \

3980 uint16x8_t __a = (a); \

3981 (uint16x8_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 25); })

3982 #define vshlq_n_u32(a, __b) __extension__ ({ \

3983 uint32x4_t __a = (a); \

3984 (uint32x4_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 26); })

3985 #define vshlq_n_u64(a, __b) __extension__ ({ \

3986 uint64x2_t __a = (a); \

3987 (uint64x2_t)__builtin_neon_vshlq_n_v((int8x16_t)__a, __b, 27); })

3988

3989 #define vshrn_n_s16(a, __b) __extension__ ({ \

3990 int16x8_t __a = (a); \

3991 (int8x8_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 0); })

3992 #define vshrn_n_s32(a, __b) __extension__ ({ \

3993 int32x4_t __a = (a); \

3994 (int16x4_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 1); })

3995 #define vshrn_n_s64(a, __b) __extension__ ({ \

3996 int64x2_t __a = (a); \

3997 (int32x2_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 2); })

3998 #define vshrn_n_u16(a, __b) __extension__ ({ \

3999 uint16x8_t __a = (a); \

4000 (uint8x8_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 8); })

4001 #define vshrn_n_u32(a, __b) __extension__ ({ \

4002 uint32x4_t __a = (a); \

4003 (uint16x4_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 9); })

4004 #define vshrn_n_u64(a, __b) __extension__ ({ \

4005 uint64x2_t __a = (a); \

4006 (uint32x2_t)__builtin_neon_vshrn_n_v((int8x16_t)__a, __b, 10); })

4007

4008 #define vshr_n_s8(a, __b) __extension__ ({ \

4009 int8x8_t __a = (a); \

4010 (int8x8_t)__builtin_neon_vshr_n_v(__a, __b, 0); })

4011 #define vshr_n_s16(a, __b) __extension__ ({ \

4012 int16x4_t __a = (a); \

4013 (int16x4_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 1); })

4014 #define vshr_n_s32(a, __b) __extension__ ({ \

4015 int32x2_t __a = (a); \

4016 (int32x2_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 2); })

4017 #define vshr_n_s64(a, __b) __extension__ ({ \

4018 int64x1_t __a = (a); \

4019 (int64x1_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 3); })

4020 #define vshr_n_u8(a, __b) __extension__ ({ \

4021 uint8x8_t __a = (a); \

4022 (uint8x8_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 8); })

4023 #define vshr_n_u16(a, __b) __extension__ ({ \

4024 uint16x4_t __a = (a); \

4025 (uint16x4_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 9); })

4026 #define vshr_n_u32(a, __b) __extension__ ({ \

4027 uint32x2_t __a = (a); \

4028 (uint32x2_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 10); })

4029 #define vshr_n_u64(a, __b) __extension__ ({ \

4030 uint64x1_t __a = (a); \

4031 (uint64x1_t)__builtin_neon_vshr_n_v((int8x8_t)__a, __b, 11); })

4032 #define vshrq_n_s8(a, __b) __extension__ ({ \

4033 int8x16_t __a = (a); \

4034 (int8x16_t)__builtin_neon_vshrq_n_v(__a, __b, 16); })

4035 #define vshrq_n_s16(a, __b) __extension__ ({ \

4036 int16x8_t __a = (a); \

4037 (int16x8_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 17); })

4038 #define vshrq_n_s32(a, __b) __extension__ ({ \

4039 int32x4_t __a = (a); \

4040 (int32x4_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 18); })

4041 #define vshrq_n_s64(a, __b) __extension__ ({ \

4042 int64x2_t __a = (a); \

4043 (int64x2_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 19); })

4044 #define vshrq_n_u8(a, __b) __extension__ ({ \

4045 uint8x16_t __a = (a); \

4046 (uint8x16_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 24); })

4047 #define vshrq_n_u16(a, __b) __extension__ ({ \

4048 uint16x8_t __a = (a); \

4049 (uint16x8_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 25); })

4050 #define vshrq_n_u32(a, __b) __extension__ ({ \

4051 uint32x4_t __a = (a); \

4052 (uint32x4_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 26); })

4053 #define vshrq_n_u64(a, __b) __extension__ ({ \

4054 uint64x2_t __a = (a); \

4055 (uint64x2_t)__builtin_neon_vshrq_n_v((int8x16_t)__a, __b, 27); })

4056

4057 #define vsli_n_s8(a, b, __c) __extension__ ({ \

4058 int8x8_t __a = (a); int8x8_t __b = (b); \

4059 (int8x8_t)__builtin_neon_vsli_n_v(__a, __b, __c, 0); })

4060 #define vsli_n_s16(a, b, __c) __extension__ ({ \

4061 int16x4_t __a = (a); int16x4_t __b = (b); \

4062 (int16x4_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 1); })

4063 #define vsli_n_s32(a, b, __c) __extension__ ({ \

4064 int32x2_t __a = (a); int32x2_t __b = (b); \

4065 (int32x2_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 2); })

4066 #define vsli_n_s64(a, b, __c) __extension__ ({ \

4067 int64x1_t __a = (a); int64x1_t __b = (b); \

4068 (int64x1_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 3); })

4069 #define vsli_n_u8(a, b, __c) __extension__ ({ \

4070 uint8x8_t __a = (a); uint8x8_t __b = (b); \

4071 (uint8x8_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 8); })

4072 #define vsli_n_u16(a, b, __c) __extension__ ({ \

4073 uint16x4_t __a = (a); uint16x4_t __b = (b); \

4074 (uint16x4_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 9); })

4075 #define vsli_n_u32(a, b, __c) __extension__ ({ \

4076 uint32x2_t __a = (a); uint32x2_t __b = (b); \

4077 (uint32x2_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 10); })

4078 #define vsli_n_u64(a, b, __c) __extension__ ({ \

4079 uint64x1_t __a = (a); uint64x1_t __b = (b); \

4080 (uint64x1_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 11); })

4081 #define vsli_n_p8(a, b, __c) __extension__ ({ \

4082 poly8x8_t __a = (a); poly8x8_t __b = (b); \

4083 (poly8x8_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 5); })

4084 #define vsli_n_p16(a, b, __c) __extension__ ({ \

4085 poly16x4_t __a = (a); poly16x4_t __b = (b); \

4086 (poly16x4_t)__builtin_neon_vsli_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 6); })

4087 #define vsliq_n_s8(a, b, __c) __extension__ ({ \

4088 int8x16_t __a = (a); int8x16_t __b = (b); \

4089 (int8x16_t)__builtin_neon_vsliq_n_v(__a, __b, __c, 16); })

4090 #define vsliq_n_s16(a, b, __c) __extension__ ({ \

4091 int16x8_t __a = (a); int16x8_t __b = (b); \

4092 (int16x8_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 17); })

4093 #define vsliq_n_s32(a, b, __c) __extension__ ({ \

4094 int32x4_t __a = (a); int32x4_t __b = (b); \

4095 (int32x4_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 18); })

4096 #define vsliq_n_s64(a, b, __c) __extension__ ({ \

4097 int64x2_t __a = (a); int64x2_t __b = (b); \

4098 (int64x2_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 19); })

4099 #define vsliq_n_u8(a, b, __c) __extension__ ({ \

4100 uint8x16_t __a = (a); uint8x16_t __b = (b); \

4101 (uint8x16_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 24); })

4102 #define vsliq_n_u16(a, b, __c) __extension__ ({ \

4103 uint16x8_t __a = (a); uint16x8_t __b = (b); \

4104 (uint16x8_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 25); })

4105 #define vsliq_n_u32(a, b, __c) __extension__ ({ \

4106 uint32x4_t __a = (a); uint32x4_t __b = (b); \

4107 (uint32x4_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 26); })

4108 #define vsliq_n_u64(a, b, __c) __extension__ ({ \

4109 uint64x2_t __a = (a); uint64x2_t __b = (b); \

4110 (uint64x2_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 27); })

4111 #define vsliq_n_p8(a, b, __c) __extension__ ({ \

4112 poly8x16_t __a = (a); poly8x16_t __b = (b); \

4113 (poly8x16_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 21); })

4114 #define vsliq_n_p16(a, b, __c) __extension__ ({ \

4115 poly16x8_t __a = (a); poly16x8_t __b = (b); \

4116 (poly16x8_t)__builtin_neon_vsliq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 22); })

4117

4118 #define vsra_n_s8(a, b, __c) __extension__ ({ \

4119 int8x8_t __a = (a); int8x8_t __b = (b); \

4120 (int8x8_t)__builtin_neon_vsra_n_v(__a, __b, __c, 0); })

4121 #define vsra_n_s16(a, b, __c) __extension__ ({ \

4122 int16x4_t __a = (a); int16x4_t __b = (b); \

4123 (int16x4_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 1); })

4124 #define vsra_n_s32(a, b, __c) __extension__ ({ \

4125 int32x2_t __a = (a); int32x2_t __b = (b); \

4126 (int32x2_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 2); })

4127 #define vsra_n_s64(a, b, __c) __extension__ ({ \

4128 int64x1_t __a = (a); int64x1_t __b = (b); \

4129 (int64x1_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 3); })

4130 #define vsra_n_u8(a, b, __c) __extension__ ({ \

4131 uint8x8_t __a = (a); uint8x8_t __b = (b); \

4132 (uint8x8_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 8); })

4133 #define vsra_n_u16(a, b, __c) __extension__ ({ \

4134 uint16x4_t __a = (a); uint16x4_t __b = (b); \

4135 (uint16x4_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 9); })

4136 #define vsra_n_u32(a, b, __c) __extension__ ({ \

4137 uint32x2_t __a = (a); uint32x2_t __b = (b); \

4138 (uint32x2_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 10); })

4139 #define vsra_n_u64(a, b, __c) __extension__ ({ \

4140 uint64x1_t __a = (a); uint64x1_t __b = (b); \

4141 (uint64x1_t)__builtin_neon_vsra_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 11); })

4142 #define vsraq_n_s8(a, b, __c) __extension__ ({ \

4143 int8x16_t __a = (a); int8x16_t __b = (b); \

4144 (int8x16_t)__builtin_neon_vsraq_n_v(__a, __b, __c, 16); })

4145 #define vsraq_n_s16(a, b, __c) __extension__ ({ \

4146 int16x8_t __a = (a); int16x8_t __b = (b); \

4147 (int16x8_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 17); })

4148 #define vsraq_n_s32(a, b, __c) __extension__ ({ \

4149 int32x4_t __a = (a); int32x4_t __b = (b); \

4150 (int32x4_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 18); })

4151 #define vsraq_n_s64(a, b, __c) __extension__ ({ \

4152 int64x2_t __a = (a); int64x2_t __b = (b); \

4153 (int64x2_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 19); })

4154 #define vsraq_n_u8(a, b, __c) __extension__ ({ \

4155 uint8x16_t __a = (a); uint8x16_t __b = (b); \

4156 (uint8x16_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 24); })

4157 #define vsraq_n_u16(a, b, __c) __extension__ ({ \

4158 uint16x8_t __a = (a); uint16x8_t __b = (b); \

4159 (uint16x8_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 25); })

4160 #define vsraq_n_u32(a, b, __c) __extension__ ({ \

4161 uint32x4_t __a = (a); uint32x4_t __b = (b); \

4162 (uint32x4_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 26); })

4163 #define vsraq_n_u64(a, b, __c) __extension__ ({ \

4164 uint64x2_t __a = (a); uint64x2_t __b = (b); \

4165 (uint64x2_t)__builtin_neon_vsraq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 27); })

4166

4167 #define vsri_n_s8(a, b, __c) __extension__ ({ \

4168 int8x8_t __a = (a); int8x8_t __b = (b); \

4169 (int8x8_t)__builtin_neon_vsri_n_v(__a, __b, __c, 0); })

4170 #define vsri_n_s16(a, b, __c) __extension__ ({ \

4171 int16x4_t __a = (a); int16x4_t __b = (b); \

4172 (int16x4_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 1); })

4173 #define vsri_n_s32(a, b, __c) __extension__ ({ \

4174 int32x2_t __a = (a); int32x2_t __b = (b); \

4175 (int32x2_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 2); })

4176 #define vsri_n_s64(a, b, __c) __extension__ ({ \

4177 int64x1_t __a = (a); int64x1_t __b = (b); \

4178 (int64x1_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 3); })

4179 #define vsri_n_u8(a, b, __c) __extension__ ({ \

4180 uint8x8_t __a = (a); uint8x8_t __b = (b); \

4181 (uint8x8_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 8); })

4182 #define vsri_n_u16(a, b, __c) __extension__ ({ \

4183 uint16x4_t __a = (a); uint16x4_t __b = (b); \

4184 (uint16x4_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 9); })

4185 #define vsri_n_u32(a, b, __c) __extension__ ({ \

4186 uint32x2_t __a = (a); uint32x2_t __b = (b); \

4187 (uint32x2_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 10); })

4188 #define vsri_n_u64(a, b, __c) __extension__ ({ \

4189 uint64x1_t __a = (a); uint64x1_t __b = (b); \

4190 (uint64x1_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 11); })

4191 #define vsri_n_p8(a, b, __c) __extension__ ({ \

4192 poly8x8_t __a = (a); poly8x8_t __b = (b); \

4193 (poly8x8_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 5); })

4194 #define vsri_n_p16(a, b, __c) __extension__ ({ \

4195 poly16x4_t __a = (a); poly16x4_t __b = (b); \

4196 (poly16x4_t)__builtin_neon_vsri_n_v((int8x8_t)__a, (int8x8_t)__b, __c, 6); })

4197 #define vsriq_n_s8(a, b, __c) __extension__ ({ \

4198 int8x16_t __a = (a); int8x16_t __b = (b); \

4199 (int8x16_t)__builtin_neon_vsriq_n_v(__a, __b, __c, 16); })

4200 #define vsriq_n_s16(a, b, __c) __extension__ ({ \

4201 int16x8_t __a = (a); int16x8_t __b = (b); \

4202 (int16x8_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 17); })

4203 #define vsriq_n_s32(a, b, __c) __extension__ ({ \

4204 int32x4_t __a = (a); int32x4_t __b = (b); \

4205 (int32x4_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 18); })

4206 #define vsriq_n_s64(a, b, __c) __extension__ ({ \

4207 int64x2_t __a = (a); int64x2_t __b = (b); \

4208 (int64x2_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 19); })

4209 #define vsriq_n_u8(a, b, __c) __extension__ ({ \

4210 uint8x16_t __a = (a); uint8x16_t __b = (b); \

4211 (uint8x16_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 24); })

4212 #define vsriq_n_u16(a, b, __c) __extension__ ({ \

4213 uint16x8_t __a = (a); uint16x8_t __b = (b); \

4214 (uint16x8_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 25); })

4215 #define vsriq_n_u32(a, b, __c) __extension__ ({ \

4216 uint32x4_t __a = (a); uint32x4_t __b = (b); \

4217 (uint32x4_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 26); })

4218 #define vsriq_n_u64(a, b, __c) __extension__ ({ \

4219 uint64x2_t __a = (a); uint64x2_t __b = (b); \

4220 (uint64x2_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 27); })

4221 #define vsriq_n_p8(a, b, __c) __extension__ ({ \

4222 poly8x16_t __a = (a); poly8x16_t __b = (b); \

4223 (poly8x16_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 21); })

4224 #define vsriq_n_p16(a, b, __c) __extension__ ({ \

4225 poly16x8_t __a = (a); poly16x8_t __b = (b); \

4226 (poly16x8_t)__builtin_neon_vsriq_n_v((int8x16_t)__a, (int8x16_t)__b, __c, 22); })

4227

4228 #define vst1q_u8(__a, b) __extension__ ({ \

4229 uint8x16_t __b = (b); \

4230 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 24); })

4231 #define vst1q_u16(__a, b) __extension__ ({ \

4232 uint16x8_t __b = (b); \

4233 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 25); })

4234 #define vst1q_u32(__a, b) __extension__ ({ \

4235 uint32x4_t __b = (b); \

4236 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 26); })

4237 #define vst1q_u64(__a, b) __extension__ ({ \

4238 uint64x2_t __b = (b); \

4239 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 27); })

4240 #define vst1q_s8(__a, b) __extension__ ({ \

4241 int8x16_t __b = (b); \

4242 __builtin_neon_vst1q_v(__a, __b, 16); })

4243 #define vst1q_s16(__a, b) __extension__ ({ \

4244 int16x8_t __b = (b); \

4245 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 17); })

4246 #define vst1q_s32(__a, b) __extension__ ({ \

4247 int32x4_t __b = (b); \

4248 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 18); })

4249 #define vst1q_s64(__a, b) __extension__ ({ \

4250 int64x2_t __b = (b); \

4251 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 19); })

4252 #define vst1q_f16(__a, b) __extension__ ({ \

4253 float16x8_t __b = (b); \

4254 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 23); })

4255 #define vst1q_f32(__a, b) __extension__ ({ \

4256 float32x4_t __b = (b); \

4257 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 20); })

4258 #define vst1q_p8(__a, b) __extension__ ({ \

4259 poly8x16_t __b = (b); \

4260 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 21); })

4261 #define vst1q_p16(__a, b) __extension__ ({ \

4262 poly16x8_t __b = (b); \

4263 __builtin_neon_vst1q_v(__a, (int8x16_t)__b, 22); })

4264 #define vst1_u8(__a, b) __extension__ ({ \

4265 uint8x8_t __b = (b); \

4266 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 8); })

4267 #define vst1_u16(__a, b) __extension__ ({ \

4268 uint16x4_t __b = (b); \

4269 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 9); })

4270 #define vst1_u32(__a, b) __extension__ ({ \

4271 uint32x2_t __b = (b); \

4272 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 10); })

4273 #define vst1_u64(__a, b) __extension__ ({ \

4274 uint64x1_t __b = (b); \

4275 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 11); })

4276 #define vst1_s8(__a, b) __extension__ ({ \

4277 int8x8_t __b = (b); \

4278 __builtin_neon_vst1_v(__a, __b, 0); })

4279 #define vst1_s16(__a, b) __extension__ ({ \

4280 int16x4_t __b = (b); \

4281 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 1); })

4282 #define vst1_s32(__a, b) __extension__ ({ \

4283 int32x2_t __b = (b); \

4284 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 2); })

4285 #define vst1_s64(__a, b) __extension__ ({ \

4286 int64x1_t __b = (b); \

4287 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 3); })

4288 #define vst1_f16(__a, b) __extension__ ({ \

4289 float16x4_t __b = (b); \

4290 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 7); })

4291 #define vst1_f32(__a, b) __extension__ ({ \

4292 float32x2_t __b = (b); \

4293 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 4); })

4294 #define vst1_p8(__a, b) __extension__ ({ \

4295 poly8x8_t __b = (b); \

4296 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 5); })

4297 #define vst1_p16(__a, b) __extension__ ({ \

4298 poly16x4_t __b = (b); \

4299 __builtin_neon_vst1_v(__a, (int8x8_t)__b, 6); })

4300

4301 #define vst1q_lane_u8(__a, b, __c) __extension__ ({ \

4302 uint8x16_t __b = (b); \

4303 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 24); })

4304 #define vst1q_lane_u16(__a, b, __c) __extension__ ({ \

4305 uint16x8_t __b = (b); \

4306 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 25); })

4307 #define vst1q_lane_u32(__a, b, __c) __extension__ ({ \

4308 uint32x4_t __b = (b); \

4309 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 26); })

4310 #define vst1q_lane_u64(__a, b, __c) __extension__ ({ \

4311 uint64x2_t __b = (b); \

4312 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 27); })

4313 #define vst1q_lane_s8(__a, b, __c) __extension__ ({ \

4314 int8x16_t __b = (b); \

4315 __builtin_neon_vst1q_lane_v(__a, __b, __c, 16); })

4316 #define vst1q_lane_s16(__a, b, __c) __extension__ ({ \

4317 int16x8_t __b = (b); \

4318 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 17); })

4319 #define vst1q_lane_s32(__a, b, __c) __extension__ ({ \

4320 int32x4_t __b = (b); \

4321 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 18); })

4322 #define vst1q_lane_s64(__a, b, __c) __extension__ ({ \

4323 int64x2_t __b = (b); \

4324 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 19); })

4325 #define vst1q_lane_f16(__a, b, __c) __extension__ ({ \

4326 float16x8_t __b = (b); \

4327 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 23); })

4328 #define vst1q_lane_f32(__a, b, __c) __extension__ ({ \

4329 float32x4_t __b = (b); \

4330 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 20); })

4331 #define vst1q_lane_p8(__a, b, __c) __extension__ ({ \

4332 poly8x16_t __b = (b); \

4333 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 21); })

4334 #define vst1q_lane_p16(__a, b, __c) __extension__ ({ \

4335 poly16x8_t __b = (b); \

4336 __builtin_neon_vst1q_lane_v(__a, (int8x16_t)__b, __c, 22); })

4337 #define vst1_lane_u8(__a, b, __c) __extension__ ({ \

4338 uint8x8_t __b = (b); \

4339 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 8); })

4340 #define vst1_lane_u16(__a, b, __c) __extension__ ({ \

4341 uint16x4_t __b = (b); \

4342 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 9); })

4343 #define vst1_lane_u32(__a, b, __c) __extension__ ({ \

4344 uint32x2_t __b = (b); \

4345 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 10); })

4346 #define vst1_lane_u64(__a, b, __c) __extension__ ({ \

4347 uint64x1_t __b = (b); \

4348 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 11); })

4349 #define vst1_lane_s8(__a, b, __c) __extension__ ({ \

4350 int8x8_t __b = (b); \

4351 __builtin_neon_vst1_lane_v(__a, __b, __c, 0); })

4352 #define vst1_lane_s16(__a, b, __c) __extension__ ({ \

4353 int16x4_t __b = (b); \

4354 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 1); })

4355 #define vst1_lane_s32(__a, b, __c) __extension__ ({ \

4356 int32x2_t __b = (b); \

4357 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 2); })

4358 #define vst1_lane_s64(__a, b, __c) __extension__ ({ \

4359 int64x1_t __b = (b); \

4360 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 3); })

4361 #define vst1_lane_f16(__a, b, __c) __extension__ ({ \

4362 float16x4_t __b = (b); \

4363 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 7); })

4364 #define vst1_lane_f32(__a, b, __c) __extension__ ({ \

4365 float32x2_t __b = (b); \

4366 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 4); })

4367 #define vst1_lane_p8(__a, b, __c) __extension__ ({ \

4368 poly8x8_t __b = (b); \

4369 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 5); })

4370 #define vst1_lane_p16(__a, b, __c) __extension__ ({ \

4371 poly16x4_t __b = (b); \

4372 __builtin_neon_vst1_lane_v(__a, (int8x8_t)__b, __c, 6); })

4373

4374 #define vst2q_u8(__a, b) __extension__ ({ \

4375 uint8x16x2_t __b = (b); \

4376 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 24); })

4377 #define vst2q_u16(__a, b) __extension__ ({ \

4378 uint16x8x2_t __b = (b); \

4379 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 25); })

4380 #define vst2q_u32(__a, b) __extension__ ({ \

4381 uint32x4x2_t __b = (b); \

4382 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 26); })

4383 #define vst2q_s8(__a, b) __extension__ ({ \

4384 int8x16x2_t __b = (b); \

4385 __builtin_neon_vst2q_v(__a, __b.val[0], __b.val[1], 16); })

4386 #define vst2q_s16(__a, b) __extension__ ({ \

4387 int16x8x2_t __b = (b); \

4388 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 17); })

4389 #define vst2q_s32(__a, b) __extension__ ({ \

4390 int32x4x2_t __b = (b); \

4391 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 18); })

4392 #define vst2q_f16(__a, b) __extension__ ({ \

4393 float16x8x2_t __b = (b); \

4394 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 23); })

4395 #define vst2q_f32(__a, b) __extension__ ({ \

4396 float32x4x2_t __b = (b); \

4397 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 20); })

4398 #define vst2q_p8(__a, b) __extension__ ({ \

4399 poly8x16x2_t __b = (b); \

4400 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 21); })

4401 #define vst2q_p16(__a, b) __extension__ ({ \

4402 poly16x8x2_t __b = (b); \

4403 __builtin_neon_vst2q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], 22); })

4404 #define vst2_u8(__a, b) __extension__ ({ \

4405 uint8x8x2_t __b = (b); \

4406 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 8); })

4407 #define vst2_u16(__a, b) __extension__ ({ \

4408 uint16x4x2_t __b = (b); \

4409 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 9); })

4410 #define vst2_u32(__a, b) __extension__ ({ \

4411 uint32x2x2_t __b = (b); \

4412 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 10); })

4413 #define vst2_u64(__a, b) __extension__ ({ \

4414 uint64x1x2_t __b = (b); \

4415 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 11); })

4416 #define vst2_s8(__a, b) __extension__ ({ \

4417 int8x8x2_t __b = (b); \

4418 __builtin_neon_vst2_v(__a, __b.val[0], __b.val[1], 0); })

4419 #define vst2_s16(__a, b) __extension__ ({ \

4420 int16x4x2_t __b = (b); \

4421 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 1); })

4422 #define vst2_s32(__a, b) __extension__ ({ \

4423 int32x2x2_t __b = (b); \

4424 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 2); })

4425 #define vst2_s64(__a, b) __extension__ ({ \

4426 int64x1x2_t __b = (b); \

4427 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 3); })

4428 #define vst2_f16(__a, b) __extension__ ({ \

4429 float16x4x2_t __b = (b); \

4430 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 7); })

4431 #define vst2_f32(__a, b) __extension__ ({ \

4432 float32x2x2_t __b = (b); \

4433 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 4); })

4434 #define vst2_p8(__a, b) __extension__ ({ \

4435 poly8x8x2_t __b = (b); \

4436 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 5); })

4437 #define vst2_p16(__a, b) __extension__ ({ \

4438 poly16x4x2_t __b = (b); \

4439 __builtin_neon_vst2_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], 6); })

4440

4441 #define vst2q_lane_u16(__a, b, __c) __extension__ ({ \

4442 uint16x8x2_t __b = (b); \

4443 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 25); })

4444 #define vst2q_lane_u32(__a, b, __c) __extension__ ({ \

4445 uint32x4x2_t __b = (b); \

4446 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 26); })

4447 #define vst2q_lane_s16(__a, b, __c) __extension__ ({ \

4448 int16x8x2_t __b = (b); \

4449 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 17); })

4450 #define vst2q_lane_s32(__a, b, __c) __extension__ ({ \

4451 int32x4x2_t __b = (b); \

4452 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 18); })

4453 #define vst2q_lane_f16(__a, b, __c) __extension__ ({ \

4454 float16x8x2_t __b = (b); \

4455 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 23); })

4456 #define vst2q_lane_f32(__a, b, __c) __extension__ ({ \

4457 float32x4x2_t __b = (b); \

4458 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 20); })

4459 #define vst2q_lane_p16(__a, b, __c) __extension__ ({ \

4460 poly16x8x2_t __b = (b); \

4461 __builtin_neon_vst2q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], __c, 22); })

4462 #define vst2_lane_u8(__a, b, __c) __extension__ ({ \

4463 uint8x8x2_t __b = (b); \

4464 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 8); })

4465 #define vst2_lane_u16(__a, b, __c) __extension__ ({ \

4466 uint16x4x2_t __b = (b); \

4467 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 9); })

4468 #define vst2_lane_u32(__a, b, __c) __extension__ ({ \

4469 uint32x2x2_t __b = (b); \

4470 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 10); })

4471 #define vst2_lane_s8(__a, b, __c) __extension__ ({ \

4472 int8x8x2_t __b = (b); \

4473 __builtin_neon_vst2_lane_v(__a, __b.val[0], __b.val[1], __c, 0); })

4474 #define vst2_lane_s16(__a, b, __c) __extension__ ({ \

4475 int16x4x2_t __b = (b); \

4476 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 1); })

4477 #define vst2_lane_s32(__a, b, __c) __extension__ ({ \

4478 int32x2x2_t __b = (b); \

4479 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 2); })

4480 #define vst2_lane_f16(__a, b, __c) __extension__ ({ \

4481 float16x4x2_t __b = (b); \

4482 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 7); })

4483 #define vst2_lane_f32(__a, b, __c) __extension__ ({ \

4484 float32x2x2_t __b = (b); \

4485 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 4); })

4486 #define vst2_lane_p8(__a, b, __c) __extension__ ({ \

4487 poly8x8x2_t __b = (b); \

4488 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 5); })

4489 #define vst2_lane_p16(__a, b, __c) __extension__ ({ \

4490 poly16x4x2_t __b = (b); \

4491 __builtin_neon_vst2_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], __ c, 6); })

4492

4493 #define vst3q_u8(__a, b) __extension__ ({ \

4494 uint8x16x3_t __b = (b); \

4495 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 24); })

4496 #define vst3q_u16(__a, b) __extension__ ({ \

4497 uint16x8x3_t __b = (b); \

4498 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 25); })

4499 #define vst3q_u32(__a, b) __extension__ ({ \

4500 uint32x4x3_t __b = (b); \

4501 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 26); })

4502 #define vst3q_s8(__a, b) __extension__ ({ \

4503 int8x16x3_t __b = (b); \

4504 __builtin_neon_vst3q_v(__a, __b.val[0], __b.val[1], __b.val[2], 16); })

4505 #define vst3q_s16(__a, b) __extension__ ({ \

4506 int16x8x3_t __b = (b); \

4507 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 17); })

4508 #define vst3q_s32(__a, b) __extension__ ({ \

4509 int32x4x3_t __b = (b); \

4510 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 18); })

4511 #define vst3q_f16(__a, b) __extension__ ({ \

4512 float16x8x3_t __b = (b); \

4513 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 23); })

4514 #define vst3q_f32(__a, b) __extension__ ({ \

4515 float32x4x3_t __b = (b); \

4516 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 20); })

4517 #define vst3q_p8(__a, b) __extension__ ({ \

4518 poly8x16x3_t __b = (b); \

4519 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 21); })

4520 #define vst3q_p16(__a, b) __extension__ ({ \

4521 poly16x8x3_t __b = (b); \

4522 __builtin_neon_vst3q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], 22); })

4523 #define vst3_u8(__a, b) __extension__ ({ \

4524 uint8x8x3_t __b = (b); \

4525 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 8); })

4526 #define vst3_u16(__a, b) __extension__ ({ \

4527 uint16x4x3_t __b = (b); \

4528 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 9); })

4529 #define vst3_u32(__a, b) __extension__ ({ \

4530 uint32x2x3_t __b = (b); \

4531 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 10); })

4532 #define vst3_u64(__a, b) __extension__ ({ \

4533 uint64x1x3_t __b = (b); \

4534 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 11); })

4535 #define vst3_s8(__a, b) __extension__ ({ \

4536 int8x8x3_t __b = (b); \

4537 __builtin_neon_vst3_v(__a, __b.val[0], __b.val[1], __b.val[2], 0); })

4538 #define vst3_s16(__a, b) __extension__ ({ \

4539 int16x4x3_t __b = (b); \

4540 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 1); })

4541 #define vst3_s32(__a, b) __extension__ ({ \

4542 int32x2x3_t __b = (b); \

4543 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 2); })

4544 #define vst3_s64(__a, b) __extension__ ({ \

4545 int64x1x3_t __b = (b); \

4546 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 3); })

4547 #define vst3_f16(__a, b) __extension__ ({ \

4548 float16x4x3_t __b = (b); \

4549 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 7); })

4550 #define vst3_f32(__a, b) __extension__ ({ \

4551 float32x2x3_t __b = (b); \

4552 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 4); })

4553 #define vst3_p8(__a, b) __extension__ ({ \

4554 poly8x8x3_t __b = (b); \

4555 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 5); })

4556 #define vst3_p16(__a, b) __extension__ ({ \

4557 poly16x4x3_t __b = (b); \

4558 __builtin_neon_vst3_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], 6); })

4559

4560 #define vst3q_lane_u16(__a, b, __c) __extension__ ({ \

4561 uint16x8x3_t __b = (b); \

4562 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 25); })

4563 #define vst3q_lane_u32(__a, b, __c) __extension__ ({ \

4564 uint32x4x3_t __b = (b); \

4565 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 26); })

4566 #define vst3q_lane_s16(__a, b, __c) __extension__ ({ \

4567 int16x8x3_t __b = (b); \

4568 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 17); })

4569 #define vst3q_lane_s32(__a, b, __c) __extension__ ({ \

4570 int32x4x3_t __b = (b); \

4571 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 18); })

4572 #define vst3q_lane_f16(__a, b, __c) __extension__ ({ \

4573 float16x8x3_t __b = (b); \

4574 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 23); })

4575 #define vst3q_lane_f32(__a, b, __c) __extension__ ({ \

4576 float32x4x3_t __b = (b); \

4577 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 20); })

4578 #define vst3q_lane_p16(__a, b, __c) __extension__ ({ \

4579 poly16x8x3_t __b = (b); \

4580 __builtin_neon_vst3q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], __c, 22); })

4581 #define vst3_lane_u8(__a, b, __c) __extension__ ({ \

4582 uint8x8x3_t __b = (b); \

4583 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 8); })

4584 #define vst3_lane_u16(__a, b, __c) __extension__ ({ \

4585 uint16x4x3_t __b = (b); \

4586 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 9); })

4587 #define vst3_lane_u32(__a, b, __c) __extension__ ({ \

4588 uint32x2x3_t __b = (b); \

4589 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 10); })

4590 #define vst3_lane_s8(__a, b, __c) __extension__ ({ \

4591 int8x8x3_t __b = (b); \

4592 __builtin_neon_vst3_lane_v(__a, __b.val[0], __b.val[1], __b.val[2], __c, 0); } )

4593 #define vst3_lane_s16(__a, b, __c) __extension__ ({ \

4594 int16x4x3_t __b = (b); \

4595 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 1); })

4596 #define vst3_lane_s32(__a, b, __c) __extension__ ({ \

4597 int32x2x3_t __b = (b); \

4598 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 2); })

4599 #define vst3_lane_f16(__a, b, __c) __extension__ ({ \

4600 float16x4x3_t __b = (b); \

4601 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 7); })

4602 #define vst3_lane_f32(__a, b, __c) __extension__ ({ \

4603 float32x2x3_t __b = (b); \

4604 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 4); })

4605 #define vst3_lane_p8(__a, b, __c) __extension__ ({ \

4606 poly8x8x3_t __b = (b); \

4607 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 5); })

4608 #define vst3_lane_p16(__a, b, __c) __extension__ ({ \

4609 poly16x4x3_t __b = (b); \

4610 __builtin_neon_vst3_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], __c, 6); })

4611

4612 #define vst4q_u8(__a, b) __extension__ ({ \

4613 uint8x16x4_t __b = (b); \

4614 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 24); })

4615 #define vst4q_u16(__a, b) __extension__ ({ \

4616 uint16x8x4_t __b = (b); \

4617 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 25); })

4618 #define vst4q_u32(__a, b) __extension__ ({ \

4619 uint32x4x4_t __b = (b); \

4620 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 26); })

4621 #define vst4q_s8(__a, b) __extension__ ({ \

4622 int8x16x4_t __b = (b); \

4623 __builtin_neon_vst4q_v(__a, __b.val[0], __b.val[1], __b.val[2], __b.val[3], 16 ); })

4624 #define vst4q_s16(__a, b) __extension__ ({ \

4625 int16x8x4_t __b = (b); \

4626 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 17); })

4627 #define vst4q_s32(__a, b) __extension__ ({ \

4628 int32x4x4_t __b = (b); \

4629 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 18); })

4630 #define vst4q_f16(__a, b) __extension__ ({ \

4631 float16x8x4_t __b = (b); \

4632 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 23); })

4633 #define vst4q_f32(__a, b) __extension__ ({ \

4634 float32x4x4_t __b = (b); \

4635 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 20); })

4636 #define vst4q_p8(__a, b) __extension__ ({ \

4637 poly8x16x4_t __b = (b); \

4638 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 21); })

4639 #define vst4q_p16(__a, b) __extension__ ({ \

4640 poly16x8x4_t __b = (b); \

4641 __builtin_neon_vst4q_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int 8x16_t)__b.val[2], (int8x16_t)__b.val[3], 22); })

4642 #define vst4_u8(__a, b) __extension__ ({ \

4643 uint8x8x4_t __b = (b); \

4644 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 8); })

4645 #define vst4_u16(__a, b) __extension__ ({ \

4646 uint16x4x4_t __b = (b); \

4647 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 9); })

4648 #define vst4_u32(__a, b) __extension__ ({ \

4649 uint32x2x4_t __b = (b); \

4650 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 10); })

4651 #define vst4_u64(__a, b) __extension__ ({ \

4652 uint64x1x4_t __b = (b); \

4653 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 11); })

4654 #define vst4_s8(__a, b) __extension__ ({ \

4655 int8x8x4_t __b = (b); \

4656 __builtin_neon_vst4_v(__a, __b.val[0], __b.val[1], __b.val[2], __b.val[3], 0); })

4657 #define vst4_s16(__a, b) __extension__ ({ \

4658 int16x4x4_t __b = (b); \

4659 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 1); })

4660 #define vst4_s32(__a, b) __extension__ ({ \

4661 int32x2x4_t __b = (b); \

4662 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 2); })

4663 #define vst4_s64(__a, b) __extension__ ({ \

4664 int64x1x4_t __b = (b); \

4665 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 3); })

4666 #define vst4_f16(__a, b) __extension__ ({ \

4667 float16x4x4_t __b = (b); \

4668 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 7); })

4669 #define vst4_f32(__a, b) __extension__ ({ \

4670 float32x2x4_t __b = (b); \

4671 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 4); })

4672 #define vst4_p8(__a, b) __extension__ ({ \

4673 poly8x8x4_t __b = (b); \

4674 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 5); })

4675 #define vst4_p16(__a, b) __extension__ ({ \

4676 poly16x4x4_t __b = (b); \

4677 __builtin_neon_vst4_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8 _t)__b.val[2], (int8x8_t)__b.val[3], 6); })

4678

4679 #define vst4q_lane_u16(__a, b, __c) __extension__ ({ \

4680 uint16x8x4_t __b = (b); \

4681 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 25); })

4682 #define vst4q_lane_u32(__a, b, __c) __extension__ ({ \

4683 uint32x4x4_t __b = (b); \

4684 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 26); })

4685 #define vst4q_lane_s16(__a, b, __c) __extension__ ({ \

4686 int16x8x4_t __b = (b); \

4687 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 17); })

4688 #define vst4q_lane_s32(__a, b, __c) __extension__ ({ \

4689 int32x4x4_t __b = (b); \

4690 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 18); })

4691 #define vst4q_lane_f16(__a, b, __c) __extension__ ({ \

4692 float16x8x4_t __b = (b); \

4693 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 23); })

4694 #define vst4q_lane_f32(__a, b, __c) __extension__ ({ \

4695 float32x4x4_t __b = (b); \

4696 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 20); })

4697 #define vst4q_lane_p16(__a, b, __c) __extension__ ({ \

4698 poly16x8x4_t __b = (b); \

4699 __builtin_neon_vst4q_lane_v(__a, (int8x16_t)__b.val[0], (int8x16_t)__b.val[1], (int8x16_t)__b.val[2], (int8x16_t)__b.val[3], __c, 22); })

4700 #define vst4_lane_u8(__a, b, __c) __extension__ ({ \

4701 uint8x8x4_t __b = (b); \

4702 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 8); })

4703 #define vst4_lane_u16(__a, b, __c) __extension__ ({ \

4704 uint16x4x4_t __b = (b); \

4705 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 9); })

4706 #define vst4_lane_u32(__a, b, __c) __extension__ ({ \

4707 uint32x2x4_t __b = (b); \

4708 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 10); })

4709 #define vst4_lane_s8(__a, b, __c) __extension__ ({ \

4710 int8x8x4_t __b = (b); \

4711 __builtin_neon_vst4_lane_v(__a, __b.val[0], __b.val[1], __b.val[2], __b.val[3] , __c, 0); })

4712 #define vst4_lane_s16(__a, b, __c) __extension__ ({ \

4713 int16x4x4_t __b = (b); \

4714 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 1); })

4715 #define vst4_lane_s32(__a, b, __c) __extension__ ({ \

4716 int32x2x4_t __b = (b); \

4717 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 2); })

4718 #define vst4_lane_f16(__a, b, __c) __extension__ ({ \

4719 float16x4x4_t __b = (b); \

4720 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 7); })

4721 #define vst4_lane_f32(__a, b, __c) __extension__ ({ \

4722 float32x2x4_t __b = (b); \

4723 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 4); })

4724 #define vst4_lane_p8(__a, b, __c) __extension__ ({ \

4725 poly8x8x4_t __b = (b); \

4726 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 5); })

4727 #define vst4_lane_p16(__a, b, __c) __extension__ ({ \

4728 poly16x4x4_t __b = (b); \

4729 __builtin_neon_vst4_lane_v(__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (i nt8x8_t)__b.val[2], (int8x8_t)__b.val[3], __c, 6); })

4730

4731 __ai int8x8_t vsub_s8(int8x8_t __a, int8x8_t __b) { \

4732 return __a - __b; }

4733 __ai int16x4_t vsub_s16(int16x4_t __a, int16x4_t __b) { \

4734 return __a - __b; }

4735 __ai int32x2_t vsub_s32(int32x2_t __a, int32x2_t __b) { \

4736 return __a - __b; }

4737 __ai int64x1_t vsub_s64(int64x1_t __a, int64x1_t __b) { \

4738 return __a - __b; }

4739 __ai float32x2_t vsub_f32(float32x2_t __a, float32x2_t __b) { \

4740 return __a - __b; }

4741 __ai uint8x8_t vsub_u8(uint8x8_t __a, uint8x8_t __b) { \

4742 return __a - __b; }

4743 __ai uint16x4_t vsub_u16(uint16x4_t __a, uint16x4_t __b) { \

4744 return __a - __b; }

4745 __ai uint32x2_t vsub_u32(uint32x2_t __a, uint32x2_t __b) { \

4746 return __a - __b; }

4747 __ai uint64x1_t vsub_u64(uint64x1_t __a, uint64x1_t __b) { \

4748 return __a - __b; }

4749 __ai int8x16_t vsubq_s8(int8x16_t __a, int8x16_t __b) { \

4750 return __a - __b; }

4751 __ai int16x8_t vsubq_s16(int16x8_t __a, int16x8_t __b) { \

4752 return __a - __b; }

4753 __ai int32x4_t vsubq_s32(int32x4_t __a, int32x4_t __b) { \

4754 return __a - __b; }

4755 __ai int64x2_t vsubq_s64(int64x2_t __a, int64x2_t __b) { \

4756 return __a - __b; }

4757 __ai float32x4_t vsubq_f32(float32x4_t __a, float32x4_t __b) { \

4758 return __a - __b; }

4759 __ai uint8x16_t vsubq_u8(uint8x16_t __a, uint8x16_t __b) { \

4760 return __a - __b; }

4761 __ai uint16x8_t vsubq_u16(uint16x8_t __a, uint16x8_t __b) { \

4762 return __a - __b; }

4763 __ai uint32x4_t vsubq_u32(uint32x4_t __a, uint32x4_t __b) { \

4764 return __a - __b; }

4765 __ai uint64x2_t vsubq_u64(uint64x2_t __a, uint64x2_t __b) { \

4766 return __a - __b; }

4767

4768 __ai int8x8_t vsubhn_s16(int16x8_t __a, int16x8_t __b) { \

4769 return (int8x8_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 0); }

4770 __ai int16x4_t vsubhn_s32(int32x4_t __a, int32x4_t __b) { \

4771 return (int16x4_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 1); }

4772 __ai int32x2_t vsubhn_s64(int64x2_t __a, int64x2_t __b) { \

4773 return (int32x2_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 2); }

4774 __ai uint8x8_t vsubhn_u16(uint16x8_t __a, uint16x8_t __b) { \

4775 return (uint8x8_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 8); }

4776 __ai uint16x4_t vsubhn_u32(uint32x4_t __a, uint32x4_t __b) { \

4777 return (uint16x4_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 9); }

4778 __ai uint32x2_t vsubhn_u64(uint64x2_t __a, uint64x2_t __b) { \

4779 return (uint32x2_t)__builtin_neon_vsubhn_v((int8x16_t)__a, (int8x16_t)__b, 10) ; }

4780

4781 __ai int16x8_t vsubl_s8(int8x8_t __a, int8x8_t __b) { \

4782 return vmovl_s8(__a) - vmovl_s8(__b); }

4783 __ai int32x4_t vsubl_s16(int16x4_t __a, int16x4_t __b) { \

4784 return vmovl_s16(__a) - vmovl_s16(__b); }

4785 __ai int64x2_t vsubl_s32(int32x2_t __a, int32x2_t __b) { \

4786 return vmovl_s32(__a) - vmovl_s32(__b); }

4787 __ai uint16x8_t vsubl_u8(uint8x8_t __a, uint8x8_t __b) { \

4788 return vmovl_u8(__a) - vmovl_u8(__b); }

4789 __ai uint32x4_t vsubl_u16(uint16x4_t __a, uint16x4_t __b) { \

4790 return vmovl_u16(__a) - vmovl_u16(__b); }

4791 __ai uint64x2_t vsubl_u32(uint32x2_t __a, uint32x2_t __b) { \

4792 return vmovl_u32(__a) - vmovl_u32(__b); }

4793

4794 __ai int16x8_t vsubw_s8(int16x8_t __a, int8x8_t __b) { \

4795 return __a - vmovl_s8(__b); }

4796 __ai int32x4_t vsubw_s16(int32x4_t __a, int16x4_t __b) { \

4797 return __a - vmovl_s16(__b); }

4798 __ai int64x2_t vsubw_s32(int64x2_t __a, int32x2_t __b) { \

4799 return __a - vmovl_s32(__b); }

4800 __ai uint16x8_t vsubw_u8(uint16x8_t __a, uint8x8_t __b) { \

4801 return __a - vmovl_u8(__b); }

4802 __ai uint32x4_t vsubw_u16(uint32x4_t __a, uint16x4_t __b) { \

4803 return __a - vmovl_u16(__b); }

4804 __ai uint64x2_t vsubw_u32(uint64x2_t __a, uint32x2_t __b) { \

4805 return __a - vmovl_u32(__b); }

4806

4807 __ai uint8x8_t vtbl1_u8(uint8x8_t __a, uint8x8_t __b) { \

4808 return (uint8x8_t)__builtin_neon_vtbl1_v((int8x8_t)__a, (int8x8_t)__b, 8); }

4809 __ai int8x8_t vtbl1_s8(int8x8_t __a, int8x8_t __b) { \

4810 return (int8x8_t)__builtin_neon_vtbl1_v(__a, __b, 0); }

4811 __ai poly8x8_t vtbl1_p8(poly8x8_t __a, uint8x8_t __b) { \

4812 return (poly8x8_t)__builtin_neon_vtbl1_v((int8x8_t)__a, (int8x8_t)__b, 5); }

4813

4814 __ai uint8x8_t vtbl2_u8(uint8x8x2_t __a, uint8x8_t __b) { \

4815 return (uint8x8_t)__builtin_neon_vtbl2_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__b, 8); }

4816 __ai int8x8_t vtbl2_s8(int8x8x2_t __a, int8x8_t __b) { \

4817 return (int8x8_t)__builtin_neon_vtbl2_v(__a.val[0], __a.val[1], __b, 0); }

4818 __ai poly8x8_t vtbl2_p8(poly8x8x2_t __a, uint8x8_t __b) { \

4819 return (poly8x8_t)__builtin_neon_vtbl2_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__b, 5); }

4820

4821 __ai uint8x8_t vtbl3_u8(uint8x8x3_t __a, uint8x8_t __b) { \

4822 return (uint8x8_t)__builtin_neon_vtbl3_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__a.val[2], (int8x8_t)__b, 8); }

4823 __ai int8x8_t vtbl3_s8(int8x8x3_t __a, int8x8_t __b) { \

4824 return (int8x8_t)__builtin_neon_vtbl3_v(__a.val[0], __a.val[1], __a.val[2], __ b, 0); }

4825 __ai poly8x8_t vtbl3_p8(poly8x8x3_t __a, uint8x8_t __b) { \

4826 return (poly8x8_t)__builtin_neon_vtbl3_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__a.val[2], (int8x8_t)__b, 5); }

4827

4828 __ai uint8x8_t vtbl4_u8(uint8x8x4_t __a, uint8x8_t __b) { \

4829 return (uint8x8_t)__builtin_neon_vtbl4_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__a.val[2], (int8x8_t)__a.val[3], (int8x8_t)__b, 8); }

4830 __ai int8x8_t vtbl4_s8(int8x8x4_t __a, int8x8_t __b) { \

4831 return (int8x8_t)__builtin_neon_vtbl4_v(__a.val[0], __a.val[1], __a.val[2], __ a.val[3], __b, 0); }

4832 __ai poly8x8_t vtbl4_p8(poly8x8x4_t __a, uint8x8_t __b) { \

4833 return (poly8x8_t)__builtin_neon_vtbl4_v((int8x8_t)__a.val[0], (int8x8_t)__a.v al[1], (int8x8_t)__a.val[2], (int8x8_t)__a.val[3], (int8x8_t)__b, 5); }

4834

4835 __ai uint8x8_t vtbx1_u8(uint8x8_t __a, uint8x8_t __b, uint8x8_t __c) { \

4836 return (uint8x8_t)__builtin_neon_vtbx1_v((int8x8_t)__a, (int8x8_t)__b, (int8x8 _t)__c, 8); }

4837 __ai int8x8_t vtbx1_s8(int8x8_t __a, int8x8_t __b, int8x8_t __c) { \

4838 return (int8x8_t)__builtin_neon_vtbx1_v(__a, __b, __c, 0); }

4839 __ai poly8x8_t vtbx1_p8(poly8x8_t __a, poly8x8_t __b, uint8x8_t __c) { \

4840 return (poly8x8_t)__builtin_neon_vtbx1_v((int8x8_t)__a, (int8x8_t)__b, (int8x8 _t)__c, 5); }

4841

4842 __ai uint8x8_t vtbx2_u8(uint8x8_t __a, uint8x8x2_t __b, uint8x8_t __c) { \

4843 return (uint8x8_t)__builtin_neon_vtbx2_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__c, 8); }

4844 __ai int8x8_t vtbx2_s8(int8x8_t __a, int8x8x2_t __b, int8x8_t __c) { \

4845 return (int8x8_t)__builtin_neon_vtbx2_v(__a, __b.val[0], __b.val[1], __c, 0); }

4846 __ai poly8x8_t vtbx2_p8(poly8x8_t __a, poly8x8x2_t __b, uint8x8_t __c) { \

4847 return (poly8x8_t)__builtin_neon_vtbx2_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__c, 5); }

4848

4849 __ai uint8x8_t vtbx3_u8(uint8x8_t __a, uint8x8x3_t __b, uint8x8_t __c) { \

4850 return (uint8x8_t)__builtin_neon_vtbx3_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__c, 8); }

4851 __ai int8x8_t vtbx3_s8(int8x8_t __a, int8x8x3_t __b, int8x8_t __c) { \

4852 return (int8x8_t)__builtin_neon_vtbx3_v(__a, __b.val[0], __b.val[1], __b.val[2 ], __c, 0); }

4853 __ai poly8x8_t vtbx3_p8(poly8x8_t __a, poly8x8x3_t __b, uint8x8_t __c) { \

4854 return (poly8x8_t)__builtin_neon_vtbx3_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__c, 5); }

4855

4856 __ai uint8x8_t vtbx4_u8(uint8x8_t __a, uint8x8x4_t __b, uint8x8_t __c) { \

4857 return (uint8x8_t)__builtin_neon_vtbx4_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], (int8x8_t)__c, 8); }

4858 __ai int8x8_t vtbx4_s8(int8x8_t __a, int8x8x4_t __b, int8x8_t __c) { \

4859 return (int8x8_t)__builtin_neon_vtbx4_v(__a, __b.val[0], __b.val[1], __b.val[2 ], __b.val[3], __c, 0); }

4860 __ai poly8x8_t vtbx4_p8(poly8x8_t __a, poly8x8x4_t __b, uint8x8_t __c) { \

4861 return (poly8x8_t)__builtin_neon_vtbx4_v((int8x8_t)__a, (int8x8_t)__b.val[0], (int8x8_t)__b.val[1], (int8x8_t)__b.val[2], (int8x8_t)__b.val[3], (int8x8_t)__c, 5); }

4862

4863 __ai int8x8x2_t vtrn_s8(int8x8_t __a, int8x8_t __b) { \

4864 int8x8x2_t r; __builtin_neon_vtrn_v(&r, __a, __b, 0); return r; }

4865 __ai int16x4x2_t vtrn_s16(int16x4_t __a, int16x4_t __b) { \

4866 int16x4x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 1); ret urn r; }

4867 __ai int32x2x2_t vtrn_s32(int32x2_t __a, int32x2_t __b) { \

4868 int32x2x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 2); ret urn r; }

4869 __ai uint8x8x2_t vtrn_u8(uint8x8_t __a, uint8x8_t __b) { \

4870 uint8x8x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 8); ret urn r; }

4871 __ai uint16x4x2_t vtrn_u16(uint16x4_t __a, uint16x4_t __b) { \

4872 uint16x4x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 9); re turn r; }

4873 __ai uint32x2x2_t vtrn_u32(uint32x2_t __a, uint32x2_t __b) { \

4874 uint32x2x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 10); r eturn r; }

4875 __ai float32x2x2_t vtrn_f32(float32x2_t __a, float32x2_t __b) { \

4876 float32x2x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 4); r eturn r; }

4877 __ai poly8x8x2_t vtrn_p8(poly8x8_t __a, poly8x8_t __b) { \

4878 poly8x8x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 5); ret urn r; }

4879 __ai poly16x4x2_t vtrn_p16(poly16x4_t __a, poly16x4_t __b) { \

4880 poly16x4x2_t r; __builtin_neon_vtrn_v(&r, (int8x8_t)__a, (int8x8_t)__b, 6); re turn r; }

4881 __ai int8x16x2_t vtrnq_s8(int8x16_t __a, int8x16_t __b) { \

4882 int8x16x2_t r; __builtin_neon_vtrnq_v(&r, __a, __b, 16); return r; }

4883 __ai int16x8x2_t vtrnq_s16(int16x8_t __a, int16x8_t __b) { \

4884 int16x8x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 17); return r; }

4885 __ai int32x4x2_t vtrnq_s32(int32x4_t __a, int32x4_t __b) { \

4886 int32x4x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 18); return r; }

4887 __ai uint8x16x2_t vtrnq_u8(uint8x16_t __a, uint8x16_t __b) { \

4888 uint8x16x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 24) ; return r; }

4889 __ai uint16x8x2_t vtrnq_u16(uint16x8_t __a, uint16x8_t __b) { \

4890 uint16x8x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 25) ; return r; }

4891 __ai uint32x4x2_t vtrnq_u32(uint32x4_t __a, uint32x4_t __b) { \

4892 uint32x4x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 26) ; return r; }

4893 __ai float32x4x2_t vtrnq_f32(float32x4_t __a, float32x4_t __b) { \

4894 float32x4x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 20 ); return r; }

4895 __ai poly8x16x2_t vtrnq_p8(poly8x16_t __a, poly8x16_t __b) { \

4896 poly8x16x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 21) ; return r; }

4897 __ai poly16x8x2_t vtrnq_p16(poly16x8_t __a, poly16x8_t __b) { \

4898 poly16x8x2_t r; __builtin_neon_vtrnq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 22) ; return r; }

4899

4900 __ai uint8x8_t vtst_s8(int8x8_t __a, int8x8_t __b) { \

4901 return (uint8x8_t)__builtin_neon_vtst_v(__a, __b, 8); }

4902 __ai uint16x4_t vtst_s16(int16x4_t __a, int16x4_t __b) { \

4903 return (uint16x4_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 9); }

4904 __ai uint32x2_t vtst_s32(int32x2_t __a, int32x2_t __b) { \

4905 return (uint32x2_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 10); }

4906 __ai uint8x8_t vtst_u8(uint8x8_t __a, uint8x8_t __b) { \

4907 return (uint8x8_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 8); }

4908 __ai uint16x4_t vtst_u16(uint16x4_t __a, uint16x4_t __b) { \

4909 return (uint16x4_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 9); }

4910 __ai uint32x2_t vtst_u32(uint32x2_t __a, uint32x2_t __b) { \

4911 return (uint32x2_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 10); }

4912 __ai uint8x8_t vtst_p8(poly8x8_t __a, poly8x8_t __b) { \

4913 return (uint8x8_t)__builtin_neon_vtst_v((int8x8_t)__a, (int8x8_t)__b, 8); }

4914 __ai uint8x16_t vtstq_s8(int8x16_t __a, int8x16_t __b) { \

4915 return (uint8x16_t)__builtin_neon_vtstq_v(__a, __b, 24); }

4916 __ai uint16x8_t vtstq_s16(int16x8_t __a, int16x8_t __b) { \

4917 return (uint16x8_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

4918 __ai uint32x4_t vtstq_s32(int32x4_t __a, int32x4_t __b) { \

4919 return (uint32x4_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

4920 __ai uint8x16_t vtstq_u8(uint8x16_t __a, uint8x16_t __b) { \

4921 return (uint8x16_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 24); }

4922 __ai uint16x8_t vtstq_u16(uint16x8_t __a, uint16x8_t __b) { \

4923 return (uint16x8_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 25); }

4924 __ai uint32x4_t vtstq_u32(uint32x4_t __a, uint32x4_t __b) { \

4925 return (uint32x4_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 26); }

4926 __ai uint8x16_t vtstq_p8(poly8x16_t __a, poly8x16_t __b) { \

4927 return (uint8x16_t)__builtin_neon_vtstq_v((int8x16_t)__a, (int8x16_t)__b, 24); }

4928

4929 __ai int8x8x2_t vuzp_s8(int8x8_t __a, int8x8_t __b) { \

4930 int8x8x2_t r; __builtin_neon_vuzp_v(&r, __a, __b, 0); return r; }

4931 __ai int16x4x2_t vuzp_s16(int16x4_t __a, int16x4_t __b) { \

4932 int16x4x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 1); ret urn r; }

4933 __ai int32x2x2_t vuzp_s32(int32x2_t __a, int32x2_t __b) { \

4934 int32x2x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 2); ret urn r; }

4935 __ai uint8x8x2_t vuzp_u8(uint8x8_t __a, uint8x8_t __b) { \

4936 uint8x8x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 8); ret urn r; }

4937 __ai uint16x4x2_t vuzp_u16(uint16x4_t __a, uint16x4_t __b) { \

4938 uint16x4x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 9); re turn r; }

4939 __ai uint32x2x2_t vuzp_u32(uint32x2_t __a, uint32x2_t __b) { \

4940 uint32x2x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 10); r eturn r; }

4941 __ai float32x2x2_t vuzp_f32(float32x2_t __a, float32x2_t __b) { \

4942 float32x2x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 4); r eturn r; }

4943 __ai poly8x8x2_t vuzp_p8(poly8x8_t __a, poly8x8_t __b) { \

4944 poly8x8x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 5); ret urn r; }

4945 __ai poly16x4x2_t vuzp_p16(poly16x4_t __a, poly16x4_t __b) { \

4946 poly16x4x2_t r; __builtin_neon_vuzp_v(&r, (int8x8_t)__a, (int8x8_t)__b, 6); re turn r; }

4947 __ai int8x16x2_t vuzpq_s8(int8x16_t __a, int8x16_t __b) { \

4948 int8x16x2_t r; __builtin_neon_vuzpq_v(&r, __a, __b, 16); return r; }

4949 __ai int16x8x2_t vuzpq_s16(int16x8_t __a, int16x8_t __b) { \

4950 int16x8x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 17); return r; }

4951 __ai int32x4x2_t vuzpq_s32(int32x4_t __a, int32x4_t __b) { \

4952 int32x4x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 18); return r; }

4953 __ai uint8x16x2_t vuzpq_u8(uint8x16_t __a, uint8x16_t __b) { \

4954 uint8x16x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 24) ; return r; }

4955 __ai uint16x8x2_t vuzpq_u16(uint16x8_t __a, uint16x8_t __b) { \

4956 uint16x8x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 25) ; return r; }

4957 __ai uint32x4x2_t vuzpq_u32(uint32x4_t __a, uint32x4_t __b) { \

4958 uint32x4x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 26) ; return r; }

4959 __ai float32x4x2_t vuzpq_f32(float32x4_t __a, float32x4_t __b) { \

4960 float32x4x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 20 ); return r; }

4961 __ai poly8x16x2_t vuzpq_p8(poly8x16_t __a, poly8x16_t __b) { \

4962 poly8x16x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 21) ; return r; }

4963 __ai poly16x8x2_t vuzpq_p16(poly16x8_t __a, poly16x8_t __b) { \

4964 poly16x8x2_t r; __builtin_neon_vuzpq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 22) ; return r; }

4965

4966 __ai int8x8x2_t vzip_s8(int8x8_t __a, int8x8_t __b) { \

4967 int8x8x2_t r; __builtin_neon_vzip_v(&r, __a, __b, 0); return r; }

4968 __ai int16x4x2_t vzip_s16(int16x4_t __a, int16x4_t __b) { \

4969 int16x4x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 1); ret urn r; }

4970 __ai int32x2x2_t vzip_s32(int32x2_t __a, int32x2_t __b) { \

4971 int32x2x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 2); ret urn r; }

4972 __ai uint8x8x2_t vzip_u8(uint8x8_t __a, uint8x8_t __b) { \

4973 uint8x8x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 8); ret urn r; }

4974 __ai uint16x4x2_t vzip_u16(uint16x4_t __a, uint16x4_t __b) { \

4975 uint16x4x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 9); re turn r; }

4976 __ai uint32x2x2_t vzip_u32(uint32x2_t __a, uint32x2_t __b) { \

4977 uint32x2x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 10); r eturn r; }

4978 __ai float32x2x2_t vzip_f32(float32x2_t __a, float32x2_t __b) { \

4979 float32x2x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 4); r eturn r; }

4980 __ai poly8x8x2_t vzip_p8(poly8x8_t __a, poly8x8_t __b) { \

4981 poly8x8x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 5); ret urn r; }

4982 __ai poly16x4x2_t vzip_p16(poly16x4_t __a, poly16x4_t __b) { \

4983 poly16x4x2_t r; __builtin_neon_vzip_v(&r, (int8x8_t)__a, (int8x8_t)__b, 6); re turn r; }

4984 __ai int8x16x2_t vzipq_s8(int8x16_t __a, int8x16_t __b) { \

4985 int8x16x2_t r; __builtin_neon_vzipq_v(&r, __a, __b, 16); return r; }

4986 __ai int16x8x2_t vzipq_s16(int16x8_t __a, int16x8_t __b) { \

4987 int16x8x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 17); return r; }

4988 __ai int32x4x2_t vzipq_s32(int32x4_t __a, int32x4_t __b) { \

4989 int32x4x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 18); return r; }

4990 __ai uint8x16x2_t vzipq_u8(uint8x16_t __a, uint8x16_t __b) { \

4991 uint8x16x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 24) ; return r; }

4992 __ai uint16x8x2_t vzipq_u16(uint16x8_t __a, uint16x8_t __b) { \

4993 uint16x8x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 25) ; return r; }

4994 __ai uint32x4x2_t vzipq_u32(uint32x4_t __a, uint32x4_t __b) { \

4995 uint32x4x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 26) ; return r; }

4996 __ai float32x4x2_t vzipq_f32(float32x4_t __a, float32x4_t __b) { \

4997 float32x4x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 20 ); return r; }

4998 __ai poly8x16x2_t vzipq_p8(poly8x16_t __a, poly8x16_t __b) { \

4999 poly8x16x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 21) ; return r; }

5000 __ai poly16x8x2_t vzipq_p16(poly16x8_t __a, poly16x8_t __b) { \

5001 poly16x8x2_t r; __builtin_neon_vzipq_v(&r, (int8x16_t)__a, (int8x16_t)__b, 22) ; return r; }

5002

5003 #undef __ai

5004

5005 #endif /* __ARM_NEON_H */

OLD	NEW