src/IceTargetLoweringARM32.cpp - Issue 1655313002: Subzero: ARM32: lowering of vector insert and extract.

Unified Diff: src/IceTargetLoweringARM32.cpp

Issue 1655313002: Subzero: ARM32: lowering of vector insert and extract. (Closed) Base URL: https://chromium.googlesource.com/native_client/pnacl-subzero.git@master

Patch Set: Incorporating review feedback. Created 4 years, 10 months ago

Use n/p to move between diff chunks; N/P to move between comments. Draft comments are only viewable by you.

Jump to:

View side-by-side diff with in-line comments

Download patch

Index: src/IceTargetLoweringARM32.cpp

diff --git a/src/IceTargetLoweringARM32.cpp b/src/IceTargetLoweringARM32.cpp

index 72ba954e5a1f127952489fc635234ede22d0c013..c32ac6e97cd4f5d01fe2e102ec6f780ea7f8a09e 100644

--- a/src/IceTargetLoweringARM32.cpp

+++ b/src/IceTargetLoweringARM32.cpp

@@ -297,15 +297,20 @@ void TargetARM32::staticInit(GlobalContext *Ctx) {

llvm::SmallBitVector Float32Registers(RegARM32::Reg_NUM);

llvm::SmallBitVector Float64Registers(RegARM32::Reg_NUM);

llvm::SmallBitVector VectorRegisters(RegARM32::Reg_NUM);

+ llvm::SmallBitVector QtoSRegisters(RegARM32::Reg_NUM);

llvm::SmallBitVector InvalidRegisters(RegARM32::Reg_NUM);

for (int i = 0; i < RegARM32::Reg_NUM; ++i) {

const auto &Entry = RegARM32::RegTable[i];

+ const auto EncodedReg_q8 = RegARM32::RegTable[RegARM32::Reg_q8].Encoding;

IntegerRegisters[i] = Entry.IsInt;

I64PairRegisters[i] = Entry.IsI64Pair;

Float32Registers[i] = Entry.IsFP32;

Float64Registers[i] = Entry.IsFP64;

VectorRegisters[i] = Entry.IsVec128;

RegisterAliases[i].resize(RegARM32::Reg_NUM);

+ // TODO: It would be better to store a QtoS flag in the IceRegistersARM32

Jim Stichnoth 2016/02/08 18:08:29 TODO(person):

Eric Holk 2016/02/08 18:44:11 Done.

+ // table than to compare their encodings here.

+ QtoSRegisters[i] = Entry.IsVec128 && Entry.Encoding < EncodedReg_q8;

for (int j = 0; j < Entry.NumAliases; ++j) {

assert(i == j || !RegisterAliases[i][Entry.Aliases[j]]);

RegisterAliases[i].set(Entry.Aliases[j]);

@@ -341,6 +346,7 @@ void TargetARM32::staticInit(GlobalContext *Ctx) {

TypeToRegisterSet[IceType_v8i16] = VectorRegisters;

TypeToRegisterSet[IceType_v4i32] = VectorRegisters;

TypeToRegisterSet[IceType_v4f32] = VectorRegisters;

+ TypeToRegisterSet[RegARM32::RCARM32_QtoS] = QtoSRegisters;

for (size_t i = 0; i < llvm::array_lengthof(TypeToRegisterSet); ++i)

TypeToRegisterSetUnfiltered[i] = TypeToRegisterSet[i];

@@ -3830,8 +3836,29 @@ void TargetARM32::lowerCast(const InstCast *Inst) {

}

-void TargetARM32::lowerExtractElement(const InstExtractElement *Inst) {

- UnimplementedLoweringError(this, Inst);

+void TargetARM32::lowerExtractElement(const InstExtractElement *Instr) {

+ Variable *Dest = Instr->getDest();

+ auto DestTy = Dest->getType();

+ Variable *Src0 = legalizeToReg(Instr->getSrc(0));

+ Operand *Src1 = Instr->getSrc(1);

+ if (const auto *Imm = llvm::dyn_cast<ConstantInteger32>(Src1)) {

+ const uint32_t Index = Imm->getValue();

+ Variable *T = makeReg(DestTy);

+ Variable *TSrc0 = makeReg(Src0->getType());

+ if (isFloatingType(DestTy)) {

+ // We need to make sure the source is in a suitable register.

+ TSrc0->setRegClass(RegARM32::RCARM32_QtoS);

+ }

+ _mov(TSrc0, Src0);

+ _extractelement(T, TSrc0, Index);

+ _mov(Dest, T);

+ return;

+ }

+ assert(false && "extractelement requires a constant index");

}

namespace {

@@ -4225,8 +4252,29 @@ void TargetARM32::lowerIcmp(const InstIcmp *Inst) {

return;

}

-void TargetARM32::lowerInsertElement(const InstInsertElement *Inst) {

- UnimplementedLoweringError(this, Inst);

+void TargetARM32::lowerInsertElement(const InstInsertElement *Instr) {

+ Variable *Dest = Instr->getDest();

+ auto DestTy = Dest->getType();

+ Variable *Src0 = legalizeToReg(Instr->getSrc(0));

+ Variable *Src1 = legalizeToReg(Instr->getSrc(1));

+ Operand *Src2 = Instr->getSrc(2);

+ if (const auto *Imm = llvm::dyn_cast<ConstantInteger32>(Src2)) {

+ auto Index = Imm->getValue();

+ Variable *T = makeReg(DestTy);

+ if (isFloatingType(DestTy)) {

+ T->setRegClass(RegARM32::RCARM32_QtoS);

+ }

+ _mov(T, Src0);

+ _insertelement(T, Src1, Index);

+ _set_dest_redefined();

+ _mov(Dest, T);

+ return;

+ }

+ assert(false && "insertelement requires a constant index");

}

namespace {

« src/IceInstARM32.cpp ('K') | « src/IceTargetLoweringARM32.h ('k') | tests_lit/assembler/arm32/insert-extract.ll » ('j') | tests_lit/assembler/arm32/insert-extract.ll » ('J')