add back MOVRELSD, refactor

baggins183 · baggins183 · commit 1c68db2bfbd8 · 2024-09-05T22:11:41.000-07:00
diff --git a/src/shader_recompiler/frontend/translate/translate.h b/src/shader_recompiler/frontend/translate/translate.h
@@ -235,7 +235,8 @@ class Translator {
     void SetDst(const InstOperand& operand, const IR::U32F32& value);
     void SetDst64(const InstOperand& operand, const IR::U64F64& value_raw);
 
-    void VMovRelHelper(const IR::U32 src_idx, const IR::U32 dst_idx);
+    IR::U32 VMovRelSHelper(u32 src_vgprno, const IR::U32 m0);
+    void VMovRelDHelper(u32 dst_vgprno, const IR::U32 src_val, const IR::U32 m0);
 
     void LogMissingOpcode(const GcnInst& inst);
 
diff --git a/src/shader_recompiler/frontend/translate/vector_alu.cpp b/src/shader_recompiler/frontend/translate/vector_alu.cpp
@@ -314,8 +314,8 @@ void Translator::EmitVectorAlu(const GcnInst& inst) {
         return V_MOVRELS_B32(inst);
     case Opcode::V_MOVRELD_B32:
         return V_MOVRELD_B32(inst);
-    // case Opcode::V_MOVRELSD_B32:
-    //     return V_MOVRELSD_B32(inst);
+    case Opcode::V_MOVRELSD_B32:
+        return V_MOVRELSD_B32(inst);
     case Opcode::V_NOP:
         return;
 
@@ -996,27 +996,21 @@ void Translator::V_FFBH_U32(const GcnInst& inst) {
     SetDst(inst.dst[0], IR::U32{ir.Select(cond, pos_from_left, ir.Imm32(~0U))});
 }
 
-// void Translator::VMovRelHelper(const IR::U32 src_idx, const IR::U32 dst_idx) {}
-
-void Translator::V_MOVRELS_B32(const GcnInst& inst) {
-    const IR::U32 m0 = ir.GetM0();
-    ASSERT(inst.src[0].field == OperandField::VectorGPR);
-    u32 src_vgrpno = inst.src[0].code - static_cast<u32>(IR::VectorReg::V0);
+// TODO: add range analysis pass to hopefully put an upper bound on m0, and only select one of
+// [src_vgprno, src_vgprno + max_m0]. Same for dst regs we may write back to
 
+IR::U32 Translator::VMovRelSHelper(u32 src_vgprno, const IR::U32 m0) {
+    // Read from VGPR0 by default when src_vgprno + m0 > num_allocated_vgprs
     IR::U32 src_val = ir.GetVectorReg<IR::U32>(IR::VectorReg::V0);
-    for (u32 i = src_vgrpno; i < info.num_allocated_vgprs; i++) {
-        const IR::U1 cond = ir.IEqual(m0, ir.Imm32(i - src_vgrpno));
+    for (u32 i = src_vgprno; i < info.num_allocated_vgprs; i++) {
+        const IR::U1 cond = ir.IEqual(m0, ir.Imm32(i - src_vgprno));
         src_val =
             IR::U32{ir.Select(cond, ir.GetVectorReg<IR::U32>(IR::VectorReg::V0 + i), src_val)};
     }
-    SetDst(inst.dst[0], src_val);
+    return src_val;
 }
 
-void Translator::V_MOVRELD_B32(const GcnInst& inst) {
-    const IR::U32 src_val{GetSrc(inst.src[0])};
-    IR::U32 m0 = ir.GetM0();
-    u32 dst_vgprno = inst.dst[0].code - static_cast<u32>(IR::VectorReg::V0);
-
+void Translator::VMovRelDHelper(u32 dst_vgprno, const IR::U32 src_val, const IR::U32 m0) {
     for (u32 i = dst_vgprno; i < info.num_allocated_vgprs; i++) {
         const IR::U1 cond = ir.IEqual(m0, ir.Imm32(i - dst_vgprno));
         const IR::U32 dst_val =
@@ -1025,12 +1019,29 @@ void Translator::V_MOVRELD_B32(const GcnInst& inst) {
     }
 }
 
-// void Translator::V_MOVRELSD_B32(const GcnInst& inst) {
-//     IR::U32 src_idx{GetSrc(inst.src[0])};
-//     IR::U32 dst_idx{GetSrc(inst.dst[0])};
-//     src_idx = ir.IAdd(src_idx, ir.GetM0());
-//     dst_idx = ir.IAdd(dst_idx, ir.GetM0());
-//     VMovRelHelper(src_idx, dst_idx);
-// }
+void Translator::V_MOVRELS_B32(const GcnInst& inst) {
+    u32 src_vgprno = inst.src[0].code - static_cast<u32>(IR::VectorReg::V0);
+    const IR::U32 m0 = ir.GetM0();
+
+    const IR::U32 src_val = VMovRelSHelper(src_vgprno, m0);
+    SetDst(inst.dst[0], src_val);
+}
+
+void Translator::V_MOVRELD_B32(const GcnInst& inst) {
+    const IR::U32 src_val{GetSrc(inst.src[0])};
+    u32 dst_vgprno = inst.dst[0].code - static_cast<u32>(IR::VectorReg::V0);
+    IR::U32 m0 = ir.GetM0();
+
+    VMovRelDHelper(dst_vgprno, src_val, m0);
+}
+
+void Translator::V_MOVRELSD_B32(const GcnInst& inst) {
+    u32 src_vgprno = inst.src[0].code - static_cast<u32>(IR::VectorReg::V0);
+    u32 dst_vgprno = inst.dst[0].code - static_cast<u32>(IR::VectorReg::V0);
+    IR::U32 m0 = ir.GetM0();
+
+    const IR::U32 src_val = VMovRelSHelper(src_vgprno, m0);
+    VMovRelDHelper(dst_vgprno, src_val, m0);
+}
 
 } // namespace Shader::Gcn