KVM: TDX: Set per-VM shadow_mmio_value to 0
authorIsaku Yamahata <isaku.yamahata@intel.com>
Tue, 12 Nov 2024 07:37:43 +0000 (15:37 +0800)
committerPaolo Bonzini <pbonzini@redhat.com>
Fri, 14 Mar 2025 18:20:52 +0000 (14:20 -0400)
Set per-VM shadow_mmio_value to 0 for TDX.

With enable_mmio_caching on, KVM installs MMIO SPTEs for TDs. To correctly
configure MMIO SPTEs, TDX requires the per-VM shadow_mmio_value to be set
to 0. This is necessary to override the default value of the suppress VE
bit in the SPTE, which is 1, and to ensure value 0 in RWX bits.

For MMIO SPTE, the spte value changes as follows:
1. initial value (suppress VE bit is set)
2. Guest issues MMIO and triggers EPT violation
3. KVM updates SPTE value to MMIO value (suppress VE bit is cleared)
4. Guest MMIO resumes.  It triggers VE exception in guest TD
5. Guest VE handler issues TDG.VP.VMCALL<MMIO>
6. KVM handles MMIO
7. Guest VE handler resumes its execution after MMIO instruction

Signed-off-by: Isaku Yamahata <isaku.yamahata@intel.com>
Co-developed-by: Rick Edgecombe <rick.p.edgecombe@intel.com>
Signed-off-by: Rick Edgecombe <rick.p.edgecombe@intel.com>
Co-developed-by: Yan Zhao <yan.y.zhao@intel.com>
Signed-off-by: Yan Zhao <yan.y.zhao@intel.com>
Reviewed-by: Paolo Bonzini <pbonzini@redhat.com>
Message-ID: <20241112073743.22214-1-yan.y.zhao@intel.com>
Signed-off-by: Paolo Bonzini <pbonzini@redhat.com>
arch/x86/kvm/mmu/spte.c
arch/x86/kvm/vmx/tdx.c

index c42ac5d..e819d16 100644 (file)
@@ -96,8 +96,6 @@ u64 make_mmio_spte(struct kvm_vcpu *vcpu, u64 gfn, unsigned int access)
        u64 spte = generation_mmio_spte_mask(gen);
        u64 gpa = gfn << PAGE_SHIFT;
 
-       WARN_ON_ONCE(!vcpu->kvm->arch.shadow_mmio_value);
-
        access &= shadow_mmio_access_mask;
        spte |= vcpu->kvm->arch.shadow_mmio_value | access;
        spte |= gpa | shadow_nonpresent_or_rsvd_mask;
index 78ed554..f73b03f 100644 (file)
@@ -8,6 +8,7 @@
 #include "x86_ops.h"
 #include "lapic.h"
 #include "tdx.h"
+#include "mmu/spte.h"
 
 #pragma GCC poison to_vmx
 
@@ -410,6 +411,19 @@ int tdx_vm_init(struct kvm *kvm)
        kvm->arch.has_protected_state = true;
        kvm->arch.has_private_mem = true;
 
+       /*
+        * Because guest TD is protected, VMM can't parse the instruction in TD.
+        * Instead, guest uses MMIO hypercall.  For unmodified device driver,
+        * #VE needs to be injected for MMIO and #VE handler in TD converts MMIO
+        * instruction into MMIO hypercall.
+        *
+        * SPTE value for MMIO needs to be setup so that #VE is injected into
+        * TD instead of triggering EPT MISCONFIG.
+        * - RWX=0 so that EPT violation is triggered.
+        * - suppress #VE bit is cleared to inject #VE.
+        */
+       kvm_mmu_set_mmio_spte_value(kvm, 0);
+
        /*
         * TDX has its own limit of maximum vCPUs it can support for all
         * TDX guests in addition to KVM_MAX_VCPUS.  TDX module reports