drm/xe/dgfx: Release mmap mappings on rpm suspend

author Badal Nilawar <badal.nilawar@intel.com>

Thu, 4 Jan 2024 13:07:02 +0000 (18:37 +0530)

committer Rodrigo Vivi <rodrigo.vivi@intel.com>

Mon, 8 Jan 2024 21:55:44 +0000 (16:55 -0500)
author Badal Nilawar <badal.nilawar@intel.com>
Thu, 4 Jan 2024 13:07:02 +0000 (18:37 +0530)
committer Rodrigo Vivi <rodrigo.vivi@intel.com>
Mon, 8 Jan 2024 21:55:44 +0000 (16:55 -0500)
diff --git a/drivers/gpu/drm/xe/xe_bo.c b/drivers/gpu/drm/xe/xe_bo.c

index 8e4a3b1..2e4d215 100644 (file)
--- a/drivers/gpu/drm/xe/xe_bo.c
+++ b/drivers/gpu/drm/xe/xe_bo.c
@@ -586,6 +586,8 @@ static int xe_bo_move_notify(struct xe_bo *bo,
  {
         struct ttm_buffer_object *ttm_bo = &bo->ttm;
         struct xe_device *xe = ttm_to_xe_device(ttm_bo->bdev);
+       struct ttm_resource *old_mem = ttm_bo->resource;
+       u32 old_mem_type = old_mem ? old_mem->mem_type : XE_PL_SYSTEM;
         int ret;
  
         /*
@@ -605,6 +607,18 @@ static int xe_bo_move_notify(struct xe_bo *bo,
         if (ttm_bo->base.dma_buf && !ttm_bo->base.import_attach)
                 dma_buf_move_notify(ttm_bo->base.dma_buf);
  
+       /*
+        * TTM has already nuked the mmap for us (see ttm_bo_unmap_virtual),
+        * so if we moved from VRAM make sure to unlink this from the userfault
+        * tracking.
+        */
+       if (mem_type_is_vram(old_mem_type)) {
+               mutex_lock(&xe->mem_access.vram_userfault.lock);
+               if (!list_empty(&bo->vram_userfault_link))
+                       list_del_init(&bo->vram_userfault_link);
+               mutex_unlock(&xe->mem_access.vram_userfault.lock);
+       }
+
         return 0;
  }
  
@@ -1063,6 +1077,11 @@ static void xe_ttm_bo_destroy(struct ttm_buffer_object *ttm_bo)
         if (bo->vm && xe_bo_is_user(bo))
                 xe_vm_put(bo->vm);
  
+       mutex_lock(&xe->mem_access.vram_userfault.lock);
+       if (!list_empty(&bo->vram_userfault_link))
+               list_del(&bo->vram_userfault_link);
+       mutex_unlock(&xe->mem_access.vram_userfault.lock);
+
         kfree(bo);
  }
  
@@ -1110,16 +1129,20 @@ static vm_fault_t xe_gem_fault(struct vm_fault *vmf)
  {
         struct ttm_buffer_object *tbo = vmf->vma->vm_private_data;
         struct drm_device *ddev = tbo->base.dev;
+       struct xe_device *xe = to_xe_device(ddev);
+       struct xe_bo *bo = ttm_to_xe_bo(tbo);
+       bool needs_rpm = bo->flags & XE_BO_CREATE_VRAM_MASK;
         vm_fault_t ret;
         int idx, r = 0;
  
+       if (needs_rpm)
+               xe_device_mem_access_get(xe);
+
         ret = ttm_bo_vm_reserve(tbo, vmf);
         if (ret)
-               return ret;
+               goto out;
  
         if (drm_dev_enter(ddev, &idx)) {
-               struct xe_bo *bo = ttm_to_xe_bo(tbo);
-
                 trace_xe_bo_cpu_fault(bo);
  
                 if (should_migrate_to_system(bo)) {
@@ -1137,10 +1160,24 @@ static vm_fault_t xe_gem_fault(struct vm_fault *vmf)
         } else {
                 ret = ttm_bo_vm_dummy_page(vmf, vmf->vma->vm_page_prot);
         }
+
         if (ret == VM_FAULT_RETRY && !(vmf->flags & FAULT_FLAG_RETRY_NOWAIT))
-               return ret;
+               goto out;
+       /*
+        * ttm_bo_vm_reserve() already has dma_resv_lock.
+        */
+       if (ret == VM_FAULT_NOPAGE && mem_type_is_vram(tbo->resource->mem_type)) {
+               mutex_lock(&xe->mem_access.vram_userfault.lock);
+               if (list_empty(&bo->vram_userfault_link))
+                       list_add(&bo->vram_userfault_link, &xe->mem_access.vram_userfault.list);
+               mutex_unlock(&xe->mem_access.vram_userfault.lock);
+       }
  
         dma_resv_unlock(tbo->base.resv);
+out:
+       if (needs_rpm)
+               xe_device_mem_access_put(xe);
+
         return ret;
  }
  
@@ -1254,6 +1291,7 @@ struct xe_bo *___xe_bo_create_locked(struct xe_device *xe, struct xe_bo *bo,
  #ifdef CONFIG_PROC_FS
         INIT_LIST_HEAD(&bo->client_link);
  #endif
+       INIT_LIST_HEAD(&bo->vram_userfault_link);
  
         drm_gem_private_object_init(&xe->drm, &bo->ttm.base, size);
  
@@ -2264,6 +2302,16 @@ int xe_bo_dumb_create(struct drm_file *file_priv,
         return err;
  }
  
+void xe_bo_runtime_pm_release_mmap_offset(struct xe_bo *bo)
+{
+       struct ttm_buffer_object *tbo = &bo->ttm;
+       struct ttm_device *bdev = tbo->bdev;
+
+       drm_vma_node_unmap(&tbo->base.vma_node, bdev->dev_mapping);
+
+       list_del_init(&bo->vram_userfault_link);
+}
+
  #if IS_ENABLED(CONFIG_DRM_XE_KUNIT_TEST)
  #include "tests/xe_bo.c"
  #endif
diff --git a/drivers/gpu/drm/xe/xe_bo.h b/drivers/gpu/drm/xe/xe_bo.h

index 97b3252..350cc73 100644 (file)
--- a/drivers/gpu/drm/xe/xe_bo.h
+++ b/drivers/gpu/drm/xe/xe_bo.h
@@ -249,6 +249,8 @@ int xe_gem_create_ioctl(struct drm_device *dev, void *data,
                         struct drm_file *file);
  int xe_gem_mmap_offset_ioctl(struct drm_device *dev, void *data,
                              struct drm_file *file);
+void xe_bo_runtime_pm_release_mmap_offset(struct xe_bo *bo);
+
  int xe_bo_dumb_create(struct drm_file *file_priv,
                       struct drm_device *dev,
                       struct drm_mode_create_dumb *args);
diff --git a/drivers/gpu/drm/xe/xe_bo_types.h b/drivers/gpu/drm/xe/xe_bo_types.h

index 64c2249..14ef13b 100644 (file)
--- a/drivers/gpu/drm/xe/xe_bo_types.h
+++ b/drivers/gpu/drm/xe/xe_bo_types.h
@@ -88,6 +88,9 @@ struct xe_bo {
          * objects.
          */
         u16 cpu_caching;
+
+       /** @vram_userfault_link: Link into @mem_access.vram_userfault.list */
+               struct list_head vram_userfault_link;
  };
  
  #define intel_bo_to_drm_bo(bo) (&(bo)->ttm.base)
diff --git a/drivers/gpu/drm/xe/xe_device_types.h b/drivers/gpu/drm/xe/xe_device_types.h

index 163d889..8404685 100644 (file)
--- a/drivers/gpu/drm/xe/xe_device_types.h
+++ b/drivers/gpu/drm/xe/xe_device_types.h
@@ -387,6 +387,22 @@ struct xe_device {
         struct {
                 /** @ref: ref count of memory accesses */
                 atomic_t ref;
+
+               /** @vram_userfault: Encapsulate vram_userfault related stuff */
+               struct {
+                       /**
+                        * @lock: Protects access to @vram_usefault.list
+                        * Using mutex instead of spinlock as lock is applied to entire
+                        * list operation which may sleep
+                        */
+                       struct mutex lock;
+
+                       /**
+                        * @list: Keep list of userfaulted vram bo, which require to release their
+                        * mmap mappings at runtime suspend path
+                        */
+                       struct list_head list;
+               } vram_userfault;
         } mem_access;
  
         /**
diff --git a/drivers/gpu/drm/xe/xe_pci.c b/drivers/gpu/drm/xe/xe_pci.c

index dcc5ded..7ba2000 100644 (file)
--- a/drivers/gpu/drm/xe/xe_pci.c
+++ b/drivers/gpu/drm/xe/xe_pci.c
@@ -774,6 +774,8 @@ static int xe_pci_probe(struct pci_dev *pdev, const struct pci_device_id *ent)
                 str_yes_no(xe_device_has_sriov(xe)),
                 xe_sriov_mode_to_string(xe_device_sriov_mode(xe)));
  
+       xe_pm_init_early(xe);
+
         err = xe_device_probe(xe);
         if (err)
                 return err;
diff --git a/drivers/gpu/drm/xe/xe_pm.c b/drivers/gpu/drm/xe/xe_pm.c

index b429c28..d5f2197 100644 (file)
--- a/drivers/gpu/drm/xe/xe_pm.c
+++ b/drivers/gpu/drm/xe/xe_pm.c
@@ -163,6 +163,12 @@ static void xe_pm_runtime_init(struct xe_device *xe)
         pm_runtime_put(dev);
  }
  
+void xe_pm_init_early(struct xe_device *xe)
+{
+       INIT_LIST_HEAD(&xe->mem_access.vram_userfault.list);
+       drmm_mutex_init(&xe->drm, &xe->mem_access.vram_userfault.lock);
+}
+
  void xe_pm_init(struct xe_device *xe)
  {
         struct pci_dev *pdev = to_pci_dev(xe->drm.dev);
@@ -214,6 +220,7 @@ struct task_struct *xe_pm_read_callback_task(struct xe_device *xe)
  
  int xe_pm_runtime_suspend(struct xe_device *xe)
  {
+       struct xe_bo *bo, *on;
         struct xe_gt *gt;
         u8 id;
         int err = 0;
@@ -247,6 +254,16 @@ int xe_pm_runtime_suspend(struct xe_device *xe)
          */
         lock_map_acquire(&xe_device_mem_access_lockdep_map);
  
+       /*
+        * Applying lock for entire list op as xe_ttm_bo_destroy and xe_bo_move_notify
+        * also checks and delets bo entry from user fault list.
+        */
+       mutex_lock(&xe->mem_access.vram_userfault.lock);
+       list_for_each_entry_safe(bo, on,
+                                &xe->mem_access.vram_userfault.list, vram_userfault_link)
+               xe_bo_runtime_pm_release_mmap_offset(bo);
+       mutex_unlock(&xe->mem_access.vram_userfault.lock);
+
         if (xe->d3cold.allowed) {
                 err = xe_bo_evict_all(xe);
                 if (err)
diff --git a/drivers/gpu/drm/xe/xe_pm.h b/drivers/gpu/drm/xe/xe_pm.h

index 6b9031f..64a97c6 100644 (file)
--- a/drivers/gpu/drm/xe/xe_pm.h
+++ b/drivers/gpu/drm/xe/xe_pm.h
@@ -20,6 +20,7 @@ struct xe_device;
  int xe_pm_suspend(struct xe_device *xe);
  int xe_pm_resume(struct xe_device *xe);
  
+void xe_pm_init_early(struct xe_device *xe);
  void xe_pm_init(struct xe_device *xe);
  void xe_pm_runtime_fini(struct xe_device *xe);
  int xe_pm_runtime_suspend(struct xe_device *xe);
author	Badal Nilawar <badal.nilawar@intel.com>
	Thu, 4 Jan 2024 13:07:02 +0000 (18:37 +0530)
committer	Rodrigo Vivi <rodrigo.vivi@intel.com>
	Mon, 8 Jan 2024 21:55:44 +0000 (16:55 -0500)
drivers/gpu/drm/xe/xe_bo.c		patch \| blob \| history
drivers/gpu/drm/xe/xe_bo.h		patch \| blob \| history
drivers/gpu/drm/xe/xe_bo_types.h		patch \| blob \| history
drivers/gpu/drm/xe/xe_device_types.h		patch \| blob \| history
drivers/gpu/drm/xe/xe_pci.c		patch \| blob \| history
drivers/gpu/drm/xe/xe_pm.c		patch \| blob \| history
drivers/gpu/drm/xe/xe_pm.h		patch \| blob \| history