drm/amdkfd: Introduce kfd_node struct (v5)

[linux-2.6-microblaze.git] / drivers / gpu / drm / amd / amdkfd / kfd_process.c
diff --git a/drivers/gpu/drm/amd/amdkfd/kfd_process.c b/drivers/gpu/drm/amd/amdkfd/kfd_process.c

index 7acd55a..66e0218 100644 (file)
--- a/drivers/gpu/drm/amd/amdkfd/kfd_process.c
+++ b/drivers/gpu/drm/amd/amdkfd/kfd_process.c
@@ -269,7 +269,7 @@ static int kfd_get_cu_occupancy(struct attribute *attr, char *buffer)
         int cu_cnt;
         int wave_cnt;
         int max_waves_per_cu;
-       struct kfd_dev *dev = NULL;
+       struct kfd_node *dev = NULL;
         struct kfd_process *proc = NULL;
         struct kfd_process_device *pdd = NULL;
  
@@ -344,7 +344,7 @@ static const struct sysfs_ops kfd_procfs_ops = {
         .show = kfd_procfs_show,
  };
  
-static struct kobj_type procfs_type = {
+static const struct kobj_type procfs_type = {
         .release = kfd_procfs_kobj_release,
         .sysfs_ops = &kfd_procfs_ops,
  };
@@ -469,7 +469,7 @@ static const struct sysfs_ops procfs_queue_ops = {
         .show = kfd_procfs_queue_show,
  };
  
-static struct kobj_type procfs_queue_type = {
+static const struct kobj_type procfs_queue_type = {
         .sysfs_ops = &procfs_queue_ops,
         .default_groups = procfs_queue_groups,
  };
@@ -478,7 +478,7 @@ static const struct sysfs_ops procfs_stats_ops = {
         .show = kfd_procfs_stats_show,
  };
  
-static struct kobj_type procfs_stats_type = {
+static const struct kobj_type procfs_stats_type = {
         .sysfs_ops = &procfs_stats_ops,
         .release = kfd_procfs_kobj_release,
  };
@@ -487,7 +487,7 @@ static const struct sysfs_ops sysfs_counters_ops = {
         .show = kfd_sysfs_counters_show,
  };
  
-static struct kobj_type sysfs_counters_type = {
+static const struct kobj_type sysfs_counters_type = {
         .sysfs_ops = &sysfs_counters_ops,
         .release = kfd_procfs_kobj_release,
  };
@@ -691,7 +691,7 @@ void kfd_process_destroy_wq(void)
  static void kfd_process_free_gpuvm(struct kgd_mem *mem,
                         struct kfd_process_device *pdd, void **kptr)
  {
-       struct kfd_dev *dev = pdd->dev;
+       struct kfd_node *dev = pdd->dev;
  
         if (kptr && *kptr) {
                 amdgpu_amdkfd_gpuvm_unmap_gtt_bo_from_kernel(mem);
@@ -713,7 +713,7 @@ static int kfd_process_alloc_gpuvm(struct kfd_process_device *pdd,
                                    uint64_t gpu_va, uint32_t size,
                                    uint32_t flags, struct kgd_mem **mem, void **kptr)
  {
-       struct kfd_dev *kdev = pdd->dev;
+       struct kfd_node *kdev = pdd->dev;
         int err;
  
         err = amdgpu_amdkfd_gpuvm_alloc_memory_of_gpu(kdev->adev, gpu_va, size,
@@ -982,7 +982,7 @@ static void kfd_process_device_free_bos(struct kfd_process_device *pdd)
  static void kfd_process_kunmap_signal_bo(struct kfd_process *p)
  {
         struct kfd_process_device *pdd;
-       struct kfd_dev *kdev;
+       struct kfd_node *kdev;
         void *mem;
  
         kdev = kfd_device_by_id(GET_GPU_ID(p->signal_handle));
@@ -1040,9 +1040,9 @@ static void kfd_process_destroy_pdds(struct kfd_process *p)
                 bitmap_free(pdd->qpd.doorbell_bitmap);
                 idr_destroy(&pdd->alloc_idr);
  
-               kfd_free_process_doorbells(pdd->dev, pdd->doorbell_index);
+               kfd_free_process_doorbells(pdd->dev->kfd, pdd->doorbell_index);
  
-               if (pdd->dev->shared_resources.enable_mes)
+               if (pdd->dev->kfd->shared_resources.enable_mes)
                         amdgpu_amdkfd_free_gtt_mem(pdd->dev->adev,
                                                    pdd->proc_ctx_bo);
                 /*
@@ -1167,6 +1167,17 @@ static void kfd_process_free_notifier(struct mmu_notifier *mn)
         kfd_unref_process(container_of(mn, struct kfd_process, mmu_notifier));
  }
  
+static void kfd_process_notifier_release_internal(struct kfd_process *p)
+{
+       cancel_delayed_work_sync(&p->eviction_work);
+       cancel_delayed_work_sync(&p->restore_work);
+
+       /* Indicate to other users that MM is no longer valid */
+       p->mm = NULL;
+
+       mmu_notifier_put(&p->mmu_notifier);
+}
+
  static void kfd_process_notifier_release(struct mmu_notifier *mn,
                                         struct mm_struct *mm)
  {
@@ -1181,17 +1192,22 @@ static void kfd_process_notifier_release(struct mmu_notifier *mn,
                 return;
  
         mutex_lock(&kfd_processes_mutex);
+       /*
+        * Do early return if table is empty.
+        *
+        * This could potentially happen if this function is called concurrently
+        * by mmu_notifier and by kfd_cleanup_pocesses.
+        *
+        */
+       if (hash_empty(kfd_processes_table)) {
+               mutex_unlock(&kfd_processes_mutex);
+               return;
+       }
         hash_del_rcu(&p->kfd_processes);
         mutex_unlock(&kfd_processes_mutex);
         synchronize_srcu(&kfd_processes_srcu);
  
-       cancel_delayed_work_sync(&p->eviction_work);
-       cancel_delayed_work_sync(&p->restore_work);
-
-       /* Indicate to other users that MM is no longer valid */
-       p->mm = NULL;
-
-       mmu_notifier_put(&p->mmu_notifier);
+       kfd_process_notifier_release_internal(p);
  }
  
  static const struct mmu_notifier_ops kfd_process_mmu_notifier_ops = {
@@ -1200,16 +1216,53 @@ static const struct mmu_notifier_ops kfd_process_mmu_notifier_ops = {
         .free_notifier = kfd_process_free_notifier,
  };
  
+/*
+ * This code handles the case when driver is being unloaded before all
+ * mm_struct are released.  We need to safely free the kfd_process and
+ * avoid race conditions with mmu_notifier that might try to free them.
+ *
+ */
+void kfd_cleanup_processes(void)
+{
+       struct kfd_process *p;
+       struct hlist_node *p_temp;
+       unsigned int temp;
+       HLIST_HEAD(cleanup_list);
+
+       /*
+        * Move all remaining kfd_process from the process table to a
+        * temp list for processing.   Once done, callback from mmu_notifier
+        * release will not see the kfd_process in the table and do early return,
+        * avoiding double free issues.
+        */
+       mutex_lock(&kfd_processes_mutex);
+       hash_for_each_safe(kfd_processes_table, temp, p_temp, p, kfd_processes) {
+               hash_del_rcu(&p->kfd_processes);
+               synchronize_srcu(&kfd_processes_srcu);
+               hlist_add_head(&p->kfd_processes, &cleanup_list);
+       }
+       mutex_unlock(&kfd_processes_mutex);
+
+       hlist_for_each_entry_safe(p, p_temp, &cleanup_list, kfd_processes)
+               kfd_process_notifier_release_internal(p);
+
+       /*
+        * Ensures that all outstanding free_notifier get called, triggering
+        * the release of the kfd_process struct.
+        */
+       mmu_notifier_synchronize();
+}
+
  static int kfd_process_init_cwsr_apu(struct kfd_process *p, struct file *filep)
  {
         unsigned long  offset;
         int i;
  
         for (i = 0; i < p->n_pdds; i++) {
-               struct kfd_dev *dev = p->pdds[i]->dev;
+               struct kfd_node *dev = p->pdds[i]->dev;
                 struct qcm_process_device *qpd = &p->pdds[i]->qpd;
  
-               if (!dev->cwsr_enabled || qpd->cwsr_kaddr || qpd->cwsr_base)
+               if (!dev->kfd->cwsr_enabled || qpd->cwsr_kaddr || qpd->cwsr_base)
                         continue;
  
                 offset = KFD_MMAP_TYPE_RESERVED_MEM | KFD_MMAP_GPU_ID(dev->id);
@@ -1226,7 +1279,7 @@ static int kfd_process_init_cwsr_apu(struct kfd_process *p, struct file *filep)
                         return err;
                 }
  
-               memcpy(qpd->cwsr_kaddr, dev->cwsr_isa, dev->cwsr_isa_size);
+               memcpy(qpd->cwsr_kaddr, dev->kfd->cwsr_isa, dev->kfd->cwsr_isa_size);
  
                 qpd->tma_addr = qpd->tba_addr + KFD_CWSR_TMA_OFFSET;
                 pr_debug("set tba :0x%llx, tma:0x%llx, cwsr_kaddr:%p for pqm.\n",
@@ -1238,7 +1291,7 @@ static int kfd_process_init_cwsr_apu(struct kfd_process *p, struct file *filep)
  
  static int kfd_process_device_init_cwsr_dgpu(struct kfd_process_device *pdd)
  {
-       struct kfd_dev *dev = pdd->dev;
+       struct kfd_node *dev = pdd->dev;
         struct qcm_process_device *qpd = &pdd->qpd;
         uint32_t flags = KFD_IOC_ALLOC_MEM_FLAGS_GTT
                         | KFD_IOC_ALLOC_MEM_FLAGS_NO_SUBSTITUTE
@@ -1247,7 +1300,7 @@ static int kfd_process_device_init_cwsr_dgpu(struct kfd_process_device *pdd)
         void *kaddr;
         int ret;
  
-       if (!dev->cwsr_enabled || qpd->cwsr_kaddr || !qpd->cwsr_base)
+       if (!dev->kfd->cwsr_enabled || qpd->cwsr_kaddr || !qpd->cwsr_base)
                 return 0;
  
         /* cwsr_base is only set for dGPU */
@@ -1260,7 +1313,7 @@ static int kfd_process_device_init_cwsr_dgpu(struct kfd_process_device *pdd)
         qpd->cwsr_kaddr = kaddr;
         qpd->tba_addr = qpd->cwsr_base;
  
-       memcpy(qpd->cwsr_kaddr, dev->cwsr_isa, dev->cwsr_isa_size);
+       memcpy(qpd->cwsr_kaddr, dev->kfd->cwsr_isa, dev->kfd->cwsr_isa_size);
  
         qpd->tma_addr = qpd->tba_addr + KFD_CWSR_TMA_OFFSET;
         pr_debug("set tba :0x%llx, tma:0x%llx, cwsr_kaddr:%p for pqm.\n",
@@ -1271,10 +1324,10 @@ static int kfd_process_device_init_cwsr_dgpu(struct kfd_process_device *pdd)
  
  static void kfd_process_device_destroy_cwsr_dgpu(struct kfd_process_device *pdd)
  {
-       struct kfd_dev *dev = pdd->dev;
+       struct kfd_node *dev = pdd->dev;
         struct qcm_process_device *qpd = &pdd->qpd;
  
-       if (!dev->cwsr_enabled || !qpd->cwsr_kaddr || !qpd->cwsr_base)
+       if (!dev->kfd->cwsr_enabled || !qpd->cwsr_kaddr || !qpd->cwsr_base)
                 return;
  
         kfd_process_free_gpuvm(qpd->cwsr_mem, pdd, &qpd->cwsr_kaddr);
@@ -1318,7 +1371,7 @@ bool kfd_process_xnack_mode(struct kfd_process *p, bool supported)
          * support retry.
          */
         for (i = 0; i < p->n_pdds; i++) {
-               struct kfd_dev *dev = p->pdds[i]->dev;
+               struct kfd_node *dev = p->pdds[i]->dev;
  
                 /* Only consider GFXv9 and higher GPUs. Older GPUs don't
                  * support the SVM APIs and don't need to be considered
@@ -1341,7 +1394,7 @@ bool kfd_process_xnack_mode(struct kfd_process *p, bool supported)
                 if (KFD_GC_VERSION(dev) >= IP_VERSION(10, 1, 1))
                         return false;
  
-               if (dev->noretry)
+               if (dev->kfd->noretry)
                         return false;
         }
  
@@ -1475,7 +1528,7 @@ static int init_doorbell_bitmap(struct qcm_process_device *qpd,
         return 0;
  }
  
-struct kfd_process_device *kfd_get_process_device_data(struct kfd_dev *dev,
+struct kfd_process_device *kfd_get_process_device_data(struct kfd_node *dev,
                                                         struct kfd_process *p)
  {
         int i;
@@ -1487,7 +1540,7 @@ struct kfd_process_device *kfd_get_process_device_data(struct kfd_dev *dev,
         return NULL;
  }
  
-struct kfd_process_device *kfd_create_process_device_data(struct kfd_dev *dev,
+struct kfd_process_device *kfd_create_process_device_data(struct kfd_node *dev,
                                                         struct kfd_process *p)
  {
         struct kfd_process_device *pdd = NULL;
@@ -1499,7 +1552,7 @@ struct kfd_process_device *kfd_create_process_device_data(struct kfd_dev *dev,
         if (!pdd)
                 return NULL;
  
-       if (init_doorbell_bitmap(&pdd->qpd, dev)) {
+       if (init_doorbell_bitmap(&pdd->qpd, dev->kfd)) {
                 pr_err("Failed to init doorbell for process\n");
                 goto err_free_pdd;
         }
@@ -1520,7 +1573,7 @@ struct kfd_process_device *kfd_create_process_device_data(struct kfd_dev *dev,
         pdd->user_gpu_id = dev->id;
         atomic64_set(&pdd->evict_duration_counter, 0);
  
-       if (dev->shared_resources.enable_mes) {
+       if (dev->kfd->shared_resources.enable_mes) {
                 retval = amdgpu_amdkfd_alloc_gtt_mem(dev->adev,
                                                 AMDGPU_MES_PROC_CTX_SIZE,
                                                 &pdd->proc_ctx_bo,
@@ -1566,7 +1619,7 @@ int kfd_process_device_init_vm(struct kfd_process_device *pdd,
         struct amdgpu_fpriv *drv_priv;
         struct amdgpu_vm *avm;
         struct kfd_process *p;
-       struct kfd_dev *dev;
+       struct kfd_node *dev;
         int ret;
  
         if (!drm_file)
@@ -1626,7 +1679,7 @@ err_reserve_ib_mem:
   *
   * Assumes that the process lock is held.
   */
-struct kfd_process_device *kfd_bind_process_to_device(struct kfd_dev *dev,
+struct kfd_process_device *kfd_bind_process_to_device(struct kfd_node *dev,
                                                         struct kfd_process *p)
  {
         struct kfd_process_device *pdd;
@@ -1758,7 +1811,7 @@ int kfd_process_evict_queues(struct kfd_process *p, uint32_t trigger)
         for (i = 0; i < p->n_pdds; i++) {
                 struct kfd_process_device *pdd = p->pdds[i];
  
-               kfd_smi_event_queue_eviction(pdd->dev, p->lead_thread->pid,
+               kfd_smi_event_queue_eviction(pdd->dev->kfd, p->lead_thread->pid,
                                              trigger);
  
                 r = pdd->dev->dqm->ops.evict_process_queues(pdd->dev->dqm,
@@ -1786,7 +1839,7 @@ fail:
                 if (n_evicted == 0)
                         break;
  
-               kfd_smi_event_queue_restore(pdd->dev, p->lead_thread->pid);
+               kfd_smi_event_queue_restore(pdd->dev->kfd, p->lead_thread->pid);
  
                 if (pdd->dev->dqm->ops.restore_process_queues(pdd->dev->dqm,
                                                               &pdd->qpd))
@@ -1807,7 +1860,7 @@ int kfd_process_restore_queues(struct kfd_process *p)
         for (i = 0; i < p->n_pdds; i++) {
                 struct kfd_process_device *pdd = p->pdds[i];
  
-               kfd_smi_event_queue_restore(pdd->dev, p->lead_thread->pid);
+               kfd_smi_event_queue_restore(pdd->dev->kfd, p->lead_thread->pid);
  
                 r = pdd->dev->dqm->ops.restore_process_queues(pdd->dev->dqm,
                                                               &pdd->qpd);
@@ -1963,7 +2016,7 @@ int kfd_resume_all_processes(void)
         return ret;
  }
  
-int kfd_reserved_mem_mmap(struct kfd_dev *dev, struct kfd_process *process,
+int kfd_reserved_mem_mmap(struct kfd_node *dev, struct kfd_process *process,
                           struct vm_area_struct *vma)
  {
         struct kfd_process_device *pdd;
@@ -1998,7 +2051,7 @@ void kfd_flush_tlb(struct kfd_process_device *pdd, enum TLB_FLUSH_TYPE type)
  {
         struct amdgpu_vm *vm = drm_priv_to_vm(pdd->drm_priv);
         uint64_t tlb_seq = amdgpu_vm_tlb_seq(vm);
-       struct kfd_dev *dev = pdd->dev;
+       struct kfd_node *dev = pdd->dev;
  
         /*
          * It can be that we race and lose here, but that is extremely unlikely