drm/i915/execlists: Avoid reusing the same logical CCID

author Chris Wilson <chris@chris-wilson.co.uk>

Tue, 28 Apr 2020 18:47:49 +0000 (19:47 +0100)

committer Rodrigo Vivi <rodrigo.vivi@intel.com>

Wed, 6 May 2020 22:37:46 +0000 (15:37 -0700)
author Chris Wilson <chris@chris-wilson.co.uk>
Tue, 28 Apr 2020 18:47:49 +0000 (19:47 +0100)
committer Rodrigo Vivi <rodrigo.vivi@intel.com>
Wed, 6 May 2020 22:37:46 +0000 (15:37 -0700)
diff --git a/drivers/gpu/drm/i915/gt/intel_context_types.h b/drivers/gpu/drm/i915/gt/intel_context_types.h

index 07cb83a..ca0d4f4 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_context_types.h
+++ b/drivers/gpu/drm/i915/gt/intel_context_types.h
@@ -69,7 +69,13 @@ struct intel_context {
  #define CONTEXT_NOPREEMPT              7
  
         u32 *lrc_reg_state;
-       u64 lrc_desc;
+       union {
+               struct {
+                       u32 lrca;
+                       u32 ccid;
+               };
+               u64 desc;
+       } lrc;
         u32 tag; /* cookie passed to HW to track this context on submission */
  
         /* Time on GPU as tracked by the hw. */
diff --git a/drivers/gpu/drm/i915/gt/intel_engine_types.h b/drivers/gpu/drm/i915/gt/intel_engine_types.h

index 763f8f5..8dd210a 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_engine_types.h
+++ b/drivers/gpu/drm/i915/gt/intel_engine_types.h
@@ -156,6 +156,11 @@ struct intel_engine_execlists {
          */
         struct i915_priolist default_priolist;
  
+       /**
+        * @ccid: identifier for contexts submitted to this engine
+        */
+       u32 ccid;
+
         /**
          * @yield: CCID at the time of the last semaphore-wait interrupt.
          *
diff --git a/drivers/gpu/drm/i915/gt/intel_lrc.c b/drivers/gpu/drm/i915/gt/intel_lrc.c

index a21b962..e8b02f8 100644 (file)
--- a/drivers/gpu/drm/i915/gt/intel_lrc.c
+++ b/drivers/gpu/drm/i915/gt/intel_lrc.c
@@ -456,10 +456,10 @@ assert_priority_queue(const struct i915_request *prev,
   * engine info, SW context ID and SW counter need to form a unique number
   * (Context ID) per lrc.
   */
-static u64
+static u32
  lrc_descriptor(struct intel_context *ce, struct intel_engine_cs *engine)
  {
-       u64 desc;
+       u32 desc;
  
         desc = INTEL_LEGACY_32B_CONTEXT;
         if (i915_vm_is_4lvl(ce->vm))
@@ -470,21 +470,7 @@ lrc_descriptor(struct intel_context *ce, struct intel_engine_cs *engine)
         if (IS_GEN(engine->i915, 8))
                 desc |= GEN8_CTX_L3LLC_COHERENT;
  
-       desc |= i915_ggtt_offset(ce->state); /* bits 12-31 */
-       /*
-        * The following 32bits are copied into the OA reports (dword 2).
-        * Consider updating oa_get_render_ctx_id in i915_perf.c when changing
-        * anything below.
-        */
-       if (INTEL_GEN(engine->i915) >= 11) {
-               desc |= (u64)engine->instance << GEN11_ENGINE_INSTANCE_SHIFT;
-                                                               /* bits 48-53 */
-
-               desc |= (u64)engine->class << GEN11_ENGINE_CLASS_SHIFT;
-                                                               /* bits 61-63 */
-       }
-
-       return desc;
+       return i915_ggtt_offset(ce->state) | desc;
  }
  
  static inline unsigned int dword_in_page(void *addr)
@@ -1192,7 +1178,7 @@ static void reset_active(struct i915_request *rq,
         __execlists_update_reg_state(ce, engine, head);
  
         /* We've switched away, so this should be a no-op, but intent matters */
-       ce->lrc_desc |= CTX_DESC_FORCE_RESTORE;
+       ce->lrc.desc |= CTX_DESC_FORCE_RESTORE;
  }
  
  static u32 intel_context_get_runtime(const struct intel_context *ce)
@@ -1251,18 +1237,19 @@ __execlists_schedule_in(struct i915_request *rq)
         if (IS_ENABLED(CONFIG_DRM_I915_DEBUG_GEM))
                 execlists_check_context(ce, engine);
  
-       ce->lrc_desc &= ~GENMASK_ULL(47, 37);
         if (ce->tag) {
                 /* Use a fixed tag for OA and friends */
-               ce->lrc_desc |= (u64)ce->tag << 32;
+               ce->lrc.ccid = ce->tag;
         } else {
                 /* We don't need a strict matching tag, just different values */
-               ce->lrc_desc |=
-                       (u64)(++engine->context_tag % NUM_CONTEXT_TAG) <<
-                       GEN11_SW_CTX_ID_SHIFT;
+               ce->lrc.ccid =
+                       (++engine->context_tag % NUM_CONTEXT_TAG) <<
+                       (GEN11_SW_CTX_ID_SHIFT - 32);
                 BUILD_BUG_ON(NUM_CONTEXT_TAG > GEN12_MAX_CONTEXT_HW_ID);
         }
  
+       ce->lrc.ccid |= engine->execlists.ccid;
+
         __intel_gt_pm_get(engine->gt);
         execlists_context_status_change(rq, INTEL_CONTEXT_SCHEDULE_IN);
         intel_engine_context_in(engine);
@@ -1361,7 +1348,7 @@ execlists_schedule_out(struct i915_request *rq)
  static u64 execlists_update_context(struct i915_request *rq)
  {
         struct intel_context *ce = rq->context;
-       u64 desc = ce->lrc_desc;
+       u64 desc = ce->lrc.desc;
         u32 tail, prev;
  
         /*
@@ -1400,7 +1387,7 @@ static u64 execlists_update_context(struct i915_request *rq)
          */
         wmb();
  
-       ce->lrc_desc &= ~CTX_DESC_FORCE_RESTORE;
+       ce->lrc.desc &= ~CTX_DESC_FORCE_RESTORE;
         return desc;
  }
  
@@ -1785,7 +1772,7 @@ timeslice_yield(const struct intel_engine_execlists *el,
          * safe, yield if it might be stuck -- it will be given a fresh
          * timeslice in the near future.
          */
-       return upper_32_bits(rq->context->lrc_desc) == READ_ONCE(el->yield);
+       return rq->context->lrc.ccid == READ_ONCE(el->yield);
  }
  
  static bool
@@ -3071,7 +3058,7 @@ __execlists_context_pin(struct intel_context *ce,
         if (IS_ERR(vaddr))
                 return PTR_ERR(vaddr);
  
-       ce->lrc_desc = lrc_descriptor(ce, engine) | CTX_DESC_FORCE_RESTORE;
+       ce->lrc.lrca = lrc_descriptor(ce, engine) | CTX_DESC_FORCE_RESTORE;
         ce->lrc_reg_state = vaddr + LRC_STATE_PN * PAGE_SIZE;
         __execlists_update_reg_state(ce, engine, ce->ring->tail);
  
@@ -3100,7 +3087,7 @@ static void execlists_context_reset(struct intel_context *ce)
                                  ce, ce->engine, ce->ring, true);
         __execlists_update_reg_state(ce, ce->engine, ce->ring->tail);
  
-       ce->lrc_desc |= CTX_DESC_FORCE_RESTORE;
+       ce->lrc.desc |= CTX_DESC_FORCE_RESTORE;
  }
  
  static const struct intel_context_ops execlists_context_ops = {
@@ -3781,7 +3768,7 @@ out_replay:
                      head, ce->ring->tail);
         __execlists_reset_reg_state(ce, engine);
         __execlists_update_reg_state(ce, engine, head);
-       ce->lrc_desc |= CTX_DESC_FORCE_RESTORE; /* paranoid: GPU was reset! */
+       ce->lrc.desc |= CTX_DESC_FORCE_RESTORE; /* paranoid: GPU was reset! */
  
  unwind:
         /* Push back any incomplete requests for replay after the reset. */
@@ -4548,6 +4535,11 @@ int intel_execlists_submission_setup(struct intel_engine_cs *engine)
         else
                 execlists->csb_size = GEN11_CSB_ENTRIES;
  
+       if (INTEL_GEN(engine->i915) >= 11) {
+               execlists->ccid |= engine->instance << (GEN11_ENGINE_INSTANCE_SHIFT - 32);
+               execlists->ccid |= engine->class << (GEN11_ENGINE_CLASS_SHIFT - 32);
+       }
+
         reset_csb_pointers(engine);
  
         /* Finally, take ownership and responsibility for cleanup! */
diff --git a/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c b/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c

index fe7778c..aa6d56e 100644 (file)
--- a/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c
+++ b/drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c
@@ -217,7 +217,7 @@ static void guc_wq_item_append(struct intel_guc *guc,
  static void guc_add_request(struct intel_guc *guc, struct i915_request *rq)
  {
         struct intel_engine_cs *engine = rq->engine;
-       u32 ctx_desc = lower_32_bits(rq->context->lrc_desc);
+       u32 ctx_desc = rq->context->lrc.ccid;
         u32 ring_tail = intel_ring_set_tail(rq->ring, rq->tail) / sizeof(u64);
  
         guc_wq_item_append(guc, engine->guc_id, ctx_desc,
diff --git a/drivers/gpu/drm/i915/gvt/scheduler.c b/drivers/gpu/drm/i915/gvt/scheduler.c

index cb11c31..6eb6710 100644 (file)
--- a/drivers/gpu/drm/i915/gvt/scheduler.c
+++ b/drivers/gpu/drm/i915/gvt/scheduler.c
@@ -290,7 +290,7 @@ static void
  shadow_context_descriptor_update(struct intel_context *ce,
                                  struct intel_vgpu_workload *workload)
  {
-       u64 desc = ce->lrc_desc;
+       u64 desc = ce->lrc.desc;
  
         /*
          * Update bits 0-11 of the context descriptor which includes flags
@@ -300,7 +300,7 @@ shadow_context_descriptor_update(struct intel_context *ce,
         desc |= (u64)workload->ctx_desc.addressing_mode <<
                 GEN8_CTX_ADDRESSING_MODE_SHIFT;
  
-       ce->lrc_desc = desc;
+       ce->lrc.desc = desc;
  }
  
  static int copy_workload_to_ring_buffer(struct intel_vgpu_workload *workload)
diff --git a/drivers/gpu/drm/i915/i915_perf.c b/drivers/gpu/drm/i915/i915_perf.c

index 66a46e4..b503019 100644 (file)
--- a/drivers/gpu/drm/i915/i915_perf.c
+++ b/drivers/gpu/drm/i915/i915_perf.c
@@ -1310,8 +1310,7 @@ static int oa_get_render_ctx_id(struct i915_perf_stream *stream)
                          * dropped by GuC. They won't be part of the context
                          * ID in the OA reports, so squash those lower bits.
                          */
-                       stream->specific_ctx_id =
-                               lower_32_bits(ce->lrc_desc) >> 12;
+                       stream->specific_ctx_id = ce->lrc.lrca >> 12;
  
                         /*
                          * GuC uses the top bit to signal proxy submission, so
author	Chris Wilson <chris@chris-wilson.co.uk>
	Tue, 28 Apr 2020 18:47:49 +0000 (19:47 +0100)
committer	Rodrigo Vivi <rodrigo.vivi@intel.com>
	Wed, 6 May 2020 22:37:46 +0000 (15:37 -0700)
drivers/gpu/drm/i915/gt/intel_context_types.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_engine_types.h		patch \| blob \| history
drivers/gpu/drm/i915/gt/intel_lrc.c		patch \| blob \| history
drivers/gpu/drm/i915/gt/uc/intel_guc_submission.c		patch \| blob \| history
drivers/gpu/drm/i915/gvt/scheduler.c		patch \| blob \| history
drivers/gpu/drm/i915/i915_perf.c		patch \| blob \| history