vfio/type1: Simplify bus_type determination
authorRobin Murphy <robin.murphy@arm.com>
Fri, 24 Jun 2022 17:51:44 +0000 (18:51 +0100)
committerAlex Williamson <alex.williamson@redhat.com>
Mon, 27 Jun 2022 19:23:29 +0000 (13:23 -0600)
Since IOMMU groups are mandatory for drivers to support, it stands to
reason that any device which has been successfully added to a group
must be on a bus supported by that IOMMU driver, and therefore a domain
viable for any device in the group must be viable for all devices in
the group. This already has to be the case for the IOMMU API's internal
default domain, for instance. Thus even if the group contains devices on
different buses, that can only mean that the IOMMU driver actually
supports such an odd topology, and so without loss of generality we can
expect the bus type of any device in a group to be suitable for IOMMU
API calls.

Furthermore, scrutiny reveals a lack of protection for the bus being
removed while vfio_iommu_type1_attach_group() is using it; the reference
that VFIO holds on the iommu_group ensures that data remains valid, but
does not prevent the group's membership changing underfoot.

We can address both concerns by recycling vfio_bus_type() into some
superficially similar logic to indirect the IOMMU API calls themselves.
Each call is thus protected from races by the IOMMU group's own locking,
and we no longer need to hold group-derived pointers beyond that scope.
It also gives us an easy path for the IOMMU API's migration of bus-based
interfaces to device-based, of which we can already take the first step
with device_iommu_capable(). As with domains, any capability must in
practice be consistent for devices in a given group - and after all it's
still the same capability which was expected to be consistent across an
entire bus! - so there's no need for any complicated validation.

Signed-off-by: Robin Murphy <robin.murphy@arm.com>
Reviewed-by: Kevin Tian <kevin.tian@intel.com>
Reviewed-by: Jason Gunthorpe <jgg@nvidia.com>
Link: https://lore.kernel.org/r/194a12d3434d7b38f84fa96503c7664451c8c395.1656092606.git.robin.murphy@arm.com
[aw: add comment to vfio_iommu_device_capable()]
Signed-off-by: Alex Williamson <alex.williamson@redhat.com>
drivers/vfio/vfio_iommu_type1.c

index c13b929..c496b7d 100644 (file)
@@ -1679,18 +1679,6 @@ out_unlock:
        return ret;
 }
 
-static int vfio_bus_type(struct device *dev, void *data)
-{
-       struct bus_type **bus = data;
-
-       if (*bus && *bus != dev->bus)
-               return -EINVAL;
-
-       *bus = dev->bus;
-
-       return 0;
-}
-
 static int vfio_iommu_replay(struct vfio_iommu *iommu,
                             struct vfio_domain *domain)
 {
@@ -2153,13 +2141,26 @@ static void vfio_iommu_iova_insert_copy(struct vfio_iommu *iommu,
        list_splice_tail(iova_copy, iova);
 }
 
+/* Redundantly walks non-present capabilities to simplify caller */
+static int vfio_iommu_device_capable(struct device *dev, void *data)
+{
+       return device_iommu_capable(dev, (enum iommu_cap)data);
+}
+
+static int vfio_iommu_domain_alloc(struct device *dev, void *data)
+{
+       struct iommu_domain **domain = data;
+
+       *domain = iommu_domain_alloc(dev->bus);
+       return 1; /* Don't iterate */
+}
+
 static int vfio_iommu_type1_attach_group(void *iommu_data,
                struct iommu_group *iommu_group, enum vfio_group_type type)
 {
        struct vfio_iommu *iommu = iommu_data;
        struct vfio_iommu_group *group;
        struct vfio_domain *domain, *d;
-       struct bus_type *bus = NULL;
        bool resv_msi, msi_remap;
        phys_addr_t resv_msi_base = 0;
        struct iommu_domain_geometry *geo;
@@ -2192,18 +2193,19 @@ static int vfio_iommu_type1_attach_group(void *iommu_data,
                goto out_unlock;
        }
 
-       /* Determine bus_type in order to allocate a domain */
-       ret = iommu_group_for_each_dev(iommu_group, &bus, vfio_bus_type);
-       if (ret)
-               goto out_free_group;
-
        ret = -ENOMEM;
        domain = kzalloc(sizeof(*domain), GFP_KERNEL);
        if (!domain)
                goto out_free_group;
 
+       /*
+        * Going via the iommu_group iterator avoids races, and trivially gives
+        * us a representative device for the IOMMU API call. We don't actually
+        * want to iterate beyond the first device (if any).
+        */
        ret = -EIO;
-       domain->domain = iommu_domain_alloc(bus);
+       iommu_group_for_each_dev(iommu_group, &domain->domain,
+                                vfio_iommu_domain_alloc);
        if (!domain->domain)
                goto out_free_domain;
 
@@ -2258,7 +2260,8 @@ static int vfio_iommu_type1_attach_group(void *iommu_data,
        list_add(&group->next, &domain->group_list);
 
        msi_remap = irq_domain_check_msi_remap() ||
-                   iommu_capable(bus, IOMMU_CAP_INTR_REMAP);
+                   iommu_group_for_each_dev(iommu_group, (void *)IOMMU_CAP_INTR_REMAP,
+                                            vfio_iommu_device_capable);
 
        if (!allow_unsafe_interrupts && !msi_remap) {
                pr_warn("%s: No interrupt remapping support.  Use the module param \"allow_unsafe_interrupts\" to enable VFIO IOMMU support on this platform\n",