eventfd: Make signal recursion protection a task bit
authorThomas Gleixner <tglx@linutronix.de>
Thu, 29 Jul 2021 11:01:59 +0000 (13:01 +0200)
committerThomas Gleixner <tglx@linutronix.de>
Fri, 27 Aug 2021 23:33:02 +0000 (01:33 +0200)
commitb542e383d8c005f06a131e2b40d5889b812f19c6
tree14a6c55f5366f44df978f27c4b8a92f0a30b0689
parent366e7ad6ba5f4cb2ffd0b7316e404d6ee9c0f401
eventfd: Make signal recursion protection a task bit

The recursion protection for eventfd_signal() is based on a per CPU
variable and relies on the !RT semantics of spin_lock_irqsave() for
protecting this per CPU variable. On RT kernels spin_lock_irqsave() neither
disables preemption nor interrupts which allows the spin lock held section
to be preempted. If the preempting task invokes eventfd_signal() as well,
then the recursion warning triggers.

Paolo suggested to protect the per CPU variable with a local lock, but
that's heavyweight and actually not necessary. The goal of this protection
is to prevent the task stack from overflowing, which can be achieved with a
per task recursion protection as well.

Replace the per CPU variable with a per task bit similar to other recursion
protection bits like task_struct::in_page_owner. This works on both !RT and
RT kernels and removes as a side effect the extra per CPU storage.

No functional change for !RT kernels.

Reported-by: Daniel Bristot de Oliveira <bristot@redhat.com>
Signed-off-by: Thomas Gleixner <tglx@linutronix.de>
Tested-by: Daniel Bristot de Oliveira <bristot@redhat.com>
Acked-by: Jason Wang <jasowang@redhat.com>
Cc: Al Viro <viro@zeniv.linux.org.uk>
Link: https://lore.kernel.org/r/87wnp9idso.ffs@tglx
fs/aio.c
fs/eventfd.c
include/linux/eventfd.h
include/linux/sched.h