x86: Warn when NMI handlers take large amounts of time
authorDave Hansen <dave.hansen@linux.intel.com>
Fri, 21 Jun 2013 15:51:35 +0000 (08:51 -0700)
committerIngo Molnar <mingo@kernel.org>
Sun, 23 Jun 2013 09:52:56 +0000 (11:52 +0200)
commit2ab00456ea8a0d79acb1390659b98416111880b2
tree5bda8b0f3f8a530431691e5ab309b6f2f056894e
parentbde96030f438b5eb6fb74f3bdd06d9f68bb3ba00
x86: Warn when NMI handlers take large amounts of time

I have a system which is causing all kinds of problems.  It has
8 NUMA nodes, and lots of cores that can fight over cachelines.
If things are not working _perfectly_, then NMIs can take longer
than expected.

If we get too many of them backed up to each other, we can
easily end up in a situation where we are doing nothing *but*
running NMIs.  The biggest problem, though, is that this happens
_silently_.  You might be lucky to get an hrtimer warning, but
most of the time system simply hangs.

This patch should at least give us some warning before we fall
off the cliff.  the warnings look like this:

nmi_handle: perf_event_nmi_handler() took: 26095071 ns

The message is triggered whenever we notice the longest NMI
we've seen to date.  You can always view and reset this value
via the debugfs interface if you like.

Signed-off-by: Dave Hansen <dave.hansen@linux.intel.com>
Acked-by: Peter Zijlstra <a.p.zijlstra@chello.nl>
Cc: paulus@samba.org
Cc: acme@ghostprotocols.net
Cc: Dave Hansen <dave@sr71.net>
Signed-off-by: Ingo Molnar <mingo@kernel.org>
arch/x86/kernel/nmi.c