Merge branch 'ras-core-for-linus' of git://git.kernel.org/pub/scm/linux/kernel/git...

author Linus Torvalds <torvalds@linux-foundation.org>

Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)

committer Linus Torvalds <torvalds@linux-foundation.org>

Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)
author Linus Torvalds <torvalds@linux-foundation.org>
Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)
committer Linus Torvalds <torvalds@linux-foundation.org>
Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)
diff --combined arch/x86/kernel/cpu/mcheck/mce.c

index 3d6b526,e4e6646..0f8f21c
--- 1/arch/x86/kernel/cpu/mcheck/mce.c
--- 2/arch/x86/kernel/cpu/mcheck/mce.c
+++ b/arch/x86/kernel/cpu/mcheck/mce.c
@@@ -52,11 -52,11 +52,11 @@@
   
   static DEFINE_MUTEX(mce_chrdev_read_mutex);
   
- #define rcu_dereference_check_mce(p) \
+ #define mce_log_get_idx_check(p) \
   ({ \
- -      rcu_lockdep_assert(rcu_read_lock_sched_held() || \
- -                         lockdep_is_held(&mce_chrdev_read_mutex), \
- -                         "suspicious mce_log_get_idx_check() usage"); \
+ +      RCU_LOCKDEP_WARN(!rcu_read_lock_sched_held() && \
+ +                       !lockdep_is_held(&mce_chrdev_read_mutex), \
-                        "suspicious rcu_dereference_check_mce() usage"); \
++                       "suspicious mce_log_get_idx_check() usage"); \
         smp_load_acquire(&(p)); \
   })
   
@@@ -110,15 -110,17 +110,17 @@@ DEFINE_PER_CPU(mce_banks_t, mce_poll_ba
    */
   mce_banks_t mce_banks_ce_disabled;
   
- static DEFINE_PER_CPU(struct work_struct, mce_work);
+ static struct work_struct mce_work;
+ static struct irq_work mce_irq_work;
   
   static void (*quirk_no_way_out)(int bank, struct mce *m, struct pt_regs *regs);
+ static int mce_usable_address(struct mce *m);
   
   /*
    * CPU/chipset specific EDAC code can register a notifier call here to print
    * MCE errors in a human-readable form.
    */
- static ATOMIC_NOTIFIER_HEAD(x86_mce_decoder_chain);
+ ATOMIC_NOTIFIER_HEAD(x86_mce_decoder_chain);
   
   /* Do initial initialization of a struct mce */
   void mce_setup(struct mce *m)
@@@ -157,12 -159,13 +159,13 @@@ void mce_log(struct mce *mce
         /* Emit the trace record: */
         trace_mce_record(mce);
   
-       atomic_notifier_call_chain(&x86_mce_decoder_chain, 0, mce);
+       if (!mce_gen_pool_add(mce))
+               irq_work_queue(&mce_irq_work);
   
         mce->finished = 0;
         wmb();
         for (;;) {
-               entry = rcu_dereference_check_mce(mcelog.next);
+               entry = mce_log_get_idx_check(mcelog.next);
                 for (;;) {
   
                         /*
@@@ -196,48 -199,23 +199,23 @@@
         set_bit(0, &mce_need_notify);
   }
   
- static void drain_mcelog_buffer(void)
+ void mce_inject_log(struct mce *m)
   {
-       unsigned int next, i, prev = 0;
- 
-       next = ACCESS_ONCE(mcelog.next);
- 
-       do {
-               struct mce *m;
- 
-               /* drain what was logged during boot */
-               for (i = prev; i < next; i++) {
-                       unsigned long start = jiffies;
-                       unsigned retries = 1;
- 
-                       m = &mcelog.entry[i];
- 
-                       while (!m->finished) {
-                               if (time_after_eq(jiffies, start + 2*retries))
-                                       retries++;
- 
-                               cpu_relax();
- 
-                               if (!m->finished && retries >= 4) {
-                                       pr_err("skipping error being logged currently!\n");
-                                       break;
-                               }
-                       }
-                       smp_rmb();
-                       atomic_notifier_call_chain(&x86_mce_decoder_chain, 0, m);
-               }
- 
-               memset(mcelog.entry + prev, 0, (next - prev) * sizeof(*m));
-               prev = next;
-               next = cmpxchg(&mcelog.next, prev, 0);
-       } while (next != prev);
+       mutex_lock(&mce_chrdev_read_mutex);
+       mce_log(m);
+       mutex_unlock(&mce_chrdev_read_mutex);
   }
+ EXPORT_SYMBOL_GPL(mce_inject_log);
   
+ static struct notifier_block mce_srao_nb;
   
   void mce_register_decode_chain(struct notifier_block *nb)
   {
+       /* Ensure SRAO notifier has the highest priority in the decode chain. */
+       if (nb != &mce_srao_nb && nb->priority == INT_MAX)
+               nb->priority -= 1;
+ 
         atomic_notifier_chain_register(&x86_mce_decoder_chain, nb);
-       drain_mcelog_buffer();
   }
   EXPORT_SYMBOL_GPL(mce_register_decode_chain);
   
@@@ -461,61 -439,6 +439,6 @@@ static inline void mce_gather_info(stru
         }
   }
   
- /*
-  * Simple lockless ring to communicate PFNs from the exception handler with the
-  * process context work function. This is vastly simplified because there's
-  * only a single reader and a single writer.
-  */
- #define MCE_RING_SIZE 16      /* we use one entry less */
- 
- struct mce_ring {
-       unsigned short start;
-       unsigned short end;
-       unsigned long ring[MCE_RING_SIZE];
- };
- static DEFINE_PER_CPU(struct mce_ring, mce_ring);
- 
- /* Runs with CPU affinity in workqueue */
- static int mce_ring_empty(void)
- {
-       struct mce_ring *r = this_cpu_ptr(&mce_ring);
- 
-       return r->start == r->end;
- }
- 
- static int mce_ring_get(unsigned long *pfn)
- {
-       struct mce_ring *r;
-       int ret = 0;
- 
-       *pfn = 0;
-       get_cpu();
-       r = this_cpu_ptr(&mce_ring);
-       if (r->start == r->end)
-               goto out;
-       *pfn = r->ring[r->start];
-       r->start = (r->start + 1) % MCE_RING_SIZE;
-       ret = 1;
- out:
-       put_cpu();
-       return ret;
- }
- 
- /* Always runs in MCE context with preempt off */
- static int mce_ring_add(unsigned long pfn)
- {
-       struct mce_ring *r = this_cpu_ptr(&mce_ring);
-       unsigned next;
- 
-       next = (r->end + 1) % MCE_RING_SIZE;
-       if (next == r->start)
-               return -1;
-       r->ring[r->end] = pfn;
-       wmb();
-       r->end = next;
-       return 0;
- }
- 
   int mce_available(struct cpuinfo_x86 *c)
   {
         if (mca_cfg.disabled)
@@@ -525,12 -448,10 +448,10 @@@
   
   static void mce_schedule_work(void)
   {
-       if (!mce_ring_empty())
-               schedule_work(this_cpu_ptr(&mce_work));
+       if (!mce_gen_pool_empty() && keventd_up())
+               schedule_work(&mce_work);
   }
   
- static DEFINE_PER_CPU(struct irq_work, mce_irq_work);
- 
   static void mce_irq_work_cb(struct irq_work *entry)
   {
         mce_notify_irq();
@@@ -551,8 -472,29 +472,29 @@@ static void mce_report_event(struct pt_
                 return;
         }
   
-       irq_work_queue(this_cpu_ptr(&mce_irq_work));
+       irq_work_queue(&mce_irq_work);
+ }
+ 
+ static int srao_decode_notifier(struct notifier_block *nb, unsigned long val,
+                               void *data)
+ {
+       struct mce *mce = (struct mce *)data;
+       unsigned long pfn;
+ 
+       if (!mce)
+               return NOTIFY_DONE;
+ 
+       if (mce->usable_addr && (mce->severity == MCE_AO_SEVERITY)) {
+               pfn = mce->addr >> PAGE_SHIFT;
+               memory_failure(pfn, MCE_VECTOR, 0);
+       }
+ 
+       return NOTIFY_OK;
   }
+ static struct notifier_block mce_srao_nb = {
+       .notifier_call  = srao_decode_notifier,
+       .priority = INT_MAX,
+ };
   
   /*
    * Read ADDR and MISC registers.
@@@ -672,8 -614,11 +614,11 @@@ bool machine_check_poll(enum mcp_flags 
                  */
                 if (severity == MCE_DEFERRED_SEVERITY && memory_error(&m)) {
                         if (m.status & MCI_STATUS_ADDRV) {
-                               mce_ring_add(m.addr >> PAGE_SHIFT);
-                               mce_schedule_work();
+                               m.severity = severity;
+                               m.usable_addr = mce_usable_address(&m);
+ 
+                               if (!mce_gen_pool_add(&m))
+                                       mce_schedule_work();
                         }
                 }
   
@@@ -1143,15 -1088,9 +1088,9 @@@ void do_machine_check(struct pt_regs *r
   
                 mce_read_aux(&m, i);
   
-               /*
-                * Action optional error. Queue address for later processing.
-                * When the ring overflows we just ignore the AO error.
-                * RED-PEN add some logging mechanism when
-                * usable_address or mce_add_ring fails.
-                * RED-PEN don't ignore overflow for mca_cfg.tolerant == 0
-                */
-               if (severity == MCE_AO_SEVERITY && mce_usable_address(&m))
-                       mce_ring_add(m.addr >> PAGE_SHIFT);
+               /* assuming valid severity level != 0 */
+               m.severity = severity;
+               m.usable_addr = mce_usable_address(&m);
   
                 mce_log(&m);
   
@@@ -1247,14 -1186,11 +1186,11 @@@ int memory_failure(unsigned long pfn, i
   /*
    * Action optional processing happens here (picking up
    * from the list of faulting pages that do_machine_check()
-  * placed into the "ring").
+  * placed into the genpool).
    */
   static void mce_process_work(struct work_struct *dummy)
   {
-       unsigned long pfn;
- 
-       while (mce_ring_get(&pfn))
-               memory_failure(pfn, MCE_VECTOR, 0);
+       mce_gen_pool_process();
   }
   
   #ifdef CONFIG_X86_MCE_INTEL
@@@ -1678,6 -1614,17 +1614,17 @@@ static void __mcheck_cpu_init_vendor(st
         }
   }
   
+ static void __mcheck_cpu_clear_vendor(struct cpuinfo_x86 *c)
+ {
+       switch (c->x86_vendor) {
+       case X86_VENDOR_INTEL:
+               mce_intel_feature_clear(c);
+               break;
+       default:
+               break;
+       }
+ }
+ 
   static void mce_start_timer(unsigned int cpu, struct timer_list *t)
   {
         unsigned long iv = check_interval * HZ;
@@@ -1731,13 -1678,36 +1678,36 @@@ void mcheck_cpu_init(struct cpuinfo_x8
                 return;
         }
   
+       if (mce_gen_pool_init()) {
+               mca_cfg.disabled = true;
+               pr_emerg("Couldn't allocate MCE records pool!\n");
+               return;
+       }
+ 
         machine_check_vector = do_machine_check;
   
         __mcheck_cpu_init_generic();
         __mcheck_cpu_init_vendor(c);
         __mcheck_cpu_init_timer();
-       INIT_WORK(this_cpu_ptr(&mce_work), mce_process_work);
-       init_irq_work(this_cpu_ptr(&mce_irq_work), &mce_irq_work_cb);
+ }
+ 
+ /*
+  * Called for each booted CPU to clear some machine checks opt-ins
+  */
+ void mcheck_cpu_clear(struct cpuinfo_x86 *c)
+ {
+       if (mca_cfg.disabled)
+               return;
+ 
+       if (!mce_available(c))
+               return;
+ 
+       /*
+        * Possibly to clear general settings generic to x86
+        * __mcheck_cpu_clear_generic(c);
+        */
+       __mcheck_cpu_clear_vendor(c);
+ 
   }
   
   /*
@@@ -1850,7 -1820,7 +1820,7 @@@ static ssize_t mce_chrdev_read(struct f
                         goto out;
         }
   
-       next = rcu_dereference_check_mce(mcelog.next);
+       next = mce_log_get_idx_check(mcelog.next);
   
         /* Only supports full reads right now */
         err = -EINVAL;
@@@ -2056,8 -2026,12 +2026,12 @@@ __setup("mce", mcheck_enable)
   int __init mcheck_init(void)
   {
         mcheck_intel_therm_init();
+       mce_register_decode_chain(&mce_srao_nb);
         mcheck_vendor_init_severity();
   
+       INIT_WORK(&mce_work, mce_process_work);
+       init_irq_work(&mce_irq_work, mce_irq_work_cb);
+ 
         return 0;
   }
   
@@@ -2591,5 -2565,20 +2565,20 @@@ static int __init mcheck_debugfs_init(v
   
         return 0;
   }
- late_initcall(mcheck_debugfs_init);
+ #else
+ static int __init mcheck_debugfs_init(void) { return -EINVAL; }
   #endif
+ 
+ static int __init mcheck_late_init(void)
+ {
+       mcheck_debugfs_init();
+ 
+       /*
+        * Flush out everything that has been logged during early boot, now that
+        * everything has been initialized (workqueues, decoders, ...).
+        */
+       mce_schedule_work();
+ 
+       return 0;
+ }
+ late_initcall(mcheck_late_init);
diff --combined arch/x86/kernel/process.c

index c27cad7,b20ef18..d83740a
--- 1/arch/x86/kernel/process.c
--- 2/arch/x86/kernel/process.c
+++ b/arch/x86/kernel/process.c
@@@ -29,6 -29,7 +29,7 @@@
   #include <asm/debugreg.h>
   #include <asm/nmi.h>
   #include <asm/tlbflush.h>
+ #include <asm/mce.h>
   
   /*
    * per-CPU TSS segments. Threads are completely 'soft' on Linux,
@@@ -319,6 -320,7 +320,7 @@@ void stop_this_cpu(void *dummy
          */
         set_cpu_online(smp_processor_id(), false);
         disable_local_APIC();
+       mcheck_cpu_clear(this_cpu_ptr(&cpu_info));
   
         for (;;)
                 halt();
@@@ -408,7 -410,6 +410,7 @@@ static int prefer_mwait_c1_over_halt(co
   static void mwait_idle(void)
   {
         if (!current_set_polling_and_test()) {
+ +              trace_cpu_idle_rcuidle(1, smp_processor_id());
                 if (this_cpu_has(X86_BUG_CLFLUSH_MONITOR)) {
                         smp_mb(); /* quirk */
                         clflush((void *)&current_thread_info()->flags);
@@@ -420,7 -421,6 +422,7 @@@
                         __sti_mwait(0, 0);
                 else
                         local_irq_enable();
+ +              trace_cpu_idle_rcuidle(PWR_EVENT_EXIT, smp_processor_id());
         } else {
                 local_irq_enable();
         }
author	Linus Torvalds <torvalds@linux-foundation.org>
	Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)
committer	Linus Torvalds <torvalds@linux-foundation.org>
	Tue, 1 Sep 2015 03:20:30 +0000 (20:20 -0700)
		1	2
arch/x86/kernel/cpu/mcheck/mce.c	patch \|	diff1 \|	diff2 \|	blob \| history
arch/x86/kernel/process.c	patch \|	diff1 \|	diff2 \|	blob \| history