cpufreq: schedutil: Fix iowait boost reset
authorPatrick Bellasi <patrick.bellasi@arm.com>
Tue, 22 May 2018 11:07:53 +0000 (12:07 +0100)
committerRafael J. Wysocki <rafael.j.wysocki@intel.com>
Tue, 22 May 2018 12:05:05 +0000 (14:05 +0200)
A more energy efficient update of the IO wait boosting mechanism has
been introduced in:

   commit a5a0809bc58e ("cpufreq: schedutil: Make iowait boost more energy efficient")

where the boost value is expected to be:

 - doubled at each successive wakeup from IO
   staring from the minimum frequency supported by a CPU

 - reset when a CPU is not updated for more then one tick
   by either disabling the IO wait boost or resetting its value to the
   minimum frequency if this new update requires an IO boost.

This approach is supposed to "ignore" boosting for sporadic wakeups from
IO, while still getting the frequency boosted to the maximum to benefit
long sequence of wakeup from IO operations.

However, these assumptions are not always satisfied.
For example, when an IO boosted CPU enters idle for more the one tick
and then wakes up after an IO wait, since in sugov_set_iowait_boost() we
first check the IOWAIT flag, we keep doubling the iowait boost instead
of restarting from the minimum frequency value.

This misbehavior could happen mainly on non-shared frequency domains,
thus defeating the energy efficiency optimization, but it can also
happen on shared frequency domain systems.

Let fix this issue in sugov_set_iowait_boost() by:
 - first check the IO wait boost reset conditions
   to eventually reset the boost value
 - then applying the correct IO boost value
   if required by the caller

Fixes: a5a0809bc58e (cpufreq: schedutil: Make iowait boost more energy efficient)
Reported-by: Viresh Kumar <viresh.kumar@linaro.org>
Signed-off-by: Patrick Bellasi <patrick.bellasi@arm.com>
Reviewed-by: Joel Fernandes (Google) <joel@joelfernandes.org>
Acked-by: Viresh Kumar <viresh.kumar@linaro.org>
Acked-by: Peter Zijlstra (Intel) <peterz@infradead.org>
Signed-off-by: Rafael J. Wysocki <rafael.j.wysocki@intel.com>
kernel/sched/cpufreq_schedutil.c

index 2442dec..6192e0e 100644 (file)
@@ -198,6 +198,16 @@ static unsigned long sugov_aggregate_util(struct sugov_cpu *sg_cpu)
 
 static void sugov_set_iowait_boost(struct sugov_cpu *sg_cpu, u64 time, unsigned int flags)
 {
+       /* Clear iowait_boost if the CPU apprears to have been idle. */
+       if (sg_cpu->iowait_boost) {
+               s64 delta_ns = time - sg_cpu->last_update;
+
+               if (delta_ns > TICK_NSEC) {
+                       sg_cpu->iowait_boost = 0;
+                       sg_cpu->iowait_boost_pending = false;
+               }
+       }
+
        if (flags & SCHED_CPUFREQ_IOWAIT) {
                if (sg_cpu->iowait_boost_pending)
                        return;
@@ -211,14 +221,6 @@ static void sugov_set_iowait_boost(struct sugov_cpu *sg_cpu, u64 time, unsigned
                } else {
                        sg_cpu->iowait_boost = sg_cpu->sg_policy->policy->min;
                }
-       } else if (sg_cpu->iowait_boost) {
-               s64 delta_ns = time - sg_cpu->last_update;
-
-               /* Clear iowait_boost if the CPU apprears to have been idle. */
-               if (delta_ns > TICK_NSEC) {
-                       sg_cpu->iowait_boost = 0;
-                       sg_cpu->iowait_boost_pending = false;
-               }
        }
 }