RISC-V: separate Zbb optimisations requiring and not requiring toolchain support
authorConor Dooley <conor.dooley@microchip.com>
Thu, 24 Oct 2024 10:19:41 +0000 (11:19 +0100)
committerAlexandre Ghiti <alexghiti@rivosinc.com>
Tue, 18 Mar 2025 08:53:02 +0000 (08:53 +0000)
It seems a bit ridiculous to require toolchain support for BPF to
assemble Zbb instructions, so move the dependency on toolchain support
for Zbb optimisations out of the Kconfig option and to the callsites.

Zbb support has always depended on alternatives, so while adjusting the
config options guarding optimisations, remove any checks for
whether or not alternatives are enabled.

Reviewed-by: Andrew Jones <ajones@ventanamicro.com>
Signed-off-by: Conor Dooley <conor.dooley@microchip.com>
Reviewed-by: Charlie Jenkins <charlie@rivosinc.com>
Reviewed-by: Samuel Holland <samuel.holland@sifive.com>
Link: https://lore.kernel.org/r/20241024-chump-freebase-d26b6d81af33@spud
Signed-off-by: Alexandre Ghiti <alexghiti@rivosinc.com>
arch/riscv/Kconfig
arch/riscv/include/asm/arch_hweight.h
arch/riscv/include/asm/bitops.h
arch/riscv/include/asm/checksum.h
arch/riscv/lib/csum.c
arch/riscv/lib/strcmp.S
arch/riscv/lib/strlen.S
arch/riscv/lib/strncmp.S

index 278a38c..6ec7a50 100644 (file)
@@ -664,12 +664,12 @@ config RISCV_ISA_ZBA
 
 config RISCV_ISA_ZBB
        bool "Zbb extension support for bit manipulation instructions"
-       depends on TOOLCHAIN_HAS_ZBB
        depends on RISCV_ALTERNATIVE
        default y
        help
           Add support for enabling optimisations in the kernel when the
-          Zbb extension is detected at boot.
+          Zbb extension is detected at boot. Some optimisations may
+          additionally depend on toolchain support for Zbb.
 
           The Zbb extension provides instructions to accelerate a number
           of bit-specific operations (count bit population, sign extending,
index 613769b..0e7cdbb 100644 (file)
@@ -19,7 +19,7 @@
 
 static __always_inline unsigned int __arch_hweight32(unsigned int w)
 {
-#ifdef CONFIG_RISCV_ISA_ZBB
+#if defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)
        asm goto(ALTERNATIVE("j %l[legacy]", "nop", 0,
                                      RISCV_ISA_EXT_ZBB, 1)
                          : : : : legacy);
@@ -50,7 +50,7 @@ static inline unsigned int __arch_hweight8(unsigned int w)
 #if BITS_PER_LONG == 64
 static __always_inline unsigned long __arch_hweight64(__u64 w)
 {
-# ifdef CONFIG_RISCV_ISA_ZBB
+#if defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)
        asm goto(ALTERNATIVE("j %l[legacy]", "nop", 0,
                                      RISCV_ISA_EXT_ZBB, 1)
                          : : : : legacy);
@@ -64,7 +64,7 @@ static __always_inline unsigned long __arch_hweight64(__u64 w)
        return w;
 
 legacy:
-# endif
+#endif
        return __sw_hweight64(w);
 }
 #else /* BITS_PER_LONG == 64 */
index fae152e..410e223 100644 (file)
@@ -15,7 +15,7 @@
 #include <asm/barrier.h>
 #include <asm/bitsperlong.h>
 
-#if !defined(CONFIG_RISCV_ISA_ZBB) || defined(NO_ALTERNATIVE)
+#if !(defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)) || defined(NO_ALTERNATIVE)
 #include <asm-generic/bitops/__ffs.h>
 #include <asm-generic/bitops/__fls.h>
 #include <asm-generic/bitops/ffs.h>
@@ -175,7 +175,7 @@ legacy:
         variable_fls(x_);                                      \
 })
 
-#endif /* !defined(CONFIG_RISCV_ISA_ZBB) || defined(NO_ALTERNATIVE) */
+#endif /* !(defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)) || defined(NO_ALTERNATIVE) */
 
 #include <asm-generic/bitops/ffz.h>
 #include <asm-generic/bitops/fls64.h>
index 88e6f14..da37885 100644 (file)
@@ -49,8 +49,7 @@ static inline __sum16 ip_fast_csum(const void *iph, unsigned int ihl)
         * ZBB only saves three instructions on 32-bit and five on 64-bit so not
         * worth checking if supported without Alternatives.
         */
-       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) &&
-           IS_ENABLED(CONFIG_RISCV_ALTERNATIVE)) {
+       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB)) {
                unsigned long fold_temp;
 
                asm goto(ALTERNATIVE("j %l[no_zbb]", "nop", 0,
index 7fb12c5..9408f50 100644 (file)
@@ -40,12 +40,7 @@ __sum16 csum_ipv6_magic(const struct in6_addr *saddr,
        uproto = (__force unsigned int)htonl(proto);
        sum += uproto;
 
-       /*
-        * Zbb support saves 4 instructions, so not worth checking without
-        * alternatives if supported
-        */
-       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) &&
-           IS_ENABLED(CONFIG_RISCV_ALTERNATIVE)) {
+       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB)) {
                unsigned long fold_temp;
 
                /*
@@ -157,12 +152,7 @@ do_csum_with_alignment(const unsigned char *buff, int len)
        csum = do_csum_common(ptr, end, data);
 
 #ifdef CC_HAS_ASM_GOTO_TIED_OUTPUT
-       /*
-        * Zbb support saves 6 instructions, so not worth checking without
-        * alternatives if supported
-        */
-       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) &&
-           IS_ENABLED(CONFIG_RISCV_ALTERNATIVE)) {
+       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB)) {
                unsigned long fold_temp;
 
                /*
@@ -244,12 +234,7 @@ do_csum_no_alignment(const unsigned char *buff, int len)
        end = (const unsigned long *)(buff + len);
        csum = do_csum_common(ptr, end, data);
 
-       /*
-        * Zbb support saves 6 instructions, so not worth checking without
-        * alternatives if supported
-        */
-       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) &&
-           IS_ENABLED(CONFIG_RISCV_ALTERNATIVE)) {
+       if (IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB)) {
                unsigned long fold_temp;
 
                /*
index 57a5c00..65027e7 100644 (file)
@@ -8,7 +8,8 @@
 /* int strcmp(const char *cs, const char *ct) */
 SYM_FUNC_START(strcmp)
 
-       ALTERNATIVE("nop", "j strcmp_zbb", 0, RISCV_ISA_EXT_ZBB, CONFIG_RISCV_ISA_ZBB)
+       __ALTERNATIVE_CFG("nop", "j strcmp_zbb", 0, RISCV_ISA_EXT_ZBB,
+               IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB))
 
        /*
         * Returns
@@ -43,7 +44,7 @@ SYM_FUNC_START(strcmp)
  * The code was published as part of the bitmanip manual
  * in Appendix A.
  */
-#ifdef CONFIG_RISCV_ISA_ZBB
+#if defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)
 strcmp_zbb:
 
 .option push
index 962983b..eb4d2b7 100644 (file)
@@ -8,7 +8,8 @@
 /* int strlen(const char *s) */
 SYM_FUNC_START(strlen)
 
-       ALTERNATIVE("nop", "j strlen_zbb", 0, RISCV_ISA_EXT_ZBB, CONFIG_RISCV_ISA_ZBB)
+       __ALTERNATIVE_CFG("nop", "j strlen_zbb", 0, RISCV_ISA_EXT_ZBB,
+               IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB))
 
        /*
         * Returns
@@ -33,7 +34,7 @@ SYM_FUNC_START(strlen)
 /*
  * Variant of strlen using the ZBB extension if available
  */
-#ifdef CONFIG_RISCV_ISA_ZBB
+#if defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)
 strlen_zbb:
 
 #ifdef CONFIG_CPU_BIG_ENDIAN
index 7b2d0ff..062000c 100644 (file)
@@ -8,7 +8,8 @@
 /* int strncmp(const char *cs, const char *ct, size_t count) */
 SYM_FUNC_START(strncmp)
 
-       ALTERNATIVE("nop", "j strncmp_zbb", 0, RISCV_ISA_EXT_ZBB, CONFIG_RISCV_ISA_ZBB)
+       __ALTERNATIVE_CFG("nop", "j strncmp_zbb", 0, RISCV_ISA_EXT_ZBB,
+               IS_ENABLED(CONFIG_RISCV_ISA_ZBB) && IS_ENABLED(CONFIG_TOOLCHAIN_HAS_ZBB))
 
        /*
         * Returns
@@ -46,7 +47,7 @@ SYM_FUNC_START(strncmp)
 /*
  * Variant of strncmp using the ZBB extension if available
  */
-#ifdef CONFIG_RISCV_ISA_ZBB
+#if defined(CONFIG_RISCV_ISA_ZBB) && defined(CONFIG_TOOLCHAIN_HAS_ZBB)
 strncmp_zbb:
 
 .option push