NFSD: Fix "start of NFS reply" pointer passed to nfsd_cache_update()
authorChuck Lever <chuck.lever@oracle.com>
Fri, 10 Nov 2023 16:28:33 +0000 (11:28 -0500)
committerChuck Lever <chuck.lever@oracle.com>
Fri, 17 Nov 2023 20:12:55 +0000 (15:12 -0500)
commit1caf5f61dd8430ae5a0b4538afe4953ce7517cbb
treec0fec6f1c00cd6306c68f389cb3200e9843003ae
parent49cecd8628a9855cd993792a0377559ea32d5e7c
NFSD: Fix "start of NFS reply" pointer passed to nfsd_cache_update()

The "statp + 1" pointer that is passed to nfsd_cache_update() is
supposed to point to the start of the egress NFS Reply header. In
fact, it does point there for AUTH_SYS and RPCSEC_GSS_KRB5 requests.

But both krb5i and krb5p add fields between the RPC header's
accept_stat field and the start of the NFS Reply header. In those
cases, "statp + 1" points at the extra fields instead of the Reply.
The result is that nfsd_cache_update() caches what looks to the
client like garbage.

A connection break can occur for a number of reasons, but the most
common reason when using krb5i/p is a GSS sequence number window
underrun. When an underrun is detected, the server is obliged to
drop the RPC and the connection to force a retransmit with a fresh
GSS sequence number. The client presents the same XID, it hits in
the server's DRC, and the server returns the garbage cache entry.

The "statp + 1" argument has been used since the oldest changeset
in the kernel history repo, so it has been in nfsd_dispatch()
literally since before history began. The problem arose only when
the server-side GSS implementation was added twenty years ago.

Reviewed-by: Jeff Layton <jlayton@kernel.org>
Tested-by: Jeff Layton <jlayton@kernel.org
Signed-off-by: Chuck Lever <chuck.lever@oracle.com>
fs/nfsd/nfssvc.c