Merge tag 'linux-watchdog-5.16-rc1' of git://www.linux-watchdog.org/linux-watchdog
[linux-2.6-microblaze.git] / fs / gfs2 / inode.c
1 // SPDX-License-Identifier: GPL-2.0-only
2 /*
3  * Copyright (C) Sistina Software, Inc.  1997-2003 All rights reserved.
4  * Copyright (C) 2004-2011 Red Hat, Inc.  All rights reserved.
5  */
6
7 #include <linux/slab.h>
8 #include <linux/spinlock.h>
9 #include <linux/completion.h>
10 #include <linux/buffer_head.h>
11 #include <linux/namei.h>
12 #include <linux/mm.h>
13 #include <linux/cred.h>
14 #include <linux/xattr.h>
15 #include <linux/posix_acl.h>
16 #include <linux/gfs2_ondisk.h>
17 #include <linux/crc32.h>
18 #include <linux/iomap.h>
19 #include <linux/security.h>
20 #include <linux/fiemap.h>
21 #include <linux/uaccess.h>
22
23 #include "gfs2.h"
24 #include "incore.h"
25 #include "acl.h"
26 #include "bmap.h"
27 #include "dir.h"
28 #include "xattr.h"
29 #include "glock.h"
30 #include "inode.h"
31 #include "meta_io.h"
32 #include "quota.h"
33 #include "rgrp.h"
34 #include "trans.h"
35 #include "util.h"
36 #include "super.h"
37 #include "glops.h"
38
39 static const struct inode_operations gfs2_file_iops;
40 static const struct inode_operations gfs2_dir_iops;
41 static const struct inode_operations gfs2_symlink_iops;
42
43 static int iget_test(struct inode *inode, void *opaque)
44 {
45         u64 no_addr = *(u64 *)opaque;
46
47         return GFS2_I(inode)->i_no_addr == no_addr;
48 }
49
50 static int iget_set(struct inode *inode, void *opaque)
51 {
52         u64 no_addr = *(u64 *)opaque;
53
54         GFS2_I(inode)->i_no_addr = no_addr;
55         inode->i_ino = no_addr;
56         return 0;
57 }
58
59 static struct inode *gfs2_iget(struct super_block *sb, u64 no_addr)
60 {
61         struct inode *inode;
62
63 repeat:
64         inode = iget5_locked(sb, no_addr, iget_test, iget_set, &no_addr);
65         if (!inode)
66                 return inode;
67         if (is_bad_inode(inode)) {
68                 iput(inode);
69                 goto repeat;
70         }
71         return inode;
72 }
73
74 /**
75  * gfs2_set_iop - Sets inode operations
76  * @inode: The inode with correct i_mode filled in
77  *
78  * GFS2 lookup code fills in vfs inode contents based on info obtained
79  * from directory entry inside gfs2_inode_lookup().
80  */
81
82 static void gfs2_set_iop(struct inode *inode)
83 {
84         struct gfs2_sbd *sdp = GFS2_SB(inode);
85         umode_t mode = inode->i_mode;
86
87         if (S_ISREG(mode)) {
88                 inode->i_op = &gfs2_file_iops;
89                 if (gfs2_localflocks(sdp))
90                         inode->i_fop = &gfs2_file_fops_nolock;
91                 else
92                         inode->i_fop = &gfs2_file_fops;
93         } else if (S_ISDIR(mode)) {
94                 inode->i_op = &gfs2_dir_iops;
95                 if (gfs2_localflocks(sdp))
96                         inode->i_fop = &gfs2_dir_fops_nolock;
97                 else
98                         inode->i_fop = &gfs2_dir_fops;
99         } else if (S_ISLNK(mode)) {
100                 inode->i_op = &gfs2_symlink_iops;
101         } else {
102                 inode->i_op = &gfs2_file_iops;
103                 init_special_inode(inode, inode->i_mode, inode->i_rdev);
104         }
105 }
106
107 /**
108  * gfs2_inode_lookup - Lookup an inode
109  * @sb: The super block
110  * @type: The type of the inode
111  * @no_addr: The inode number
112  * @no_formal_ino: The inode generation number
113  * @blktype: Requested block type (GFS2_BLKST_DINODE or GFS2_BLKST_UNLINKED;
114  *           GFS2_BLKST_FREE to indicate not to verify)
115  *
116  * If @type is DT_UNKNOWN, the inode type is fetched from disk.
117  *
118  * If @blktype is anything other than GFS2_BLKST_FREE (which is used as a
119  * placeholder because it doesn't otherwise make sense), the on-disk block type
120  * is verified to be @blktype.
121  *
122  * When @no_formal_ino is non-zero, this function will return ERR_PTR(-ESTALE)
123  * if it detects that @no_formal_ino doesn't match the actual inode generation
124  * number.  However, it doesn't always know unless @type is DT_UNKNOWN.
125  *
126  * Returns: A VFS inode, or an error
127  */
128
129 struct inode *gfs2_inode_lookup(struct super_block *sb, unsigned int type,
130                                 u64 no_addr, u64 no_formal_ino,
131                                 unsigned int blktype)
132 {
133         struct inode *inode;
134         struct gfs2_inode *ip;
135         struct gfs2_glock *io_gl = NULL;
136         struct gfs2_holder i_gh;
137         int error;
138
139         gfs2_holder_mark_uninitialized(&i_gh);
140         inode = gfs2_iget(sb, no_addr);
141         if (!inode)
142                 return ERR_PTR(-ENOMEM);
143
144         ip = GFS2_I(inode);
145
146         if (inode->i_state & I_NEW) {
147                 struct gfs2_sbd *sdp = GFS2_SB(inode);
148
149                 error = gfs2_glock_get(sdp, no_addr, &gfs2_inode_glops, CREATE, &ip->i_gl);
150                 if (unlikely(error))
151                         goto fail;
152                 flush_delayed_work(&ip->i_gl->gl_work);
153
154                 error = gfs2_glock_get(sdp, no_addr, &gfs2_iopen_glops, CREATE, &io_gl);
155                 if (unlikely(error))
156                         goto fail;
157                 if (blktype != GFS2_BLKST_UNLINKED)
158                         gfs2_cancel_delete_work(io_gl);
159
160                 if (type == DT_UNKNOWN || blktype != GFS2_BLKST_FREE) {
161                         /*
162                          * The GL_SKIP flag indicates to skip reading the inode
163                          * block.  We read the inode with gfs2_inode_refresh
164                          * after possibly checking the block type.
165                          */
166                         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE,
167                                                    GL_SKIP, &i_gh);
168                         if (error)
169                                 goto fail;
170
171                         error = -ESTALE;
172                         if (no_formal_ino &&
173                             gfs2_inode_already_deleted(ip->i_gl, no_formal_ino))
174                                 goto fail;
175
176                         if (blktype != GFS2_BLKST_FREE) {
177                                 error = gfs2_check_blk_type(sdp, no_addr,
178                                                             blktype);
179                                 if (error)
180                                         goto fail;
181                         }
182                 }
183
184                 glock_set_object(ip->i_gl, ip);
185                 set_bit(GLF_INSTANTIATE_NEEDED, &ip->i_gl->gl_flags);
186                 error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &ip->i_iopen_gh);
187                 if (unlikely(error))
188                         goto fail;
189                 glock_set_object(ip->i_iopen_gh.gh_gl, ip);
190                 gfs2_glock_put(io_gl);
191                 io_gl = NULL;
192
193                 /* Lowest possible timestamp; will be overwritten in gfs2_dinode_in. */
194                 inode->i_atime.tv_sec = 1LL << (8 * sizeof(inode->i_atime.tv_sec) - 1);
195                 inode->i_atime.tv_nsec = 0;
196
197                 if (type == DT_UNKNOWN) {
198                         /* Inode glock must be locked already */
199                         error = gfs2_instantiate(&i_gh);
200                         if (error)
201                                 goto fail;
202                 } else {
203                         ip->i_no_formal_ino = no_formal_ino;
204                         inode->i_mode = DT2IF(type);
205                 }
206
207                 if (gfs2_holder_initialized(&i_gh))
208                         gfs2_glock_dq_uninit(&i_gh);
209
210                 gfs2_set_iop(inode);
211         }
212
213         if (no_formal_ino && ip->i_no_formal_ino &&
214             no_formal_ino != ip->i_no_formal_ino) {
215                 error = -ESTALE;
216                 if (inode->i_state & I_NEW)
217                         goto fail;
218                 iput(inode);
219                 return ERR_PTR(error);
220         }
221
222         if (inode->i_state & I_NEW)
223                 unlock_new_inode(inode);
224
225         return inode;
226
227 fail:
228         if (gfs2_holder_initialized(&ip->i_iopen_gh)) {
229                 glock_clear_object(ip->i_iopen_gh.gh_gl, ip);
230                 gfs2_glock_dq_uninit(&ip->i_iopen_gh);
231         }
232         if (io_gl)
233                 gfs2_glock_put(io_gl);
234         if (gfs2_holder_initialized(&i_gh))
235                 gfs2_glock_dq_uninit(&i_gh);
236         iget_failed(inode);
237         return ERR_PTR(error);
238 }
239
240 /**
241  * gfs2_lookup_by_inum - look up an inode by inode number
242  * @sdp: The super block
243  * @no_addr: The inode number
244  * @no_formal_ino: The inode generation number (0 for any)
245  * @blktype: Requested block type (see gfs2_inode_lookup)
246  */
247 struct inode *gfs2_lookup_by_inum(struct gfs2_sbd *sdp, u64 no_addr,
248                                   u64 no_formal_ino, unsigned int blktype)
249 {
250         struct super_block *sb = sdp->sd_vfs;
251         struct inode *inode;
252         int error;
253
254         inode = gfs2_inode_lookup(sb, DT_UNKNOWN, no_addr, no_formal_ino,
255                                   blktype);
256         if (IS_ERR(inode))
257                 return inode;
258
259         if (no_formal_ino) {
260                 error = -EIO;
261                 if (GFS2_I(inode)->i_diskflags & GFS2_DIF_SYSTEM)
262                         goto fail_iput;
263         }
264         return inode;
265
266 fail_iput:
267         iput(inode);
268         return ERR_PTR(error);
269 }
270
271
272 struct inode *gfs2_lookup_simple(struct inode *dip, const char *name)
273 {
274         struct qstr qstr;
275         struct inode *inode;
276         gfs2_str2qstr(&qstr, name);
277         inode = gfs2_lookupi(dip, &qstr, 1);
278         /* gfs2_lookupi has inconsistent callers: vfs
279          * related routines expect NULL for no entry found,
280          * gfs2_lookup_simple callers expect ENOENT
281          * and do not check for NULL.
282          */
283         if (inode == NULL)
284                 return ERR_PTR(-ENOENT);
285         else
286                 return inode;
287 }
288
289
290 /**
291  * gfs2_lookupi - Look up a filename in a directory and return its inode
292  * @dir: The inode of the directory containing the inode to look-up
293  * @name: The name of the inode to look for
294  * @is_root: If 1, ignore the caller's permissions
295  *
296  * This can be called via the VFS filldir function when NFS is doing
297  * a readdirplus and the inode which its intending to stat isn't
298  * already in cache. In this case we must not take the directory glock
299  * again, since the readdir call will have already taken that lock.
300  *
301  * Returns: errno
302  */
303
304 struct inode *gfs2_lookupi(struct inode *dir, const struct qstr *name,
305                            int is_root)
306 {
307         struct super_block *sb = dir->i_sb;
308         struct gfs2_inode *dip = GFS2_I(dir);
309         struct gfs2_holder d_gh;
310         int error = 0;
311         struct inode *inode = NULL;
312
313         gfs2_holder_mark_uninitialized(&d_gh);
314         if (!name->len || name->len > GFS2_FNAMESIZE)
315                 return ERR_PTR(-ENAMETOOLONG);
316
317         if ((name->len == 1 && memcmp(name->name, ".", 1) == 0) ||
318             (name->len == 2 && memcmp(name->name, "..", 2) == 0 &&
319              dir == d_inode(sb->s_root))) {
320                 igrab(dir);
321                 return dir;
322         }
323
324         if (gfs2_glock_is_locked_by_me(dip->i_gl) == NULL) {
325                 error = gfs2_glock_nq_init(dip->i_gl, LM_ST_SHARED, 0, &d_gh);
326                 if (error)
327                         return ERR_PTR(error);
328         }
329
330         if (!is_root) {
331                 error = gfs2_permission(&init_user_ns, dir, MAY_EXEC);
332                 if (error)
333                         goto out;
334         }
335
336         inode = gfs2_dir_search(dir, name, false);
337         if (IS_ERR(inode))
338                 error = PTR_ERR(inode);
339 out:
340         if (gfs2_holder_initialized(&d_gh))
341                 gfs2_glock_dq_uninit(&d_gh);
342         if (error == -ENOENT)
343                 return NULL;
344         return inode ? inode : ERR_PTR(error);
345 }
346
347 /**
348  * create_ok - OK to create a new on-disk inode here?
349  * @dip:  Directory in which dinode is to be created
350  * @name:  Name of new dinode
351  * @mode:
352  *
353  * Returns: errno
354  */
355
356 static int create_ok(struct gfs2_inode *dip, const struct qstr *name,
357                      umode_t mode)
358 {
359         int error;
360
361         error = gfs2_permission(&init_user_ns, &dip->i_inode,
362                                 MAY_WRITE | MAY_EXEC);
363         if (error)
364                 return error;
365
366         /*  Don't create entries in an unlinked directory  */
367         if (!dip->i_inode.i_nlink)
368                 return -ENOENT;
369
370         if (dip->i_entries == (u32)-1)
371                 return -EFBIG;
372         if (S_ISDIR(mode) && dip->i_inode.i_nlink == (u32)-1)
373                 return -EMLINK;
374
375         return 0;
376 }
377
378 static void munge_mode_uid_gid(const struct gfs2_inode *dip,
379                                struct inode *inode)
380 {
381         if (GFS2_SB(&dip->i_inode)->sd_args.ar_suiddir &&
382             (dip->i_inode.i_mode & S_ISUID) &&
383             !uid_eq(dip->i_inode.i_uid, GLOBAL_ROOT_UID)) {
384                 if (S_ISDIR(inode->i_mode))
385                         inode->i_mode |= S_ISUID;
386                 else if (!uid_eq(dip->i_inode.i_uid, current_fsuid()))
387                         inode->i_mode &= ~07111;
388                 inode->i_uid = dip->i_inode.i_uid;
389         } else
390                 inode->i_uid = current_fsuid();
391
392         if (dip->i_inode.i_mode & S_ISGID) {
393                 if (S_ISDIR(inode->i_mode))
394                         inode->i_mode |= S_ISGID;
395                 inode->i_gid = dip->i_inode.i_gid;
396         } else
397                 inode->i_gid = current_fsgid();
398 }
399
400 static int alloc_dinode(struct gfs2_inode *ip, u32 flags, unsigned *dblocks)
401 {
402         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
403         struct gfs2_alloc_parms ap = { .target = *dblocks, .aflags = flags, };
404         int error;
405
406         error = gfs2_quota_lock_check(ip, &ap);
407         if (error)
408                 goto out;
409
410         error = gfs2_inplace_reserve(ip, &ap);
411         if (error)
412                 goto out_quota;
413
414         error = gfs2_trans_begin(sdp, (*dblocks * RES_RG_BIT) + RES_STATFS + RES_QUOTA, 0);
415         if (error)
416                 goto out_ipreserv;
417
418         error = gfs2_alloc_blocks(ip, &ip->i_no_addr, dblocks, 1, &ip->i_generation);
419         ip->i_no_formal_ino = ip->i_generation;
420         ip->i_inode.i_ino = ip->i_no_addr;
421         ip->i_goal = ip->i_no_addr;
422
423         gfs2_trans_end(sdp);
424
425 out_ipreserv:
426         gfs2_inplace_release(ip);
427 out_quota:
428         gfs2_quota_unlock(ip);
429 out:
430         return error;
431 }
432
433 static void gfs2_init_dir(struct buffer_head *dibh,
434                           const struct gfs2_inode *parent)
435 {
436         struct gfs2_dinode *di = (struct gfs2_dinode *)dibh->b_data;
437         struct gfs2_dirent *dent = (struct gfs2_dirent *)(di+1);
438
439         gfs2_qstr2dirent(&gfs2_qdot, GFS2_DIRENT_SIZE(gfs2_qdot.len), dent);
440         dent->de_inum = di->di_num; /* already GFS2 endian */
441         dent->de_type = cpu_to_be16(DT_DIR);
442
443         dent = (struct gfs2_dirent *)((char*)dent + GFS2_DIRENT_SIZE(1));
444         gfs2_qstr2dirent(&gfs2_qdotdot, dibh->b_size - GFS2_DIRENT_SIZE(1) - sizeof(struct gfs2_dinode), dent);
445         gfs2_inum_out(parent, dent);
446         dent->de_type = cpu_to_be16(DT_DIR);
447         
448 }
449
450 /**
451  * gfs2_init_xattr - Initialise an xattr block for a new inode
452  * @ip: The inode in question
453  *
454  * This sets up an empty xattr block for a new inode, ready to
455  * take any ACLs, LSM xattrs, etc.
456  */
457
458 static void gfs2_init_xattr(struct gfs2_inode *ip)
459 {
460         struct gfs2_sbd *sdp = GFS2_SB(&ip->i_inode);
461         struct buffer_head *bh;
462         struct gfs2_ea_header *ea;
463
464         bh = gfs2_meta_new(ip->i_gl, ip->i_eattr);
465         gfs2_trans_add_meta(ip->i_gl, bh);
466         gfs2_metatype_set(bh, GFS2_METATYPE_EA, GFS2_FORMAT_EA);
467         gfs2_buffer_clear_tail(bh, sizeof(struct gfs2_meta_header));
468
469         ea = GFS2_EA_BH2FIRST(bh);
470         ea->ea_rec_len = cpu_to_be32(sdp->sd_jbsize);
471         ea->ea_type = GFS2_EATYPE_UNUSED;
472         ea->ea_flags = GFS2_EAFLAG_LAST;
473
474         brelse(bh);
475 }
476
477 /**
478  * init_dinode - Fill in a new dinode structure
479  * @dip: The directory this inode is being created in
480  * @ip: The inode
481  * @symname: The symlink destination (if a symlink)
482  *
483  */
484
485 static void init_dinode(struct gfs2_inode *dip, struct gfs2_inode *ip,
486                         const char *symname)
487 {
488         struct gfs2_dinode *di;
489         struct buffer_head *dibh;
490
491         dibh = gfs2_meta_new(ip->i_gl, ip->i_no_addr);
492         gfs2_trans_add_meta(ip->i_gl, dibh);
493         di = (struct gfs2_dinode *)dibh->b_data;
494         gfs2_dinode_out(ip, di);
495
496         di->di_major = cpu_to_be32(imajor(&ip->i_inode));
497         di->di_minor = cpu_to_be32(iminor(&ip->i_inode));
498         di->__pad1 = 0;
499         di->__pad2 = 0;
500         di->__pad3 = 0;
501         memset(&di->__pad4, 0, sizeof(di->__pad4));
502         memset(&di->di_reserved, 0, sizeof(di->di_reserved));
503         gfs2_buffer_clear_tail(dibh, sizeof(struct gfs2_dinode));
504
505         switch(ip->i_inode.i_mode & S_IFMT) {
506         case S_IFDIR:
507                 gfs2_init_dir(dibh, dip);
508                 break;
509         case S_IFLNK:
510                 memcpy(dibh->b_data + sizeof(struct gfs2_dinode), symname, ip->i_inode.i_size);
511                 break;
512         }
513
514         set_buffer_uptodate(dibh);
515         brelse(dibh);
516 }
517
518 /**
519  * gfs2_trans_da_blks - Calculate number of blocks to link inode
520  * @dip: The directory we are linking into
521  * @da: The dir add information
522  * @nr_inodes: The number of inodes involved
523  *
524  * This calculate the number of blocks we need to reserve in a
525  * transaction to link @nr_inodes into a directory. In most cases
526  * @nr_inodes will be 2 (the directory plus the inode being linked in)
527  * but in case of rename, 4 may be required.
528  *
529  * Returns: Number of blocks
530  */
531
532 static unsigned gfs2_trans_da_blks(const struct gfs2_inode *dip,
533                                    const struct gfs2_diradd *da,
534                                    unsigned nr_inodes)
535 {
536         return da->nr_blocks + gfs2_rg_blocks(dip, da->nr_blocks) +
537                (nr_inodes * RES_DINODE) + RES_QUOTA + RES_STATFS;
538 }
539
540 static int link_dinode(struct gfs2_inode *dip, const struct qstr *name,
541                        struct gfs2_inode *ip, struct gfs2_diradd *da)
542 {
543         struct gfs2_sbd *sdp = GFS2_SB(&dip->i_inode);
544         struct gfs2_alloc_parms ap = { .target = da->nr_blocks, };
545         int error;
546
547         if (da->nr_blocks) {
548                 error = gfs2_quota_lock_check(dip, &ap);
549                 if (error)
550                         goto fail_quota_locks;
551
552                 error = gfs2_inplace_reserve(dip, &ap);
553                 if (error)
554                         goto fail_quota_locks;
555
556                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(dip, da, 2), 0);
557                 if (error)
558                         goto fail_ipreserv;
559         } else {
560                 error = gfs2_trans_begin(sdp, RES_LEAF + 2 * RES_DINODE, 0);
561                 if (error)
562                         goto fail_quota_locks;
563         }
564
565         error = gfs2_dir_add(&dip->i_inode, name, ip, da);
566
567         gfs2_trans_end(sdp);
568 fail_ipreserv:
569         gfs2_inplace_release(dip);
570 fail_quota_locks:
571         gfs2_quota_unlock(dip);
572         return error;
573 }
574
575 static int gfs2_initxattrs(struct inode *inode, const struct xattr *xattr_array,
576                     void *fs_info)
577 {
578         const struct xattr *xattr;
579         int err = 0;
580
581         for (xattr = xattr_array; xattr->name != NULL; xattr++) {
582                 err = __gfs2_xattr_set(inode, xattr->name, xattr->value,
583                                        xattr->value_len, 0,
584                                        GFS2_EATYPE_SECURITY);
585                 if (err < 0)
586                         break;
587         }
588         return err;
589 }
590
591 /**
592  * gfs2_create_inode - Create a new inode
593  * @dir: The parent directory
594  * @dentry: The new dentry
595  * @file: If non-NULL, the file which is being opened
596  * @mode: The permissions on the new inode
597  * @dev: For device nodes, this is the device number
598  * @symname: For symlinks, this is the link destination
599  * @size: The initial size of the inode (ignored for directories)
600  * @excl: Force fail if inode exists
601  *
602  * Returns: 0 on success, or error code
603  */
604
605 static int gfs2_create_inode(struct inode *dir, struct dentry *dentry,
606                              struct file *file,
607                              umode_t mode, dev_t dev, const char *symname,
608                              unsigned int size, int excl)
609 {
610         const struct qstr *name = &dentry->d_name;
611         struct posix_acl *default_acl, *acl;
612         struct gfs2_holder ghs[2];
613         struct inode *inode = NULL;
614         struct gfs2_inode *dip = GFS2_I(dir), *ip;
615         struct gfs2_sbd *sdp = GFS2_SB(&dip->i_inode);
616         struct gfs2_glock *io_gl;
617         int error, free_vfs_inode = 1;
618         u32 aflags = 0;
619         unsigned blocks = 1;
620         struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };
621
622         if (!name->len || name->len > GFS2_FNAMESIZE)
623                 return -ENAMETOOLONG;
624
625         error = gfs2_qa_get(dip);
626         if (error)
627                 return error;
628
629         error = gfs2_rindex_update(sdp);
630         if (error)
631                 goto fail;
632
633         error = gfs2_glock_nq_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
634         if (error)
635                 goto fail;
636         gfs2_holder_mark_uninitialized(ghs + 1);
637
638         error = create_ok(dip, name, mode);
639         if (error)
640                 goto fail_gunlock;
641
642         inode = gfs2_dir_search(dir, &dentry->d_name, !S_ISREG(mode) || excl);
643         error = PTR_ERR(inode);
644         if (!IS_ERR(inode)) {
645                 if (S_ISDIR(inode->i_mode)) {
646                         iput(inode);
647                         inode = ERR_PTR(-EISDIR);
648                         goto fail_gunlock;
649                 }
650                 d_instantiate(dentry, inode);
651                 error = 0;
652                 if (file) {
653                         if (S_ISREG(inode->i_mode))
654                                 error = finish_open(file, dentry, gfs2_open_common);
655                         else
656                                 error = finish_no_open(file, NULL);
657                 }
658                 gfs2_glock_dq_uninit(ghs);
659                 goto fail;
660         } else if (error != -ENOENT) {
661                 goto fail_gunlock;
662         }
663
664         error = gfs2_diradd_alloc_required(dir, name, &da);
665         if (error < 0)
666                 goto fail_gunlock;
667
668         inode = new_inode(sdp->sd_vfs);
669         error = -ENOMEM;
670         if (!inode)
671                 goto fail_gunlock;
672
673         error = posix_acl_create(dir, &mode, &default_acl, &acl);
674         if (error)
675                 goto fail_gunlock;
676
677         ip = GFS2_I(inode);
678         error = gfs2_qa_get(ip);
679         if (error)
680                 goto fail_free_acls;
681
682         inode->i_mode = mode;
683         set_nlink(inode, S_ISDIR(mode) ? 2 : 1);
684         inode->i_rdev = dev;
685         inode->i_size = size;
686         inode->i_atime = inode->i_mtime = inode->i_ctime = current_time(inode);
687         munge_mode_uid_gid(dip, inode);
688         check_and_update_goal(dip);
689         ip->i_goal = dip->i_goal;
690         ip->i_diskflags = 0;
691         ip->i_eattr = 0;
692         ip->i_height = 0;
693         ip->i_depth = 0;
694         ip->i_entries = 0;
695         ip->i_no_addr = 0; /* Temporarily zero until real addr is assigned */
696
697         switch(mode & S_IFMT) {
698         case S_IFREG:
699                 if ((dip->i_diskflags & GFS2_DIF_INHERIT_JDATA) ||
700                     gfs2_tune_get(sdp, gt_new_files_jdata))
701                         ip->i_diskflags |= GFS2_DIF_JDATA;
702                 gfs2_set_aops(inode);
703                 break;
704         case S_IFDIR:
705                 ip->i_diskflags |= (dip->i_diskflags & GFS2_DIF_INHERIT_JDATA);
706                 ip->i_diskflags |= GFS2_DIF_JDATA;
707                 ip->i_entries = 2;
708                 break;
709         }
710
711         /* Force SYSTEM flag on all files and subdirs of a SYSTEM directory */
712         if (dip->i_diskflags & GFS2_DIF_SYSTEM)
713                 ip->i_diskflags |= GFS2_DIF_SYSTEM;
714
715         gfs2_set_inode_flags(inode);
716
717         if ((GFS2_I(d_inode(sdp->sd_root_dir)) == dip) ||
718             (dip->i_diskflags & GFS2_DIF_TOPDIR))
719                 aflags |= GFS2_AF_ORLOV;
720
721         if (default_acl || acl)
722                 blocks++;
723
724         error = alloc_dinode(ip, aflags, &blocks);
725         if (error)
726                 goto fail_free_inode;
727
728         gfs2_set_inode_blocks(inode, blocks);
729
730         error = gfs2_glock_get(sdp, ip->i_no_addr, &gfs2_inode_glops, CREATE, &ip->i_gl);
731         if (error)
732                 goto fail_free_inode;
733         flush_delayed_work(&ip->i_gl->gl_work);
734
735         error = gfs2_glock_get(sdp, ip->i_no_addr, &gfs2_iopen_glops, CREATE, &io_gl);
736         if (error)
737                 goto fail_free_inode;
738         gfs2_cancel_delete_work(io_gl);
739
740         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, GL_SKIP, ghs + 1);
741         if (error)
742                 goto fail_gunlock2;
743
744         glock_set_object(ip->i_gl, ip);
745         error = gfs2_trans_begin(sdp, blocks, 0);
746         if (error)
747                 goto fail_gunlock2;
748
749         if (blocks > 1) {
750                 ip->i_eattr = ip->i_no_addr + 1;
751                 gfs2_init_xattr(ip);
752         }
753         init_dinode(dip, ip, symname);
754         gfs2_trans_end(sdp);
755
756         error = gfs2_glock_nq_init(io_gl, LM_ST_SHARED, GL_EXACT, &ip->i_iopen_gh);
757         if (error)
758                 goto fail_gunlock2;
759
760         glock_set_object(io_gl, ip);
761         gfs2_set_iop(inode);
762         insert_inode_hash(inode);
763
764         free_vfs_inode = 0; /* After this point, the inode is no longer
765                                considered free. Any failures need to undo
766                                the gfs2 structures. */
767         if (default_acl) {
768                 error = __gfs2_set_acl(inode, default_acl, ACL_TYPE_DEFAULT);
769                 if (error)
770                         goto fail_gunlock3;
771                 posix_acl_release(default_acl);
772                 default_acl = NULL;
773         }
774         if (acl) {
775                 error = __gfs2_set_acl(inode, acl, ACL_TYPE_ACCESS);
776                 if (error)
777                         goto fail_gunlock3;
778                 posix_acl_release(acl);
779                 acl = NULL;
780         }
781
782         error = security_inode_init_security(&ip->i_inode, &dip->i_inode, name,
783                                              &gfs2_initxattrs, NULL);
784         if (error)
785                 goto fail_gunlock3;
786
787         error = link_dinode(dip, name, ip, &da);
788         if (error)
789                 goto fail_gunlock3;
790
791         mark_inode_dirty(inode);
792         d_instantiate(dentry, inode);
793         /* After instantiate, errors should result in evict which will destroy
794          * both inode and iopen glocks properly. */
795         if (file) {
796                 file->f_mode |= FMODE_CREATED;
797                 error = finish_open(file, dentry, gfs2_open_common);
798         }
799         gfs2_glock_dq_uninit(ghs);
800         gfs2_qa_put(ip);
801         gfs2_glock_dq_uninit(ghs + 1);
802         gfs2_glock_put(io_gl);
803         gfs2_qa_put(dip);
804         return error;
805
806 fail_gunlock3:
807         glock_clear_object(io_gl, ip);
808         gfs2_glock_dq_uninit(&ip->i_iopen_gh);
809 fail_gunlock2:
810         glock_clear_object(io_gl, ip);
811         gfs2_glock_put(io_gl);
812 fail_free_inode:
813         if (ip->i_gl) {
814                 glock_clear_object(ip->i_gl, ip);
815                 if (free_vfs_inode) /* else evict will do the put for us */
816                         gfs2_glock_put(ip->i_gl);
817         }
818         gfs2_rs_delete(ip, NULL);
819         gfs2_qa_put(ip);
820 fail_free_acls:
821         posix_acl_release(default_acl);
822         posix_acl_release(acl);
823 fail_gunlock:
824         gfs2_dir_no_add(&da);
825         gfs2_glock_dq_uninit(ghs);
826         if (!IS_ERR_OR_NULL(inode)) {
827                 clear_nlink(inode);
828                 if (!free_vfs_inode)
829                         mark_inode_dirty(inode);
830                 set_bit(free_vfs_inode ? GIF_FREE_VFS_INODE : GIF_ALLOC_FAILED,
831                         &GFS2_I(inode)->i_flags);
832                 iput(inode);
833         }
834         if (gfs2_holder_initialized(ghs + 1))
835                 gfs2_glock_dq_uninit(ghs + 1);
836 fail:
837         gfs2_qa_put(dip);
838         return error;
839 }
840
841 /**
842  * gfs2_create - Create a file
843  * @mnt_userns: User namespace of the mount the inode was found from
844  * @dir: The directory in which to create the file
845  * @dentry: The dentry of the new file
846  * @mode: The mode of the new file
847  * @excl: Force fail if inode exists
848  *
849  * Returns: errno
850  */
851
852 static int gfs2_create(struct user_namespace *mnt_userns, struct inode *dir,
853                        struct dentry *dentry, umode_t mode, bool excl)
854 {
855         return gfs2_create_inode(dir, dentry, NULL, S_IFREG | mode, 0, NULL, 0, excl);
856 }
857
858 /**
859  * __gfs2_lookup - Look up a filename in a directory and return its inode
860  * @dir: The directory inode
861  * @dentry: The dentry of the new inode
862  * @file: File to be opened
863  *
864  *
865  * Returns: errno
866  */
867
868 static struct dentry *__gfs2_lookup(struct inode *dir, struct dentry *dentry,
869                                     struct file *file)
870 {
871         struct inode *inode;
872         struct dentry *d;
873         struct gfs2_holder gh;
874         struct gfs2_glock *gl;
875         int error;
876
877         inode = gfs2_lookupi(dir, &dentry->d_name, 0);
878         if (inode == NULL) {
879                 d_add(dentry, NULL);
880                 return NULL;
881         }
882         if (IS_ERR(inode))
883                 return ERR_CAST(inode);
884
885         gl = GFS2_I(inode)->i_gl;
886         error = gfs2_glock_nq_init(gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
887         if (error) {
888                 iput(inode);
889                 return ERR_PTR(error);
890         }
891
892         d = d_splice_alias(inode, dentry);
893         if (IS_ERR(d)) {
894                 gfs2_glock_dq_uninit(&gh);
895                 return d;
896         }
897         if (file && S_ISREG(inode->i_mode))
898                 error = finish_open(file, dentry, gfs2_open_common);
899
900         gfs2_glock_dq_uninit(&gh);
901         if (error) {
902                 dput(d);
903                 return ERR_PTR(error);
904         }
905         return d;
906 }
907
908 static struct dentry *gfs2_lookup(struct inode *dir, struct dentry *dentry,
909                                   unsigned flags)
910 {
911         return __gfs2_lookup(dir, dentry, NULL);
912 }
913
914 /**
915  * gfs2_link - Link to a file
916  * @old_dentry: The inode to link
917  * @dir: Add link to this directory
918  * @dentry: The name of the link
919  *
920  * Link the inode in "old_dentry" into the directory "dir" with the
921  * name in "dentry".
922  *
923  * Returns: errno
924  */
925
926 static int gfs2_link(struct dentry *old_dentry, struct inode *dir,
927                      struct dentry *dentry)
928 {
929         struct gfs2_inode *dip = GFS2_I(dir);
930         struct gfs2_sbd *sdp = GFS2_SB(dir);
931         struct inode *inode = d_inode(old_dentry);
932         struct gfs2_inode *ip = GFS2_I(inode);
933         struct gfs2_holder ghs[2];
934         struct buffer_head *dibh;
935         struct gfs2_diradd da = { .bh = NULL, .save_loc = 1, };
936         int error;
937
938         if (S_ISDIR(inode->i_mode))
939                 return -EPERM;
940
941         error = gfs2_qa_get(dip);
942         if (error)
943                 return error;
944
945         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
946         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, ghs + 1);
947
948         error = gfs2_glock_nq(ghs); /* parent */
949         if (error)
950                 goto out_parent;
951
952         error = gfs2_glock_nq(ghs + 1); /* child */
953         if (error)
954                 goto out_child;
955
956         error = -ENOENT;
957         if (inode->i_nlink == 0)
958                 goto out_gunlock;
959
960         error = gfs2_permission(&init_user_ns, dir, MAY_WRITE | MAY_EXEC);
961         if (error)
962                 goto out_gunlock;
963
964         error = gfs2_dir_check(dir, &dentry->d_name, NULL);
965         switch (error) {
966         case -ENOENT:
967                 break;
968         case 0:
969                 error = -EEXIST;
970                 goto out_gunlock;
971         default:
972                 goto out_gunlock;
973         }
974
975         error = -EINVAL;
976         if (!dip->i_inode.i_nlink)
977                 goto out_gunlock;
978         error = -EFBIG;
979         if (dip->i_entries == (u32)-1)
980                 goto out_gunlock;
981         error = -EPERM;
982         if (IS_IMMUTABLE(inode) || IS_APPEND(inode))
983                 goto out_gunlock;
984         error = -EINVAL;
985         if (!ip->i_inode.i_nlink)
986                 goto out_gunlock;
987         error = -EMLINK;
988         if (ip->i_inode.i_nlink == (u32)-1)
989                 goto out_gunlock;
990
991         error = gfs2_diradd_alloc_required(dir, &dentry->d_name, &da);
992         if (error < 0)
993                 goto out_gunlock;
994
995         if (da.nr_blocks) {
996                 struct gfs2_alloc_parms ap = { .target = da.nr_blocks, };
997                 error = gfs2_quota_lock_check(dip, &ap);
998                 if (error)
999                         goto out_gunlock;
1000
1001                 error = gfs2_inplace_reserve(dip, &ap);
1002                 if (error)
1003                         goto out_gunlock_q;
1004
1005                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(dip, &da, 2), 0);
1006                 if (error)
1007                         goto out_ipres;
1008         } else {
1009                 error = gfs2_trans_begin(sdp, 2 * RES_DINODE + RES_LEAF, 0);
1010                 if (error)
1011                         goto out_ipres;
1012         }
1013
1014         error = gfs2_meta_inode_buffer(ip, &dibh);
1015         if (error)
1016                 goto out_end_trans;
1017
1018         error = gfs2_dir_add(dir, &dentry->d_name, ip, &da);
1019         if (error)
1020                 goto out_brelse;
1021
1022         gfs2_trans_add_meta(ip->i_gl, dibh);
1023         inc_nlink(&ip->i_inode);
1024         ip->i_inode.i_ctime = current_time(&ip->i_inode);
1025         ihold(inode);
1026         d_instantiate(dentry, inode);
1027         mark_inode_dirty(inode);
1028
1029 out_brelse:
1030         brelse(dibh);
1031 out_end_trans:
1032         gfs2_trans_end(sdp);
1033 out_ipres:
1034         if (da.nr_blocks)
1035                 gfs2_inplace_release(dip);
1036 out_gunlock_q:
1037         if (da.nr_blocks)
1038                 gfs2_quota_unlock(dip);
1039 out_gunlock:
1040         gfs2_dir_no_add(&da);
1041         gfs2_glock_dq(ghs + 1);
1042 out_child:
1043         gfs2_glock_dq(ghs);
1044 out_parent:
1045         gfs2_qa_put(dip);
1046         gfs2_holder_uninit(ghs);
1047         gfs2_holder_uninit(ghs + 1);
1048         return error;
1049 }
1050
1051 /*
1052  * gfs2_unlink_ok - check to see that a inode is still in a directory
1053  * @dip: the directory
1054  * @name: the name of the file
1055  * @ip: the inode
1056  *
1057  * Assumes that the lock on (at least) @dip is held.
1058  *
1059  * Returns: 0 if the parent/child relationship is correct, errno if it isn't
1060  */
1061
1062 static int gfs2_unlink_ok(struct gfs2_inode *dip, const struct qstr *name,
1063                           const struct gfs2_inode *ip)
1064 {
1065         int error;
1066
1067         if (IS_IMMUTABLE(&ip->i_inode) || IS_APPEND(&ip->i_inode))
1068                 return -EPERM;
1069
1070         if ((dip->i_inode.i_mode & S_ISVTX) &&
1071             !uid_eq(dip->i_inode.i_uid, current_fsuid()) &&
1072             !uid_eq(ip->i_inode.i_uid, current_fsuid()) && !capable(CAP_FOWNER))
1073                 return -EPERM;
1074
1075         if (IS_APPEND(&dip->i_inode))
1076                 return -EPERM;
1077
1078         error = gfs2_permission(&init_user_ns, &dip->i_inode,
1079                                 MAY_WRITE | MAY_EXEC);
1080         if (error)
1081                 return error;
1082
1083         return gfs2_dir_check(&dip->i_inode, name, ip);
1084 }
1085
1086 /**
1087  * gfs2_unlink_inode - Removes an inode from its parent dir and unlinks it
1088  * @dip: The parent directory
1089  * @dentry: The dentry to unlink
1090  *
1091  * Called with all the locks and in a transaction. This will only be
1092  * called for a directory after it has been checked to ensure it is empty.
1093  *
1094  * Returns: 0 on success, or an error
1095  */
1096
1097 static int gfs2_unlink_inode(struct gfs2_inode *dip,
1098                              const struct dentry *dentry)
1099 {
1100         struct inode *inode = d_inode(dentry);
1101         struct gfs2_inode *ip = GFS2_I(inode);
1102         int error;
1103
1104         error = gfs2_dir_del(dip, dentry);
1105         if (error)
1106                 return error;
1107
1108         ip->i_entries = 0;
1109         inode->i_ctime = current_time(inode);
1110         if (S_ISDIR(inode->i_mode))
1111                 clear_nlink(inode);
1112         else
1113                 drop_nlink(inode);
1114         mark_inode_dirty(inode);
1115         if (inode->i_nlink == 0)
1116                 gfs2_unlink_di(inode);
1117         return 0;
1118 }
1119
1120
1121 /**
1122  * gfs2_unlink - Unlink an inode (this does rmdir as well)
1123  * @dir: The inode of the directory containing the inode to unlink
1124  * @dentry: The file itself
1125  *
1126  * This routine uses the type of the inode as a flag to figure out
1127  * whether this is an unlink or an rmdir.
1128  *
1129  * Returns: errno
1130  */
1131
1132 static int gfs2_unlink(struct inode *dir, struct dentry *dentry)
1133 {
1134         struct gfs2_inode *dip = GFS2_I(dir);
1135         struct gfs2_sbd *sdp = GFS2_SB(dir);
1136         struct inode *inode = d_inode(dentry);
1137         struct gfs2_inode *ip = GFS2_I(inode);
1138         struct gfs2_holder ghs[3];
1139         struct gfs2_rgrpd *rgd;
1140         int error;
1141
1142         error = gfs2_rindex_update(sdp);
1143         if (error)
1144                 return error;
1145
1146         error = -EROFS;
1147
1148         gfs2_holder_init(dip->i_gl, LM_ST_EXCLUSIVE, 0, ghs);
1149         gfs2_holder_init(ip->i_gl,  LM_ST_EXCLUSIVE, 0, ghs + 1);
1150
1151         rgd = gfs2_blk2rgrpd(sdp, ip->i_no_addr, 1);
1152         if (!rgd)
1153                 goto out_inodes;
1154
1155         gfs2_holder_init(rgd->rd_gl, LM_ST_EXCLUSIVE, LM_FLAG_NODE_SCOPE, ghs + 2);
1156
1157
1158         error = gfs2_glock_nq(ghs); /* parent */
1159         if (error)
1160                 goto out_parent;
1161
1162         error = gfs2_glock_nq(ghs + 1); /* child */
1163         if (error)
1164                 goto out_child;
1165
1166         error = -ENOENT;
1167         if (inode->i_nlink == 0)
1168                 goto out_rgrp;
1169
1170         if (S_ISDIR(inode->i_mode)) {
1171                 error = -ENOTEMPTY;
1172                 if (ip->i_entries > 2 || inode->i_nlink > 2)
1173                         goto out_rgrp;
1174         }
1175
1176         error = gfs2_glock_nq(ghs + 2); /* rgrp */
1177         if (error)
1178                 goto out_rgrp;
1179
1180         error = gfs2_unlink_ok(dip, &dentry->d_name, ip);
1181         if (error)
1182                 goto out_gunlock;
1183
1184         error = gfs2_trans_begin(sdp, 2*RES_DINODE + 3*RES_LEAF + RES_RG_BIT, 0);
1185         if (error)
1186                 goto out_gunlock;
1187
1188         error = gfs2_unlink_inode(dip, dentry);
1189         gfs2_trans_end(sdp);
1190
1191 out_gunlock:
1192         gfs2_glock_dq(ghs + 2);
1193 out_rgrp:
1194         gfs2_glock_dq(ghs + 1);
1195 out_child:
1196         gfs2_glock_dq(ghs);
1197 out_parent:
1198         gfs2_holder_uninit(ghs + 2);
1199 out_inodes:
1200         gfs2_holder_uninit(ghs + 1);
1201         gfs2_holder_uninit(ghs);
1202         return error;
1203 }
1204
1205 /**
1206  * gfs2_symlink - Create a symlink
1207  * @mnt_userns: User namespace of the mount the inode was found from
1208  * @dir: The directory to create the symlink in
1209  * @dentry: The dentry to put the symlink in
1210  * @symname: The thing which the link points to
1211  *
1212  * Returns: errno
1213  */
1214
1215 static int gfs2_symlink(struct user_namespace *mnt_userns, struct inode *dir,
1216                         struct dentry *dentry, const char *symname)
1217 {
1218         unsigned int size;
1219
1220         size = strlen(symname);
1221         if (size >= gfs2_max_stuffed_size(GFS2_I(dir)))
1222                 return -ENAMETOOLONG;
1223
1224         return gfs2_create_inode(dir, dentry, NULL, S_IFLNK | S_IRWXUGO, 0, symname, size, 0);
1225 }
1226
1227 /**
1228  * gfs2_mkdir - Make a directory
1229  * @mnt_userns: User namespace of the mount the inode was found from
1230  * @dir: The parent directory of the new one
1231  * @dentry: The dentry of the new directory
1232  * @mode: The mode of the new directory
1233  *
1234  * Returns: errno
1235  */
1236
1237 static int gfs2_mkdir(struct user_namespace *mnt_userns, struct inode *dir,
1238                       struct dentry *dentry, umode_t mode)
1239 {
1240         unsigned dsize = gfs2_max_stuffed_size(GFS2_I(dir));
1241         return gfs2_create_inode(dir, dentry, NULL, S_IFDIR | mode, 0, NULL, dsize, 0);
1242 }
1243
1244 /**
1245  * gfs2_mknod - Make a special file
1246  * @mnt_userns: User namespace of the mount the inode was found from
1247  * @dir: The directory in which the special file will reside
1248  * @dentry: The dentry of the special file
1249  * @mode: The mode of the special file
1250  * @dev: The device specification of the special file
1251  *
1252  */
1253
1254 static int gfs2_mknod(struct user_namespace *mnt_userns, struct inode *dir,
1255                       struct dentry *dentry, umode_t mode, dev_t dev)
1256 {
1257         return gfs2_create_inode(dir, dentry, NULL, mode, dev, NULL, 0, 0);
1258 }
1259
1260 /**
1261  * gfs2_atomic_open - Atomically open a file
1262  * @dir: The directory
1263  * @dentry: The proposed new entry
1264  * @file: The proposed new struct file
1265  * @flags: open flags
1266  * @mode: File mode
1267  *
1268  * Returns: error code or 0 for success
1269  */
1270
1271 static int gfs2_atomic_open(struct inode *dir, struct dentry *dentry,
1272                             struct file *file, unsigned flags,
1273                             umode_t mode)
1274 {
1275         struct dentry *d;
1276         bool excl = !!(flags & O_EXCL);
1277
1278         if (!d_in_lookup(dentry))
1279                 goto skip_lookup;
1280
1281         d = __gfs2_lookup(dir, dentry, file);
1282         if (IS_ERR(d))
1283                 return PTR_ERR(d);
1284         if (d != NULL)
1285                 dentry = d;
1286         if (d_really_is_positive(dentry)) {
1287                 if (!(file->f_mode & FMODE_OPENED))
1288                         return finish_no_open(file, d);
1289                 dput(d);
1290                 return excl && (flags & O_CREAT) ? -EEXIST : 0;
1291         }
1292
1293         BUG_ON(d != NULL);
1294
1295 skip_lookup:
1296         if (!(flags & O_CREAT))
1297                 return -ENOENT;
1298
1299         return gfs2_create_inode(dir, dentry, file, S_IFREG | mode, 0, NULL, 0, excl);
1300 }
1301
1302 /*
1303  * gfs2_ok_to_move - check if it's ok to move a directory to another directory
1304  * @this: move this
1305  * @to: to here
1306  *
1307  * Follow @to back to the root and make sure we don't encounter @this
1308  * Assumes we already hold the rename lock.
1309  *
1310  * Returns: errno
1311  */
1312
1313 static int gfs2_ok_to_move(struct gfs2_inode *this, struct gfs2_inode *to)
1314 {
1315         struct inode *dir = &to->i_inode;
1316         struct super_block *sb = dir->i_sb;
1317         struct inode *tmp;
1318         int error = 0;
1319
1320         igrab(dir);
1321
1322         for (;;) {
1323                 if (dir == &this->i_inode) {
1324                         error = -EINVAL;
1325                         break;
1326                 }
1327                 if (dir == d_inode(sb->s_root)) {
1328                         error = 0;
1329                         break;
1330                 }
1331
1332                 tmp = gfs2_lookupi(dir, &gfs2_qdotdot, 1);
1333                 if (!tmp) {
1334                         error = -ENOENT;
1335                         break;
1336                 }
1337                 if (IS_ERR(tmp)) {
1338                         error = PTR_ERR(tmp);
1339                         break;
1340                 }
1341
1342                 iput(dir);
1343                 dir = tmp;
1344         }
1345
1346         iput(dir);
1347
1348         return error;
1349 }
1350
1351 /**
1352  * update_moved_ino - Update an inode that's being moved
1353  * @ip: The inode being moved
1354  * @ndip: The parent directory of the new filename
1355  * @dir_rename: True of ip is a directory
1356  *
1357  * Returns: errno
1358  */
1359
1360 static int update_moved_ino(struct gfs2_inode *ip, struct gfs2_inode *ndip,
1361                             int dir_rename)
1362 {
1363         if (dir_rename)
1364                 return gfs2_dir_mvino(ip, &gfs2_qdotdot, ndip, DT_DIR);
1365
1366         ip->i_inode.i_ctime = current_time(&ip->i_inode);
1367         mark_inode_dirty_sync(&ip->i_inode);
1368         return 0;
1369 }
1370
1371
1372 /**
1373  * gfs2_rename - Rename a file
1374  * @odir: Parent directory of old file name
1375  * @odentry: The old dentry of the file
1376  * @ndir: Parent directory of new file name
1377  * @ndentry: The new dentry of the file
1378  *
1379  * Returns: errno
1380  */
1381
1382 static int gfs2_rename(struct inode *odir, struct dentry *odentry,
1383                        struct inode *ndir, struct dentry *ndentry)
1384 {
1385         struct gfs2_inode *odip = GFS2_I(odir);
1386         struct gfs2_inode *ndip = GFS2_I(ndir);
1387         struct gfs2_inode *ip = GFS2_I(d_inode(odentry));
1388         struct gfs2_inode *nip = NULL;
1389         struct gfs2_sbd *sdp = GFS2_SB(odir);
1390         struct gfs2_holder ghs[4], r_gh, rd_gh;
1391         struct gfs2_rgrpd *nrgd;
1392         unsigned int num_gh;
1393         int dir_rename = 0;
1394         struct gfs2_diradd da = { .nr_blocks = 0, .save_loc = 0, };
1395         unsigned int x;
1396         int error;
1397
1398         gfs2_holder_mark_uninitialized(&r_gh);
1399         gfs2_holder_mark_uninitialized(&rd_gh);
1400         if (d_really_is_positive(ndentry)) {
1401                 nip = GFS2_I(d_inode(ndentry));
1402                 if (ip == nip)
1403                         return 0;
1404         }
1405
1406         error = gfs2_rindex_update(sdp);
1407         if (error)
1408                 return error;
1409
1410         error = gfs2_qa_get(ndip);
1411         if (error)
1412                 return error;
1413
1414         if (odip != ndip) {
1415                 error = gfs2_glock_nq_init(sdp->sd_rename_gl, LM_ST_EXCLUSIVE,
1416                                            0, &r_gh);
1417                 if (error)
1418                         goto out;
1419
1420                 if (S_ISDIR(ip->i_inode.i_mode)) {
1421                         dir_rename = 1;
1422                         /* don't move a directory into its subdir */
1423                         error = gfs2_ok_to_move(ip, ndip);
1424                         if (error)
1425                                 goto out_gunlock_r;
1426                 }
1427         }
1428
1429         num_gh = 1;
1430         gfs2_holder_init(odip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC, ghs);
1431         if (odip != ndip) {
1432                 gfs2_holder_init(ndip->i_gl, LM_ST_EXCLUSIVE,GL_ASYNC,
1433                                  ghs + num_gh);
1434                 num_gh++;
1435         }
1436         gfs2_holder_init(ip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC, ghs + num_gh);
1437         num_gh++;
1438
1439         if (nip) {
1440                 gfs2_holder_init(nip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC,
1441                                  ghs + num_gh);
1442                 num_gh++;
1443         }
1444
1445         for (x = 0; x < num_gh; x++) {
1446                 error = gfs2_glock_nq(ghs + x);
1447                 if (error)
1448                         goto out_gunlock;
1449         }
1450         error = gfs2_glock_async_wait(num_gh, ghs);
1451         if (error)
1452                 goto out_gunlock;
1453
1454         if (nip) {
1455                 /* Grab the resource group glock for unlink flag twiddling.
1456                  * This is the case where the target dinode already exists
1457                  * so we unlink before doing the rename.
1458                  */
1459                 nrgd = gfs2_blk2rgrpd(sdp, nip->i_no_addr, 1);
1460                 if (!nrgd) {
1461                         error = -ENOENT;
1462                         goto out_gunlock;
1463                 }
1464                 error = gfs2_glock_nq_init(nrgd->rd_gl, LM_ST_EXCLUSIVE,
1465                                            LM_FLAG_NODE_SCOPE, &rd_gh);
1466                 if (error)
1467                         goto out_gunlock;
1468         }
1469
1470         error = -ENOENT;
1471         if (ip->i_inode.i_nlink == 0)
1472                 goto out_gunlock;
1473
1474         /* Check out the old directory */
1475
1476         error = gfs2_unlink_ok(odip, &odentry->d_name, ip);
1477         if (error)
1478                 goto out_gunlock;
1479
1480         /* Check out the new directory */
1481
1482         if (nip) {
1483                 error = gfs2_unlink_ok(ndip, &ndentry->d_name, nip);
1484                 if (error)
1485                         goto out_gunlock;
1486
1487                 if (nip->i_inode.i_nlink == 0) {
1488                         error = -EAGAIN;
1489                         goto out_gunlock;
1490                 }
1491
1492                 if (S_ISDIR(nip->i_inode.i_mode)) {
1493                         if (nip->i_entries < 2) {
1494                                 gfs2_consist_inode(nip);
1495                                 error = -EIO;
1496                                 goto out_gunlock;
1497                         }
1498                         if (nip->i_entries > 2) {
1499                                 error = -ENOTEMPTY;
1500                                 goto out_gunlock;
1501                         }
1502                 }
1503         } else {
1504                 error = gfs2_permission(&init_user_ns, ndir,
1505                                         MAY_WRITE | MAY_EXEC);
1506                 if (error)
1507                         goto out_gunlock;
1508
1509                 error = gfs2_dir_check(ndir, &ndentry->d_name, NULL);
1510                 switch (error) {
1511                 case -ENOENT:
1512                         error = 0;
1513                         break;
1514                 case 0:
1515                         error = -EEXIST;
1516                         goto out_gunlock;
1517                 default:
1518                         goto out_gunlock;
1519                 }
1520
1521                 if (odip != ndip) {
1522                         if (!ndip->i_inode.i_nlink) {
1523                                 error = -ENOENT;
1524                                 goto out_gunlock;
1525                         }
1526                         if (ndip->i_entries == (u32)-1) {
1527                                 error = -EFBIG;
1528                                 goto out_gunlock;
1529                         }
1530                         if (S_ISDIR(ip->i_inode.i_mode) &&
1531                             ndip->i_inode.i_nlink == (u32)-1) {
1532                                 error = -EMLINK;
1533                                 goto out_gunlock;
1534                         }
1535                 }
1536         }
1537
1538         /* Check out the dir to be renamed */
1539
1540         if (dir_rename) {
1541                 error = gfs2_permission(&init_user_ns, d_inode(odentry),
1542                                         MAY_WRITE);
1543                 if (error)
1544                         goto out_gunlock;
1545         }
1546
1547         if (nip == NULL) {
1548                 error = gfs2_diradd_alloc_required(ndir, &ndentry->d_name, &da);
1549                 if (error)
1550                         goto out_gunlock;
1551         }
1552
1553         if (da.nr_blocks) {
1554                 struct gfs2_alloc_parms ap = { .target = da.nr_blocks, };
1555                 error = gfs2_quota_lock_check(ndip, &ap);
1556                 if (error)
1557                         goto out_gunlock;
1558
1559                 error = gfs2_inplace_reserve(ndip, &ap);
1560                 if (error)
1561                         goto out_gunlock_q;
1562
1563                 error = gfs2_trans_begin(sdp, gfs2_trans_da_blks(ndip, &da, 4) +
1564                                          4 * RES_LEAF + 4, 0);
1565                 if (error)
1566                         goto out_ipreserv;
1567         } else {
1568                 error = gfs2_trans_begin(sdp, 4 * RES_DINODE +
1569                                          5 * RES_LEAF + 4, 0);
1570                 if (error)
1571                         goto out_gunlock;
1572         }
1573
1574         /* Remove the target file, if it exists */
1575
1576         if (nip)
1577                 error = gfs2_unlink_inode(ndip, ndentry);
1578
1579         error = update_moved_ino(ip, ndip, dir_rename);
1580         if (error)
1581                 goto out_end_trans;
1582
1583         error = gfs2_dir_del(odip, odentry);
1584         if (error)
1585                 goto out_end_trans;
1586
1587         error = gfs2_dir_add(ndir, &ndentry->d_name, ip, &da);
1588         if (error)
1589                 goto out_end_trans;
1590
1591 out_end_trans:
1592         gfs2_trans_end(sdp);
1593 out_ipreserv:
1594         if (da.nr_blocks)
1595                 gfs2_inplace_release(ndip);
1596 out_gunlock_q:
1597         if (da.nr_blocks)
1598                 gfs2_quota_unlock(ndip);
1599 out_gunlock:
1600         gfs2_dir_no_add(&da);
1601         if (gfs2_holder_initialized(&rd_gh))
1602                 gfs2_glock_dq_uninit(&rd_gh);
1603
1604         while (x--) {
1605                 if (gfs2_holder_queued(ghs + x))
1606                         gfs2_glock_dq(ghs + x);
1607                 gfs2_holder_uninit(ghs + x);
1608         }
1609 out_gunlock_r:
1610         if (gfs2_holder_initialized(&r_gh))
1611                 gfs2_glock_dq_uninit(&r_gh);
1612 out:
1613         gfs2_qa_put(ndip);
1614         return error;
1615 }
1616
1617 /**
1618  * gfs2_exchange - exchange two files
1619  * @odir: Parent directory of old file name
1620  * @odentry: The old dentry of the file
1621  * @ndir: Parent directory of new file name
1622  * @ndentry: The new dentry of the file
1623  * @flags: The rename flags
1624  *
1625  * Returns: errno
1626  */
1627
1628 static int gfs2_exchange(struct inode *odir, struct dentry *odentry,
1629                          struct inode *ndir, struct dentry *ndentry,
1630                          unsigned int flags)
1631 {
1632         struct gfs2_inode *odip = GFS2_I(odir);
1633         struct gfs2_inode *ndip = GFS2_I(ndir);
1634         struct gfs2_inode *oip = GFS2_I(odentry->d_inode);
1635         struct gfs2_inode *nip = GFS2_I(ndentry->d_inode);
1636         struct gfs2_sbd *sdp = GFS2_SB(odir);
1637         struct gfs2_holder ghs[4], r_gh;
1638         unsigned int num_gh;
1639         unsigned int x;
1640         umode_t old_mode = oip->i_inode.i_mode;
1641         umode_t new_mode = nip->i_inode.i_mode;
1642         int error;
1643
1644         gfs2_holder_mark_uninitialized(&r_gh);
1645         error = gfs2_rindex_update(sdp);
1646         if (error)
1647                 return error;
1648
1649         if (odip != ndip) {
1650                 error = gfs2_glock_nq_init(sdp->sd_rename_gl, LM_ST_EXCLUSIVE,
1651                                            0, &r_gh);
1652                 if (error)
1653                         goto out;
1654
1655                 if (S_ISDIR(old_mode)) {
1656                         /* don't move a directory into its subdir */
1657                         error = gfs2_ok_to_move(oip, ndip);
1658                         if (error)
1659                                 goto out_gunlock_r;
1660                 }
1661
1662                 if (S_ISDIR(new_mode)) {
1663                         /* don't move a directory into its subdir */
1664                         error = gfs2_ok_to_move(nip, odip);
1665                         if (error)
1666                                 goto out_gunlock_r;
1667                 }
1668         }
1669
1670         num_gh = 1;
1671         gfs2_holder_init(odip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC, ghs);
1672         if (odip != ndip) {
1673                 gfs2_holder_init(ndip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC,
1674                                  ghs + num_gh);
1675                 num_gh++;
1676         }
1677         gfs2_holder_init(oip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC, ghs + num_gh);
1678         num_gh++;
1679
1680         gfs2_holder_init(nip->i_gl, LM_ST_EXCLUSIVE, GL_ASYNC, ghs + num_gh);
1681         num_gh++;
1682
1683         for (x = 0; x < num_gh; x++) {
1684                 error = gfs2_glock_nq(ghs + x);
1685                 if (error)
1686                         goto out_gunlock;
1687         }
1688
1689         error = gfs2_glock_async_wait(num_gh, ghs);
1690         if (error)
1691                 goto out_gunlock;
1692
1693         error = -ENOENT;
1694         if (oip->i_inode.i_nlink == 0 || nip->i_inode.i_nlink == 0)
1695                 goto out_gunlock;
1696
1697         error = gfs2_unlink_ok(odip, &odentry->d_name, oip);
1698         if (error)
1699                 goto out_gunlock;
1700         error = gfs2_unlink_ok(ndip, &ndentry->d_name, nip);
1701         if (error)
1702                 goto out_gunlock;
1703
1704         if (S_ISDIR(old_mode)) {
1705                 error = gfs2_permission(&init_user_ns, odentry->d_inode,
1706                                         MAY_WRITE);
1707                 if (error)
1708                         goto out_gunlock;
1709         }
1710         if (S_ISDIR(new_mode)) {
1711                 error = gfs2_permission(&init_user_ns, ndentry->d_inode,
1712                                         MAY_WRITE);
1713                 if (error)
1714                         goto out_gunlock;
1715         }
1716         error = gfs2_trans_begin(sdp, 4 * RES_DINODE + 4 * RES_LEAF, 0);
1717         if (error)
1718                 goto out_gunlock;
1719
1720         error = update_moved_ino(oip, ndip, S_ISDIR(old_mode));
1721         if (error)
1722                 goto out_end_trans;
1723
1724         error = update_moved_ino(nip, odip, S_ISDIR(new_mode));
1725         if (error)
1726                 goto out_end_trans;
1727
1728         error = gfs2_dir_mvino(ndip, &ndentry->d_name, oip,
1729                                IF2DT(old_mode));
1730         if (error)
1731                 goto out_end_trans;
1732
1733         error = gfs2_dir_mvino(odip, &odentry->d_name, nip,
1734                                IF2DT(new_mode));
1735         if (error)
1736                 goto out_end_trans;
1737
1738         if (odip != ndip) {
1739                 if (S_ISDIR(new_mode) && !S_ISDIR(old_mode)) {
1740                         inc_nlink(&odip->i_inode);
1741                         drop_nlink(&ndip->i_inode);
1742                 } else if (S_ISDIR(old_mode) && !S_ISDIR(new_mode)) {
1743                         inc_nlink(&ndip->i_inode);
1744                         drop_nlink(&odip->i_inode);
1745                 }
1746         }
1747         mark_inode_dirty(&ndip->i_inode);
1748         if (odip != ndip)
1749                 mark_inode_dirty(&odip->i_inode);
1750
1751 out_end_trans:
1752         gfs2_trans_end(sdp);
1753 out_gunlock:
1754         while (x--) {
1755                 if (gfs2_holder_queued(ghs + x))
1756                         gfs2_glock_dq(ghs + x);
1757                 gfs2_holder_uninit(ghs + x);
1758         }
1759 out_gunlock_r:
1760         if (gfs2_holder_initialized(&r_gh))
1761                 gfs2_glock_dq_uninit(&r_gh);
1762 out:
1763         return error;
1764 }
1765
1766 static int gfs2_rename2(struct user_namespace *mnt_userns, struct inode *odir,
1767                         struct dentry *odentry, struct inode *ndir,
1768                         struct dentry *ndentry, unsigned int flags)
1769 {
1770         flags &= ~RENAME_NOREPLACE;
1771
1772         if (flags & ~RENAME_EXCHANGE)
1773                 return -EINVAL;
1774
1775         if (flags & RENAME_EXCHANGE)
1776                 return gfs2_exchange(odir, odentry, ndir, ndentry, flags);
1777
1778         return gfs2_rename(odir, odentry, ndir, ndentry);
1779 }
1780
1781 /**
1782  * gfs2_get_link - Follow a symbolic link
1783  * @dentry: The dentry of the link
1784  * @inode: The inode of the link
1785  * @done: destructor for return value
1786  *
1787  * This can handle symlinks of any size.
1788  *
1789  * Returns: 0 on success or error code
1790  */
1791
1792 static const char *gfs2_get_link(struct dentry *dentry,
1793                                  struct inode *inode,
1794                                  struct delayed_call *done)
1795 {
1796         struct gfs2_inode *ip = GFS2_I(inode);
1797         struct gfs2_holder i_gh;
1798         struct buffer_head *dibh;
1799         unsigned int size;
1800         char *buf;
1801         int error;
1802
1803         if (!dentry)
1804                 return ERR_PTR(-ECHILD);
1805
1806         gfs2_holder_init(ip->i_gl, LM_ST_SHARED, 0, &i_gh);
1807         error = gfs2_glock_nq(&i_gh);
1808         if (error) {
1809                 gfs2_holder_uninit(&i_gh);
1810                 return ERR_PTR(error);
1811         }
1812
1813         size = (unsigned int)i_size_read(&ip->i_inode);
1814         if (size == 0) {
1815                 gfs2_consist_inode(ip);
1816                 buf = ERR_PTR(-EIO);
1817                 goto out;
1818         }
1819
1820         error = gfs2_meta_inode_buffer(ip, &dibh);
1821         if (error) {
1822                 buf = ERR_PTR(error);
1823                 goto out;
1824         }
1825
1826         buf = kzalloc(size + 1, GFP_NOFS);
1827         if (!buf)
1828                 buf = ERR_PTR(-ENOMEM);
1829         else
1830                 memcpy(buf, dibh->b_data + sizeof(struct gfs2_dinode), size);
1831         brelse(dibh);
1832 out:
1833         gfs2_glock_dq_uninit(&i_gh);
1834         if (!IS_ERR(buf))
1835                 set_delayed_call(done, kfree_link, buf);
1836         return buf;
1837 }
1838
1839 /**
1840  * gfs2_permission
1841  * @mnt_userns: User namespace of the mount the inode was found from
1842  * @inode: The inode
1843  * @mask: The mask to be tested
1844  *
1845  * This may be called from the VFS directly, or from within GFS2 with the
1846  * inode locked, so we look to see if the glock is already locked and only
1847  * lock the glock if its not already been done.
1848  *
1849  * Returns: errno
1850  */
1851
1852 int gfs2_permission(struct user_namespace *mnt_userns, struct inode *inode,
1853                     int mask)
1854 {
1855         struct gfs2_inode *ip;
1856         struct gfs2_holder i_gh;
1857         int error;
1858
1859         gfs2_holder_mark_uninitialized(&i_gh);
1860         ip = GFS2_I(inode);
1861         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
1862                 if (mask & MAY_NOT_BLOCK)
1863                         return -ECHILD;
1864                 error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &i_gh);
1865                 if (error)
1866                         return error;
1867         }
1868
1869         if ((mask & MAY_WRITE) && IS_IMMUTABLE(inode))
1870                 error = -EPERM;
1871         else
1872                 error = generic_permission(&init_user_ns, inode, mask);
1873         if (gfs2_holder_initialized(&i_gh))
1874                 gfs2_glock_dq_uninit(&i_gh);
1875
1876         return error;
1877 }
1878
1879 static int __gfs2_setattr_simple(struct inode *inode, struct iattr *attr)
1880 {
1881         setattr_copy(&init_user_ns, inode, attr);
1882         mark_inode_dirty(inode);
1883         return 0;
1884 }
1885
1886 static int gfs2_setattr_simple(struct inode *inode, struct iattr *attr)
1887 {
1888         int error;
1889
1890         if (current->journal_info)
1891                 return __gfs2_setattr_simple(inode, attr);
1892
1893         error = gfs2_trans_begin(GFS2_SB(inode), RES_DINODE, 0);
1894         if (error)
1895                 return error;
1896
1897         error = __gfs2_setattr_simple(inode, attr);
1898         gfs2_trans_end(GFS2_SB(inode));
1899         return error;
1900 }
1901
1902 static int setattr_chown(struct inode *inode, struct iattr *attr)
1903 {
1904         struct gfs2_inode *ip = GFS2_I(inode);
1905         struct gfs2_sbd *sdp = GFS2_SB(inode);
1906         kuid_t ouid, nuid;
1907         kgid_t ogid, ngid;
1908         int error;
1909         struct gfs2_alloc_parms ap;
1910
1911         ouid = inode->i_uid;
1912         ogid = inode->i_gid;
1913         nuid = attr->ia_uid;
1914         ngid = attr->ia_gid;
1915
1916         if (!(attr->ia_valid & ATTR_UID) || uid_eq(ouid, nuid))
1917                 ouid = nuid = NO_UID_QUOTA_CHANGE;
1918         if (!(attr->ia_valid & ATTR_GID) || gid_eq(ogid, ngid))
1919                 ogid = ngid = NO_GID_QUOTA_CHANGE;
1920         error = gfs2_qa_get(ip);
1921         if (error)
1922                 return error;
1923
1924         error = gfs2_rindex_update(sdp);
1925         if (error)
1926                 goto out;
1927
1928         error = gfs2_quota_lock(ip, nuid, ngid);
1929         if (error)
1930                 goto out;
1931
1932         ap.target = gfs2_get_inode_blocks(&ip->i_inode);
1933
1934         if (!uid_eq(ouid, NO_UID_QUOTA_CHANGE) ||
1935             !gid_eq(ogid, NO_GID_QUOTA_CHANGE)) {
1936                 error = gfs2_quota_check(ip, nuid, ngid, &ap);
1937                 if (error)
1938                         goto out_gunlock_q;
1939         }
1940
1941         error = gfs2_trans_begin(sdp, RES_DINODE + 2 * RES_QUOTA, 0);
1942         if (error)
1943                 goto out_gunlock_q;
1944
1945         error = gfs2_setattr_simple(inode, attr);
1946         if (error)
1947                 goto out_end_trans;
1948
1949         if (!uid_eq(ouid, NO_UID_QUOTA_CHANGE) ||
1950             !gid_eq(ogid, NO_GID_QUOTA_CHANGE)) {
1951                 gfs2_quota_change(ip, -(s64)ap.target, ouid, ogid);
1952                 gfs2_quota_change(ip, ap.target, nuid, ngid);
1953         }
1954
1955 out_end_trans:
1956         gfs2_trans_end(sdp);
1957 out_gunlock_q:
1958         gfs2_quota_unlock(ip);
1959 out:
1960         gfs2_qa_put(ip);
1961         return error;
1962 }
1963
1964 /**
1965  * gfs2_setattr - Change attributes on an inode
1966  * @mnt_userns: User namespace of the mount the inode was found from
1967  * @dentry: The dentry which is changing
1968  * @attr: The structure describing the change
1969  *
1970  * The VFS layer wants to change one or more of an inodes attributes.  Write
1971  * that change out to disk.
1972  *
1973  * Returns: errno
1974  */
1975
1976 static int gfs2_setattr(struct user_namespace *mnt_userns,
1977                         struct dentry *dentry, struct iattr *attr)
1978 {
1979         struct inode *inode = d_inode(dentry);
1980         struct gfs2_inode *ip = GFS2_I(inode);
1981         struct gfs2_holder i_gh;
1982         int error;
1983
1984         error = gfs2_qa_get(ip);
1985         if (error)
1986                 return error;
1987
1988         error = gfs2_glock_nq_init(ip->i_gl, LM_ST_EXCLUSIVE, 0, &i_gh);
1989         if (error)
1990                 goto out;
1991
1992         error = may_setattr(&init_user_ns, inode, attr->ia_valid);
1993         if (error)
1994                 goto error;
1995
1996         error = setattr_prepare(&init_user_ns, dentry, attr);
1997         if (error)
1998                 goto error;
1999
2000         if (attr->ia_valid & ATTR_SIZE)
2001                 error = gfs2_setattr_size(inode, attr->ia_size);
2002         else if (attr->ia_valid & (ATTR_UID | ATTR_GID))
2003                 error = setattr_chown(inode, attr);
2004         else {
2005                 error = gfs2_setattr_simple(inode, attr);
2006                 if (!error && attr->ia_valid & ATTR_MODE)
2007                         error = posix_acl_chmod(&init_user_ns, inode,
2008                                                 inode->i_mode);
2009         }
2010
2011 error:
2012         if (!error)
2013                 mark_inode_dirty(inode);
2014         gfs2_glock_dq_uninit(&i_gh);
2015 out:
2016         gfs2_qa_put(ip);
2017         return error;
2018 }
2019
2020 /**
2021  * gfs2_getattr - Read out an inode's attributes
2022  * @mnt_userns: user namespace of the mount the inode was found from
2023  * @path: Object to query
2024  * @stat: The inode's stats
2025  * @request_mask: Mask of STATX_xxx flags indicating the caller's interests
2026  * @flags: AT_STATX_xxx setting
2027  *
2028  * This may be called from the VFS directly, or from within GFS2 with the
2029  * inode locked, so we look to see if the glock is already locked and only
2030  * lock the glock if its not already been done. Note that its the NFS
2031  * readdirplus operation which causes this to be called (from filldir)
2032  * with the glock already held.
2033  *
2034  * Returns: errno
2035  */
2036
2037 static int gfs2_getattr(struct user_namespace *mnt_userns,
2038                         const struct path *path, struct kstat *stat,
2039                         u32 request_mask, unsigned int flags)
2040 {
2041         struct inode *inode = d_inode(path->dentry);
2042         struct gfs2_inode *ip = GFS2_I(inode);
2043         struct gfs2_holder gh;
2044         u32 gfsflags;
2045         int error;
2046
2047         gfs2_holder_mark_uninitialized(&gh);
2048         if (gfs2_glock_is_locked_by_me(ip->i_gl) == NULL) {
2049                 error = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, LM_FLAG_ANY, &gh);
2050                 if (error)
2051                         return error;
2052         }
2053
2054         gfsflags = ip->i_diskflags;
2055         if (gfsflags & GFS2_DIF_APPENDONLY)
2056                 stat->attributes |= STATX_ATTR_APPEND;
2057         if (gfsflags & GFS2_DIF_IMMUTABLE)
2058                 stat->attributes |= STATX_ATTR_IMMUTABLE;
2059
2060         stat->attributes_mask |= (STATX_ATTR_APPEND |
2061                                   STATX_ATTR_COMPRESSED |
2062                                   STATX_ATTR_ENCRYPTED |
2063                                   STATX_ATTR_IMMUTABLE |
2064                                   STATX_ATTR_NODUMP);
2065
2066         generic_fillattr(&init_user_ns, inode, stat);
2067
2068         if (gfs2_holder_initialized(&gh))
2069                 gfs2_glock_dq_uninit(&gh);
2070
2071         return 0;
2072 }
2073
2074 static int gfs2_fiemap(struct inode *inode, struct fiemap_extent_info *fieinfo,
2075                        u64 start, u64 len)
2076 {
2077         struct gfs2_inode *ip = GFS2_I(inode);
2078         struct gfs2_holder gh;
2079         int ret;
2080
2081         inode_lock_shared(inode);
2082
2083         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, 0, &gh);
2084         if (ret)
2085                 goto out;
2086
2087         ret = iomap_fiemap(inode, fieinfo, start, len, &gfs2_iomap_ops);
2088
2089         gfs2_glock_dq_uninit(&gh);
2090
2091 out:
2092         inode_unlock_shared(inode);
2093         return ret;
2094 }
2095
2096 loff_t gfs2_seek_data(struct file *file, loff_t offset)
2097 {
2098         struct inode *inode = file->f_mapping->host;
2099         struct gfs2_inode *ip = GFS2_I(inode);
2100         struct gfs2_holder gh;
2101         loff_t ret;
2102
2103         inode_lock_shared(inode);
2104         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, 0, &gh);
2105         if (!ret)
2106                 ret = iomap_seek_data(inode, offset, &gfs2_iomap_ops);
2107         gfs2_glock_dq_uninit(&gh);
2108         inode_unlock_shared(inode);
2109
2110         if (ret < 0)
2111                 return ret;
2112         return vfs_setpos(file, ret, inode->i_sb->s_maxbytes);
2113 }
2114
2115 loff_t gfs2_seek_hole(struct file *file, loff_t offset)
2116 {
2117         struct inode *inode = file->f_mapping->host;
2118         struct gfs2_inode *ip = GFS2_I(inode);
2119         struct gfs2_holder gh;
2120         loff_t ret;
2121
2122         inode_lock_shared(inode);
2123         ret = gfs2_glock_nq_init(ip->i_gl, LM_ST_SHARED, 0, &gh);
2124         if (!ret)
2125                 ret = iomap_seek_hole(inode, offset, &gfs2_iomap_ops);
2126         gfs2_glock_dq_uninit(&gh);
2127         inode_unlock_shared(inode);
2128
2129         if (ret < 0)
2130                 return ret;
2131         return vfs_setpos(file, ret, inode->i_sb->s_maxbytes);
2132 }
2133
2134 static int gfs2_update_time(struct inode *inode, struct timespec64 *time,
2135                             int flags)
2136 {
2137         struct gfs2_inode *ip = GFS2_I(inode);
2138         struct gfs2_glock *gl = ip->i_gl;
2139         struct gfs2_holder *gh;
2140         int error;
2141
2142         gh = gfs2_glock_is_locked_by_me(gl);
2143         if (gh && !gfs2_glock_is_held_excl(gl)) {
2144                 gfs2_glock_dq(gh);
2145                 gfs2_holder_reinit(LM_ST_EXCLUSIVE, 0, gh);
2146                 error = gfs2_glock_nq(gh);
2147                 if (error)
2148                         return error;
2149         }
2150         return generic_update_time(inode, time, flags);
2151 }
2152
2153 static const struct inode_operations gfs2_file_iops = {
2154         .permission = gfs2_permission,
2155         .setattr = gfs2_setattr,
2156         .getattr = gfs2_getattr,
2157         .listxattr = gfs2_listxattr,
2158         .fiemap = gfs2_fiemap,
2159         .get_acl = gfs2_get_acl,
2160         .set_acl = gfs2_set_acl,
2161         .update_time = gfs2_update_time,
2162         .fileattr_get = gfs2_fileattr_get,
2163         .fileattr_set = gfs2_fileattr_set,
2164 };
2165
2166 static const struct inode_operations gfs2_dir_iops = {
2167         .create = gfs2_create,
2168         .lookup = gfs2_lookup,
2169         .link = gfs2_link,
2170         .unlink = gfs2_unlink,
2171         .symlink = gfs2_symlink,
2172         .mkdir = gfs2_mkdir,
2173         .rmdir = gfs2_unlink,
2174         .mknod = gfs2_mknod,
2175         .rename = gfs2_rename2,
2176         .permission = gfs2_permission,
2177         .setattr = gfs2_setattr,
2178         .getattr = gfs2_getattr,
2179         .listxattr = gfs2_listxattr,
2180         .fiemap = gfs2_fiemap,
2181         .get_acl = gfs2_get_acl,
2182         .set_acl = gfs2_set_acl,
2183         .update_time = gfs2_update_time,
2184         .atomic_open = gfs2_atomic_open,
2185         .fileattr_get = gfs2_fileattr_get,
2186         .fileattr_set = gfs2_fileattr_set,
2187 };
2188
2189 static const struct inode_operations gfs2_symlink_iops = {
2190         .get_link = gfs2_get_link,
2191         .permission = gfs2_permission,
2192         .setattr = gfs2_setattr,
2193         .getattr = gfs2_getattr,
2194         .listxattr = gfs2_listxattr,
2195         .fiemap = gfs2_fiemap,
2196 };
2197