xfs: pass along transaction context when reading xattr block buffers
[linux-2.6-microblaze.git] / fs / xfs / libxfs / xfs_attr.c
1 /*
2  * Copyright (c) 2000-2005 Silicon Graphics, Inc.
3  * All Rights Reserved.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License as
7  * published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it would be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write the Free Software Foundation,
16  * Inc.,  51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17  */
18 #include "xfs.h"
19 #include "xfs_fs.h"
20 #include "xfs_shared.h"
21 #include "xfs_format.h"
22 #include "xfs_log_format.h"
23 #include "xfs_trans_resv.h"
24 #include "xfs_bit.h"
25 #include "xfs_mount.h"
26 #include "xfs_defer.h"
27 #include "xfs_da_format.h"
28 #include "xfs_da_btree.h"
29 #include "xfs_attr_sf.h"
30 #include "xfs_inode.h"
31 #include "xfs_alloc.h"
32 #include "xfs_trans.h"
33 #include "xfs_inode_item.h"
34 #include "xfs_bmap.h"
35 #include "xfs_bmap_util.h"
36 #include "xfs_bmap_btree.h"
37 #include "xfs_attr.h"
38 #include "xfs_attr_leaf.h"
39 #include "xfs_attr_remote.h"
40 #include "xfs_error.h"
41 #include "xfs_quota.h"
42 #include "xfs_trans_space.h"
43 #include "xfs_trace.h"
44
45 /*
46  * xfs_attr.c
47  *
48  * Provide the external interfaces to manage attribute lists.
49  */
50
51 /*========================================================================
52  * Function prototypes for the kernel.
53  *========================================================================*/
54
55 /*
56  * Internal routines when attribute list fits inside the inode.
57  */
58 STATIC int xfs_attr_shortform_addname(xfs_da_args_t *args);
59
60 /*
61  * Internal routines when attribute list is one block.
62  */
63 STATIC int xfs_attr_leaf_get(xfs_da_args_t *args);
64 STATIC int xfs_attr_leaf_addname(xfs_da_args_t *args);
65 STATIC int xfs_attr_leaf_removename(xfs_da_args_t *args);
66
67 /*
68  * Internal routines when attribute list is more than one block.
69  */
70 STATIC int xfs_attr_node_get(xfs_da_args_t *args);
71 STATIC int xfs_attr_node_addname(xfs_da_args_t *args);
72 STATIC int xfs_attr_node_removename(xfs_da_args_t *args);
73 STATIC int xfs_attr_fillstate(xfs_da_state_t *state);
74 STATIC int xfs_attr_refillstate(xfs_da_state_t *state);
75
76
77 STATIC int
78 xfs_attr_args_init(
79         struct xfs_da_args      *args,
80         struct xfs_inode        *dp,
81         const unsigned char     *name,
82         int                     flags)
83 {
84
85         if (!name)
86                 return -EINVAL;
87
88         memset(args, 0, sizeof(*args));
89         args->geo = dp->i_mount->m_attr_geo;
90         args->whichfork = XFS_ATTR_FORK;
91         args->dp = dp;
92         args->flags = flags;
93         args->name = name;
94         args->namelen = strlen((const char *)name);
95         if (args->namelen >= MAXNAMELEN)
96                 return -EFAULT;         /* match IRIX behaviour */
97
98         args->hashval = xfs_da_hashname(args->name, args->namelen);
99         return 0;
100 }
101
102 int
103 xfs_inode_hasattr(
104         struct xfs_inode        *ip)
105 {
106         if (!XFS_IFORK_Q(ip) ||
107             (ip->i_d.di_aformat == XFS_DINODE_FMT_EXTENTS &&
108              ip->i_d.di_anextents == 0))
109                 return 0;
110         return 1;
111 }
112
113 /*========================================================================
114  * Overall external interface routines.
115  *========================================================================*/
116
117 /* Retrieve an extended attribute and its value.  Must have iolock. */
118 int
119 xfs_attr_get_ilocked(
120         struct xfs_inode        *ip,
121         struct xfs_da_args      *args)
122 {
123         if (!xfs_inode_hasattr(ip))
124                 return -ENOATTR;
125         else if (ip->i_d.di_aformat == XFS_DINODE_FMT_LOCAL)
126                 return xfs_attr_shortform_getvalue(args);
127         else if (xfs_bmap_one_block(ip, XFS_ATTR_FORK))
128                 return xfs_attr_leaf_get(args);
129         else
130                 return xfs_attr_node_get(args);
131 }
132
133 /* Retrieve an extended attribute by name, and its value. */
134 int
135 xfs_attr_get(
136         struct xfs_inode        *ip,
137         const unsigned char     *name,
138         unsigned char           *value,
139         int                     *valuelenp,
140         int                     flags)
141 {
142         struct xfs_da_args      args;
143         uint                    lock_mode;
144         int                     error;
145
146         XFS_STATS_INC(ip->i_mount, xs_attr_get);
147
148         if (XFS_FORCED_SHUTDOWN(ip->i_mount))
149                 return -EIO;
150
151         error = xfs_attr_args_init(&args, ip, name, flags);
152         if (error)
153                 return error;
154
155         args.value = value;
156         args.valuelen = *valuelenp;
157         /* Entirely possible to look up a name which doesn't exist */
158         args.op_flags = XFS_DA_OP_OKNOENT;
159
160         lock_mode = xfs_ilock_attr_map_shared(ip);
161         error = xfs_attr_get_ilocked(ip, &args);
162         xfs_iunlock(ip, lock_mode);
163
164         *valuelenp = args.valuelen;
165         return error == -EEXIST ? 0 : error;
166 }
167
168 /*
169  * Calculate how many blocks we need for the new attribute,
170  */
171 STATIC int
172 xfs_attr_calc_size(
173         struct xfs_da_args      *args,
174         int                     *local)
175 {
176         struct xfs_mount        *mp = args->dp->i_mount;
177         int                     size;
178         int                     nblks;
179
180         /*
181          * Determine space new attribute will use, and if it would be
182          * "local" or "remote" (note: local != inline).
183          */
184         size = xfs_attr_leaf_newentsize(args, local);
185         nblks = XFS_DAENTER_SPACE_RES(mp, XFS_ATTR_FORK);
186         if (*local) {
187                 if (size > (args->geo->blksize / 2)) {
188                         /* Double split possible */
189                         nblks *= 2;
190                 }
191         } else {
192                 /*
193                  * Out of line attribute, cannot double split, but
194                  * make room for the attribute value itself.
195                  */
196                 uint    dblocks = xfs_attr3_rmt_blocks(mp, args->valuelen);
197                 nblks += dblocks;
198                 nblks += XFS_NEXTENTADD_SPACE_RES(mp, dblocks, XFS_ATTR_FORK);
199         }
200
201         return nblks;
202 }
203
204 int
205 xfs_attr_set(
206         struct xfs_inode        *dp,
207         const unsigned char     *name,
208         unsigned char           *value,
209         int                     valuelen,
210         int                     flags)
211 {
212         struct xfs_mount        *mp = dp->i_mount;
213         struct xfs_da_args      args;
214         struct xfs_defer_ops    dfops;
215         struct xfs_trans_res    tres;
216         xfs_fsblock_t           firstblock;
217         int                     rsvd = (flags & ATTR_ROOT) != 0;
218         int                     error, err2, local;
219
220         XFS_STATS_INC(mp, xs_attr_set);
221
222         if (XFS_FORCED_SHUTDOWN(dp->i_mount))
223                 return -EIO;
224
225         error = xfs_attr_args_init(&args, dp, name, flags);
226         if (error)
227                 return error;
228
229         args.value = value;
230         args.valuelen = valuelen;
231         args.firstblock = &firstblock;
232         args.dfops = &dfops;
233         args.op_flags = XFS_DA_OP_ADDNAME | XFS_DA_OP_OKNOENT;
234         args.total = xfs_attr_calc_size(&args, &local);
235
236         error = xfs_qm_dqattach(dp, 0);
237         if (error)
238                 return error;
239
240         /*
241          * If the inode doesn't have an attribute fork, add one.
242          * (inode must not be locked when we call this routine)
243          */
244         if (XFS_IFORK_Q(dp) == 0) {
245                 int sf_size = sizeof(xfs_attr_sf_hdr_t) +
246                         XFS_ATTR_SF_ENTSIZE_BYNAME(args.namelen, valuelen);
247
248                 error = xfs_bmap_add_attrfork(dp, sf_size, rsvd);
249                 if (error)
250                         return error;
251         }
252
253         tres.tr_logres = M_RES(mp)->tr_attrsetm.tr_logres +
254                          M_RES(mp)->tr_attrsetrt.tr_logres * args.total;
255         tres.tr_logcount = XFS_ATTRSET_LOG_COUNT;
256         tres.tr_logflags = XFS_TRANS_PERM_LOG_RES;
257
258         /*
259          * Root fork attributes can use reserved data blocks for this
260          * operation if necessary
261          */
262         error = xfs_trans_alloc(mp, &tres, args.total, 0,
263                         rsvd ? XFS_TRANS_RESERVE : 0, &args.trans);
264         if (error)
265                 return error;
266
267         xfs_ilock(dp, XFS_ILOCK_EXCL);
268         error = xfs_trans_reserve_quota_nblks(args.trans, dp, args.total, 0,
269                                 rsvd ? XFS_QMOPT_RES_REGBLKS | XFS_QMOPT_FORCE_RES :
270                                        XFS_QMOPT_RES_REGBLKS);
271         if (error) {
272                 xfs_iunlock(dp, XFS_ILOCK_EXCL);
273                 xfs_trans_cancel(args.trans);
274                 return error;
275         }
276
277         xfs_trans_ijoin(args.trans, dp, 0);
278
279         /*
280          * If the attribute list is non-existent or a shortform list,
281          * upgrade it to a single-leaf-block attribute list.
282          */
283         if (dp->i_d.di_aformat == XFS_DINODE_FMT_LOCAL ||
284             (dp->i_d.di_aformat == XFS_DINODE_FMT_EXTENTS &&
285              dp->i_d.di_anextents == 0)) {
286
287                 /*
288                  * Build initial attribute list (if required).
289                  */
290                 if (dp->i_d.di_aformat == XFS_DINODE_FMT_EXTENTS)
291                         xfs_attr_shortform_create(&args);
292
293                 /*
294                  * Try to add the attr to the attribute list in
295                  * the inode.
296                  */
297                 error = xfs_attr_shortform_addname(&args);
298                 if (error != -ENOSPC) {
299                         /*
300                          * Commit the shortform mods, and we're done.
301                          * NOTE: this is also the error path (EEXIST, etc).
302                          */
303                         ASSERT(args.trans != NULL);
304
305                         /*
306                          * If this is a synchronous mount, make sure that
307                          * the transaction goes to disk before returning
308                          * to the user.
309                          */
310                         if (mp->m_flags & XFS_MOUNT_WSYNC)
311                                 xfs_trans_set_sync(args.trans);
312
313                         if (!error && (flags & ATTR_KERNOTIME) == 0) {
314                                 xfs_trans_ichgtime(args.trans, dp,
315                                                         XFS_ICHGTIME_CHG);
316                         }
317                         err2 = xfs_trans_commit(args.trans);
318                         xfs_iunlock(dp, XFS_ILOCK_EXCL);
319
320                         return error ? error : err2;
321                 }
322
323                 /*
324                  * It won't fit in the shortform, transform to a leaf block.
325                  * GROT: another possible req'mt for a double-split btree op.
326                  */
327                 xfs_defer_init(args.dfops, args.firstblock);
328                 error = xfs_attr_shortform_to_leaf(&args);
329                 if (!error)
330                         error = xfs_defer_finish(&args.trans, args.dfops, dp);
331                 if (error) {
332                         args.trans = NULL;
333                         xfs_defer_cancel(&dfops);
334                         goto out;
335                 }
336
337                 /*
338                  * Commit the leaf transformation.  We'll need another (linked)
339                  * transaction to add the new attribute to the leaf.
340                  */
341
342                 error = xfs_trans_roll(&args.trans, dp);
343                 if (error)
344                         goto out;
345
346         }
347
348         if (xfs_bmap_one_block(dp, XFS_ATTR_FORK))
349                 error = xfs_attr_leaf_addname(&args);
350         else
351                 error = xfs_attr_node_addname(&args);
352         if (error)
353                 goto out;
354
355         /*
356          * If this is a synchronous mount, make sure that the
357          * transaction goes to disk before returning to the user.
358          */
359         if (mp->m_flags & XFS_MOUNT_WSYNC)
360                 xfs_trans_set_sync(args.trans);
361
362         if ((flags & ATTR_KERNOTIME) == 0)
363                 xfs_trans_ichgtime(args.trans, dp, XFS_ICHGTIME_CHG);
364
365         /*
366          * Commit the last in the sequence of transactions.
367          */
368         xfs_trans_log_inode(args.trans, dp, XFS_ILOG_CORE);
369         error = xfs_trans_commit(args.trans);
370         xfs_iunlock(dp, XFS_ILOCK_EXCL);
371
372         return error;
373
374 out:
375         if (args.trans)
376                 xfs_trans_cancel(args.trans);
377         xfs_iunlock(dp, XFS_ILOCK_EXCL);
378         return error;
379 }
380
381 /*
382  * Generic handler routine to remove a name from an attribute list.
383  * Transitions attribute list from Btree to shortform as necessary.
384  */
385 int
386 xfs_attr_remove(
387         struct xfs_inode        *dp,
388         const unsigned char     *name,
389         int                     flags)
390 {
391         struct xfs_mount        *mp = dp->i_mount;
392         struct xfs_da_args      args;
393         struct xfs_defer_ops    dfops;
394         xfs_fsblock_t           firstblock;
395         int                     error;
396
397         XFS_STATS_INC(mp, xs_attr_remove);
398
399         if (XFS_FORCED_SHUTDOWN(dp->i_mount))
400                 return -EIO;
401
402         error = xfs_attr_args_init(&args, dp, name, flags);
403         if (error)
404                 return error;
405
406         args.firstblock = &firstblock;
407         args.dfops = &dfops;
408
409         /*
410          * we have no control over the attribute names that userspace passes us
411          * to remove, so we have to allow the name lookup prior to attribute
412          * removal to fail.
413          */
414         args.op_flags = XFS_DA_OP_OKNOENT;
415
416         error = xfs_qm_dqattach(dp, 0);
417         if (error)
418                 return error;
419
420         /*
421          * Root fork attributes can use reserved data blocks for this
422          * operation if necessary
423          */
424         error = xfs_trans_alloc(mp, &M_RES(mp)->tr_attrrm,
425                         XFS_ATTRRM_SPACE_RES(mp), 0,
426                         (flags & ATTR_ROOT) ? XFS_TRANS_RESERVE : 0,
427                         &args.trans);
428         if (error)
429                 return error;
430
431         xfs_ilock(dp, XFS_ILOCK_EXCL);
432         /*
433          * No need to make quota reservations here. We expect to release some
434          * blocks not allocate in the common case.
435          */
436         xfs_trans_ijoin(args.trans, dp, 0);
437
438         if (!xfs_inode_hasattr(dp)) {
439                 error = -ENOATTR;
440         } else if (dp->i_d.di_aformat == XFS_DINODE_FMT_LOCAL) {
441                 ASSERT(dp->i_afp->if_flags & XFS_IFINLINE);
442                 error = xfs_attr_shortform_remove(&args);
443         } else if (xfs_bmap_one_block(dp, XFS_ATTR_FORK)) {
444                 error = xfs_attr_leaf_removename(&args);
445         } else {
446                 error = xfs_attr_node_removename(&args);
447         }
448
449         if (error)
450                 goto out;
451
452         /*
453          * If this is a synchronous mount, make sure that the
454          * transaction goes to disk before returning to the user.
455          */
456         if (mp->m_flags & XFS_MOUNT_WSYNC)
457                 xfs_trans_set_sync(args.trans);
458
459         if ((flags & ATTR_KERNOTIME) == 0)
460                 xfs_trans_ichgtime(args.trans, dp, XFS_ICHGTIME_CHG);
461
462         /*
463          * Commit the last in the sequence of transactions.
464          */
465         xfs_trans_log_inode(args.trans, dp, XFS_ILOG_CORE);
466         error = xfs_trans_commit(args.trans);
467         xfs_iunlock(dp, XFS_ILOCK_EXCL);
468
469         return error;
470
471 out:
472         if (args.trans)
473                 xfs_trans_cancel(args.trans);
474         xfs_iunlock(dp, XFS_ILOCK_EXCL);
475         return error;
476 }
477
478 /*========================================================================
479  * External routines when attribute list is inside the inode
480  *========================================================================*/
481
482 /*
483  * Add a name to the shortform attribute list structure
484  * This is the external routine.
485  */
486 STATIC int
487 xfs_attr_shortform_addname(xfs_da_args_t *args)
488 {
489         int newsize, forkoff, retval;
490
491         trace_xfs_attr_sf_addname(args);
492
493         retval = xfs_attr_shortform_lookup(args);
494         if ((args->flags & ATTR_REPLACE) && (retval == -ENOATTR)) {
495                 return retval;
496         } else if (retval == -EEXIST) {
497                 if (args->flags & ATTR_CREATE)
498                         return retval;
499                 retval = xfs_attr_shortform_remove(args);
500                 ASSERT(retval == 0);
501         }
502
503         if (args->namelen >= XFS_ATTR_SF_ENTSIZE_MAX ||
504             args->valuelen >= XFS_ATTR_SF_ENTSIZE_MAX)
505                 return -ENOSPC;
506
507         newsize = XFS_ATTR_SF_TOTSIZE(args->dp);
508         newsize += XFS_ATTR_SF_ENTSIZE_BYNAME(args->namelen, args->valuelen);
509
510         forkoff = xfs_attr_shortform_bytesfit(args->dp, newsize);
511         if (!forkoff)
512                 return -ENOSPC;
513
514         xfs_attr_shortform_add(args, forkoff);
515         return 0;
516 }
517
518
519 /*========================================================================
520  * External routines when attribute list is one block
521  *========================================================================*/
522
523 /*
524  * Add a name to the leaf attribute list structure
525  *
526  * This leaf block cannot have a "remote" value, we only call this routine
527  * if bmap_one_block() says there is only one block (ie: no remote blks).
528  */
529 STATIC int
530 xfs_attr_leaf_addname(xfs_da_args_t *args)
531 {
532         xfs_inode_t *dp;
533         struct xfs_buf *bp;
534         int retval, error, forkoff;
535
536         trace_xfs_attr_leaf_addname(args);
537
538         /*
539          * Read the (only) block in the attribute list in.
540          */
541         dp = args->dp;
542         args->blkno = 0;
543         error = xfs_attr3_leaf_read(args->trans, args->dp, args->blkno, -1, &bp);
544         if (error)
545                 return error;
546
547         /*
548          * Look up the given attribute in the leaf block.  Figure out if
549          * the given flags produce an error or call for an atomic rename.
550          */
551         retval = xfs_attr3_leaf_lookup_int(bp, args);
552         if ((args->flags & ATTR_REPLACE) && (retval == -ENOATTR)) {
553                 xfs_trans_brelse(args->trans, bp);
554                 return retval;
555         } else if (retval == -EEXIST) {
556                 if (args->flags & ATTR_CREATE) {        /* pure create op */
557                         xfs_trans_brelse(args->trans, bp);
558                         return retval;
559                 }
560
561                 trace_xfs_attr_leaf_replace(args);
562
563                 /* save the attribute state for later removal*/
564                 args->op_flags |= XFS_DA_OP_RENAME;     /* an atomic rename */
565                 args->blkno2 = args->blkno;             /* set 2nd entry info*/
566                 args->index2 = args->index;
567                 args->rmtblkno2 = args->rmtblkno;
568                 args->rmtblkcnt2 = args->rmtblkcnt;
569                 args->rmtvaluelen2 = args->rmtvaluelen;
570
571                 /*
572                  * clear the remote attr state now that it is saved so that the
573                  * values reflect the state of the attribute we are about to
574                  * add, not the attribute we just found and will remove later.
575                  */
576                 args->rmtblkno = 0;
577                 args->rmtblkcnt = 0;
578                 args->rmtvaluelen = 0;
579         }
580
581         /*
582          * Add the attribute to the leaf block, transitioning to a Btree
583          * if required.
584          */
585         retval = xfs_attr3_leaf_add(bp, args);
586         if (retval == -ENOSPC) {
587                 /*
588                  * Promote the attribute list to the Btree format, then
589                  * Commit that transaction so that the node_addname() call
590                  * can manage its own transactions.
591                  */
592                 xfs_defer_init(args->dfops, args->firstblock);
593                 error = xfs_attr3_leaf_to_node(args);
594                 if (!error)
595                         error = xfs_defer_finish(&args->trans, args->dfops, dp);
596                 if (error) {
597                         args->trans = NULL;
598                         xfs_defer_cancel(args->dfops);
599                         return error;
600                 }
601
602                 /*
603                  * Commit the current trans (including the inode) and start
604                  * a new one.
605                  */
606                 error = xfs_trans_roll(&args->trans, dp);
607                 if (error)
608                         return error;
609
610                 /*
611                  * Fob the whole rest of the problem off on the Btree code.
612                  */
613                 error = xfs_attr_node_addname(args);
614                 return error;
615         }
616
617         /*
618          * Commit the transaction that added the attr name so that
619          * later routines can manage their own transactions.
620          */
621         error = xfs_trans_roll(&args->trans, dp);
622         if (error)
623                 return error;
624
625         /*
626          * If there was an out-of-line value, allocate the blocks we
627          * identified for its storage and copy the value.  This is done
628          * after we create the attribute so that we don't overflow the
629          * maximum size of a transaction and/or hit a deadlock.
630          */
631         if (args->rmtblkno > 0) {
632                 error = xfs_attr_rmtval_set(args);
633                 if (error)
634                         return error;
635         }
636
637         /*
638          * If this is an atomic rename operation, we must "flip" the
639          * incomplete flags on the "new" and "old" attribute/value pairs
640          * so that one disappears and one appears atomically.  Then we
641          * must remove the "old" attribute/value pair.
642          */
643         if (args->op_flags & XFS_DA_OP_RENAME) {
644                 /*
645                  * In a separate transaction, set the incomplete flag on the
646                  * "old" attr and clear the incomplete flag on the "new" attr.
647                  */
648                 error = xfs_attr3_leaf_flipflags(args);
649                 if (error)
650                         return error;
651
652                 /*
653                  * Dismantle the "old" attribute/value pair by removing
654                  * a "remote" value (if it exists).
655                  */
656                 args->index = args->index2;
657                 args->blkno = args->blkno2;
658                 args->rmtblkno = args->rmtblkno2;
659                 args->rmtblkcnt = args->rmtblkcnt2;
660                 args->rmtvaluelen = args->rmtvaluelen2;
661                 if (args->rmtblkno) {
662                         error = xfs_attr_rmtval_remove(args);
663                         if (error)
664                                 return error;
665                 }
666
667                 /*
668                  * Read in the block containing the "old" attr, then
669                  * remove the "old" attr from that block (neat, huh!)
670                  */
671                 error = xfs_attr3_leaf_read(args->trans, args->dp, args->blkno,
672                                            -1, &bp);
673                 if (error)
674                         return error;
675
676                 xfs_attr3_leaf_remove(bp, args);
677
678                 /*
679                  * If the result is small enough, shrink it all into the inode.
680                  */
681                 if ((forkoff = xfs_attr_shortform_allfit(bp, dp))) {
682                         xfs_defer_init(args->dfops, args->firstblock);
683                         error = xfs_attr3_leaf_to_shortform(bp, args, forkoff);
684                         /* bp is gone due to xfs_da_shrink_inode */
685                         if (!error)
686                                 error = xfs_defer_finish(&args->trans,
687                                                         args->dfops, dp);
688                         if (error) {
689                                 args->trans = NULL;
690                                 xfs_defer_cancel(args->dfops);
691                                 return error;
692                         }
693                 }
694
695                 /*
696                  * Commit the remove and start the next trans in series.
697                  */
698                 error = xfs_trans_roll(&args->trans, dp);
699
700         } else if (args->rmtblkno > 0) {
701                 /*
702                  * Added a "remote" value, just clear the incomplete flag.
703                  */
704                 error = xfs_attr3_leaf_clearflag(args);
705         }
706         return error;
707 }
708
709 /*
710  * Remove a name from the leaf attribute list structure
711  *
712  * This leaf block cannot have a "remote" value, we only call this routine
713  * if bmap_one_block() says there is only one block (ie: no remote blks).
714  */
715 STATIC int
716 xfs_attr_leaf_removename(xfs_da_args_t *args)
717 {
718         xfs_inode_t *dp;
719         struct xfs_buf *bp;
720         int error, forkoff;
721
722         trace_xfs_attr_leaf_removename(args);
723
724         /*
725          * Remove the attribute.
726          */
727         dp = args->dp;
728         args->blkno = 0;
729         error = xfs_attr3_leaf_read(args->trans, args->dp, args->blkno, -1, &bp);
730         if (error)
731                 return error;
732
733         error = xfs_attr3_leaf_lookup_int(bp, args);
734         if (error == -ENOATTR) {
735                 xfs_trans_brelse(args->trans, bp);
736                 return error;
737         }
738
739         xfs_attr3_leaf_remove(bp, args);
740
741         /*
742          * If the result is small enough, shrink it all into the inode.
743          */
744         if ((forkoff = xfs_attr_shortform_allfit(bp, dp))) {
745                 xfs_defer_init(args->dfops, args->firstblock);
746                 error = xfs_attr3_leaf_to_shortform(bp, args, forkoff);
747                 /* bp is gone due to xfs_da_shrink_inode */
748                 if (!error)
749                         error = xfs_defer_finish(&args->trans, args->dfops, dp);
750                 if (error) {
751                         args->trans = NULL;
752                         xfs_defer_cancel(args->dfops);
753                         return error;
754                 }
755         }
756         return 0;
757 }
758
759 /*
760  * Look up a name in a leaf attribute list structure.
761  *
762  * This leaf block cannot have a "remote" value, we only call this routine
763  * if bmap_one_block() says there is only one block (ie: no remote blks).
764  */
765 STATIC int
766 xfs_attr_leaf_get(xfs_da_args_t *args)
767 {
768         struct xfs_buf *bp;
769         int error;
770
771         trace_xfs_attr_leaf_get(args);
772
773         args->blkno = 0;
774         error = xfs_attr3_leaf_read(args->trans, args->dp, args->blkno, -1, &bp);
775         if (error)
776                 return error;
777
778         error = xfs_attr3_leaf_lookup_int(bp, args);
779         if (error != -EEXIST)  {
780                 xfs_trans_brelse(args->trans, bp);
781                 return error;
782         }
783         error = xfs_attr3_leaf_getvalue(bp, args);
784         xfs_trans_brelse(args->trans, bp);
785         if (!error && (args->rmtblkno > 0) && !(args->flags & ATTR_KERNOVAL)) {
786                 error = xfs_attr_rmtval_get(args);
787         }
788         return error;
789 }
790
791 /*========================================================================
792  * External routines when attribute list size > geo->blksize
793  *========================================================================*/
794
795 /*
796  * Add a name to a Btree-format attribute list.
797  *
798  * This will involve walking down the Btree, and may involve splitting
799  * leaf nodes and even splitting intermediate nodes up to and including
800  * the root node (a special case of an intermediate node).
801  *
802  * "Remote" attribute values confuse the issue and atomic rename operations
803  * add a whole extra layer of confusion on top of that.
804  */
805 STATIC int
806 xfs_attr_node_addname(xfs_da_args_t *args)
807 {
808         xfs_da_state_t *state;
809         xfs_da_state_blk_t *blk;
810         xfs_inode_t *dp;
811         xfs_mount_t *mp;
812         int retval, error;
813
814         trace_xfs_attr_node_addname(args);
815
816         /*
817          * Fill in bucket of arguments/results/context to carry around.
818          */
819         dp = args->dp;
820         mp = dp->i_mount;
821 restart:
822         state = xfs_da_state_alloc();
823         state->args = args;
824         state->mp = mp;
825
826         /*
827          * Search to see if name already exists, and get back a pointer
828          * to where it should go.
829          */
830         error = xfs_da3_node_lookup_int(state, &retval);
831         if (error)
832                 goto out;
833         blk = &state->path.blk[ state->path.active-1 ];
834         ASSERT(blk->magic == XFS_ATTR_LEAF_MAGIC);
835         if ((args->flags & ATTR_REPLACE) && (retval == -ENOATTR)) {
836                 goto out;
837         } else if (retval == -EEXIST) {
838                 if (args->flags & ATTR_CREATE)
839                         goto out;
840
841                 trace_xfs_attr_node_replace(args);
842
843                 /* save the attribute state for later removal*/
844                 args->op_flags |= XFS_DA_OP_RENAME;     /* atomic rename op */
845                 args->blkno2 = args->blkno;             /* set 2nd entry info*/
846                 args->index2 = args->index;
847                 args->rmtblkno2 = args->rmtblkno;
848                 args->rmtblkcnt2 = args->rmtblkcnt;
849                 args->rmtvaluelen2 = args->rmtvaluelen;
850
851                 /*
852                  * clear the remote attr state now that it is saved so that the
853                  * values reflect the state of the attribute we are about to
854                  * add, not the attribute we just found and will remove later.
855                  */
856                 args->rmtblkno = 0;
857                 args->rmtblkcnt = 0;
858                 args->rmtvaluelen = 0;
859         }
860
861         retval = xfs_attr3_leaf_add(blk->bp, state->args);
862         if (retval == -ENOSPC) {
863                 if (state->path.active == 1) {
864                         /*
865                          * Its really a single leaf node, but it had
866                          * out-of-line values so it looked like it *might*
867                          * have been a b-tree.
868                          */
869                         xfs_da_state_free(state);
870                         state = NULL;
871                         xfs_defer_init(args->dfops, args->firstblock);
872                         error = xfs_attr3_leaf_to_node(args);
873                         if (!error)
874                                 error = xfs_defer_finish(&args->trans,
875                                                         args->dfops, dp);
876                         if (error) {
877                                 args->trans = NULL;
878                                 xfs_defer_cancel(args->dfops);
879                                 goto out;
880                         }
881
882                         /*
883                          * Commit the node conversion and start the next
884                          * trans in the chain.
885                          */
886                         error = xfs_trans_roll(&args->trans, dp);
887                         if (error)
888                                 goto out;
889
890                         goto restart;
891                 }
892
893                 /*
894                  * Split as many Btree elements as required.
895                  * This code tracks the new and old attr's location
896                  * in the index/blkno/rmtblkno/rmtblkcnt fields and
897                  * in the index2/blkno2/rmtblkno2/rmtblkcnt2 fields.
898                  */
899                 xfs_defer_init(args->dfops, args->firstblock);
900                 error = xfs_da3_split(state);
901                 if (!error)
902                         error = xfs_defer_finish(&args->trans, args->dfops, dp);
903                 if (error) {
904                         args->trans = NULL;
905                         xfs_defer_cancel(args->dfops);
906                         goto out;
907                 }
908         } else {
909                 /*
910                  * Addition succeeded, update Btree hashvals.
911                  */
912                 xfs_da3_fixhashpath(state, &state->path);
913         }
914
915         /*
916          * Kill the state structure, we're done with it and need to
917          * allow the buffers to come back later.
918          */
919         xfs_da_state_free(state);
920         state = NULL;
921
922         /*
923          * Commit the leaf addition or btree split and start the next
924          * trans in the chain.
925          */
926         error = xfs_trans_roll(&args->trans, dp);
927         if (error)
928                 goto out;
929
930         /*
931          * If there was an out-of-line value, allocate the blocks we
932          * identified for its storage and copy the value.  This is done
933          * after we create the attribute so that we don't overflow the
934          * maximum size of a transaction and/or hit a deadlock.
935          */
936         if (args->rmtblkno > 0) {
937                 error = xfs_attr_rmtval_set(args);
938                 if (error)
939                         return error;
940         }
941
942         /*
943          * If this is an atomic rename operation, we must "flip" the
944          * incomplete flags on the "new" and "old" attribute/value pairs
945          * so that one disappears and one appears atomically.  Then we
946          * must remove the "old" attribute/value pair.
947          */
948         if (args->op_flags & XFS_DA_OP_RENAME) {
949                 /*
950                  * In a separate transaction, set the incomplete flag on the
951                  * "old" attr and clear the incomplete flag on the "new" attr.
952                  */
953                 error = xfs_attr3_leaf_flipflags(args);
954                 if (error)
955                         goto out;
956
957                 /*
958                  * Dismantle the "old" attribute/value pair by removing
959                  * a "remote" value (if it exists).
960                  */
961                 args->index = args->index2;
962                 args->blkno = args->blkno2;
963                 args->rmtblkno = args->rmtblkno2;
964                 args->rmtblkcnt = args->rmtblkcnt2;
965                 args->rmtvaluelen = args->rmtvaluelen2;
966                 if (args->rmtblkno) {
967                         error = xfs_attr_rmtval_remove(args);
968                         if (error)
969                                 return error;
970                 }
971
972                 /*
973                  * Re-find the "old" attribute entry after any split ops.
974                  * The INCOMPLETE flag means that we will find the "old"
975                  * attr, not the "new" one.
976                  */
977                 args->flags |= XFS_ATTR_INCOMPLETE;
978                 state = xfs_da_state_alloc();
979                 state->args = args;
980                 state->mp = mp;
981                 state->inleaf = 0;
982                 error = xfs_da3_node_lookup_int(state, &retval);
983                 if (error)
984                         goto out;
985
986                 /*
987                  * Remove the name and update the hashvals in the tree.
988                  */
989                 blk = &state->path.blk[ state->path.active-1 ];
990                 ASSERT(blk->magic == XFS_ATTR_LEAF_MAGIC);
991                 error = xfs_attr3_leaf_remove(blk->bp, args);
992                 xfs_da3_fixhashpath(state, &state->path);
993
994                 /*
995                  * Check to see if the tree needs to be collapsed.
996                  */
997                 if (retval && (state->path.active > 1)) {
998                         xfs_defer_init(args->dfops, args->firstblock);
999                         error = xfs_da3_join(state);
1000                         if (!error)
1001                                 error = xfs_defer_finish(&args->trans,
1002                                                         args->dfops, dp);
1003                         if (error) {
1004                                 args->trans = NULL;
1005                                 xfs_defer_cancel(args->dfops);
1006                                 goto out;
1007                         }
1008                 }
1009
1010                 /*
1011                  * Commit and start the next trans in the chain.
1012                  */
1013                 error = xfs_trans_roll(&args->trans, dp);
1014                 if (error)
1015                         goto out;
1016
1017         } else if (args->rmtblkno > 0) {
1018                 /*
1019                  * Added a "remote" value, just clear the incomplete flag.
1020                  */
1021                 error = xfs_attr3_leaf_clearflag(args);
1022                 if (error)
1023                         goto out;
1024         }
1025         retval = error = 0;
1026
1027 out:
1028         if (state)
1029                 xfs_da_state_free(state);
1030         if (error)
1031                 return error;
1032         return retval;
1033 }
1034
1035 /*
1036  * Remove a name from a B-tree attribute list.
1037  *
1038  * This will involve walking down the Btree, and may involve joining
1039  * leaf nodes and even joining intermediate nodes up to and including
1040  * the root node (a special case of an intermediate node).
1041  */
1042 STATIC int
1043 xfs_attr_node_removename(xfs_da_args_t *args)
1044 {
1045         xfs_da_state_t *state;
1046         xfs_da_state_blk_t *blk;
1047         xfs_inode_t *dp;
1048         struct xfs_buf *bp;
1049         int retval, error, forkoff;
1050
1051         trace_xfs_attr_node_removename(args);
1052
1053         /*
1054          * Tie a string around our finger to remind us where we are.
1055          */
1056         dp = args->dp;
1057         state = xfs_da_state_alloc();
1058         state->args = args;
1059         state->mp = dp->i_mount;
1060
1061         /*
1062          * Search to see if name exists, and get back a pointer to it.
1063          */
1064         error = xfs_da3_node_lookup_int(state, &retval);
1065         if (error || (retval != -EEXIST)) {
1066                 if (error == 0)
1067                         error = retval;
1068                 goto out;
1069         }
1070
1071         /*
1072          * If there is an out-of-line value, de-allocate the blocks.
1073          * This is done before we remove the attribute so that we don't
1074          * overflow the maximum size of a transaction and/or hit a deadlock.
1075          */
1076         blk = &state->path.blk[ state->path.active-1 ];
1077         ASSERT(blk->bp != NULL);
1078         ASSERT(blk->magic == XFS_ATTR_LEAF_MAGIC);
1079         if (args->rmtblkno > 0) {
1080                 /*
1081                  * Fill in disk block numbers in the state structure
1082                  * so that we can get the buffers back after we commit
1083                  * several transactions in the following calls.
1084                  */
1085                 error = xfs_attr_fillstate(state);
1086                 if (error)
1087                         goto out;
1088
1089                 /*
1090                  * Mark the attribute as INCOMPLETE, then bunmapi() the
1091                  * remote value.
1092                  */
1093                 error = xfs_attr3_leaf_setflag(args);
1094                 if (error)
1095                         goto out;
1096                 error = xfs_attr_rmtval_remove(args);
1097                 if (error)
1098                         goto out;
1099
1100                 /*
1101                  * Refill the state structure with buffers, the prior calls
1102                  * released our buffers.
1103                  */
1104                 error = xfs_attr_refillstate(state);
1105                 if (error)
1106                         goto out;
1107         }
1108
1109         /*
1110          * Remove the name and update the hashvals in the tree.
1111          */
1112         blk = &state->path.blk[ state->path.active-1 ];
1113         ASSERT(blk->magic == XFS_ATTR_LEAF_MAGIC);
1114         retval = xfs_attr3_leaf_remove(blk->bp, args);
1115         xfs_da3_fixhashpath(state, &state->path);
1116
1117         /*
1118          * Check to see if the tree needs to be collapsed.
1119          */
1120         if (retval && (state->path.active > 1)) {
1121                 xfs_defer_init(args->dfops, args->firstblock);
1122                 error = xfs_da3_join(state);
1123                 if (!error)
1124                         error = xfs_defer_finish(&args->trans, args->dfops, dp);
1125                 if (error) {
1126                         args->trans = NULL;
1127                         xfs_defer_cancel(args->dfops);
1128                         goto out;
1129                 }
1130                 /*
1131                  * Commit the Btree join operation and start a new trans.
1132                  */
1133                 error = xfs_trans_roll(&args->trans, dp);
1134                 if (error)
1135                         goto out;
1136         }
1137
1138         /*
1139          * If the result is small enough, push it all into the inode.
1140          */
1141         if (xfs_bmap_one_block(dp, XFS_ATTR_FORK)) {
1142                 /*
1143                  * Have to get rid of the copy of this dabuf in the state.
1144                  */
1145                 ASSERT(state->path.active == 1);
1146                 ASSERT(state->path.blk[0].bp);
1147                 state->path.blk[0].bp = NULL;
1148
1149                 error = xfs_attr3_leaf_read(args->trans, args->dp, 0, -1, &bp);
1150                 if (error)
1151                         goto out;
1152
1153                 if ((forkoff = xfs_attr_shortform_allfit(bp, dp))) {
1154                         xfs_defer_init(args->dfops, args->firstblock);
1155                         error = xfs_attr3_leaf_to_shortform(bp, args, forkoff);
1156                         /* bp is gone due to xfs_da_shrink_inode */
1157                         if (!error)
1158                                 error = xfs_defer_finish(&args->trans,
1159                                                         args->dfops, dp);
1160                         if (error) {
1161                                 args->trans = NULL;
1162                                 xfs_defer_cancel(args->dfops);
1163                                 goto out;
1164                         }
1165                 } else
1166                         xfs_trans_brelse(args->trans, bp);
1167         }
1168         error = 0;
1169
1170 out:
1171         xfs_da_state_free(state);
1172         return error;
1173 }
1174
1175 /*
1176  * Fill in the disk block numbers in the state structure for the buffers
1177  * that are attached to the state structure.
1178  * This is done so that we can quickly reattach ourselves to those buffers
1179  * after some set of transaction commits have released these buffers.
1180  */
1181 STATIC int
1182 xfs_attr_fillstate(xfs_da_state_t *state)
1183 {
1184         xfs_da_state_path_t *path;
1185         xfs_da_state_blk_t *blk;
1186         int level;
1187
1188         trace_xfs_attr_fillstate(state->args);
1189
1190         /*
1191          * Roll down the "path" in the state structure, storing the on-disk
1192          * block number for those buffers in the "path".
1193          */
1194         path = &state->path;
1195         ASSERT((path->active >= 0) && (path->active < XFS_DA_NODE_MAXDEPTH));
1196         for (blk = path->blk, level = 0; level < path->active; blk++, level++) {
1197                 if (blk->bp) {
1198                         blk->disk_blkno = XFS_BUF_ADDR(blk->bp);
1199                         blk->bp = NULL;
1200                 } else {
1201                         blk->disk_blkno = 0;
1202                 }
1203         }
1204
1205         /*
1206          * Roll down the "altpath" in the state structure, storing the on-disk
1207          * block number for those buffers in the "altpath".
1208          */
1209         path = &state->altpath;
1210         ASSERT((path->active >= 0) && (path->active < XFS_DA_NODE_MAXDEPTH));
1211         for (blk = path->blk, level = 0; level < path->active; blk++, level++) {
1212                 if (blk->bp) {
1213                         blk->disk_blkno = XFS_BUF_ADDR(blk->bp);
1214                         blk->bp = NULL;
1215                 } else {
1216                         blk->disk_blkno = 0;
1217                 }
1218         }
1219
1220         return 0;
1221 }
1222
1223 /*
1224  * Reattach the buffers to the state structure based on the disk block
1225  * numbers stored in the state structure.
1226  * This is done after some set of transaction commits have released those
1227  * buffers from our grip.
1228  */
1229 STATIC int
1230 xfs_attr_refillstate(xfs_da_state_t *state)
1231 {
1232         xfs_da_state_path_t *path;
1233         xfs_da_state_blk_t *blk;
1234         int level, error;
1235
1236         trace_xfs_attr_refillstate(state->args);
1237
1238         /*
1239          * Roll down the "path" in the state structure, storing the on-disk
1240          * block number for those buffers in the "path".
1241          */
1242         path = &state->path;
1243         ASSERT((path->active >= 0) && (path->active < XFS_DA_NODE_MAXDEPTH));
1244         for (blk = path->blk, level = 0; level < path->active; blk++, level++) {
1245                 if (blk->disk_blkno) {
1246                         error = xfs_da3_node_read(state->args->trans,
1247                                                 state->args->dp,
1248                                                 blk->blkno, blk->disk_blkno,
1249                                                 &blk->bp, XFS_ATTR_FORK);
1250                         if (error)
1251                                 return error;
1252                 } else {
1253                         blk->bp = NULL;
1254                 }
1255         }
1256
1257         /*
1258          * Roll down the "altpath" in the state structure, storing the on-disk
1259          * block number for those buffers in the "altpath".
1260          */
1261         path = &state->altpath;
1262         ASSERT((path->active >= 0) && (path->active < XFS_DA_NODE_MAXDEPTH));
1263         for (blk = path->blk, level = 0; level < path->active; blk++, level++) {
1264                 if (blk->disk_blkno) {
1265                         error = xfs_da3_node_read(state->args->trans,
1266                                                 state->args->dp,
1267                                                 blk->blkno, blk->disk_blkno,
1268                                                 &blk->bp, XFS_ATTR_FORK);
1269                         if (error)
1270                                 return error;
1271                 } else {
1272                         blk->bp = NULL;
1273                 }
1274         }
1275
1276         return 0;
1277 }
1278
1279 /*
1280  * Look up a filename in a node attribute list.
1281  *
1282  * This routine gets called for any attribute fork that has more than one
1283  * block, ie: both true Btree attr lists and for single-leaf-blocks with
1284  * "remote" values taking up more blocks.
1285  */
1286 STATIC int
1287 xfs_attr_node_get(xfs_da_args_t *args)
1288 {
1289         xfs_da_state_t *state;
1290         xfs_da_state_blk_t *blk;
1291         int error, retval;
1292         int i;
1293
1294         trace_xfs_attr_node_get(args);
1295
1296         state = xfs_da_state_alloc();
1297         state->args = args;
1298         state->mp = args->dp->i_mount;
1299
1300         /*
1301          * Search to see if name exists, and get back a pointer to it.
1302          */
1303         error = xfs_da3_node_lookup_int(state, &retval);
1304         if (error) {
1305                 retval = error;
1306         } else if (retval == -EEXIST) {
1307                 blk = &state->path.blk[ state->path.active-1 ];
1308                 ASSERT(blk->bp != NULL);
1309                 ASSERT(blk->magic == XFS_ATTR_LEAF_MAGIC);
1310
1311                 /*
1312                  * Get the value, local or "remote"
1313                  */
1314                 retval = xfs_attr3_leaf_getvalue(blk->bp, args);
1315                 if (!retval && (args->rmtblkno > 0)
1316                     && !(args->flags & ATTR_KERNOVAL)) {
1317                         retval = xfs_attr_rmtval_get(args);
1318                 }
1319         }
1320
1321         /*
1322          * If not in a transaction, we have to release all the buffers.
1323          */
1324         for (i = 0; i < state->path.active; i++) {
1325                 xfs_trans_brelse(args->trans, state->path.blk[i].bp);
1326                 state->path.blk[i].bp = NULL;
1327         }
1328
1329         xfs_da_state_free(state);
1330         return retval;
1331 }