[XFS] Initial pass at going directly-to-bio on the buffered IO path. This
[linux-2.6-microblaze.git] / fs / xfs / linux-2.6 / xfs_linux.h
1 /*
2  * Copyright (c) 2000-2005 Silicon Graphics, Inc.
3  * All Rights Reserved.
4  *
5  * This program is free software; you can redistribute it and/or
6  * modify it under the terms of the GNU General Public License as
7  * published by the Free Software Foundation.
8  *
9  * This program is distributed in the hope that it would be useful,
10  * but WITHOUT ANY WARRANTY; without even the implied warranty of
11  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12  * GNU General Public License for more details.
13  *
14  * You should have received a copy of the GNU General Public License
15  * along with this program; if not, write the Free Software Foundation,
16  * Inc.,  51 Franklin St, Fifth Floor, Boston, MA  02110-1301  USA
17  */
18 #ifndef __XFS_LINUX__
19 #define __XFS_LINUX__
20
21 #include <linux/types.h>
22 #include <linux/config.h>
23
24 /*
25  * Some types are conditional depending on the target system.
26  * XFS_BIG_BLKNOS needs block layer disk addresses to be 64 bits.
27  * XFS_BIG_INUMS needs the VFS inode number to be 64 bits, as well
28  * as requiring XFS_BIG_BLKNOS to be set.
29  */
30 #if defined(CONFIG_LBD) || (BITS_PER_LONG == 64)
31 # define XFS_BIG_BLKNOS 1
32 # if BITS_PER_LONG == 64
33 #  define XFS_BIG_INUMS 1
34 # else
35 #  define XFS_BIG_INUMS 0
36 # endif
37 #else
38 # define XFS_BIG_BLKNOS 0
39 # define XFS_BIG_INUMS  0
40 #endif
41
42 #include <xfs_types.h>
43 #include <xfs_arch.h>
44
45 #include <kmem.h>
46 #include <mrlock.h>
47 #include <spin.h>
48 #include <sv.h>
49 #include <mutex.h>
50 #include <sema.h>
51 #include <time.h>
52
53 #include <support/ktrace.h>
54 #include <support/debug.h>
55 #include <support/move.h>
56 #include <support/uuid.h>
57
58 #include <linux/mm.h>
59 #include <linux/kernel.h>
60 #include <linux/blkdev.h>
61 #include <linux/slab.h>
62 #include <linux/module.h>
63 #include <linux/file.h>
64 #include <linux/swap.h>
65 #include <linux/errno.h>
66 #include <linux/sched.h>
67 #include <linux/bitops.h>
68 #include <linux/major.h>
69 #include <linux/pagemap.h>
70 #include <linux/vfs.h>
71 #include <linux/seq_file.h>
72 #include <linux/init.h>
73 #include <linux/list.h>
74 #include <linux/proc_fs.h>
75 #include <linux/sort.h>
76
77 #include <asm/page.h>
78 #include <asm/div64.h>
79 #include <asm/param.h>
80 #include <asm/uaccess.h>
81 #include <asm/byteorder.h>
82 #include <asm/unaligned.h>
83
84 #include <xfs_behavior.h>
85 #include <xfs_vfs.h>
86 #include <xfs_cred.h>
87 #include <xfs_vnode.h>
88 #include <xfs_stats.h>
89 #include <xfs_sysctl.h>
90 #include <xfs_iops.h>
91 #include <xfs_aops.h>
92 #include <xfs_super.h>
93 #include <xfs_globals.h>
94 #include <xfs_fs_subr.h>
95 #include <xfs_lrw.h>
96 #include <xfs_buf.h>
97
98 /*
99  * Feature macros (disable/enable)
100  */
101 #undef  HAVE_REFCACHE   /* reference cache not needed for NFS in 2.6 */
102 #define HAVE_SENDFILE   /* sendfile(2) exists in 2.6, but not in 2.4 */
103
104 /*
105  * State flag for unwritten extent buffers.
106  *
107  * We need to be able to distinguish between these and delayed
108  * allocate buffers within XFS.  The generic IO path code does
109  * not need to distinguish - we use the BH_Delay flag for both
110  * delalloc and these ondisk-uninitialised buffers.
111  */
112 BUFFER_FNS(PrivateStart, unwritten);
113
114 #define restricted_chown        xfs_params.restrict_chown.val
115 #define irix_sgid_inherit       xfs_params.sgid_inherit.val
116 #define irix_symlink_mode       xfs_params.symlink_mode.val
117 #define xfs_panic_mask          xfs_params.panic_mask.val
118 #define xfs_error_level         xfs_params.error_level.val
119 #define xfs_syncd_centisecs     xfs_params.syncd_timer.val
120 #define xfs_stats_clear         xfs_params.stats_clear.val
121 #define xfs_inherit_sync        xfs_params.inherit_sync.val
122 #define xfs_inherit_nodump      xfs_params.inherit_nodump.val
123 #define xfs_inherit_noatime     xfs_params.inherit_noatim.val
124 #define xfs_buf_timer_centisecs xfs_params.xfs_buf_timer.val
125 #define xfs_buf_age_centisecs   xfs_params.xfs_buf_age.val
126 #define xfs_inherit_nosymlinks  xfs_params.inherit_nosym.val
127 #define xfs_rotorstep           xfs_params.rotorstep.val
128
129 #ifndef raw_smp_processor_id
130 #define raw_smp_processor_id()  smp_processor_id()
131 #endif
132 #define current_cpu()           raw_smp_processor_id()
133 #define current_pid()           (current->pid)
134 #define current_fsuid(cred)     (current->fsuid)
135 #define current_fsgid(cred)     (current->fsgid)
136
137 #define NBPP            PAGE_SIZE
138 #define DPPSHFT         (PAGE_SHIFT - 9)
139 #define NDPP            (1 << (PAGE_SHIFT - 9))
140 #define dtop(DD)        (((DD) + NDPP - 1) >> DPPSHFT)
141 #define dtopt(DD)       ((DD) >> DPPSHFT)
142 #define dpoff(DD)       ((DD) & (NDPP-1))
143
144 #define NBBY            8               /* number of bits per byte */
145 #define NBPC            PAGE_SIZE       /* Number of bytes per click */
146 #define BPCSHIFT        PAGE_SHIFT      /* LOG2(NBPC) if exact */
147
148 /*
149  * Size of block device i/o is parameterized here.
150  * Currently the system supports page-sized i/o.
151  */
152 #define BLKDEV_IOSHIFT          BPCSHIFT
153 #define BLKDEV_IOSIZE           (1<<BLKDEV_IOSHIFT)
154 /* number of BB's per block device block */
155 #define BLKDEV_BB               BTOBB(BLKDEV_IOSIZE)
156
157 /* bytes to clicks */
158 #define btoc(x)         (((__psunsigned_t)(x)+(NBPC-1))>>BPCSHIFT)
159 #define btoct(x)        ((__psunsigned_t)(x)>>BPCSHIFT)
160 #define btoc64(x)       (((__uint64_t)(x)+(NBPC-1))>>BPCSHIFT)
161 #define btoct64(x)      ((__uint64_t)(x)>>BPCSHIFT)
162 #define io_btoc(x)      (((__psunsigned_t)(x)+(IO_NBPC-1))>>IO_BPCSHIFT)
163 #define io_btoct(x)     ((__psunsigned_t)(x)>>IO_BPCSHIFT)
164
165 /* off_t bytes to clicks */
166 #define offtoc(x)       (((__uint64_t)(x)+(NBPC-1))>>BPCSHIFT)
167 #define offtoct(x)      ((xfs_off_t)(x)>>BPCSHIFT)
168
169 /* clicks to off_t bytes */
170 #define ctooff(x)       ((xfs_off_t)(x)<<BPCSHIFT)
171
172 /* clicks to bytes */
173 #define ctob(x)         ((__psunsigned_t)(x)<<BPCSHIFT)
174 #define btoct(x)        ((__psunsigned_t)(x)>>BPCSHIFT)
175 #define ctob64(x)       ((__uint64_t)(x)<<BPCSHIFT)
176 #define io_ctob(x)      ((__psunsigned_t)(x)<<IO_BPCSHIFT)
177
178 /* bytes to clicks */
179 #define btoc(x)         (((__psunsigned_t)(x)+(NBPC-1))>>BPCSHIFT)
180
181 #ifndef ENOATTR
182 #define ENOATTR         ENODATA         /* Attribute not found */
183 #endif
184
185 /* Note: EWRONGFS never visible outside the kernel */
186 #define EWRONGFS        EINVAL          /* Mount with wrong filesystem type */
187
188 /*
189  * XXX EFSCORRUPTED needs a real value in errno.h. asm-i386/errno.h won't
190  *     return codes out of its known range in errno.
191  * XXX Also note: needs to be < 1000 and fairly unique on Linux (mustn't
192  *     conflict with any code we use already or any code a driver may use)
193  * XXX Some options (currently we do #2):
194  *      1/ New error code ["Filesystem is corrupted", _after_ glibc updated]
195  *      2/ 990 ["Unknown error 990"]
196  *      3/ EUCLEAN ["Structure needs cleaning"]
197  *      4/ Convert EFSCORRUPTED to EIO [just prior to return into userspace]
198  */
199 #define EFSCORRUPTED    990             /* Filesystem is corrupted */
200
201 #define SYNCHRONIZE()   barrier()
202 #define __return_address __builtin_return_address(0)
203
204 /*
205  * IRIX (BSD) quotactl makes use of separate commands for user/group,
206  * whereas on Linux the syscall encodes this information into the cmd
207  * field (see the QCMD macro in quota.h).  These macros help keep the
208  * code portable - they are not visible from the syscall interface.
209  */
210 #define Q_XSETGQLIM     XQM_CMD(8)      /* set groups disk limits */
211 #define Q_XGETGQUOTA    XQM_CMD(9)      /* get groups disk limits */
212 #define Q_XSETPQLIM     XQM_CMD(10)     /* set projects disk limits */
213 #define Q_XGETPQUOTA    XQM_CMD(11)     /* get projects disk limits */
214
215 #define dfltprid        0
216 #define MAXPATHLEN      1024
217
218 #define MIN(a,b)        (min(a,b))
219 #define MAX(a,b)        (max(a,b))
220 #define howmany(x, y)   (((x)+((y)-1))/(y))
221 #define roundup(x, y)   ((((x)+((y)-1))/(y))*(y))
222
223 /*
224  * Various platform dependent calls that don't fit anywhere else
225  */
226 #define xfs_sort(a,n,s,fn)      sort(a,n,s,fn,NULL)
227 #define xfs_stack_trace()       dump_stack()
228 #define xfs_itruncate_data(ip, off)     \
229         (-vmtruncate(LINVFS_GET_IP(XFS_ITOV(ip)), (off)))
230 #define xfs_statvfs_fsid(statp, mp)     \
231         ({ u64 id = huge_encode_dev((mp)->m_ddev_targp->bt_dev); \
232            __kernel_fsid_t *fsid = &(statp)->f_fsid;    \
233         (fsid->val[0] = (u32)id, fsid->val[1] = (u32)(id >> 32)); })
234
235
236 /* Move the kernel do_div definition off to one side */
237
238 #if defined __i386__
239 /* For ia32 we need to pull some tricks to get past various versions
240  * of the compiler which do not like us using do_div in the middle
241  * of large functions.
242  */
243 static inline __u32 xfs_do_div(void *a, __u32 b, int n)
244 {
245         __u32   mod;
246
247         switch (n) {
248                 case 4:
249                         mod = *(__u32 *)a % b;
250                         *(__u32 *)a = *(__u32 *)a / b;
251                         return mod;
252                 case 8:
253                         {
254                         unsigned long __upper, __low, __high, __mod;
255                         __u64   c = *(__u64 *)a;
256                         __upper = __high = c >> 32;
257                         __low = c;
258                         if (__high) {
259                                 __upper = __high % (b);
260                                 __high = __high / (b);
261                         }
262                         asm("divl %2":"=a" (__low), "=d" (__mod):"rm" (b), "0" (__low), "1" (__upper));
263                         asm("":"=A" (c):"a" (__low),"d" (__high));
264                         *(__u64 *)a = c;
265                         return __mod;
266                         }
267         }
268
269         /* NOTREACHED */
270         return 0;
271 }
272
273 /* Side effect free 64 bit mod operation */
274 static inline __u32 xfs_do_mod(void *a, __u32 b, int n)
275 {
276         switch (n) {
277                 case 4:
278                         return *(__u32 *)a % b;
279                 case 8:
280                         {
281                         unsigned long __upper, __low, __high, __mod;
282                         __u64   c = *(__u64 *)a;
283                         __upper = __high = c >> 32;
284                         __low = c;
285                         if (__high) {
286                                 __upper = __high % (b);
287                                 __high = __high / (b);
288                         }
289                         asm("divl %2":"=a" (__low), "=d" (__mod):"rm" (b), "0" (__low), "1" (__upper));
290                         asm("":"=A" (c):"a" (__low),"d" (__high));
291                         return __mod;
292                         }
293         }
294
295         /* NOTREACHED */
296         return 0;
297 }
298 #else
299 static inline __u32 xfs_do_div(void *a, __u32 b, int n)
300 {
301         __u32   mod;
302
303         switch (n) {
304                 case 4:
305                         mod = *(__u32 *)a % b;
306                         *(__u32 *)a = *(__u32 *)a / b;
307                         return mod;
308                 case 8:
309                         mod = do_div(*(__u64 *)a, b);
310                         return mod;
311         }
312
313         /* NOTREACHED */
314         return 0;
315 }
316
317 /* Side effect free 64 bit mod operation */
318 static inline __u32 xfs_do_mod(void *a, __u32 b, int n)
319 {
320         switch (n) {
321                 case 4:
322                         return *(__u32 *)a % b;
323                 case 8:
324                         {
325                         __u64   c = *(__u64 *)a;
326                         return do_div(c, b);
327                         }
328         }
329
330         /* NOTREACHED */
331         return 0;
332 }
333 #endif
334
335 #undef do_div
336 #define do_div(a, b)    xfs_do_div(&(a), (b), sizeof(a))
337 #define do_mod(a, b)    xfs_do_mod(&(a), (b), sizeof(a))
338
339 static inline __uint64_t roundup_64(__uint64_t x, __uint32_t y)
340 {
341         x += y - 1;
342         do_div(x, y);
343         return(x * y);
344 }
345
346 #endif /* __XFS_LINUX__ */