riscv: Fix accessing pfn bits in PTEs for non-32bit variants
[linux-2.6-microblaze.git] / arch / riscv / include / asm / pgtable.h
1 /* SPDX-License-Identifier: GPL-2.0-only */
2 /*
3  * Copyright (C) 2012 Regents of the University of California
4  */
5
6 #ifndef _ASM_RISCV_PGTABLE_H
7 #define _ASM_RISCV_PGTABLE_H
8
9 #include <linux/mmzone.h>
10 #include <linux/sizes.h>
11
12 #include <asm/pgtable-bits.h>
13
14 #ifndef CONFIG_MMU
15 #define KERNEL_LINK_ADDR        PAGE_OFFSET
16 #define KERN_VIRT_SIZE          (UL(-1))
17 #else
18
19 #define ADDRESS_SPACE_END       (UL(-1))
20
21 #ifdef CONFIG_64BIT
22 /* Leave 2GB for kernel and BPF at the end of the address space */
23 #define KERNEL_LINK_ADDR        (ADDRESS_SPACE_END - SZ_2G + 1)
24 #else
25 #define KERNEL_LINK_ADDR        PAGE_OFFSET
26 #endif
27
28 /* Number of entries in the page global directory */
29 #define PTRS_PER_PGD    (PAGE_SIZE / sizeof(pgd_t))
30 /* Number of entries in the page table */
31 #define PTRS_PER_PTE    (PAGE_SIZE / sizeof(pte_t))
32
33 /*
34  * Half of the kernel address space (half of the entries of the page global
35  * directory) is for the direct mapping.
36  */
37 #define KERN_VIRT_SIZE          ((PTRS_PER_PGD / 2 * PGDIR_SIZE) / 2)
38
39 #define VMALLOC_SIZE     (KERN_VIRT_SIZE >> 1)
40 #define VMALLOC_END      PAGE_OFFSET
41 #define VMALLOC_START    (PAGE_OFFSET - VMALLOC_SIZE)
42
43 #define BPF_JIT_REGION_SIZE     (SZ_128M)
44 #ifdef CONFIG_64BIT
45 #define BPF_JIT_REGION_START    (BPF_JIT_REGION_END - BPF_JIT_REGION_SIZE)
46 #define BPF_JIT_REGION_END      (MODULES_END)
47 #else
48 #define BPF_JIT_REGION_START    (PAGE_OFFSET - BPF_JIT_REGION_SIZE)
49 #define BPF_JIT_REGION_END      (VMALLOC_END)
50 #endif
51
52 /* Modules always live before the kernel */
53 #ifdef CONFIG_64BIT
54 /* This is used to define the end of the KASAN shadow region */
55 #define MODULES_LOWEST_VADDR    (KERNEL_LINK_ADDR - SZ_2G)
56 #define MODULES_VADDR           (PFN_ALIGN((unsigned long)&_end) - SZ_2G)
57 #define MODULES_END             (PFN_ALIGN((unsigned long)&_start))
58 #endif
59
60 /*
61  * Roughly size the vmemmap space to be large enough to fit enough
62  * struct pages to map half the virtual address space. Then
63  * position vmemmap directly below the VMALLOC region.
64  */
65 #ifdef CONFIG_64BIT
66 #define VA_BITS         (pgtable_l5_enabled ? \
67                                 57 : (pgtable_l4_enabled ? 48 : 39))
68 #else
69 #define VA_BITS         32
70 #endif
71
72 #define VMEMMAP_SHIFT \
73         (VA_BITS - PAGE_SHIFT - 1 + STRUCT_PAGE_MAX_SHIFT)
74 #define VMEMMAP_SIZE    BIT(VMEMMAP_SHIFT)
75 #define VMEMMAP_END     VMALLOC_START
76 #define VMEMMAP_START   (VMALLOC_START - VMEMMAP_SIZE)
77
78 /*
79  * Define vmemmap for pfn_to_page & page_to_pfn calls. Needed if kernel
80  * is configured with CONFIG_SPARSEMEM_VMEMMAP enabled.
81  */
82 #define vmemmap         ((struct page *)VMEMMAP_START)
83
84 #define PCI_IO_SIZE      SZ_16M
85 #define PCI_IO_END       VMEMMAP_START
86 #define PCI_IO_START     (PCI_IO_END - PCI_IO_SIZE)
87
88 #define FIXADDR_TOP      PCI_IO_START
89 #ifdef CONFIG_64BIT
90 #define FIXADDR_SIZE     PMD_SIZE
91 #else
92 #define FIXADDR_SIZE     PGDIR_SIZE
93 #endif
94 #define FIXADDR_START    (FIXADDR_TOP - FIXADDR_SIZE)
95
96 #endif
97
98 #ifdef CONFIG_XIP_KERNEL
99 #define XIP_OFFSET              SZ_32M
100 #define XIP_OFFSET_MASK         (SZ_32M - 1)
101 #else
102 #define XIP_OFFSET              0
103 #endif
104
105 #ifndef __ASSEMBLY__
106
107 #include <asm/page.h>
108 #include <asm/tlbflush.h>
109 #include <linux/mm_types.h>
110
111 #define __page_val_to_pfn(_val)  (((_val) & _PAGE_PFN_MASK) >> _PAGE_PFN_SHIFT)
112
113 #ifdef CONFIG_64BIT
114 #include <asm/pgtable-64.h>
115 #else
116 #include <asm/pgtable-32.h>
117 #endif /* CONFIG_64BIT */
118
119 #ifdef CONFIG_XIP_KERNEL
120 #define XIP_FIXUP(addr) ({                                                      \
121         uintptr_t __a = (uintptr_t)(addr);                                      \
122         (__a >= CONFIG_XIP_PHYS_ADDR && \
123          __a < CONFIG_XIP_PHYS_ADDR + XIP_OFFSET * 2) ? \
124                 __a - CONFIG_XIP_PHYS_ADDR + CONFIG_PHYS_RAM_BASE - XIP_OFFSET :\
125                 __a;                                                            \
126         })
127 #else
128 #define XIP_FIXUP(addr)         (addr)
129 #endif /* CONFIG_XIP_KERNEL */
130
131 struct pt_alloc_ops {
132         pte_t *(*get_pte_virt)(phys_addr_t pa);
133         phys_addr_t (*alloc_pte)(uintptr_t va);
134 #ifndef __PAGETABLE_PMD_FOLDED
135         pmd_t *(*get_pmd_virt)(phys_addr_t pa);
136         phys_addr_t (*alloc_pmd)(uintptr_t va);
137         pud_t *(*get_pud_virt)(phys_addr_t pa);
138         phys_addr_t (*alloc_pud)(uintptr_t va);
139         p4d_t *(*get_p4d_virt)(phys_addr_t pa);
140         phys_addr_t (*alloc_p4d)(uintptr_t va);
141 #endif
142 };
143
144 extern struct pt_alloc_ops pt_ops __initdata;
145
146 #ifdef CONFIG_MMU
147 /* Number of PGD entries that a user-mode program can use */
148 #define USER_PTRS_PER_PGD   (TASK_SIZE / PGDIR_SIZE)
149
150 /* Page protection bits */
151 #define _PAGE_BASE      (_PAGE_PRESENT | _PAGE_ACCESSED | _PAGE_USER)
152
153 #define PAGE_NONE               __pgprot(_PAGE_PROT_NONE | _PAGE_READ)
154 #define PAGE_READ               __pgprot(_PAGE_BASE | _PAGE_READ)
155 #define PAGE_WRITE              __pgprot(_PAGE_BASE | _PAGE_READ | _PAGE_WRITE)
156 #define PAGE_EXEC               __pgprot(_PAGE_BASE | _PAGE_EXEC)
157 #define PAGE_READ_EXEC          __pgprot(_PAGE_BASE | _PAGE_READ | _PAGE_EXEC)
158 #define PAGE_WRITE_EXEC         __pgprot(_PAGE_BASE | _PAGE_READ |      \
159                                          _PAGE_EXEC | _PAGE_WRITE)
160
161 #define PAGE_COPY               PAGE_READ
162 #define PAGE_COPY_EXEC          PAGE_EXEC
163 #define PAGE_COPY_READ_EXEC     PAGE_READ_EXEC
164 #define PAGE_SHARED             PAGE_WRITE
165 #define PAGE_SHARED_EXEC        PAGE_WRITE_EXEC
166
167 #define _PAGE_KERNEL            (_PAGE_READ \
168                                 | _PAGE_WRITE \
169                                 | _PAGE_PRESENT \
170                                 | _PAGE_ACCESSED \
171                                 | _PAGE_DIRTY \
172                                 | _PAGE_GLOBAL)
173
174 #define PAGE_KERNEL             __pgprot(_PAGE_KERNEL)
175 #define PAGE_KERNEL_READ        __pgprot(_PAGE_KERNEL & ~_PAGE_WRITE)
176 #define PAGE_KERNEL_EXEC        __pgprot(_PAGE_KERNEL | _PAGE_EXEC)
177 #define PAGE_KERNEL_READ_EXEC   __pgprot((_PAGE_KERNEL & ~_PAGE_WRITE) \
178                                          | _PAGE_EXEC)
179
180 #define PAGE_TABLE              __pgprot(_PAGE_TABLE)
181
182 /*
183  * The RISC-V ISA doesn't yet specify how to query or modify PMAs, so we can't
184  * change the properties of memory regions.
185  */
186 #define _PAGE_IOREMAP _PAGE_KERNEL
187
188 extern pgd_t swapper_pg_dir[];
189
190 /* MAP_PRIVATE permissions: xwr (copy-on-write) */
191 #define __P000  PAGE_NONE
192 #define __P001  PAGE_READ
193 #define __P010  PAGE_COPY
194 #define __P011  PAGE_COPY
195 #define __P100  PAGE_EXEC
196 #define __P101  PAGE_READ_EXEC
197 #define __P110  PAGE_COPY_EXEC
198 #define __P111  PAGE_COPY_READ_EXEC
199
200 /* MAP_SHARED permissions: xwr */
201 #define __S000  PAGE_NONE
202 #define __S001  PAGE_READ
203 #define __S010  PAGE_SHARED
204 #define __S011  PAGE_SHARED
205 #define __S100  PAGE_EXEC
206 #define __S101  PAGE_READ_EXEC
207 #define __S110  PAGE_SHARED_EXEC
208 #define __S111  PAGE_SHARED_EXEC
209
210 #ifdef CONFIG_TRANSPARENT_HUGEPAGE
211 static inline int pmd_present(pmd_t pmd)
212 {
213         /*
214          * Checking for _PAGE_LEAF is needed too because:
215          * When splitting a THP, split_huge_page() will temporarily clear
216          * the present bit, in this situation, pmd_present() and
217          * pmd_trans_huge() still needs to return true.
218          */
219         return (pmd_val(pmd) & (_PAGE_PRESENT | _PAGE_PROT_NONE | _PAGE_LEAF));
220 }
221 #else
222 static inline int pmd_present(pmd_t pmd)
223 {
224         return (pmd_val(pmd) & (_PAGE_PRESENT | _PAGE_PROT_NONE));
225 }
226 #endif
227
228 static inline int pmd_none(pmd_t pmd)
229 {
230         return (pmd_val(pmd) == 0);
231 }
232
233 static inline int pmd_bad(pmd_t pmd)
234 {
235         return !pmd_present(pmd) || (pmd_val(pmd) & _PAGE_LEAF);
236 }
237
238 #define pmd_leaf        pmd_leaf
239 static inline int pmd_leaf(pmd_t pmd)
240 {
241         return pmd_present(pmd) && (pmd_val(pmd) & _PAGE_LEAF);
242 }
243
244 static inline void set_pmd(pmd_t *pmdp, pmd_t pmd)
245 {
246         *pmdp = pmd;
247 }
248
249 static inline void pmd_clear(pmd_t *pmdp)
250 {
251         set_pmd(pmdp, __pmd(0));
252 }
253
254 static inline pgd_t pfn_pgd(unsigned long pfn, pgprot_t prot)
255 {
256         return __pgd((pfn << _PAGE_PFN_SHIFT) | pgprot_val(prot));
257 }
258
259 static inline unsigned long _pgd_pfn(pgd_t pgd)
260 {
261         return pgd_val(pgd) >> _PAGE_PFN_SHIFT;
262 }
263
264 static inline struct page *pmd_page(pmd_t pmd)
265 {
266         return pfn_to_page(__page_val_to_pfn(pmd_val(pmd)));
267 }
268
269 static inline unsigned long pmd_page_vaddr(pmd_t pmd)
270 {
271         return (unsigned long)pfn_to_virt(__page_val_to_pfn(pmd_val(pmd)));
272 }
273
274 static inline pte_t pmd_pte(pmd_t pmd)
275 {
276         return __pte(pmd_val(pmd));
277 }
278
279 static inline pte_t pud_pte(pud_t pud)
280 {
281         return __pte(pud_val(pud));
282 }
283
284 /* Yields the page frame number (PFN) of a page table entry */
285 static inline unsigned long pte_pfn(pte_t pte)
286 {
287         return __page_val_to_pfn(pte_val(pte));
288 }
289
290 #define pte_page(x)     pfn_to_page(pte_pfn(x))
291
292 /* Constructs a page table entry */
293 static inline pte_t pfn_pte(unsigned long pfn, pgprot_t prot)
294 {
295         return __pte((pfn << _PAGE_PFN_SHIFT) | pgprot_val(prot));
296 }
297
298 #define mk_pte(page, prot)       pfn_pte(page_to_pfn(page), prot)
299
300 static inline int pte_present(pte_t pte)
301 {
302         return (pte_val(pte) & (_PAGE_PRESENT | _PAGE_PROT_NONE));
303 }
304
305 static inline int pte_none(pte_t pte)
306 {
307         return (pte_val(pte) == 0);
308 }
309
310 static inline int pte_write(pte_t pte)
311 {
312         return pte_val(pte) & _PAGE_WRITE;
313 }
314
315 static inline int pte_exec(pte_t pte)
316 {
317         return pte_val(pte) & _PAGE_EXEC;
318 }
319
320 static inline int pte_huge(pte_t pte)
321 {
322         return pte_present(pte) && (pte_val(pte) & _PAGE_LEAF);
323 }
324
325 static inline int pte_dirty(pte_t pte)
326 {
327         return pte_val(pte) & _PAGE_DIRTY;
328 }
329
330 static inline int pte_young(pte_t pte)
331 {
332         return pte_val(pte) & _PAGE_ACCESSED;
333 }
334
335 static inline int pte_special(pte_t pte)
336 {
337         return pte_val(pte) & _PAGE_SPECIAL;
338 }
339
340 /* static inline pte_t pte_rdprotect(pte_t pte) */
341
342 static inline pte_t pte_wrprotect(pte_t pte)
343 {
344         return __pte(pte_val(pte) & ~(_PAGE_WRITE));
345 }
346
347 /* static inline pte_t pte_mkread(pte_t pte) */
348
349 static inline pte_t pte_mkwrite(pte_t pte)
350 {
351         return __pte(pte_val(pte) | _PAGE_WRITE);
352 }
353
354 /* static inline pte_t pte_mkexec(pte_t pte) */
355
356 static inline pte_t pte_mkdirty(pte_t pte)
357 {
358         return __pte(pte_val(pte) | _PAGE_DIRTY);
359 }
360
361 static inline pte_t pte_mkclean(pte_t pte)
362 {
363         return __pte(pte_val(pte) & ~(_PAGE_DIRTY));
364 }
365
366 static inline pte_t pte_mkyoung(pte_t pte)
367 {
368         return __pte(pte_val(pte) | _PAGE_ACCESSED);
369 }
370
371 static inline pte_t pte_mkold(pte_t pte)
372 {
373         return __pte(pte_val(pte) & ~(_PAGE_ACCESSED));
374 }
375
376 static inline pte_t pte_mkspecial(pte_t pte)
377 {
378         return __pte(pte_val(pte) | _PAGE_SPECIAL);
379 }
380
381 static inline pte_t pte_mkhuge(pte_t pte)
382 {
383         return pte;
384 }
385
386 #ifdef CONFIG_NUMA_BALANCING
387 /*
388  * See the comment in include/asm-generic/pgtable.h
389  */
390 static inline int pte_protnone(pte_t pte)
391 {
392         return (pte_val(pte) & (_PAGE_PRESENT | _PAGE_PROT_NONE)) == _PAGE_PROT_NONE;
393 }
394
395 static inline int pmd_protnone(pmd_t pmd)
396 {
397         return pte_protnone(pmd_pte(pmd));
398 }
399 #endif
400
401 /* Modify page protection bits */
402 static inline pte_t pte_modify(pte_t pte, pgprot_t newprot)
403 {
404         return __pte((pte_val(pte) & _PAGE_CHG_MASK) | pgprot_val(newprot));
405 }
406
407 #define pgd_ERROR(e) \
408         pr_err("%s:%d: bad pgd " PTE_FMT ".\n", __FILE__, __LINE__, pgd_val(e))
409
410
411 /* Commit new configuration to MMU hardware */
412 static inline void update_mmu_cache(struct vm_area_struct *vma,
413         unsigned long address, pte_t *ptep)
414 {
415         /*
416          * The kernel assumes that TLBs don't cache invalid entries, but
417          * in RISC-V, SFENCE.VMA specifies an ordering constraint, not a
418          * cache flush; it is necessary even after writing invalid entries.
419          * Relying on flush_tlb_fix_spurious_fault would suffice, but
420          * the extra traps reduce performance.  So, eagerly SFENCE.VMA.
421          */
422         local_flush_tlb_page(address);
423 }
424
425 static inline void update_mmu_cache_pmd(struct vm_area_struct *vma,
426                 unsigned long address, pmd_t *pmdp)
427 {
428         pte_t *ptep = (pte_t *)pmdp;
429
430         update_mmu_cache(vma, address, ptep);
431 }
432
433 #define __HAVE_ARCH_PTE_SAME
434 static inline int pte_same(pte_t pte_a, pte_t pte_b)
435 {
436         return pte_val(pte_a) == pte_val(pte_b);
437 }
438
439 /*
440  * Certain architectures need to do special things when PTEs within
441  * a page table are directly modified.  Thus, the following hook is
442  * made available.
443  */
444 static inline void set_pte(pte_t *ptep, pte_t pteval)
445 {
446         *ptep = pteval;
447 }
448
449 void flush_icache_pte(pte_t pte);
450
451 static inline void set_pte_at(struct mm_struct *mm,
452         unsigned long addr, pte_t *ptep, pte_t pteval)
453 {
454         if (pte_present(pteval) && pte_exec(pteval))
455                 flush_icache_pte(pteval);
456
457         set_pte(ptep, pteval);
458 }
459
460 static inline void pte_clear(struct mm_struct *mm,
461         unsigned long addr, pte_t *ptep)
462 {
463         set_pte_at(mm, addr, ptep, __pte(0));
464 }
465
466 #define __HAVE_ARCH_PTEP_SET_ACCESS_FLAGS
467 static inline int ptep_set_access_flags(struct vm_area_struct *vma,
468                                         unsigned long address, pte_t *ptep,
469                                         pte_t entry, int dirty)
470 {
471         if (!pte_same(*ptep, entry))
472                 set_pte_at(vma->vm_mm, address, ptep, entry);
473         /*
474          * update_mmu_cache will unconditionally execute, handling both
475          * the case that the PTE changed and the spurious fault case.
476          */
477         return true;
478 }
479
480 #define __HAVE_ARCH_PTEP_GET_AND_CLEAR
481 static inline pte_t ptep_get_and_clear(struct mm_struct *mm,
482                                        unsigned long address, pte_t *ptep)
483 {
484         return __pte(atomic_long_xchg((atomic_long_t *)ptep, 0));
485 }
486
487 #define __HAVE_ARCH_PTEP_TEST_AND_CLEAR_YOUNG
488 static inline int ptep_test_and_clear_young(struct vm_area_struct *vma,
489                                             unsigned long address,
490                                             pte_t *ptep)
491 {
492         if (!pte_young(*ptep))
493                 return 0;
494         return test_and_clear_bit(_PAGE_ACCESSED_OFFSET, &pte_val(*ptep));
495 }
496
497 #define __HAVE_ARCH_PTEP_SET_WRPROTECT
498 static inline void ptep_set_wrprotect(struct mm_struct *mm,
499                                       unsigned long address, pte_t *ptep)
500 {
501         atomic_long_and(~(unsigned long)_PAGE_WRITE, (atomic_long_t *)ptep);
502 }
503
504 #define __HAVE_ARCH_PTEP_CLEAR_YOUNG_FLUSH
505 static inline int ptep_clear_flush_young(struct vm_area_struct *vma,
506                                          unsigned long address, pte_t *ptep)
507 {
508         /*
509          * This comment is borrowed from x86, but applies equally to RISC-V:
510          *
511          * Clearing the accessed bit without a TLB flush
512          * doesn't cause data corruption. [ It could cause incorrect
513          * page aging and the (mistaken) reclaim of hot pages, but the
514          * chance of that should be relatively low. ]
515          *
516          * So as a performance optimization don't flush the TLB when
517          * clearing the accessed bit, it will eventually be flushed by
518          * a context switch or a VM operation anyway. [ In the rare
519          * event of it not getting flushed for a long time the delay
520          * shouldn't really matter because there's no real memory
521          * pressure for swapout to react to. ]
522          */
523         return ptep_test_and_clear_young(vma, address, ptep);
524 }
525
526 /*
527  * THP functions
528  */
529 static inline pmd_t pte_pmd(pte_t pte)
530 {
531         return __pmd(pte_val(pte));
532 }
533
534 static inline pmd_t pmd_mkhuge(pmd_t pmd)
535 {
536         return pmd;
537 }
538
539 static inline pmd_t pmd_mkinvalid(pmd_t pmd)
540 {
541         return __pmd(pmd_val(pmd) & ~(_PAGE_PRESENT|_PAGE_PROT_NONE));
542 }
543
544 #define __pmd_to_phys(pmd)  (pmd_val(pmd) >> _PAGE_PFN_SHIFT << PAGE_SHIFT)
545
546 static inline unsigned long pmd_pfn(pmd_t pmd)
547 {
548         return ((__pmd_to_phys(pmd) & PMD_MASK) >> PAGE_SHIFT);
549 }
550
551 static inline pmd_t pmd_modify(pmd_t pmd, pgprot_t newprot)
552 {
553         return pte_pmd(pte_modify(pmd_pte(pmd), newprot));
554 }
555
556 #define pmd_write pmd_write
557 static inline int pmd_write(pmd_t pmd)
558 {
559         return pte_write(pmd_pte(pmd));
560 }
561
562 static inline int pmd_dirty(pmd_t pmd)
563 {
564         return pte_dirty(pmd_pte(pmd));
565 }
566
567 static inline int pmd_young(pmd_t pmd)
568 {
569         return pte_young(pmd_pte(pmd));
570 }
571
572 static inline pmd_t pmd_mkold(pmd_t pmd)
573 {
574         return pte_pmd(pte_mkold(pmd_pte(pmd)));
575 }
576
577 static inline pmd_t pmd_mkyoung(pmd_t pmd)
578 {
579         return pte_pmd(pte_mkyoung(pmd_pte(pmd)));
580 }
581
582 static inline pmd_t pmd_mkwrite(pmd_t pmd)
583 {
584         return pte_pmd(pte_mkwrite(pmd_pte(pmd)));
585 }
586
587 static inline pmd_t pmd_wrprotect(pmd_t pmd)
588 {
589         return pte_pmd(pte_wrprotect(pmd_pte(pmd)));
590 }
591
592 static inline pmd_t pmd_mkclean(pmd_t pmd)
593 {
594         return pte_pmd(pte_mkclean(pmd_pte(pmd)));
595 }
596
597 static inline pmd_t pmd_mkdirty(pmd_t pmd)
598 {
599         return pte_pmd(pte_mkdirty(pmd_pte(pmd)));
600 }
601
602 static inline void set_pmd_at(struct mm_struct *mm, unsigned long addr,
603                                 pmd_t *pmdp, pmd_t pmd)
604 {
605         return set_pte_at(mm, addr, (pte_t *)pmdp, pmd_pte(pmd));
606 }
607
608 static inline void set_pud_at(struct mm_struct *mm, unsigned long addr,
609                                 pud_t *pudp, pud_t pud)
610 {
611         return set_pte_at(mm, addr, (pte_t *)pudp, pud_pte(pud));
612 }
613
614 #ifdef CONFIG_TRANSPARENT_HUGEPAGE
615 static inline int pmd_trans_huge(pmd_t pmd)
616 {
617         return pmd_leaf(pmd);
618 }
619
620 #define __HAVE_ARCH_PMDP_SET_ACCESS_FLAGS
621 static inline int pmdp_set_access_flags(struct vm_area_struct *vma,
622                                         unsigned long address, pmd_t *pmdp,
623                                         pmd_t entry, int dirty)
624 {
625         return ptep_set_access_flags(vma, address, (pte_t *)pmdp, pmd_pte(entry), dirty);
626 }
627
628 #define __HAVE_ARCH_PMDP_TEST_AND_CLEAR_YOUNG
629 static inline int pmdp_test_and_clear_young(struct vm_area_struct *vma,
630                                         unsigned long address, pmd_t *pmdp)
631 {
632         return ptep_test_and_clear_young(vma, address, (pte_t *)pmdp);
633 }
634
635 #define __HAVE_ARCH_PMDP_HUGE_GET_AND_CLEAR
636 static inline pmd_t pmdp_huge_get_and_clear(struct mm_struct *mm,
637                                         unsigned long address, pmd_t *pmdp)
638 {
639         return pte_pmd(ptep_get_and_clear(mm, address, (pte_t *)pmdp));
640 }
641
642 #define __HAVE_ARCH_PMDP_SET_WRPROTECT
643 static inline void pmdp_set_wrprotect(struct mm_struct *mm,
644                                         unsigned long address, pmd_t *pmdp)
645 {
646         ptep_set_wrprotect(mm, address, (pte_t *)pmdp);
647 }
648
649 #define pmdp_establish pmdp_establish
650 static inline pmd_t pmdp_establish(struct vm_area_struct *vma,
651                                 unsigned long address, pmd_t *pmdp, pmd_t pmd)
652 {
653         return __pmd(atomic_long_xchg((atomic_long_t *)pmdp, pmd_val(pmd)));
654 }
655 #endif /* CONFIG_TRANSPARENT_HUGEPAGE */
656
657 /*
658  * Encode and decode a swap entry
659  *
660  * Format of swap PTE:
661  *      bit            0:       _PAGE_PRESENT (zero)
662  *      bit       1 to 3:       _PAGE_LEAF (zero)
663  *      bit            5:       _PAGE_PROT_NONE (zero)
664  *      bits      6 to 10:      swap type
665  *      bits 10 to XLEN-1:      swap offset
666  */
667 #define __SWP_TYPE_SHIFT        6
668 #define __SWP_TYPE_BITS         5
669 #define __SWP_TYPE_MASK         ((1UL << __SWP_TYPE_BITS) - 1)
670 #define __SWP_OFFSET_SHIFT      (__SWP_TYPE_BITS + __SWP_TYPE_SHIFT)
671
672 #define MAX_SWAPFILES_CHECK()   \
673         BUILD_BUG_ON(MAX_SWAPFILES_SHIFT > __SWP_TYPE_BITS)
674
675 #define __swp_type(x)   (((x).val >> __SWP_TYPE_SHIFT) & __SWP_TYPE_MASK)
676 #define __swp_offset(x) ((x).val >> __SWP_OFFSET_SHIFT)
677 #define __swp_entry(type, offset) ((swp_entry_t) \
678         { ((type) << __SWP_TYPE_SHIFT) | ((offset) << __SWP_OFFSET_SHIFT) })
679
680 #define __pte_to_swp_entry(pte) ((swp_entry_t) { pte_val(pte) })
681 #define __swp_entry_to_pte(x)   ((pte_t) { (x).val })
682
683 #ifdef CONFIG_ARCH_ENABLE_THP_MIGRATION
684 #define __pmd_to_swp_entry(pmd) ((swp_entry_t) { pmd_val(pmd) })
685 #define __swp_entry_to_pmd(swp) __pmd((swp).val)
686 #endif /* CONFIG_ARCH_ENABLE_THP_MIGRATION */
687
688 /*
689  * In the RV64 Linux scheme, we give the user half of the virtual-address space
690  * and give the kernel the other (upper) half.
691  */
692 #ifdef CONFIG_64BIT
693 #define KERN_VIRT_START (-(BIT(VA_BITS)) + TASK_SIZE)
694 #else
695 #define KERN_VIRT_START FIXADDR_START
696 #endif
697
698 /*
699  * Task size is 0x4000000000 for RV64 or 0x9fc00000 for RV32.
700  * Note that PGDIR_SIZE must evenly divide TASK_SIZE.
701  * Task size is:
702  * -     0x9fc00000 (~2.5GB) for RV32.
703  * -   0x4000000000 ( 256GB) for RV64 using SV39 mmu
704  * - 0x800000000000 ( 128TB) for RV64 using SV48 mmu
705  *
706  * Note that PGDIR_SIZE must evenly divide TASK_SIZE since "RISC-V
707  * Instruction Set Manual Volume II: Privileged Architecture" states that
708  * "load and store effective addresses, which are 64bits, must have bits
709  * 63–48 all equal to bit 47, or else a page-fault exception will occur."
710  */
711 #ifdef CONFIG_64BIT
712 #define TASK_SIZE      (PGDIR_SIZE * PTRS_PER_PGD / 2)
713 #define TASK_SIZE_MIN  (PGDIR_SIZE_L3 * PTRS_PER_PGD / 2)
714 #else
715 #define TASK_SIZE       FIXADDR_START
716 #define TASK_SIZE_MIN   TASK_SIZE
717 #endif
718
719 #else /* CONFIG_MMU */
720
721 #define PAGE_SHARED             __pgprot(0)
722 #define PAGE_KERNEL             __pgprot(0)
723 #define swapper_pg_dir          NULL
724 #define TASK_SIZE               0xffffffffUL
725 #define VMALLOC_START           0
726 #define VMALLOC_END             TASK_SIZE
727
728 #endif /* !CONFIG_MMU */
729
730 #define kern_addr_valid(addr)   (1) /* FIXME */
731
732 extern char _start[];
733 extern void *_dtb_early_va;
734 extern uintptr_t _dtb_early_pa;
735 #if defined(CONFIG_XIP_KERNEL) && defined(CONFIG_MMU)
736 #define dtb_early_va    (*(void **)XIP_FIXUP(&_dtb_early_va))
737 #define dtb_early_pa    (*(uintptr_t *)XIP_FIXUP(&_dtb_early_pa))
738 #else
739 #define dtb_early_va    _dtb_early_va
740 #define dtb_early_pa    _dtb_early_pa
741 #endif /* CONFIG_XIP_KERNEL */
742 extern u64 satp_mode;
743 extern bool pgtable_l4_enabled;
744
745 void paging_init(void);
746 void misc_mem_init(void);
747
748 /*
749  * ZERO_PAGE is a global shared page that is always zero,
750  * used for zero-mapped memory areas, etc.
751  */
752 extern unsigned long empty_zero_page[PAGE_SIZE / sizeof(unsigned long)];
753 #define ZERO_PAGE(vaddr) (virt_to_page(empty_zero_page))
754
755 #endif /* !__ASSEMBLY__ */
756
757 #endif /* _ASM_RISCV_PGTABLE_H */