docs: ntb.txt: use Sphinx notation for the two ascii figures
[linux-2.6-microblaze.git] / Documentation / ntb.txt
1 ===========
2 NTB Drivers
3 ===========
4
5 NTB (Non-Transparent Bridge) is a type of PCI-Express bridge chip that connects
6 the separate memory systems of two or more computers to the same PCI-Express
7 fabric. Existing NTB hardware supports a common feature set: doorbell
8 registers and memory translation windows, as well as non common features like
9 scratchpad and message registers. Scratchpad registers are read-and-writable
10 registers that are accessible from either side of the device, so that peers can
11 exchange a small amount of information at a fixed address. Message registers can
12 be utilized for the same purpose. Additionally they are provided with with
13 special status bits to make sure the information isn't rewritten by another
14 peer. Doorbell registers provide a way for peers to send interrupt events.
15 Memory windows allow translated read and write access to the peer memory.
16
17 NTB Core Driver (ntb)
18 =====================
19
20 The NTB core driver defines an api wrapping the common feature set, and allows
21 clients interested in NTB features to discover NTB the devices supported by
22 hardware drivers.  The term "client" is used here to mean an upper layer
23 component making use of the NTB api.  The term "driver," or "hardware driver,"
24 is used here to mean a driver for a specific vendor and model of NTB hardware.
25
26 NTB Client Drivers
27 ==================
28
29 NTB client drivers should register with the NTB core driver.  After
30 registering, the client probe and remove functions will be called appropriately
31 as ntb hardware, or hardware drivers, are inserted and removed.  The
32 registration uses the Linux Device framework, so it should feel familiar to
33 anyone who has written a pci driver.
34
35 NTB Typical client driver implementation
36 ----------------------------------------
37
38 Primary purpose of NTB is to share some peace of memory between at least two
39 systems. So the NTB device features like Scratchpad/Message registers are
40 mainly used to perform the proper memory window initialization. Typically
41 there are two types of memory window interfaces supported by the NTB API:
42 inbound translation configured on the local ntb port and outbound translation
43 configured by the peer, on the peer ntb port. The first type is
44 depicted on the next figure::
45
46  Inbound translation:
47
48  Memory:              Local NTB Port:      Peer NTB Port:      Peer MMIO:
49   ____________
50  | dma-mapped |-ntb_mw_set_trans(addr)  |
51  | memory     |        _v____________   |   ______________
52  | (addr)     |<======| MW xlat addr |<====| MW base addr |<== memory-mapped IO
53  |------------|       |--------------|  |  |--------------|
54
55 So typical scenario of the first type memory window initialization looks:
56 1) allocate a memory region, 2) put translated address to NTB config,
57 3) somehow notify a peer device of performed initialization, 4) peer device
58 maps corresponding outbound memory window so to have access to the shared
59 memory region.
60
61 The second type of interface, that implies the shared windows being
62 initialized by a peer device, is depicted on the figure::
63
64  Outbound translation:
65
66  Memory:        Local NTB Port:    Peer NTB Port:      Peer MMIO:
67   ____________                      ______________
68  | dma-mapped |                |   | MW base addr |<== memory-mapped IO
69  | memory     |                |   |--------------|
70  | (addr)     |<===================| MW xlat addr |<-ntb_peer_mw_set_trans(addr)
71  |------------|                |   |--------------|
72
73 Typical scenario of the second type interface initialization would be:
74 1) allocate a memory region, 2) somehow deliver a translated address to a peer
75 device, 3) peer puts the translated address to NTB config, 4) peer device maps
76 outbound memory window so to have access to the shared memory region.
77
78 As one can see the described scenarios can be combined in one portable
79 algorithm.
80  Local device:
81   1) Allocate memory for a shared window
82   2) Initialize memory window by translated address of the allocated region
83      (it may fail if local memory window initialization is unsupported)
84   3) Send the translated address and memory window index to a peer device
85  Peer device:
86   1) Initialize memory window with retrieved address of the allocated
87      by another device memory region (it may fail if peer memory window
88      initialization is unsupported)
89   2) Map outbound memory window
90
91 In accordance with this scenario, the NTB Memory Window API can be used as
92 follows:
93  Local device:
94   1) ntb_mw_count(pidx) - retrieve number of memory ranges, which can
95      be allocated for memory windows between local device and peer device
96      of port with specified index.
97   2) ntb_get_align(pidx, midx) - retrieve parameters restricting the
98      shared memory region alignment and size. Then memory can be properly
99      allocated.
100   3) Allocate physically contiguous memory region in compliance with
101      restrictions retrieved in 2).
102   4) ntb_mw_set_trans(pidx, midx) - try to set translation address of
103      the memory window with specified index for the defined peer device
104      (it may fail if local translated address setting is not supported)
105   5) Send translated base address (usually together with memory window
106      number) to the peer device using, for instance, scratchpad or message
107      registers.
108  Peer device:
109   1) ntb_peer_mw_set_trans(pidx, midx) - try to set received from other
110      device (related to pidx) translated address for specified memory
111      window. It may fail if retrieved address, for instance, exceeds
112      maximum possible address or isn't properly aligned.
113   2) ntb_peer_mw_get_addr(widx) - retrieve MMIO address to map the memory
114      window so to have an access to the shared memory.
115
116 Also it is worth to note, that method ntb_mw_count(pidx) should return the
117 same value as ntb_peer_mw_count() on the peer with port index - pidx.
118
119 NTB Transport Client (ntb\_transport) and NTB Netdev (ntb\_netdev)
120 ------------------------------------------------------------------
121
122 The primary client for NTB is the Transport client, used in tandem with NTB
123 Netdev.  These drivers function together to create a logical link to the peer,
124 across the ntb, to exchange packets of network data.  The Transport client
125 establishes a logical link to the peer, and creates queue pairs to exchange
126 messages and data.  The NTB Netdev then creates an ethernet device using a
127 Transport queue pair.  Network data is copied between socket buffers and the
128 Transport queue pair buffer.  The Transport client may be used for other things
129 besides Netdev, however no other applications have yet been written.
130
131 NTB Ping Pong Test Client (ntb\_pingpong)
132 -----------------------------------------
133
134 The Ping Pong test client serves as a demonstration to exercise the doorbell
135 and scratchpad registers of NTB hardware, and as an example simple NTB client.
136 Ping Pong enables the link when started, waits for the NTB link to come up, and
137 then proceeds to read and write the doorbell scratchpad registers of the NTB.
138 The peers interrupt each other using a bit mask of doorbell bits, which is
139 shifted by one in each round, to test the behavior of multiple doorbell bits
140 and interrupt vectors.  The Ping Pong driver also reads the first local
141 scratchpad, and writes the value plus one to the first peer scratchpad, each
142 round before writing the peer doorbell register.
143
144 Module Parameters:
145
146 * unsafe - Some hardware has known issues with scratchpad and doorbell
147         registers.  By default, Ping Pong will not attempt to exercise such
148         hardware.  You may override this behavior at your own risk by setting
149         unsafe=1.
150 * delay\_ms - Specify the delay between receiving a doorbell
151         interrupt event and setting the peer doorbell register for the next
152         round.
153 * init\_db - Specify the doorbell bits to start new series of rounds.  A new
154         series begins once all the doorbell bits have been shifted out of
155         range.
156 * dyndbg - It is suggested to specify dyndbg=+p when loading this module, and
157         then to observe debugging output on the console.
158
159 NTB Tool Test Client (ntb\_tool)
160 --------------------------------
161
162 The Tool test client serves for debugging, primarily, ntb hardware and drivers.
163 The Tool provides access through debugfs for reading, setting, and clearing the
164 NTB doorbell, and reading and writing scratchpads.
165
166 The Tool does not currently have any module parameters.
167
168 Debugfs Files:
169
170 * *debugfs*/ntb\_tool/*hw*/
171         A directory in debugfs will be created for each
172         NTB device probed by the tool.  This directory is shortened to *hw*
173         below.
174 * *hw*/db
175         This file is used to read, set, and clear the local doorbell.  Not
176         all operations may be supported by all hardware.  To read the doorbell,
177         read the file.  To set the doorbell, write `s` followed by the bits to
178         set (eg: `echo 's 0x0101' > db`).  To clear the doorbell, write `c`
179         followed by the bits to clear.
180 * *hw*/mask
181         This file is used to read, set, and clear the local doorbell mask.
182         See *db* for details.
183 * *hw*/peer\_db
184         This file is used to read, set, and clear the peer doorbell.
185         See *db* for details.
186 * *hw*/peer\_mask
187         This file is used to read, set, and clear the peer doorbell
188         mask.  See *db* for details.
189 * *hw*/spad
190         This file is used to read and write local scratchpads.  To read
191         the values of all scratchpads, read the file.  To write values, write a
192         series of pairs of scratchpad number and value
193         (eg: `echo '4 0x123 7 0xabc' > spad`
194         # to set scratchpads `4` and `7` to `0x123` and `0xabc`, respectively).
195 * *hw*/peer\_spad
196         This file is used to read and write peer scratchpads.  See
197         *spad* for details.
198
199 NTB Hardware Drivers
200 ====================
201
202 NTB hardware drivers should register devices with the NTB core driver.  After
203 registering, clients probe and remove functions will be called.
204
205 NTB Intel Hardware Driver (ntb\_hw\_intel)
206 ------------------------------------------
207
208 The Intel hardware driver supports NTB on Xeon and Atom CPUs.
209
210 Module Parameters:
211
212 * b2b\_mw\_idx
213         If the peer ntb is to be accessed via a memory window, then use
214         this memory window to access the peer ntb.  A value of zero or positive
215         starts from the first mw idx, and a negative value starts from the last
216         mw idx.  Both sides MUST set the same value here!  The default value is
217         `-1`.
218 * b2b\_mw\_share
219         If the peer ntb is to be accessed via a memory window, and if
220         the memory window is large enough, still allow the client to use the
221         second half of the memory window for address translation to the peer.
222 * xeon\_b2b\_usd\_bar2\_addr64
223         If using B2B topology on Xeon hardware, use
224         this 64 bit address on the bus between the NTB devices for the window
225         at BAR2, on the upstream side of the link.
226 * xeon\_b2b\_usd\_bar4\_addr64 - See *xeon\_b2b\_bar2\_addr64*.
227 * xeon\_b2b\_usd\_bar4\_addr32 - See *xeon\_b2b\_bar2\_addr64*.
228 * xeon\_b2b\_usd\_bar5\_addr32 - See *xeon\_b2b\_bar2\_addr64*.
229 * xeon\_b2b\_dsd\_bar2\_addr64 - See *xeon\_b2b\_bar2\_addr64*.
230 * xeon\_b2b\_dsd\_bar4\_addr64 - See *xeon\_b2b\_bar2\_addr64*.
231 * xeon\_b2b\_dsd\_bar4\_addr32 - See *xeon\_b2b\_bar2\_addr64*.
232 * xeon\_b2b\_dsd\_bar5\_addr32 - See *xeon\_b2b\_bar2\_addr64*.