e549d6fa4a412f6bf5257dfc886e7e1d0a350765
[linux-2.6-microblaze.git] / drivers / infiniband / hw / mlx5 / gsi.c
1 /*
2  * Copyright (c) 2016, Mellanox Technologies. All rights reserved.
3  *
4  * This software is available to you under a choice of one of two
5  * licenses.  You may choose to be licensed under the terms of the GNU
6  * General Public License (GPL) Version 2, available from the file
7  * COPYING in the main directory of this source tree, or the
8  * OpenIB.org BSD license below:
9  *
10  *     Redistribution and use in source and binary forms, with or
11  *     without modification, are permitted provided that the following
12  *     conditions are met:
13  *
14  *      - Redistributions of source code must retain the above
15  *        copyright notice, this list of conditions and the following
16  *        disclaimer.
17  *
18  *      - Redistributions in binary form must reproduce the above
19  *        copyright notice, this list of conditions and the following
20  *        disclaimer in the documentation and/or other materials
21  *        provided with the distribution.
22  *
23  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND,
24  * EXPRESS OR IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF
25  * MERCHANTABILITY, FITNESS FOR A PARTICULAR PURPOSE AND
26  * NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT HOLDERS
27  * BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN
28  * ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN
29  * CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
30  * SOFTWARE.
31  */
32
33 #include "mlx5_ib.h"
34
35 struct mlx5_ib_gsi_wr {
36         struct ib_cqe cqe;
37         struct ib_wc wc;
38         bool completed:1;
39 };
40
41 static bool mlx5_ib_deth_sqpn_cap(struct mlx5_ib_dev *dev)
42 {
43         return MLX5_CAP_GEN(dev->mdev, set_deth_sqpn);
44 }
45
46 /* Call with gsi->lock locked */
47 static void generate_completions(struct mlx5_ib_qp *mqp)
48 {
49         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
50         struct ib_cq *gsi_cq = mqp->ibqp.send_cq;
51         struct mlx5_ib_gsi_wr *wr;
52         u32 index;
53
54         for (index = gsi->outstanding_ci; index != gsi->outstanding_pi;
55              index++) {
56                 wr = &gsi->outstanding_wrs[index % gsi->cap.max_send_wr];
57
58                 if (!wr->completed)
59                         break;
60
61                 WARN_ON_ONCE(mlx5_ib_generate_wc(gsi_cq, &wr->wc));
62                 wr->completed = false;
63         }
64
65         gsi->outstanding_ci = index;
66 }
67
68 static void handle_single_completion(struct ib_cq *cq, struct ib_wc *wc)
69 {
70         struct mlx5_ib_gsi_qp *gsi = cq->cq_context;
71         struct mlx5_ib_gsi_wr *wr =
72                 container_of(wc->wr_cqe, struct mlx5_ib_gsi_wr, cqe);
73         struct mlx5_ib_qp *mqp = container_of(gsi, struct mlx5_ib_qp, gsi);
74         u64 wr_id;
75         unsigned long flags;
76
77         spin_lock_irqsave(&gsi->lock, flags);
78         wr->completed = true;
79         wr_id = wr->wc.wr_id;
80         wr->wc = *wc;
81         wr->wc.wr_id = wr_id;
82         wr->wc.qp = &mqp->ibqp;
83
84         generate_completions(mqp);
85         spin_unlock_irqrestore(&gsi->lock, flags);
86 }
87
88 int mlx5_ib_create_gsi(struct ib_pd *pd, struct mlx5_ib_qp *mqp,
89                        struct ib_qp_init_attr *attr)
90 {
91         struct mlx5_ib_dev *dev = to_mdev(pd->device);
92         struct mlx5_ib_gsi_qp *gsi;
93         struct ib_qp_init_attr hw_init_attr = *attr;
94         const u8 port_num = attr->port_num;
95         int num_qps = 0;
96         int ret;
97
98         if (mlx5_ib_deth_sqpn_cap(dev)) {
99                 if (MLX5_CAP_GEN(dev->mdev,
100                                  port_type) == MLX5_CAP_PORT_TYPE_IB)
101                         num_qps = pd->device->attrs.max_pkeys;
102                 else if (dev->lag_active)
103                         num_qps = MLX5_MAX_PORTS;
104         }
105
106         gsi = &mqp->gsi;
107         gsi->tx_qps = kcalloc(num_qps, sizeof(*gsi->tx_qps), GFP_KERNEL);
108         if (!gsi->tx_qps)
109                 return -ENOMEM;
110
111         gsi->outstanding_wrs =
112                 kcalloc(attr->cap.max_send_wr, sizeof(*gsi->outstanding_wrs),
113                         GFP_KERNEL);
114         if (!gsi->outstanding_wrs) {
115                 ret = -ENOMEM;
116                 goto err_free_tx;
117         }
118
119         if (dev->devr.ports[port_num - 1].gsi) {
120                 mlx5_ib_warn(dev, "GSI QP already exists on port %d\n",
121                              port_num);
122                 ret = -EBUSY;
123                 goto err_free_wrs;
124         }
125         gsi->num_qps = num_qps;
126         spin_lock_init(&gsi->lock);
127
128         gsi->cap = attr->cap;
129         gsi->port_num = port_num;
130
131         gsi->cq = ib_alloc_cq(pd->device, gsi, attr->cap.max_send_wr, 0,
132                               IB_POLL_SOFTIRQ);
133         if (IS_ERR(gsi->cq)) {
134                 mlx5_ib_warn(dev, "unable to create send CQ for GSI QP. error %ld\n",
135                              PTR_ERR(gsi->cq));
136                 ret = PTR_ERR(gsi->cq);
137                 goto err_free_wrs;
138         }
139
140         hw_init_attr.qp_type = MLX5_IB_QPT_HW_GSI;
141         hw_init_attr.send_cq = gsi->cq;
142         if (num_qps) {
143                 hw_init_attr.cap.max_send_wr = 0;
144                 hw_init_attr.cap.max_send_sge = 0;
145                 hw_init_attr.cap.max_inline_data = 0;
146         }
147
148         gsi->rx_qp = mlx5_ib_create_qp(pd, &hw_init_attr, NULL);
149         if (IS_ERR(gsi->rx_qp)) {
150                 mlx5_ib_warn(dev, "unable to create hardware GSI QP. error %ld\n",
151                              PTR_ERR(gsi->rx_qp));
152                 ret = PTR_ERR(gsi->rx_qp);
153                 goto err_destroy_cq;
154         }
155         gsi->rx_qp->device = pd->device;
156         gsi->rx_qp->pd = pd;
157         gsi->rx_qp->real_qp = gsi->rx_qp;
158
159         gsi->rx_qp->qp_type = hw_init_attr.qp_type;
160         gsi->rx_qp->send_cq = hw_init_attr.send_cq;
161         gsi->rx_qp->recv_cq = hw_init_attr.recv_cq;
162         gsi->rx_qp->event_handler = hw_init_attr.event_handler;
163         spin_lock_init(&gsi->rx_qp->mr_lock);
164         INIT_LIST_HEAD(&gsi->rx_qp->rdma_mrs);
165         INIT_LIST_HEAD(&gsi->rx_qp->sig_mrs);
166
167         dev->devr.ports[attr->port_num - 1].gsi = gsi;
168         return 0;
169
170 err_destroy_cq:
171         ib_free_cq(gsi->cq);
172 err_free_wrs:
173         kfree(gsi->outstanding_wrs);
174 err_free_tx:
175         kfree(gsi->tx_qps);
176         return ret;
177 }
178
179 int mlx5_ib_destroy_gsi(struct mlx5_ib_qp *mqp)
180 {
181         struct mlx5_ib_dev *dev = to_mdev(mqp->ibqp.device);
182         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
183         const int port_num = gsi->port_num;
184         int qp_index;
185         int ret;
186
187         ret = mlx5_ib_destroy_qp(gsi->rx_qp, NULL);
188         if (ret) {
189                 mlx5_ib_warn(dev, "unable to destroy hardware GSI QP. error %d\n",
190                              ret);
191                 return ret;
192         }
193         dev->devr.ports[port_num - 1].gsi = NULL;
194         gsi->rx_qp = NULL;
195
196         for (qp_index = 0; qp_index < gsi->num_qps; ++qp_index) {
197                 if (!gsi->tx_qps[qp_index])
198                         continue;
199                 WARN_ON_ONCE(ib_destroy_qp(gsi->tx_qps[qp_index]));
200                 gsi->tx_qps[qp_index] = NULL;
201         }
202
203         ib_free_cq(gsi->cq);
204
205         kfree(gsi->outstanding_wrs);
206         kfree(gsi->tx_qps);
207         kfree(mqp);
208
209         return 0;
210 }
211
212 static struct ib_qp *create_gsi_ud_qp(struct mlx5_ib_gsi_qp *gsi)
213 {
214         struct ib_pd *pd = gsi->rx_qp->pd;
215         struct ib_qp_init_attr init_attr = {
216                 .event_handler = gsi->rx_qp->event_handler,
217                 .qp_context = gsi->rx_qp->qp_context,
218                 .send_cq = gsi->cq,
219                 .recv_cq = gsi->rx_qp->recv_cq,
220                 .cap = {
221                         .max_send_wr = gsi->cap.max_send_wr,
222                         .max_send_sge = gsi->cap.max_send_sge,
223                         .max_inline_data = gsi->cap.max_inline_data,
224                 },
225                 .qp_type = IB_QPT_UD,
226                 .create_flags = MLX5_IB_QP_CREATE_SQPN_QP1,
227         };
228
229         return ib_create_qp(pd, &init_attr);
230 }
231
232 static int modify_to_rts(struct mlx5_ib_gsi_qp *gsi, struct ib_qp *qp,
233                          u16 pkey_index)
234 {
235         struct mlx5_ib_dev *dev = to_mdev(qp->device);
236         struct ib_qp_attr attr;
237         int mask;
238         int ret;
239
240         mask = IB_QP_STATE | IB_QP_PKEY_INDEX | IB_QP_QKEY | IB_QP_PORT;
241         attr.qp_state = IB_QPS_INIT;
242         attr.pkey_index = pkey_index;
243         attr.qkey = IB_QP1_QKEY;
244         attr.port_num = gsi->port_num;
245         ret = ib_modify_qp(qp, &attr, mask);
246         if (ret) {
247                 mlx5_ib_err(dev, "could not change QP%d state to INIT: %d\n",
248                             qp->qp_num, ret);
249                 return ret;
250         }
251
252         attr.qp_state = IB_QPS_RTR;
253         ret = ib_modify_qp(qp, &attr, IB_QP_STATE);
254         if (ret) {
255                 mlx5_ib_err(dev, "could not change QP%d state to RTR: %d\n",
256                             qp->qp_num, ret);
257                 return ret;
258         }
259
260         attr.qp_state = IB_QPS_RTS;
261         attr.sq_psn = 0;
262         ret = ib_modify_qp(qp, &attr, IB_QP_STATE | IB_QP_SQ_PSN);
263         if (ret) {
264                 mlx5_ib_err(dev, "could not change QP%d state to RTS: %d\n",
265                             qp->qp_num, ret);
266                 return ret;
267         }
268
269         return 0;
270 }
271
272 static void setup_qp(struct mlx5_ib_gsi_qp *gsi, u16 qp_index)
273 {
274         struct ib_device *device = gsi->rx_qp->device;
275         struct mlx5_ib_dev *dev = to_mdev(device);
276         int pkey_index = qp_index;
277         struct mlx5_ib_qp *mqp;
278         struct ib_qp *qp;
279         unsigned long flags;
280         u16 pkey;
281         int ret;
282
283         if (MLX5_CAP_GEN(dev->mdev,  port_type) != MLX5_CAP_PORT_TYPE_IB)
284                 pkey_index = 0;
285
286         ret = ib_query_pkey(device, gsi->port_num, pkey_index, &pkey);
287         if (ret) {
288                 mlx5_ib_warn(dev, "unable to read P_Key at port %d, index %d\n",
289                              gsi->port_num, qp_index);
290                 return;
291         }
292
293         if (!pkey) {
294                 mlx5_ib_dbg(dev, "invalid P_Key at port %d, index %d.  Skipping.\n",
295                             gsi->port_num, qp_index);
296                 return;
297         }
298
299         spin_lock_irqsave(&gsi->lock, flags);
300         qp = gsi->tx_qps[qp_index];
301         spin_unlock_irqrestore(&gsi->lock, flags);
302         if (qp) {
303                 mlx5_ib_dbg(dev, "already existing GSI TX QP at port %d, index %d. Skipping\n",
304                             gsi->port_num, qp_index);
305                 return;
306         }
307
308         qp = create_gsi_ud_qp(gsi);
309         if (IS_ERR(qp)) {
310                 mlx5_ib_warn(dev, "unable to create hardware UD QP for GSI: %ld\n",
311                              PTR_ERR(qp));
312                 return;
313         }
314
315         mqp = to_mqp(qp);
316         if (dev->lag_active)
317                 mqp->gsi_lag_port = qp_index + 1;
318         ret = modify_to_rts(gsi, qp, pkey_index);
319         if (ret)
320                 goto err_destroy_qp;
321
322         spin_lock_irqsave(&gsi->lock, flags);
323         WARN_ON_ONCE(gsi->tx_qps[qp_index]);
324         gsi->tx_qps[qp_index] = qp;
325         spin_unlock_irqrestore(&gsi->lock, flags);
326
327         return;
328
329 err_destroy_qp:
330         WARN_ON_ONCE(qp);
331 }
332
333 int mlx5_ib_gsi_modify_qp(struct ib_qp *qp, struct ib_qp_attr *attr,
334                           int attr_mask)
335 {
336         struct mlx5_ib_dev *dev = to_mdev(qp->device);
337         struct mlx5_ib_qp *mqp = to_mqp(qp);
338         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
339         u16 qp_index;
340         int ret;
341
342         mlx5_ib_dbg(dev, "modifying GSI QP to state %d\n", attr->qp_state);
343
344         ret = ib_modify_qp(gsi->rx_qp, attr, attr_mask);
345         if (ret) {
346                 mlx5_ib_warn(dev, "unable to modify GSI rx QP: %d\n", ret);
347                 return ret;
348         }
349
350         if (to_mqp(gsi->rx_qp)->state != IB_QPS_RTS)
351                 return 0;
352
353         for (qp_index = 0; qp_index < gsi->num_qps; ++qp_index)
354                 setup_qp(gsi, qp_index);
355         return 0;
356 }
357
358 int mlx5_ib_gsi_query_qp(struct ib_qp *qp, struct ib_qp_attr *qp_attr,
359                          int qp_attr_mask,
360                          struct ib_qp_init_attr *qp_init_attr)
361 {
362         struct mlx5_ib_qp *mqp = to_mqp(qp);
363         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
364         int ret;
365
366         ret = ib_query_qp(gsi->rx_qp, qp_attr, qp_attr_mask, qp_init_attr);
367         qp_init_attr->cap = gsi->cap;
368         return ret;
369 }
370
371 /* Call with gsi->lock locked */
372 static int mlx5_ib_add_outstanding_wr(struct mlx5_ib_qp *mqp,
373                                       struct ib_ud_wr *wr, struct ib_wc *wc)
374 {
375         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
376         struct mlx5_ib_dev *dev = to_mdev(gsi->rx_qp->device);
377         struct mlx5_ib_gsi_wr *gsi_wr;
378
379         if (gsi->outstanding_pi == gsi->outstanding_ci + gsi->cap.max_send_wr) {
380                 mlx5_ib_warn(dev, "no available GSI work request.\n");
381                 return -ENOMEM;
382         }
383
384         gsi_wr = &gsi->outstanding_wrs[gsi->outstanding_pi %
385                                        gsi->cap.max_send_wr];
386         gsi->outstanding_pi++;
387
388         if (!wc) {
389                 memset(&gsi_wr->wc, 0, sizeof(gsi_wr->wc));
390                 gsi_wr->wc.pkey_index = wr->pkey_index;
391                 gsi_wr->wc.wr_id = wr->wr.wr_id;
392         } else {
393                 gsi_wr->wc = *wc;
394                 gsi_wr->completed = true;
395         }
396
397         gsi_wr->cqe.done = &handle_single_completion;
398         wr->wr.wr_cqe = &gsi_wr->cqe;
399
400         return 0;
401 }
402
403 /* Call with gsi->lock locked */
404 static int mlx5_ib_gsi_silent_drop(struct mlx5_ib_qp *mqp, struct ib_ud_wr *wr)
405 {
406         struct ib_wc wc = {
407                 { .wr_id = wr->wr.wr_id },
408                 .status = IB_WC_SUCCESS,
409                 .opcode = IB_WC_SEND,
410                 .qp = &mqp->ibqp,
411         };
412         int ret;
413
414         ret = mlx5_ib_add_outstanding_wr(mqp, wr, &wc);
415         if (ret)
416                 return ret;
417
418         generate_completions(mqp);
419
420         return 0;
421 }
422
423 /* Call with gsi->lock locked */
424 static struct ib_qp *get_tx_qp(struct mlx5_ib_gsi_qp *gsi, struct ib_ud_wr *wr)
425 {
426         struct mlx5_ib_dev *dev = to_mdev(gsi->rx_qp->device);
427         struct mlx5_ib_ah *ah = to_mah(wr->ah);
428         int qp_index = wr->pkey_index;
429
430         if (!gsi->num_qps)
431                 return gsi->rx_qp;
432
433         if (dev->lag_active && ah->xmit_port)
434                 qp_index = ah->xmit_port - 1;
435
436         if (qp_index >= gsi->num_qps)
437                 return NULL;
438
439         return gsi->tx_qps[qp_index];
440 }
441
442 int mlx5_ib_gsi_post_send(struct ib_qp *qp, const struct ib_send_wr *wr,
443                           const struct ib_send_wr **bad_wr)
444 {
445         struct mlx5_ib_qp *mqp = to_mqp(qp);
446         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
447         struct ib_qp *tx_qp;
448         unsigned long flags;
449         int ret;
450
451         for (; wr; wr = wr->next) {
452                 struct ib_ud_wr cur_wr = *ud_wr(wr);
453
454                 cur_wr.wr.next = NULL;
455
456                 spin_lock_irqsave(&gsi->lock, flags);
457                 tx_qp = get_tx_qp(gsi, &cur_wr);
458                 if (!tx_qp) {
459                         ret = mlx5_ib_gsi_silent_drop(mqp, &cur_wr);
460                         if (ret)
461                                 goto err;
462                         spin_unlock_irqrestore(&gsi->lock, flags);
463                         continue;
464                 }
465
466                 ret = mlx5_ib_add_outstanding_wr(mqp, &cur_wr, NULL);
467                 if (ret)
468                         goto err;
469
470                 ret = ib_post_send(tx_qp, &cur_wr.wr, bad_wr);
471                 if (ret) {
472                         /* Undo the effect of adding the outstanding wr */
473                         gsi->outstanding_pi--;
474                         goto err;
475                 }
476                 spin_unlock_irqrestore(&gsi->lock, flags);
477         }
478
479         return 0;
480
481 err:
482         spin_unlock_irqrestore(&gsi->lock, flags);
483         *bad_wr = wr;
484         return ret;
485 }
486
487 int mlx5_ib_gsi_post_recv(struct ib_qp *qp, const struct ib_recv_wr *wr,
488                           const struct ib_recv_wr **bad_wr)
489 {
490         struct mlx5_ib_qp *mqp = to_mqp(qp);
491         struct mlx5_ib_gsi_qp *gsi = &mqp->gsi;
492
493         return ib_post_recv(gsi->rx_qp, wr, bad_wr);
494 }
495
496 void mlx5_ib_gsi_pkey_change(struct mlx5_ib_gsi_qp *gsi)
497 {
498         u16 qp_index;
499
500         for (qp_index = 0; qp_index < gsi->num_qps; ++qp_index)
501                 setup_qp(gsi, qp_index);
502 }