Merge tag 'powerpc-5.9-3' of git://git.kernel.org/pub/scm/linux/kernel/git/powerpc...
[linux-2.6-microblaze.git] / net / qrtr / qrtr.c
1 // SPDX-License-Identifier: GPL-2.0-only
2 /*
3  * Copyright (c) 2015, Sony Mobile Communications Inc.
4  * Copyright (c) 2013, The Linux Foundation. All rights reserved.
5  */
6 #include <linux/module.h>
7 #include <linux/netlink.h>
8 #include <linux/qrtr.h>
9 #include <linux/termios.h>      /* For TIOCINQ/OUTQ */
10 #include <linux/spinlock.h>
11 #include <linux/wait.h>
12
13 #include <net/sock.h>
14
15 #include "qrtr.h"
16
17 #define QRTR_PROTO_VER_1 1
18 #define QRTR_PROTO_VER_2 3
19
20 /* auto-bind range */
21 #define QRTR_MIN_EPH_SOCKET 0x4000
22 #define QRTR_MAX_EPH_SOCKET 0x7fff
23
24 /**
25  * struct qrtr_hdr_v1 - (I|R)PCrouter packet header version 1
26  * @version: protocol version
27  * @type: packet type; one of QRTR_TYPE_*
28  * @src_node_id: source node
29  * @src_port_id: source port
30  * @confirm_rx: boolean; whether a resume-tx packet should be send in reply
31  * @size: length of packet, excluding this header
32  * @dst_node_id: destination node
33  * @dst_port_id: destination port
34  */
35 struct qrtr_hdr_v1 {
36         __le32 version;
37         __le32 type;
38         __le32 src_node_id;
39         __le32 src_port_id;
40         __le32 confirm_rx;
41         __le32 size;
42         __le32 dst_node_id;
43         __le32 dst_port_id;
44 } __packed;
45
46 /**
47  * struct qrtr_hdr_v2 - (I|R)PCrouter packet header later versions
48  * @version: protocol version
49  * @type: packet type; one of QRTR_TYPE_*
50  * @flags: bitmask of QRTR_FLAGS_*
51  * @optlen: length of optional header data
52  * @size: length of packet, excluding this header and optlen
53  * @src_node_id: source node
54  * @src_port_id: source port
55  * @dst_node_id: destination node
56  * @dst_port_id: destination port
57  */
58 struct qrtr_hdr_v2 {
59         u8 version;
60         u8 type;
61         u8 flags;
62         u8 optlen;
63         __le32 size;
64         __le16 src_node_id;
65         __le16 src_port_id;
66         __le16 dst_node_id;
67         __le16 dst_port_id;
68 };
69
70 #define QRTR_FLAGS_CONFIRM_RX   BIT(0)
71
72 struct qrtr_cb {
73         u32 src_node;
74         u32 src_port;
75         u32 dst_node;
76         u32 dst_port;
77
78         u8 type;
79         u8 confirm_rx;
80 };
81
82 #define QRTR_HDR_MAX_SIZE max_t(size_t, sizeof(struct qrtr_hdr_v1), \
83                                         sizeof(struct qrtr_hdr_v2))
84
85 struct qrtr_sock {
86         /* WARNING: sk must be the first member */
87         struct sock sk;
88         struct sockaddr_qrtr us;
89         struct sockaddr_qrtr peer;
90 };
91
92 static inline struct qrtr_sock *qrtr_sk(struct sock *sk)
93 {
94         BUILD_BUG_ON(offsetof(struct qrtr_sock, sk) != 0);
95         return container_of(sk, struct qrtr_sock, sk);
96 }
97
98 static unsigned int qrtr_local_nid = 1;
99
100 /* for node ids */
101 static RADIX_TREE(qrtr_nodes, GFP_ATOMIC);
102 static DEFINE_SPINLOCK(qrtr_nodes_lock);
103 /* broadcast list */
104 static LIST_HEAD(qrtr_all_nodes);
105 /* lock for qrtr_all_nodes and node reference */
106 static DEFINE_MUTEX(qrtr_node_lock);
107
108 /* local port allocation management */
109 static DEFINE_IDR(qrtr_ports);
110 static DEFINE_MUTEX(qrtr_port_lock);
111
112 /**
113  * struct qrtr_node - endpoint node
114  * @ep_lock: lock for endpoint management and callbacks
115  * @ep: endpoint
116  * @ref: reference count for node
117  * @nid: node id
118  * @qrtr_tx_flow: tree of qrtr_tx_flow, keyed by node << 32 | port
119  * @qrtr_tx_lock: lock for qrtr_tx_flow inserts
120  * @rx_queue: receive queue
121  * @item: list item for broadcast list
122  */
123 struct qrtr_node {
124         struct mutex ep_lock;
125         struct qrtr_endpoint *ep;
126         struct kref ref;
127         unsigned int nid;
128
129         struct radix_tree_root qrtr_tx_flow;
130         struct mutex qrtr_tx_lock; /* for qrtr_tx_flow */
131
132         struct sk_buff_head rx_queue;
133         struct list_head item;
134 };
135
136 /**
137  * struct qrtr_tx_flow - tx flow control
138  * @resume_tx: waiters for a resume tx from the remote
139  * @pending: number of waiting senders
140  * @tx_failed: indicates that a message with confirm_rx flag was lost
141  */
142 struct qrtr_tx_flow {
143         struct wait_queue_head resume_tx;
144         int pending;
145         int tx_failed;
146 };
147
148 #define QRTR_TX_FLOW_HIGH       10
149 #define QRTR_TX_FLOW_LOW        5
150
151 static int qrtr_local_enqueue(struct qrtr_node *node, struct sk_buff *skb,
152                               int type, struct sockaddr_qrtr *from,
153                               struct sockaddr_qrtr *to);
154 static int qrtr_bcast_enqueue(struct qrtr_node *node, struct sk_buff *skb,
155                               int type, struct sockaddr_qrtr *from,
156                               struct sockaddr_qrtr *to);
157 static struct qrtr_sock *qrtr_port_lookup(int port);
158 static void qrtr_port_put(struct qrtr_sock *ipc);
159
160 /* Release node resources and free the node.
161  *
162  * Do not call directly, use qrtr_node_release.  To be used with
163  * kref_put_mutex.  As such, the node mutex is expected to be locked on call.
164  */
165 static void __qrtr_node_release(struct kref *kref)
166 {
167         struct qrtr_node *node = container_of(kref, struct qrtr_node, ref);
168         struct radix_tree_iter iter;
169         struct qrtr_tx_flow *flow;
170         unsigned long flags;
171         void __rcu **slot;
172
173         spin_lock_irqsave(&qrtr_nodes_lock, flags);
174         if (node->nid != QRTR_EP_NID_AUTO)
175                 radix_tree_delete(&qrtr_nodes, node->nid);
176         spin_unlock_irqrestore(&qrtr_nodes_lock, flags);
177
178         list_del(&node->item);
179         mutex_unlock(&qrtr_node_lock);
180
181         skb_queue_purge(&node->rx_queue);
182
183         /* Free tx flow counters */
184         radix_tree_for_each_slot(slot, &node->qrtr_tx_flow, &iter, 0) {
185                 flow = *slot;
186                 radix_tree_iter_delete(&node->qrtr_tx_flow, &iter, slot);
187                 kfree(flow);
188         }
189         kfree(node);
190 }
191
192 /* Increment reference to node. */
193 static struct qrtr_node *qrtr_node_acquire(struct qrtr_node *node)
194 {
195         if (node)
196                 kref_get(&node->ref);
197         return node;
198 }
199
200 /* Decrement reference to node and release as necessary. */
201 static void qrtr_node_release(struct qrtr_node *node)
202 {
203         if (!node)
204                 return;
205         kref_put_mutex(&node->ref, __qrtr_node_release, &qrtr_node_lock);
206 }
207
208 /**
209  * qrtr_tx_resume() - reset flow control counter
210  * @node:       qrtr_node that the QRTR_TYPE_RESUME_TX packet arrived on
211  * @skb:        resume_tx packet
212  */
213 static void qrtr_tx_resume(struct qrtr_node *node, struct sk_buff *skb)
214 {
215         struct qrtr_ctrl_pkt *pkt = (struct qrtr_ctrl_pkt *)skb->data;
216         u64 remote_node = le32_to_cpu(pkt->client.node);
217         u32 remote_port = le32_to_cpu(pkt->client.port);
218         struct qrtr_tx_flow *flow;
219         unsigned long key;
220
221         key = remote_node << 32 | remote_port;
222
223         rcu_read_lock();
224         flow = radix_tree_lookup(&node->qrtr_tx_flow, key);
225         rcu_read_unlock();
226         if (flow) {
227                 spin_lock(&flow->resume_tx.lock);
228                 flow->pending = 0;
229                 spin_unlock(&flow->resume_tx.lock);
230                 wake_up_interruptible_all(&flow->resume_tx);
231         }
232
233         consume_skb(skb);
234 }
235
236 /**
237  * qrtr_tx_wait() - flow control for outgoing packets
238  * @node:       qrtr_node that the packet is to be send to
239  * @dest_node:  node id of the destination
240  * @dest_port:  port number of the destination
241  * @type:       type of message
242  *
243  * The flow control scheme is based around the low and high "watermarks". When
244  * the low watermark is passed the confirm_rx flag is set on the outgoing
245  * message, which will trigger the remote to send a control message of the type
246  * QRTR_TYPE_RESUME_TX to reset the counter. If the high watermark is hit
247  * further transmision should be paused.
248  *
249  * Return: 1 if confirm_rx should be set, 0 otherwise or errno failure
250  */
251 static int qrtr_tx_wait(struct qrtr_node *node, int dest_node, int dest_port,
252                         int type)
253 {
254         unsigned long key = (u64)dest_node << 32 | dest_port;
255         struct qrtr_tx_flow *flow;
256         int confirm_rx = 0;
257         int ret;
258
259         /* Never set confirm_rx on non-data packets */
260         if (type != QRTR_TYPE_DATA)
261                 return 0;
262
263         mutex_lock(&node->qrtr_tx_lock);
264         flow = radix_tree_lookup(&node->qrtr_tx_flow, key);
265         if (!flow) {
266                 flow = kzalloc(sizeof(*flow), GFP_KERNEL);
267                 if (flow) {
268                         init_waitqueue_head(&flow->resume_tx);
269                         radix_tree_insert(&node->qrtr_tx_flow, key, flow);
270                 }
271         }
272         mutex_unlock(&node->qrtr_tx_lock);
273
274         /* Set confirm_rx if we where unable to find and allocate a flow */
275         if (!flow)
276                 return 1;
277
278         spin_lock_irq(&flow->resume_tx.lock);
279         ret = wait_event_interruptible_locked_irq(flow->resume_tx,
280                                                   flow->pending < QRTR_TX_FLOW_HIGH ||
281                                                   flow->tx_failed ||
282                                                   !node->ep);
283         if (ret < 0) {
284                 confirm_rx = ret;
285         } else if (!node->ep) {
286                 confirm_rx = -EPIPE;
287         } else if (flow->tx_failed) {
288                 flow->tx_failed = 0;
289                 confirm_rx = 1;
290         } else {
291                 flow->pending++;
292                 confirm_rx = flow->pending == QRTR_TX_FLOW_LOW;
293         }
294         spin_unlock_irq(&flow->resume_tx.lock);
295
296         return confirm_rx;
297 }
298
299 /**
300  * qrtr_tx_flow_failed() - flag that tx of confirm_rx flagged messages failed
301  * @node:       qrtr_node that the packet is to be send to
302  * @dest_node:  node id of the destination
303  * @dest_port:  port number of the destination
304  *
305  * Signal that the transmission of a message with confirm_rx flag failed. The
306  * flow's "pending" counter will keep incrementing towards QRTR_TX_FLOW_HIGH,
307  * at which point transmission would stall forever waiting for the resume TX
308  * message associated with the dropped confirm_rx message.
309  * Work around this by marking the flow as having a failed transmission and
310  * cause the next transmission attempt to be sent with the confirm_rx.
311  */
312 static void qrtr_tx_flow_failed(struct qrtr_node *node, int dest_node,
313                                 int dest_port)
314 {
315         unsigned long key = (u64)dest_node << 32 | dest_port;
316         struct qrtr_tx_flow *flow;
317
318         rcu_read_lock();
319         flow = radix_tree_lookup(&node->qrtr_tx_flow, key);
320         rcu_read_unlock();
321         if (flow) {
322                 spin_lock_irq(&flow->resume_tx.lock);
323                 flow->tx_failed = 1;
324                 spin_unlock_irq(&flow->resume_tx.lock);
325         }
326 }
327
328 /* Pass an outgoing packet socket buffer to the endpoint driver. */
329 static int qrtr_node_enqueue(struct qrtr_node *node, struct sk_buff *skb,
330                              int type, struct sockaddr_qrtr *from,
331                              struct sockaddr_qrtr *to)
332 {
333         struct qrtr_hdr_v1 *hdr;
334         size_t len = skb->len;
335         int rc = -ENODEV;
336         int confirm_rx;
337
338         confirm_rx = qrtr_tx_wait(node, to->sq_node, to->sq_port, type);
339         if (confirm_rx < 0) {
340                 kfree_skb(skb);
341                 return confirm_rx;
342         }
343
344         hdr = skb_push(skb, sizeof(*hdr));
345         hdr->version = cpu_to_le32(QRTR_PROTO_VER_1);
346         hdr->type = cpu_to_le32(type);
347         hdr->src_node_id = cpu_to_le32(from->sq_node);
348         hdr->src_port_id = cpu_to_le32(from->sq_port);
349         if (to->sq_port == QRTR_PORT_CTRL) {
350                 hdr->dst_node_id = cpu_to_le32(node->nid);
351                 hdr->dst_port_id = cpu_to_le32(QRTR_NODE_BCAST);
352         } else {
353                 hdr->dst_node_id = cpu_to_le32(to->sq_node);
354                 hdr->dst_port_id = cpu_to_le32(to->sq_port);
355         }
356
357         hdr->size = cpu_to_le32(len);
358         hdr->confirm_rx = !!confirm_rx;
359
360         skb_put_padto(skb, ALIGN(len, 4) + sizeof(*hdr));
361
362         mutex_lock(&node->ep_lock);
363         if (node->ep)
364                 rc = node->ep->xmit(node->ep, skb);
365         else
366                 kfree_skb(skb);
367         mutex_unlock(&node->ep_lock);
368
369         /* Need to ensure that a subsequent message carries the otherwise lost
370          * confirm_rx flag if we dropped this one */
371         if (rc && confirm_rx)
372                 qrtr_tx_flow_failed(node, to->sq_node, to->sq_port);
373
374         return rc;
375 }
376
377 /* Lookup node by id.
378  *
379  * callers must release with qrtr_node_release()
380  */
381 static struct qrtr_node *qrtr_node_lookup(unsigned int nid)
382 {
383         struct qrtr_node *node;
384         unsigned long flags;
385
386         spin_lock_irqsave(&qrtr_nodes_lock, flags);
387         node = radix_tree_lookup(&qrtr_nodes, nid);
388         node = qrtr_node_acquire(node);
389         spin_unlock_irqrestore(&qrtr_nodes_lock, flags);
390
391         return node;
392 }
393
394 /* Assign node id to node.
395  *
396  * This is mostly useful for automatic node id assignment, based on
397  * the source id in the incoming packet.
398  */
399 static void qrtr_node_assign(struct qrtr_node *node, unsigned int nid)
400 {
401         unsigned long flags;
402
403         if (node->nid != QRTR_EP_NID_AUTO || nid == QRTR_EP_NID_AUTO)
404                 return;
405
406         spin_lock_irqsave(&qrtr_nodes_lock, flags);
407         radix_tree_insert(&qrtr_nodes, nid, node);
408         node->nid = nid;
409         spin_unlock_irqrestore(&qrtr_nodes_lock, flags);
410 }
411
412 /**
413  * qrtr_endpoint_post() - post incoming data
414  * @ep: endpoint handle
415  * @data: data pointer
416  * @len: size of data in bytes
417  *
418  * Return: 0 on success; negative error code on failure
419  */
420 int qrtr_endpoint_post(struct qrtr_endpoint *ep, const void *data, size_t len)
421 {
422         struct qrtr_node *node = ep->node;
423         const struct qrtr_hdr_v1 *v1;
424         const struct qrtr_hdr_v2 *v2;
425         struct qrtr_sock *ipc;
426         struct sk_buff *skb;
427         struct qrtr_cb *cb;
428         unsigned int size;
429         unsigned int ver;
430         size_t hdrlen;
431
432         if (len == 0 || len & 3)
433                 return -EINVAL;
434
435         skb = netdev_alloc_skb(NULL, len);
436         if (!skb)
437                 return -ENOMEM;
438
439         cb = (struct qrtr_cb *)skb->cb;
440
441         /* Version field in v1 is little endian, so this works for both cases */
442         ver = *(u8*)data;
443
444         switch (ver) {
445         case QRTR_PROTO_VER_1:
446                 if (len < sizeof(*v1))
447                         goto err;
448                 v1 = data;
449                 hdrlen = sizeof(*v1);
450
451                 cb->type = le32_to_cpu(v1->type);
452                 cb->src_node = le32_to_cpu(v1->src_node_id);
453                 cb->src_port = le32_to_cpu(v1->src_port_id);
454                 cb->confirm_rx = !!v1->confirm_rx;
455                 cb->dst_node = le32_to_cpu(v1->dst_node_id);
456                 cb->dst_port = le32_to_cpu(v1->dst_port_id);
457
458                 size = le32_to_cpu(v1->size);
459                 break;
460         case QRTR_PROTO_VER_2:
461                 if (len < sizeof(*v2))
462                         goto err;
463                 v2 = data;
464                 hdrlen = sizeof(*v2) + v2->optlen;
465
466                 cb->type = v2->type;
467                 cb->confirm_rx = !!(v2->flags & QRTR_FLAGS_CONFIRM_RX);
468                 cb->src_node = le16_to_cpu(v2->src_node_id);
469                 cb->src_port = le16_to_cpu(v2->src_port_id);
470                 cb->dst_node = le16_to_cpu(v2->dst_node_id);
471                 cb->dst_port = le16_to_cpu(v2->dst_port_id);
472
473                 if (cb->src_port == (u16)QRTR_PORT_CTRL)
474                         cb->src_port = QRTR_PORT_CTRL;
475                 if (cb->dst_port == (u16)QRTR_PORT_CTRL)
476                         cb->dst_port = QRTR_PORT_CTRL;
477
478                 size = le32_to_cpu(v2->size);
479                 break;
480         default:
481                 pr_err("qrtr: Invalid version %d\n", ver);
482                 goto err;
483         }
484
485         if (len != ALIGN(size, 4) + hdrlen)
486                 goto err;
487
488         if (cb->dst_port != QRTR_PORT_CTRL && cb->type != QRTR_TYPE_DATA &&
489             cb->type != QRTR_TYPE_RESUME_TX)
490                 goto err;
491
492         skb_put_data(skb, data + hdrlen, size);
493
494         qrtr_node_assign(node, cb->src_node);
495
496         if (cb->type == QRTR_TYPE_RESUME_TX) {
497                 qrtr_tx_resume(node, skb);
498         } else {
499                 ipc = qrtr_port_lookup(cb->dst_port);
500                 if (!ipc)
501                         goto err;
502
503                 if (sock_queue_rcv_skb(&ipc->sk, skb))
504                         goto err;
505
506                 qrtr_port_put(ipc);
507         }
508
509         return 0;
510
511 err:
512         kfree_skb(skb);
513         return -EINVAL;
514
515 }
516 EXPORT_SYMBOL_GPL(qrtr_endpoint_post);
517
518 /**
519  * qrtr_alloc_ctrl_packet() - allocate control packet skb
520  * @pkt: reference to qrtr_ctrl_pkt pointer
521  *
522  * Returns newly allocated sk_buff, or NULL on failure
523  *
524  * This function allocates a sk_buff large enough to carry a qrtr_ctrl_pkt and
525  * on success returns a reference to the control packet in @pkt.
526  */
527 static struct sk_buff *qrtr_alloc_ctrl_packet(struct qrtr_ctrl_pkt **pkt)
528 {
529         const int pkt_len = sizeof(struct qrtr_ctrl_pkt);
530         struct sk_buff *skb;
531
532         skb = alloc_skb(QRTR_HDR_MAX_SIZE + pkt_len, GFP_KERNEL);
533         if (!skb)
534                 return NULL;
535
536         skb_reserve(skb, QRTR_HDR_MAX_SIZE);
537         *pkt = skb_put_zero(skb, pkt_len);
538
539         return skb;
540 }
541
542 /**
543  * qrtr_endpoint_register() - register a new endpoint
544  * @ep: endpoint to register
545  * @nid: desired node id; may be QRTR_EP_NID_AUTO for auto-assignment
546  * Return: 0 on success; negative error code on failure
547  *
548  * The specified endpoint must have the xmit function pointer set on call.
549  */
550 int qrtr_endpoint_register(struct qrtr_endpoint *ep, unsigned int nid)
551 {
552         struct qrtr_node *node;
553
554         if (!ep || !ep->xmit)
555                 return -EINVAL;
556
557         node = kzalloc(sizeof(*node), GFP_KERNEL);
558         if (!node)
559                 return -ENOMEM;
560
561         kref_init(&node->ref);
562         mutex_init(&node->ep_lock);
563         skb_queue_head_init(&node->rx_queue);
564         node->nid = QRTR_EP_NID_AUTO;
565         node->ep = ep;
566
567         INIT_RADIX_TREE(&node->qrtr_tx_flow, GFP_KERNEL);
568         mutex_init(&node->qrtr_tx_lock);
569
570         qrtr_node_assign(node, nid);
571
572         mutex_lock(&qrtr_node_lock);
573         list_add(&node->item, &qrtr_all_nodes);
574         mutex_unlock(&qrtr_node_lock);
575         ep->node = node;
576
577         return 0;
578 }
579 EXPORT_SYMBOL_GPL(qrtr_endpoint_register);
580
581 /**
582  * qrtr_endpoint_unregister - unregister endpoint
583  * @ep: endpoint to unregister
584  */
585 void qrtr_endpoint_unregister(struct qrtr_endpoint *ep)
586 {
587         struct qrtr_node *node = ep->node;
588         struct sockaddr_qrtr src = {AF_QIPCRTR, node->nid, QRTR_PORT_CTRL};
589         struct sockaddr_qrtr dst = {AF_QIPCRTR, qrtr_local_nid, QRTR_PORT_CTRL};
590         struct radix_tree_iter iter;
591         struct qrtr_ctrl_pkt *pkt;
592         struct qrtr_tx_flow *flow;
593         struct sk_buff *skb;
594         void __rcu **slot;
595
596         mutex_lock(&node->ep_lock);
597         node->ep = NULL;
598         mutex_unlock(&node->ep_lock);
599
600         /* Notify the local controller about the event */
601         skb = qrtr_alloc_ctrl_packet(&pkt);
602         if (skb) {
603                 pkt->cmd = cpu_to_le32(QRTR_TYPE_BYE);
604                 qrtr_local_enqueue(NULL, skb, QRTR_TYPE_BYE, &src, &dst);
605         }
606
607         /* Wake up any transmitters waiting for resume-tx from the node */
608         mutex_lock(&node->qrtr_tx_lock);
609         radix_tree_for_each_slot(slot, &node->qrtr_tx_flow, &iter, 0) {
610                 flow = *slot;
611                 wake_up_interruptible_all(&flow->resume_tx);
612         }
613         mutex_unlock(&node->qrtr_tx_lock);
614
615         qrtr_node_release(node);
616         ep->node = NULL;
617 }
618 EXPORT_SYMBOL_GPL(qrtr_endpoint_unregister);
619
620 /* Lookup socket by port.
621  *
622  * Callers must release with qrtr_port_put()
623  */
624 static struct qrtr_sock *qrtr_port_lookup(int port)
625 {
626         struct qrtr_sock *ipc;
627
628         if (port == QRTR_PORT_CTRL)
629                 port = 0;
630
631         rcu_read_lock();
632         ipc = idr_find(&qrtr_ports, port);
633         if (ipc)
634                 sock_hold(&ipc->sk);
635         rcu_read_unlock();
636
637         return ipc;
638 }
639
640 /* Release acquired socket. */
641 static void qrtr_port_put(struct qrtr_sock *ipc)
642 {
643         sock_put(&ipc->sk);
644 }
645
646 /* Remove port assignment. */
647 static void qrtr_port_remove(struct qrtr_sock *ipc)
648 {
649         struct qrtr_ctrl_pkt *pkt;
650         struct sk_buff *skb;
651         int port = ipc->us.sq_port;
652         struct sockaddr_qrtr to;
653
654         to.sq_family = AF_QIPCRTR;
655         to.sq_node = QRTR_NODE_BCAST;
656         to.sq_port = QRTR_PORT_CTRL;
657
658         skb = qrtr_alloc_ctrl_packet(&pkt);
659         if (skb) {
660                 pkt->cmd = cpu_to_le32(QRTR_TYPE_DEL_CLIENT);
661                 pkt->client.node = cpu_to_le32(ipc->us.sq_node);
662                 pkt->client.port = cpu_to_le32(ipc->us.sq_port);
663
664                 skb_set_owner_w(skb, &ipc->sk);
665                 qrtr_bcast_enqueue(NULL, skb, QRTR_TYPE_DEL_CLIENT, &ipc->us,
666                                    &to);
667         }
668
669         if (port == QRTR_PORT_CTRL)
670                 port = 0;
671
672         __sock_put(&ipc->sk);
673
674         mutex_lock(&qrtr_port_lock);
675         idr_remove(&qrtr_ports, port);
676         mutex_unlock(&qrtr_port_lock);
677
678         /* Ensure that if qrtr_port_lookup() did enter the RCU read section we
679          * wait for it to up increment the refcount */
680         synchronize_rcu();
681 }
682
683 /* Assign port number to socket.
684  *
685  * Specify port in the integer pointed to by port, and it will be adjusted
686  * on return as necesssary.
687  *
688  * Port may be:
689  *   0: Assign ephemeral port in [QRTR_MIN_EPH_SOCKET, QRTR_MAX_EPH_SOCKET]
690  *   <QRTR_MIN_EPH_SOCKET: Specified; requires CAP_NET_ADMIN
691  *   >QRTR_MIN_EPH_SOCKET: Specified; available to all
692  */
693 static int qrtr_port_assign(struct qrtr_sock *ipc, int *port)
694 {
695         u32 min_port;
696         int rc;
697
698         mutex_lock(&qrtr_port_lock);
699         if (!*port) {
700                 min_port = QRTR_MIN_EPH_SOCKET;
701                 rc = idr_alloc_u32(&qrtr_ports, ipc, &min_port, QRTR_MAX_EPH_SOCKET, GFP_ATOMIC);
702                 if (!rc)
703                         *port = min_port;
704         } else if (*port < QRTR_MIN_EPH_SOCKET && !capable(CAP_NET_ADMIN)) {
705                 rc = -EACCES;
706         } else if (*port == QRTR_PORT_CTRL) {
707                 min_port = 0;
708                 rc = idr_alloc_u32(&qrtr_ports, ipc, &min_port, 0, GFP_ATOMIC);
709         } else {
710                 min_port = *port;
711                 rc = idr_alloc_u32(&qrtr_ports, ipc, &min_port, *port, GFP_ATOMIC);
712                 if (!rc)
713                         *port = min_port;
714         }
715         mutex_unlock(&qrtr_port_lock);
716
717         if (rc == -ENOSPC)
718                 return -EADDRINUSE;
719         else if (rc < 0)
720                 return rc;
721
722         sock_hold(&ipc->sk);
723
724         return 0;
725 }
726
727 /* Reset all non-control ports */
728 static void qrtr_reset_ports(void)
729 {
730         struct qrtr_sock *ipc;
731         int id;
732
733         mutex_lock(&qrtr_port_lock);
734         idr_for_each_entry(&qrtr_ports, ipc, id) {
735                 /* Don't reset control port */
736                 if (id == 0)
737                         continue;
738
739                 sock_hold(&ipc->sk);
740                 ipc->sk.sk_err = ENETRESET;
741                 ipc->sk.sk_error_report(&ipc->sk);
742                 sock_put(&ipc->sk);
743         }
744         mutex_unlock(&qrtr_port_lock);
745 }
746
747 /* Bind socket to address.
748  *
749  * Socket should be locked upon call.
750  */
751 static int __qrtr_bind(struct socket *sock,
752                        const struct sockaddr_qrtr *addr, int zapped)
753 {
754         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
755         struct sock *sk = sock->sk;
756         int port;
757         int rc;
758
759         /* rebinding ok */
760         if (!zapped && addr->sq_port == ipc->us.sq_port)
761                 return 0;
762
763         port = addr->sq_port;
764         rc = qrtr_port_assign(ipc, &port);
765         if (rc)
766                 return rc;
767
768         /* unbind previous, if any */
769         if (!zapped)
770                 qrtr_port_remove(ipc);
771         ipc->us.sq_port = port;
772
773         sock_reset_flag(sk, SOCK_ZAPPED);
774
775         /* Notify all open ports about the new controller */
776         if (port == QRTR_PORT_CTRL)
777                 qrtr_reset_ports();
778
779         return 0;
780 }
781
782 /* Auto bind to an ephemeral port. */
783 static int qrtr_autobind(struct socket *sock)
784 {
785         struct sock *sk = sock->sk;
786         struct sockaddr_qrtr addr;
787
788         if (!sock_flag(sk, SOCK_ZAPPED))
789                 return 0;
790
791         addr.sq_family = AF_QIPCRTR;
792         addr.sq_node = qrtr_local_nid;
793         addr.sq_port = 0;
794
795         return __qrtr_bind(sock, &addr, 1);
796 }
797
798 /* Bind socket to specified sockaddr. */
799 static int qrtr_bind(struct socket *sock, struct sockaddr *saddr, int len)
800 {
801         DECLARE_SOCKADDR(struct sockaddr_qrtr *, addr, saddr);
802         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
803         struct sock *sk = sock->sk;
804         int rc;
805
806         if (len < sizeof(*addr) || addr->sq_family != AF_QIPCRTR)
807                 return -EINVAL;
808
809         if (addr->sq_node != ipc->us.sq_node)
810                 return -EINVAL;
811
812         lock_sock(sk);
813         rc = __qrtr_bind(sock, addr, sock_flag(sk, SOCK_ZAPPED));
814         release_sock(sk);
815
816         return rc;
817 }
818
819 /* Queue packet to local peer socket. */
820 static int qrtr_local_enqueue(struct qrtr_node *node, struct sk_buff *skb,
821                               int type, struct sockaddr_qrtr *from,
822                               struct sockaddr_qrtr *to)
823 {
824         struct qrtr_sock *ipc;
825         struct qrtr_cb *cb;
826
827         ipc = qrtr_port_lookup(to->sq_port);
828         if (!ipc || &ipc->sk == skb->sk) { /* do not send to self */
829                 kfree_skb(skb);
830                 return -ENODEV;
831         }
832
833         cb = (struct qrtr_cb *)skb->cb;
834         cb->src_node = from->sq_node;
835         cb->src_port = from->sq_port;
836
837         if (sock_queue_rcv_skb(&ipc->sk, skb)) {
838                 qrtr_port_put(ipc);
839                 kfree_skb(skb);
840                 return -ENOSPC;
841         }
842
843         qrtr_port_put(ipc);
844
845         return 0;
846 }
847
848 /* Queue packet for broadcast. */
849 static int qrtr_bcast_enqueue(struct qrtr_node *node, struct sk_buff *skb,
850                               int type, struct sockaddr_qrtr *from,
851                               struct sockaddr_qrtr *to)
852 {
853         struct sk_buff *skbn;
854
855         mutex_lock(&qrtr_node_lock);
856         list_for_each_entry(node, &qrtr_all_nodes, item) {
857                 skbn = skb_clone(skb, GFP_KERNEL);
858                 if (!skbn)
859                         break;
860                 skb_set_owner_w(skbn, skb->sk);
861                 qrtr_node_enqueue(node, skbn, type, from, to);
862         }
863         mutex_unlock(&qrtr_node_lock);
864
865         qrtr_local_enqueue(NULL, skb, type, from, to);
866
867         return 0;
868 }
869
870 static int qrtr_sendmsg(struct socket *sock, struct msghdr *msg, size_t len)
871 {
872         DECLARE_SOCKADDR(struct sockaddr_qrtr *, addr, msg->msg_name);
873         int (*enqueue_fn)(struct qrtr_node *, struct sk_buff *, int,
874                           struct sockaddr_qrtr *, struct sockaddr_qrtr *);
875         __le32 qrtr_type = cpu_to_le32(QRTR_TYPE_DATA);
876         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
877         struct sock *sk = sock->sk;
878         struct qrtr_node *node;
879         struct sk_buff *skb;
880         size_t plen;
881         u32 type;
882         int rc;
883
884         if (msg->msg_flags & ~(MSG_DONTWAIT))
885                 return -EINVAL;
886
887         if (len > 65535)
888                 return -EMSGSIZE;
889
890         lock_sock(sk);
891
892         if (addr) {
893                 if (msg->msg_namelen < sizeof(*addr)) {
894                         release_sock(sk);
895                         return -EINVAL;
896                 }
897
898                 if (addr->sq_family != AF_QIPCRTR) {
899                         release_sock(sk);
900                         return -EINVAL;
901                 }
902
903                 rc = qrtr_autobind(sock);
904                 if (rc) {
905                         release_sock(sk);
906                         return rc;
907                 }
908         } else if (sk->sk_state == TCP_ESTABLISHED) {
909                 addr = &ipc->peer;
910         } else {
911                 release_sock(sk);
912                 return -ENOTCONN;
913         }
914
915         node = NULL;
916         if (addr->sq_node == QRTR_NODE_BCAST) {
917                 if (addr->sq_port != QRTR_PORT_CTRL &&
918                     qrtr_local_nid != QRTR_NODE_BCAST) {
919                         release_sock(sk);
920                         return -ENOTCONN;
921                 }
922                 enqueue_fn = qrtr_bcast_enqueue;
923         } else if (addr->sq_node == ipc->us.sq_node) {
924                 enqueue_fn = qrtr_local_enqueue;
925         } else {
926                 node = qrtr_node_lookup(addr->sq_node);
927                 if (!node) {
928                         release_sock(sk);
929                         return -ECONNRESET;
930                 }
931                 enqueue_fn = qrtr_node_enqueue;
932         }
933
934         plen = (len + 3) & ~3;
935         skb = sock_alloc_send_skb(sk, plen + QRTR_HDR_MAX_SIZE,
936                                   msg->msg_flags & MSG_DONTWAIT, &rc);
937         if (!skb)
938                 goto out_node;
939
940         skb_reserve(skb, QRTR_HDR_MAX_SIZE);
941
942         rc = memcpy_from_msg(skb_put(skb, len), msg, len);
943         if (rc) {
944                 kfree_skb(skb);
945                 goto out_node;
946         }
947
948         if (ipc->us.sq_port == QRTR_PORT_CTRL) {
949                 if (len < 4) {
950                         rc = -EINVAL;
951                         kfree_skb(skb);
952                         goto out_node;
953                 }
954
955                 /* control messages already require the type as 'command' */
956                 skb_copy_bits(skb, 0, &qrtr_type, 4);
957         }
958
959         type = le32_to_cpu(qrtr_type);
960         rc = enqueue_fn(node, skb, type, &ipc->us, addr);
961         if (rc >= 0)
962                 rc = len;
963
964 out_node:
965         qrtr_node_release(node);
966         release_sock(sk);
967
968         return rc;
969 }
970
971 static int qrtr_send_resume_tx(struct qrtr_cb *cb)
972 {
973         struct sockaddr_qrtr remote = { AF_QIPCRTR, cb->src_node, cb->src_port };
974         struct sockaddr_qrtr local = { AF_QIPCRTR, cb->dst_node, cb->dst_port };
975         struct qrtr_ctrl_pkt *pkt;
976         struct qrtr_node *node;
977         struct sk_buff *skb;
978         int ret;
979
980         node = qrtr_node_lookup(remote.sq_node);
981         if (!node)
982                 return -EINVAL;
983
984         skb = qrtr_alloc_ctrl_packet(&pkt);
985         if (!skb)
986                 return -ENOMEM;
987
988         pkt->cmd = cpu_to_le32(QRTR_TYPE_RESUME_TX);
989         pkt->client.node = cpu_to_le32(cb->dst_node);
990         pkt->client.port = cpu_to_le32(cb->dst_port);
991
992         ret = qrtr_node_enqueue(node, skb, QRTR_TYPE_RESUME_TX, &local, &remote);
993
994         qrtr_node_release(node);
995
996         return ret;
997 }
998
999 static int qrtr_recvmsg(struct socket *sock, struct msghdr *msg,
1000                         size_t size, int flags)
1001 {
1002         DECLARE_SOCKADDR(struct sockaddr_qrtr *, addr, msg->msg_name);
1003         struct sock *sk = sock->sk;
1004         struct sk_buff *skb;
1005         struct qrtr_cb *cb;
1006         int copied, rc;
1007
1008         lock_sock(sk);
1009
1010         if (sock_flag(sk, SOCK_ZAPPED)) {
1011                 release_sock(sk);
1012                 return -EADDRNOTAVAIL;
1013         }
1014
1015         skb = skb_recv_datagram(sk, flags & ~MSG_DONTWAIT,
1016                                 flags & MSG_DONTWAIT, &rc);
1017         if (!skb) {
1018                 release_sock(sk);
1019                 return rc;
1020         }
1021         cb = (struct qrtr_cb *)skb->cb;
1022
1023         copied = skb->len;
1024         if (copied > size) {
1025                 copied = size;
1026                 msg->msg_flags |= MSG_TRUNC;
1027         }
1028
1029         rc = skb_copy_datagram_msg(skb, 0, msg, copied);
1030         if (rc < 0)
1031                 goto out;
1032         rc = copied;
1033
1034         if (addr) {
1035                 addr->sq_family = AF_QIPCRTR;
1036                 addr->sq_node = cb->src_node;
1037                 addr->sq_port = cb->src_port;
1038                 msg->msg_namelen = sizeof(*addr);
1039         }
1040
1041 out:
1042         if (cb->confirm_rx)
1043                 qrtr_send_resume_tx(cb);
1044
1045         skb_free_datagram(sk, skb);
1046         release_sock(sk);
1047
1048         return rc;
1049 }
1050
1051 static int qrtr_connect(struct socket *sock, struct sockaddr *saddr,
1052                         int len, int flags)
1053 {
1054         DECLARE_SOCKADDR(struct sockaddr_qrtr *, addr, saddr);
1055         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
1056         struct sock *sk = sock->sk;
1057         int rc;
1058
1059         if (len < sizeof(*addr) || addr->sq_family != AF_QIPCRTR)
1060                 return -EINVAL;
1061
1062         lock_sock(sk);
1063
1064         sk->sk_state = TCP_CLOSE;
1065         sock->state = SS_UNCONNECTED;
1066
1067         rc = qrtr_autobind(sock);
1068         if (rc) {
1069                 release_sock(sk);
1070                 return rc;
1071         }
1072
1073         ipc->peer = *addr;
1074         sock->state = SS_CONNECTED;
1075         sk->sk_state = TCP_ESTABLISHED;
1076
1077         release_sock(sk);
1078
1079         return 0;
1080 }
1081
1082 static int qrtr_getname(struct socket *sock, struct sockaddr *saddr,
1083                         int peer)
1084 {
1085         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
1086         struct sockaddr_qrtr qaddr;
1087         struct sock *sk = sock->sk;
1088
1089         lock_sock(sk);
1090         if (peer) {
1091                 if (sk->sk_state != TCP_ESTABLISHED) {
1092                         release_sock(sk);
1093                         return -ENOTCONN;
1094                 }
1095
1096                 qaddr = ipc->peer;
1097         } else {
1098                 qaddr = ipc->us;
1099         }
1100         release_sock(sk);
1101
1102         qaddr.sq_family = AF_QIPCRTR;
1103
1104         memcpy(saddr, &qaddr, sizeof(qaddr));
1105
1106         return sizeof(qaddr);
1107 }
1108
1109 static int qrtr_ioctl(struct socket *sock, unsigned int cmd, unsigned long arg)
1110 {
1111         void __user *argp = (void __user *)arg;
1112         struct qrtr_sock *ipc = qrtr_sk(sock->sk);
1113         struct sock *sk = sock->sk;
1114         struct sockaddr_qrtr *sq;
1115         struct sk_buff *skb;
1116         struct ifreq ifr;
1117         long len = 0;
1118         int rc = 0;
1119
1120         lock_sock(sk);
1121
1122         switch (cmd) {
1123         case TIOCOUTQ:
1124                 len = sk->sk_sndbuf - sk_wmem_alloc_get(sk);
1125                 if (len < 0)
1126                         len = 0;
1127                 rc = put_user(len, (int __user *)argp);
1128                 break;
1129         case TIOCINQ:
1130                 skb = skb_peek(&sk->sk_receive_queue);
1131                 if (skb)
1132                         len = skb->len;
1133                 rc = put_user(len, (int __user *)argp);
1134                 break;
1135         case SIOCGIFADDR:
1136                 if (copy_from_user(&ifr, argp, sizeof(ifr))) {
1137                         rc = -EFAULT;
1138                         break;
1139                 }
1140
1141                 sq = (struct sockaddr_qrtr *)&ifr.ifr_addr;
1142                 *sq = ipc->us;
1143                 if (copy_to_user(argp, &ifr, sizeof(ifr))) {
1144                         rc = -EFAULT;
1145                         break;
1146                 }
1147                 break;
1148         case SIOCADDRT:
1149         case SIOCDELRT:
1150         case SIOCSIFADDR:
1151         case SIOCGIFDSTADDR:
1152         case SIOCSIFDSTADDR:
1153         case SIOCGIFBRDADDR:
1154         case SIOCSIFBRDADDR:
1155         case SIOCGIFNETMASK:
1156         case SIOCSIFNETMASK:
1157                 rc = -EINVAL;
1158                 break;
1159         default:
1160                 rc = -ENOIOCTLCMD;
1161                 break;
1162         }
1163
1164         release_sock(sk);
1165
1166         return rc;
1167 }
1168
1169 static int qrtr_release(struct socket *sock)
1170 {
1171         struct sock *sk = sock->sk;
1172         struct qrtr_sock *ipc;
1173
1174         if (!sk)
1175                 return 0;
1176
1177         lock_sock(sk);
1178
1179         ipc = qrtr_sk(sk);
1180         sk->sk_shutdown = SHUTDOWN_MASK;
1181         if (!sock_flag(sk, SOCK_DEAD))
1182                 sk->sk_state_change(sk);
1183
1184         sock_set_flag(sk, SOCK_DEAD);
1185         sock_orphan(sk);
1186         sock->sk = NULL;
1187
1188         if (!sock_flag(sk, SOCK_ZAPPED))
1189                 qrtr_port_remove(ipc);
1190
1191         skb_queue_purge(&sk->sk_receive_queue);
1192
1193         release_sock(sk);
1194         sock_put(sk);
1195
1196         return 0;
1197 }
1198
1199 static const struct proto_ops qrtr_proto_ops = {
1200         .owner          = THIS_MODULE,
1201         .family         = AF_QIPCRTR,
1202         .bind           = qrtr_bind,
1203         .connect        = qrtr_connect,
1204         .socketpair     = sock_no_socketpair,
1205         .accept         = sock_no_accept,
1206         .listen         = sock_no_listen,
1207         .sendmsg        = qrtr_sendmsg,
1208         .recvmsg        = qrtr_recvmsg,
1209         .getname        = qrtr_getname,
1210         .ioctl          = qrtr_ioctl,
1211         .gettstamp      = sock_gettstamp,
1212         .poll           = datagram_poll,
1213         .shutdown       = sock_no_shutdown,
1214         .release        = qrtr_release,
1215         .mmap           = sock_no_mmap,
1216         .sendpage       = sock_no_sendpage,
1217 };
1218
1219 static struct proto qrtr_proto = {
1220         .name           = "QIPCRTR",
1221         .owner          = THIS_MODULE,
1222         .obj_size       = sizeof(struct qrtr_sock),
1223 };
1224
1225 static int qrtr_create(struct net *net, struct socket *sock,
1226                        int protocol, int kern)
1227 {
1228         struct qrtr_sock *ipc;
1229         struct sock *sk;
1230
1231         if (sock->type != SOCK_DGRAM)
1232                 return -EPROTOTYPE;
1233
1234         sk = sk_alloc(net, AF_QIPCRTR, GFP_KERNEL, &qrtr_proto, kern);
1235         if (!sk)
1236                 return -ENOMEM;
1237
1238         sock_set_flag(sk, SOCK_ZAPPED);
1239
1240         sock_init_data(sock, sk);
1241         sock->ops = &qrtr_proto_ops;
1242
1243         ipc = qrtr_sk(sk);
1244         ipc->us.sq_family = AF_QIPCRTR;
1245         ipc->us.sq_node = qrtr_local_nid;
1246         ipc->us.sq_port = 0;
1247
1248         return 0;
1249 }
1250
1251 static const struct net_proto_family qrtr_family = {
1252         .owner  = THIS_MODULE,
1253         .family = AF_QIPCRTR,
1254         .create = qrtr_create,
1255 };
1256
1257 static int __init qrtr_proto_init(void)
1258 {
1259         int rc;
1260
1261         rc = proto_register(&qrtr_proto, 1);
1262         if (rc)
1263                 return rc;
1264
1265         rc = sock_register(&qrtr_family);
1266         if (rc) {
1267                 proto_unregister(&qrtr_proto);
1268                 return rc;
1269         }
1270
1271         qrtr_ns_init();
1272
1273         return rc;
1274 }
1275 postcore_initcall(qrtr_proto_init);
1276
1277 static void __exit qrtr_proto_fini(void)
1278 {
1279         qrtr_ns_remove();
1280         sock_unregister(qrtr_family.family);
1281         proto_unregister(&qrtr_proto);
1282 }
1283 module_exit(qrtr_proto_fini);
1284
1285 MODULE_DESCRIPTION("Qualcomm IPC-router driver");
1286 MODULE_LICENSE("GPL v2");
1287 MODULE_ALIAS_NETPROTO(PF_QIPCRTR);