D5798.id21892.diff
No OneTemporary
Actions

Size

186 KB

Referenced Files

None

Subscribers

None

D5798.id21892.diff
View Options

	Index: sys/conf/files
	===================================================================
	--- sys/conf/files
	+++ sys/conf/files
	@@ -4336,7 +4336,9 @@
	compile-with "${OFED_C}"
	dev/mlx5/mlx5_core/mlx5_eq.c optional mlx5 pci \
	compile-with "${OFED_C}"
	-dev/mlx5/mlx5_core/mlx5_flow_table.c optional mlx5 pci \
	+dev/mlx5/mlx5_core/mlx5_fs_cmd.c optional mlx5 pci \
	+ compile-with "${OFED_C}"
	+dev/mlx5/mlx5_core/mlx5_fs_tree.c optional mlx5 pci \
	compile-with "${OFED_C}"
	dev/mlx5/mlx5_core/mlx5_fw.c optional mlx5 pci \
	compile-with "${OFED_C}"
	Index: sys/dev/mlx5/device.h
	===================================================================
	--- sys/dev/mlx5/device.h
	+++ sys/dev/mlx5/device.h
	@@ -399,7 +399,6 @@
	__be32 ieee1588_clk_type;
	__be32 clr_intx;
	};
	-
	struct mlx5_eqe_comp {
	__be32 reserved[6];
	__be32 cqn;
	Index: sys/dev/mlx5/driver.h
	===================================================================
	--- sys/dev/mlx5/driver.h
	+++ sys/dev/mlx5/driver.h
	@@ -504,6 +504,8 @@
	char name[MLX5_MAX_IRQ_NAME];
	};

	+struct mlx5_eswitch;
	+
	struct mlx5_priv {
	char name[MLX5_MAX_NAME_LEN];
	struct mlx5_eq_table eq_table;
	@@ -556,6 +558,7 @@
	struct list_head dev_list;
	struct list_head ctx_list;
	spinlock_t ctx_lock;
	+ struct mlx5_eswitch *eswitch;
	unsigned long pci_dev_data;
	};

	@@ -568,8 +571,10 @@
	int resd_lkey;
	};

	+struct mlx5_flow_root_namespace;
	struct mlx5_core_dev {
	struct pci_dev *pdev;
	+ u8 rev_id;
	char board_id[MLX5_BOARD_ID_LEN];
	struct mlx5_cmd cmd;
	struct mlx5_port_caps port_caps[MLX5_MAX_PORTS];
	@@ -586,6 +591,12 @@
	u32 issi;
	struct mlx5_special_contexts special_contexts;
	unsigned int module_status[MLX5_MAX_PORTS];
	+ struct mlx5_flow_root_namespace *root_ns;
	+ struct mlx5_flow_root_namespace *fdb_root_ns;
	+ struct mlx5_flow_root_namespace *esw_egress_root_ns;
	+ struct mlx5_flow_root_namespace *esw_ingress_root_ns;
	+ struct mlx5_flow_root_namespace *sniffer_rx_root_ns;
	+ struct mlx5_flow_root_namespace *sniffer_tx_root_ns;
	u32 num_q_counter_allocated[MLX5_INTERFACE_NUMBER];
	};

	Index: sys/dev/mlx5/fs.h
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/fs.h
	@@ -0,0 +1,223 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#ifndef _MLX5_FS_
	+#define _MLX5_FS_
	+
	+#include <linux/list.h>
	+
	+#include <dev/mlx5/mlx5_ifc.h>
	+#include <dev/mlx5/device.h>
	+#include <dev/mlx5/driver.h>
	+
	+/Flow tag/
	+enum {
	+ MLX5_FS_DEFAULT_FLOW_TAG = 0xFFFFFF,
	+ MLX5_FS_ETH_FLOW_TAG = 0xFFFFFE,
	+ MLX5_FS_SNIFFER_FLOW_TAG = 0xFFFFFD,
	+};
	+
	+enum {
	+ MLX5_FS_FLOW_TAG_MASK = 0xFFFFFF,
	+};
	+
	+#define FS_MAX_TYPES 10
	+#define FS_MAX_ENTRIES 32000U
	+
	+enum mlx5_flow_namespace_type {
	+ MLX5_FLOW_NAMESPACE_BYPASS,
	+ MLX5_FLOW_NAMESPACE_KERNEL,
	+ MLX5_FLOW_NAMESPACE_LEFTOVERS,
	+ MLX5_FLOW_NAMESPACE_SNIFFER_RX,
	+ MLX5_FLOW_NAMESPACE_SNIFFER_TX,
	+ MLX5_FLOW_NAMESPACE_FDB,
	+ MLX5_FLOW_NAMESPACE_ESW_EGRESS,
	+ MLX5_FLOW_NAMESPACE_ESW_INGRESS,
	+};
	+
	+struct mlx5_flow_table;
	+struct mlx5_flow_group;
	+struct mlx5_flow_rule;
	+struct mlx5_flow_namespace;
	+
	+
	+struct mlx5_flow_destination {
	+ u32 type;
	+ union {
	+ u32 tir_num;
	+ struct mlx5_flow_table *ft;
	+ u32 vport_num;
	+ };
	+};
	+
	+#define FT_NAME_STR_SZ 20
	+#define LEFTOVERS_RULE_NUM 2
	+static inline void build_leftovers_ft_param(char *name,
	+ unsigned int *priority,
	+ int *n_ent,
	+ int *n_grp)
	+{
	+ snprintf(name, FT_NAME_STR_SZ, "leftovers");
	+ priority = 0; /Priority of leftovers_prio-0*/
	+ n_ent = LEFTOVERS_RULE_NUM + 1; /1: star rules*/
	+ *n_grp = LEFTOVERS_RULE_NUM;
	+}
	+
	+static inline bool outer_header_zero(u32 *match_criteria)
	+{
	+ int size = MLX5_ST_SZ_BYTES(fte_match_param);
	+ char *outer_headers_c = MLX5_ADDR_OF(fte_match_param, match_criteria,
	+ outer_headers);
	+
	+ return outer_headers_c[0] == 0 && !memcmp(outer_headers_c,
	+ outer_headers_c + 1,
	+ size - 1);
	+}
	+
	+struct mlx5_flow_namespace *
	+mlx5_get_flow_namespace(struct mlx5_core_dev *dev,
	+ enum mlx5_flow_namespace_type type);
	+
	+/* The underlying implementation create two more entries for
	+ * chaining flow tables. the user should be aware that if he pass
	+ * max_num_ftes as 2^N it will result in doubled size flow table
	+ */
	+struct mlx5_flow_table *
	+mlx5_create_auto_grouped_flow_table(struct mlx5_flow_namespace *ns,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries,
	+ int max_num_groups);
	+
	+struct mlx5_flow_table *
	+mlx5_create_vport_flow_table(struct mlx5_flow_namespace *ns,
	+ u16 vport,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries);
	+
	+struct mlx5_flow_table *
	+mlx5_create_flow_table(struct mlx5_flow_namespace *ns,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries);
	+int mlx5_destroy_flow_table(struct mlx5_flow_table *ft);
	+
	+/* inbox should be set with the following values:
	+ * start_flow_index
	+ * end_flow_index
	+ * match_criteria_enable
	+ * match_criteria
	+ */
	+struct mlx5_flow_group *
	+mlx5_create_flow_group(struct mlx5_flow_table ft, u32 in);
	+void mlx5_destroy_flow_group(struct mlx5_flow_group *fg);
	+
	+/* Single destination per rule.
	+ * Group ID is implied by the match criteria.
	+ */
	+struct mlx5_flow_rule *
	+mlx5_add_flow_rule(struct mlx5_flow_table *ft,
	+ u8 match_criteria_enable,
	+ u32 *match_criteria,
	+ u32 *match_value,
	+ u32 action,
	+ u32 flow_tag,
	+ struct mlx5_flow_destination *dest);
	+void mlx5_del_flow_rule(struct mlx5_flow_rule *fr);
	+
	+/The following API is for sniffer/
	+typedef int (rule_event_fn)(struct mlx5_flow_rule rule,
	+ bool ctx_changed,
	+ void *client_data,
	+ void *context);
	+
	+struct mlx5_flow_handler;
	+
	+struct flow_client_priv_data;
	+
	+void mlx5e_sniffer_roce_mode_notify(
	+ struct mlx5_core_dev *mdev,
	+ int action);
	+
	+int mlx5_set_rule_private_data(struct mlx5_flow_rule *rule, struct
	+ mlx5_flow_handler *handler, void
	+ *client_data);
	+
	+struct mlx5_flow_handler mlx5_register_rule_notifier(struct mlx5_core_dev dev,
	+ enum mlx5_flow_namespace_type ns_type,
	+ rule_event_fn add_cb,
	+ rule_event_fn del_cb,
	+ void *context);
	+
	+void mlx5_unregister_rule_notifier(struct mlx5_flow_handler *handler);
	+
	+void mlx5_flow_iterate_existing_rules(struct mlx5_flow_namespace *ns,
	+ rule_event_fn cb,
	+ void *context);
	+
	+void mlx5_get_match_criteria(u32 *match_criteria,
	+ struct mlx5_flow_rule *rule);
	+
	+void mlx5_get_match_value(u32 *match_value,
	+ struct mlx5_flow_rule *rule);
	+
	+u8 mlx5_get_match_criteria_enable(struct mlx5_flow_rule *rule);
	+
	+struct mlx5_flow_rules_list *get_roce_flow_rules(u8 roce_mode);
	+
	+void mlx5_del_flow_rules_list(struct mlx5_flow_rules_list *rules_list);
	+
	+struct mlx5_flow_rules_list {
	+ struct list_head head;
	+};
	+
	+struct mlx5_flow_rule_node {
	+ struct list_head list;
	+ u32 match_criteria[MLX5_ST_SZ_DW(fte_match_param)];
	+ u32 match_value[MLX5_ST_SZ_DW(fte_match_param)];
	+ u8 match_criteria_enable;
	+};
	+
	+struct mlx5_core_fs_mask {
	+ u8 match_criteria_enable;
	+ u32 match_criteria[MLX5_ST_SZ_DW(fte_match_param)];
	+};
	+
	+bool fs_match_exact_val(
	+ struct mlx5_core_fs_mask *mask,
	+ void *val1,
	+ void *val2);
	+
	+bool fs_match_exact_mask(
	+ u8 match_criteria_enable1,
	+ u8 match_criteria_enable2,
	+ void *mask1,
	+ void *mask2);
	+/********end API for sniffer********/
	+
	+#endif
	Index: sys/dev/mlx5/mlx5_core/eswitch.h
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/mlx5_core/eswitch.h
	@@ -0,0 +1,169 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#ifndef __MLX5_ESWITCH_H__
	+#define __MLX5_ESWITCH_H__
	+
	+#include <linux/if_ether.h>
	+#include <dev/mlx5/device.h>
	+
	+#define MLX5_MAX_UC_PER_VPORT(dev) \
	+ (1 << MLX5_CAP_GEN(dev, log_max_current_uc_list))
	+
	+#define MLX5_MAX_MC_PER_VPORT(dev) \
	+ (1 << MLX5_CAP_GEN(dev, log_max_current_mc_list))
	+
	+#define MLX5_L2_ADDR_HASH_SIZE (BIT(BITS_PER_BYTE))
	+#define MLX5_L2_ADDR_HASH(addr) (addr[5])
	+
	+/* L2 -mac address based- hash helpers */
	+struct l2addr_node {
	+ struct hlist_node hlist;
	+ u8 addr[ETH_ALEN];
	+};
	+
	+#define for_each_l2hash_node(hn, tmp, hash, i) \
	+ for (i = 0; i < MLX5_L2_ADDR_HASH_SIZE; i++) \
	+ hlist_for_each_entry_safe(hn, tmp, &hash[i], hlist)
	+
	+#define l2addr_hash_find(hash, mac, type) ({ \
	+ int ix = MLX5_L2_ADDR_HASH(mac); \
	+ bool found = false; \
	+ type *ptr = NULL; \
	+ \
	+ hlist_for_each_entry(ptr, &hash[ix], node.hlist) \
	+ if (ether_addr_equal(ptr->node.addr, mac)) {\
	+ found = true; \
	+ break; \
	+ } \
	+ if (!found) \
	+ ptr = NULL; \
	+ ptr; \
	+})
	+
	+#define l2addr_hash_add(hash, mac, type, gfp) ({ \
	+ int ix = MLX5_L2_ADDR_HASH(mac); \
	+ type *ptr = NULL; \
	+ \
	+ ptr = kzalloc(sizeof(type), gfp); \
	+ if (ptr) { \
	+ ether_addr_copy(ptr->node.addr, mac); \
	+ hlist_add_head(&ptr->node.hlist, &hash[ix]);\
	+ } \
	+ ptr; \
	+})
	+
	+#define l2addr_hash_del(ptr) ({ \
	+ hlist_del(&ptr->node.hlist); \
	+ kfree(ptr); \
	+})
	+
	+struct vport_ingress {
	+ struct mlx5_flow_table *acl;
	+ struct mlx5_flow_group *drop_grp;
	+ struct mlx5_flow_rule *drop_rule;
	+};
	+
	+struct vport_egress {
	+ struct mlx5_flow_table *acl;
	+ struct mlx5_flow_group *allowed_vlans_grp;
	+ struct mlx5_flow_group *drop_grp;
	+ struct mlx5_flow_rule *allowed_vlan;
	+ struct mlx5_flow_rule *drop_rule;
	+};
	+
	+struct mlx5_vport {
	+ struct mlx5_core_dev *dev;
	+ int vport;
	+ struct hlist_head uc_list[MLX5_L2_ADDR_HASH_SIZE];
	+ struct hlist_head mc_list[MLX5_L2_ADDR_HASH_SIZE];
	+ struct work_struct vport_change_handler;
	+
	+ struct vport_ingress ingress;
	+ struct vport_egress egress;
	+
	+ u16 vlan;
	+ u8 qos;
	+ struct mutex state_lock; /* protect dynamic state changes */
	+ /* This spinlock protects access to vport data, between
	+ * "esw_vport_disable" and ongoing interrupt "mlx5_eswitch_vport_event"
	+ * once vport marked as disabled new interrupts are discarded.
	+ */
	+ spinlock_t lock; /* vport events sync */
	+ bool enabled;
	+ u16 enabled_events;
	+};
	+
	+struct mlx5_l2_table {
	+ struct hlist_head l2_hash[MLX5_L2_ADDR_HASH_SIZE];
	+ u32 size;
	+ unsigned long *bitmap;
	+};
	+
	+struct mlx5_eswitch_fdb {
	+ void *fdb;
	+ struct mlx5_flow_group *addr_grp;
	+};
	+
	+struct mlx5_eswitch {
	+ struct mlx5_core_dev *dev;
	+ struct mlx5_l2_table l2_table;
	+ struct mlx5_eswitch_fdb fdb_table;
	+ struct hlist_head mc_table[MLX5_L2_ADDR_HASH_SIZE];
	+ struct workqueue_struct *work_queue;
	+ struct mlx5_vport *vports;
	+ int total_vports;
	+ int enabled_vports;
	+};
	+
	+struct mlx5_esw_vport_info {
	+ __u32 vf;
	+ __u8 mac[32];
	+ __u32 vlan;
	+ __u32 qos;
	+ __u32 spoofchk;
	+ __u32 linkstate;
	+ __u32 min_tx_rate;
	+ __u32 max_tx_rate;
	+};
	+
	+/* E-Switch API */
	+int mlx5_eswitch_init(struct mlx5_core_dev *dev);
	+void mlx5_eswitch_cleanup(struct mlx5_eswitch *esw);
	+void mlx5_eswitch_vport_event(struct mlx5_eswitch esw, struct mlx5_eqe eqe);
	+int mlx5_eswitch_enable_sriov(struct mlx5_eswitch *esw, int nvfs);
	+void mlx5_eswitch_disable_sriov(struct mlx5_eswitch *esw);
	+int mlx5_eswitch_set_vport_mac(struct mlx5_eswitch *esw,
	+ int vport, u8 mac[ETH_ALEN]);
	+int mlx5_eswitch_set_vport_state(struct mlx5_eswitch *esw,
	+ int vport, int link_state);
	+int mlx5_eswitch_set_vport_vlan(struct mlx5_eswitch *esw,
	+ int vport, u16 vlan, u8 qos);
	+int mlx5_eswitch_get_vport_config(struct mlx5_eswitch *esw,
	+ int vport, struct mlx5_esw_vport_info *evi);
	+
	+#endif /* __MLX5_ESWITCH_H__ */
	Index: sys/dev/mlx5/mlx5_core/fs_core.h
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/mlx5_core/fs_core.h
	@@ -0,0 +1,300 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#ifndef _MLX5_FS_CORE_
	+#define _MLX5_FS_CORE_
	+
	+#include <asm/atomic.h>
	+#include <linux/completion.h>
	+#include <linux/mutex.h>
	+#include <dev/mlx5/fs.h>
	+
	+enum fs_type {
	+ FS_TYPE_NAMESPACE,
	+ FS_TYPE_PRIO,
	+ FS_TYPE_FLOW_TABLE,
	+ FS_TYPE_FLOW_GROUP,
	+ FS_TYPE_FLOW_ENTRY,
	+ FS_TYPE_FLOW_DEST
	+};
	+
	+enum fs_ft_type {
	+ FS_FT_NIC_RX = 0x0,
	+ FS_FT_ESW_EGRESS_ACL = 0x2,
	+ FS_FT_ESW_INGRESS_ACL = 0x3,
	+ FS_FT_FDB = 0X4,
	+ FS_FT_SNIFFER_RX = 0x5,
	+ FS_FT_SNIFFER_TX = 0x6
	+};
	+
	+enum fs_fte_status {
	+ FS_FTE_STATUS_EXISTING = 1UL << 0,
	+};
	+
	+/* Should always be the first variable in the struct */
	+struct fs_base {
	+ struct list_head list;
	+ struct fs_base *parent;
	+ enum fs_type type;
	+ struct kref refcount;
	+ /* lock the node for writing and traversing */
	+ struct mutex lock;
	+ struct completion complete;
	+ atomic_t users_refcount;
	+ const char *name;
	+};
	+
	+struct mlx5_flow_rule {
	+ struct fs_base base;
	+ struct mlx5_flow_destination dest_attr;
	+ struct list_head clients_data;
	+ /protect clients lits/
	+ struct mutex clients_lock;
	+};
	+
	+struct fs_fte {
	+ struct fs_base base;
	+ u32 val[MLX5_ST_SZ_DW(fte_match_param)];
	+ uint32_t dests_size;
	+ uint32_t flow_tag;
	+ struct list_head dests;
	+ uint32_t index; /* index in ft */
	+ u8 action; /* MLX5_FLOW_CONTEXT_ACTION */
	+ enum fs_fte_status status;
	+};
	+
	+struct fs_star_rule {
	+ struct mlx5_flow_group *fg;
	+ struct fs_fte *fte;
	+};
	+
	+struct mlx5_flow_table {
	+ struct fs_base base;
	+ /* sorted list by start_index */
	+ struct list_head fgs;
	+ struct {
	+ bool active;
	+ unsigned int max_types;
	+ unsigned int num_types;
	+ } autogroup;
	+ unsigned int max_fte;
	+ unsigned int level;
	+ uint32_t id;
	+ u16 vport;
	+ enum fs_ft_type type;
	+ struct fs_star_rule star_rule;
	+ unsigned int shared_refcount;
	+};
	+
	+enum fs_prio_flags {
	+ MLX5_CORE_FS_PRIO_SHARED = 1
	+};
	+
	+struct fs_prio {
	+ struct fs_base base;
	+ struct list_head objs; /* each object is a namespace or ft */
	+ unsigned int max_ft;
	+ unsigned int num_ft;
	+ unsigned int max_ns;
	+ unsigned int prio;
	+ /When create shared flow table, this lock should be taken/
	+ struct mutex shared_lock;
	+ u8 flags;
	+};
	+
	+struct mlx5_flow_namespace {
	+ /* parent == NULL => root ns */
	+ struct fs_base base;
	+ /* sorted by priority number */
	+ struct list_head prios; /* list of fs_prios */
	+ struct list_head list_notifiers;
	+ struct rw_semaphore notifiers_rw_sem;
	+ struct rw_semaphore dests_rw_sem;
	+};
	+
	+struct mlx5_flow_root_namespace {
	+ struct mlx5_flow_namespace ns;
	+ struct mlx5_flow_table *ft_level_0;
	+ enum fs_ft_type table_type;
	+ struct mlx5_core_dev *dev;
	+ struct mlx5_flow_table *root_ft;
	+ /* When chaining flow-tables, this lock should be taken */
	+ struct mutex fs_chain_lock;
	+};
	+
	+struct mlx5_flow_group {
	+ struct fs_base base;
	+ struct list_head ftes;
	+ struct mlx5_core_fs_mask mask;
	+ uint32_t start_index;
	+ uint32_t max_ftes;
	+ uint32_t num_ftes;
	+ uint32_t id;
	+};
	+
	+struct mlx5_flow_handler {
	+ struct list_head list;
	+ rule_event_fn add_dst_cb;
	+ rule_event_fn del_dst_cb;
	+ void *client_context;
	+ struct mlx5_flow_namespace *ns;
	+};
	+
	+struct fs_client_priv_data {
	+ struct mlx5_flow_handler *fs_handler;
	+ struct list_head list;
	+ void *client_dst_data;
	+};
	+
	+void _fs_remove_node(struct kref *kref);
	+#define fs_get_obj(v, _base) {v = container_of((_base), typeof(*v), base); }
	+#define fs_get_parent(v, child) {v = (child)->base.parent ? \
	+ container_of((child)->base.parent, \
	+ typeof(*v), base) : NULL; }
	+
	+#define fs_list_for_each_entry(pos, cond, root) \
	+ list_for_each_entry(pos, root, base.list) \
	+ if (!(cond)) {} else
	+
	+#define fs_list_for_each_entry_continue(pos, cond, root) \
	+ list_for_each_entry_continue(pos, root, base.list) \
	+ if (!(cond)) {} else
	+
	+#define fs_list_for_each_entry_reverse(pos, cond, root) \
	+ list_for_each_entry_reverse(pos, root, base.list) \
	+ if (!(cond)) {} else
	+
	+#define fs_list_for_each_entry_continue_reverse(pos, cond, root) \
	+ list_for_each_entry_continue_reverse(pos, root, base.list) \
	+ if (!(cond)) {} else
	+
	+#define fs_for_each_ft(pos, prio) \
	+ fs_list_for_each_entry(pos, (pos)->base.type == FS_TYPE_FLOW_TABLE, \
	+ &(prio)->objs)
	+
	+#define fs_for_each_ft_reverse(pos, prio) \
	+ fs_list_for_each_entry_reverse(pos, \
	+ (pos)->base.type == FS_TYPE_FLOW_TABLE, \
	+ &(prio)->objs)
	+
	+#define fs_for_each_ns(pos, prio) \
	+ fs_list_for_each_entry(pos, \
	+ (pos)->base.type == FS_TYPE_NAMESPACE, \
	+ &(prio)->objs)
	+
	+#define fs_for_each_ns_or_ft_reverse(pos, prio) \
	+ list_for_each_entry_reverse(pos, &(prio)->objs, list) \
	+ if (!((pos)->type == FS_TYPE_NAMESPACE \|\| \
	+ (pos)->type == FS_TYPE_FLOW_TABLE)) {} else
	+
	+#define fs_for_each_ns_or_ft(pos, prio) \
	+ list_for_each_entry(pos, &(prio)->objs, list) \
	+ if (!((pos)->type == FS_TYPE_NAMESPACE \|\| \
	+ (pos)->type == FS_TYPE_FLOW_TABLE)) {} else
	+
	+#define fs_for_each_ns_or_ft_continue_reverse(pos, prio) \
	+ list_for_each_entry_continue_reverse(pos, &(prio)->objs, list) \
	+ if (!((pos)->type == FS_TYPE_NAMESPACE \|\| \
	+ (pos)->type == FS_TYPE_FLOW_TABLE)) {} else
	+
	+#define fs_for_each_ns_or_ft_continue(pos, prio) \
	+ list_for_each_entry_continue(pos, &(prio)->objs, list) \
	+ if (!((pos)->type == FS_TYPE_NAMESPACE \|\| \
	+ (pos)->type == FS_TYPE_FLOW_TABLE)) {} else
	+
	+#define fs_for_each_prio(pos, ns) \
	+ fs_list_for_each_entry(pos, (pos)->base.type == FS_TYPE_PRIO, \
	+ &(ns)->prios)
	+
	+#define fs_for_each_prio_reverse(pos, ns) \
	+ fs_list_for_each_entry_reverse(pos, (pos)->base.type == FS_TYPE_PRIO, \
	+ &(ns)->prios)
	+
	+#define fs_for_each_prio_continue(pos, ns) \
	+ fs_list_for_each_entry_continue(pos, (pos)->base.type == FS_TYPE_PRIO, \
	+ &(ns)->prios)
	+
	+#define fs_for_each_prio_continue_reverse(pos, ns) \
	+ fs_list_for_each_entry_continue_reverse(pos, \
	+ (pos)->base.type == FS_TYPE_PRIO, \
	+ &(ns)->prios)
	+
	+#define fs_for_each_fg(pos, ft) \
	+ fs_list_for_each_entry(pos, (pos)->base.type == FS_TYPE_FLOW_GROUP, \
	+ &(ft)->fgs)
	+
	+#define fs_for_each_fte(pos, fg) \
	+ fs_list_for_each_entry(pos, (pos)->base.type == FS_TYPE_FLOW_ENTRY, \
	+ &(fg)->ftes)
	+#define fs_for_each_dst(pos, fte) \
	+ fs_list_for_each_entry(pos, (pos)->base.type == FS_TYPE_FLOW_DEST, \
	+ &(fte)->dests)
	+
	+int mlx5_cmd_fs_create_ft(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int level,
	+ unsigned int log_size, unsigned int *table_id);
	+
	+int mlx5_cmd_fs_destroy_ft(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id);
	+
	+int mlx5_cmd_fs_create_fg(struct mlx5_core_dev *dev,
	+ u32 *in,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int *group_id);
	+
	+int mlx5_cmd_fs_destroy_fg(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int group_id);
	+
	+
	+int mlx5_cmd_fs_set_fte(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_fte_status *fte_status,
	+ u32 *match_val,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int index, unsigned int group_id,
	+ unsigned int flow_tag,
	+ unsigned short action, int dest_size,
	+ struct list_head dests); / mlx5_flow_desination */
	+
	+int mlx5_cmd_fs_delete_fte(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_fte_status *fte_status,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int index);
	+
	+int mlx5_cmd_update_root_ft(struct mlx5_core_dev *dev,
	+ enum fs_ft_type type,
	+ unsigned int id);
	+
	+int mlx5_init_fs(struct mlx5_core_dev *dev);
	+void mlx5_cleanup_fs(struct mlx5_core_dev *dev);
	+#endif
	Index: sys/dev/mlx5/mlx5_core/mlx5_core.h
	===================================================================
	--- sys/dev/mlx5/mlx5_core/mlx5_core.h
	+++ sys/dev/mlx5/mlx5_core/mlx5_core.h
	@@ -33,8 +33,8 @@
	#include <linux/sched.h>

	#define DRIVER_NAME "mlx5_core"
	-#define DRIVER_VERSION "1.23.0 (03 Mar 2015)"
	-#define DRIVER_RELDATE "03 Mar 2015"
	+#define DRIVER_VERSION "3.2-rc1"
	+#define DRIVER_RELDATE "May 2016"

	extern int mlx5_core_debug_mask;

	Index: sys/dev/mlx5/mlx5_core/mlx5_eswitch.c
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/mlx5_core/mlx5_eswitch.c
	@@ -0,0 +1,1411 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#include <linux/etherdevice.h>
	+#include <dev/mlx5/driver.h>
	+#include <dev/mlx5/mlx5_ifc.h>
	+#include <dev/mlx5/vport.h>
	+#include <dev/mlx5/fs.h>
	+#include "mlx5_core.h"
	+#include "eswitch.h"
	+
	+#define UPLINK_VPORT 0xFFFF
	+
	+#define MLX5_DEBUG_ESWITCH_MASK BIT(3)
	+
	+#define esw_info(dev, format, ...) \
	+ printf("mlx5_core: INFO: ""(%s): E-Switch: " format, (dev)->priv.name, ##__VA_ARGS__)
	+
	+#define esw_warn(dev, format, ...) \
	+ printf("mlx5_core: WARN: ""(%s): E-Switch: " format, (dev)->priv.name, ##__VA_ARGS__)
	+
	+#define esw_debug(dev, format, ...) \
	+ mlx5_core_dbg_mask(dev, MLX5_DEBUG_ESWITCH_MASK, format, ##__VA_ARGS__)
	+
	+enum {
	+ MLX5_ACTION_NONE = 0,
	+ MLX5_ACTION_ADD = 1,
	+ MLX5_ACTION_DEL = 2,
	+};
	+
	+/* E-Switch UC L2 table hash node */
	+struct esw_uc_addr {
	+ struct l2addr_node node;
	+ u32 table_index;
	+ u32 vport;
	+};
	+
	+/* E-Switch MC FDB table hash node */
	+struct esw_mc_addr { /* SRIOV only */
	+ struct l2addr_node node;
	+ struct mlx5_flow_rule uplink_rule; / Forward to uplink rule */
	+ u32 refcnt;
	+};
	+
	+/* Vport UC/MC hash node */
	+struct vport_addr {
	+ struct l2addr_node node;
	+ u8 action;
	+ u32 vport;
	+ struct mlx5_flow_rule flow_rule; / SRIOV only */
	+};
	+
	+enum {
	+ UC_ADDR_CHANGE = BIT(0),
	+ MC_ADDR_CHANGE = BIT(1),
	+};
	+
	+/* Vport context events */
	+#define SRIOV_VPORT_EVENTS (UC_ADDR_CHANGE \| \
	+ MC_ADDR_CHANGE)
	+
	+static int arm_vport_context_events_cmd(struct mlx5_core_dev *dev, u16 vport,
	+ u32 events_mask)
	+{
	+ int in[MLX5_ST_SZ_DW(modify_nic_vport_context_in)];
	+ int out[MLX5_ST_SZ_DW(modify_nic_vport_context_out)];
	+ void *nic_vport_ctx;
	+ int err;
	+
	+ memset(out, 0, sizeof(out));
	+ memset(in, 0, sizeof(in));
	+
	+ MLX5_SET(modify_nic_vport_context_in, in,
	+ opcode, MLX5_CMD_OP_MODIFY_NIC_VPORT_CONTEXT);
	+ MLX5_SET(modify_nic_vport_context_in, in, field_select.change_event, 1);
	+ MLX5_SET(modify_nic_vport_context_in, in, vport_number, vport);
	+ if (vport)
	+ MLX5_SET(modify_nic_vport_context_in, in, other_vport, 1);
	+ nic_vport_ctx = MLX5_ADDR_OF(modify_nic_vport_context_in,
	+ in, nic_vport_context);
	+
	+ MLX5_SET(nic_vport_context, nic_vport_ctx, arm_change_event, 1);
	+
	+ if (events_mask & UC_ADDR_CHANGE)
	+ MLX5_SET(nic_vport_context, nic_vport_ctx,
	+ event_on_uc_address_change, 1);
	+ if (events_mask & MC_ADDR_CHANGE)
	+ MLX5_SET(nic_vport_context, nic_vport_ctx,
	+ event_on_mc_address_change, 1);
	+
	+ err = mlx5_cmd_exec(dev, in, sizeof(in), out, sizeof(out));
	+ if (err)
	+ goto ex;
	+ err = mlx5_cmd_status_to_err_v2(out);
	+ if (err)
	+ goto ex;
	+ return 0;
	+ex:
	+ return err;
	+}
	+
	+/* E-Switch vport context HW commands */
	+static int query_esw_vport_context_cmd(struct mlx5_core_dev *mdev, u32 vport,
	+ u32 *out, int outlen)
	+{
	+ u32 in[MLX5_ST_SZ_DW(query_esw_vport_context_in)];
	+
	+ memset(in, 0, sizeof(in));
	+
	+ MLX5_SET(query_nic_vport_context_in, in, opcode,
	+ MLX5_CMD_OP_QUERY_ESW_VPORT_CONTEXT);
	+
	+ MLX5_SET(query_esw_vport_context_in, in, vport_number, vport);
	+ if (vport)
	+ MLX5_SET(query_esw_vport_context_in, in, other_vport, 1);
	+
	+ return mlx5_cmd_exec_check_status(mdev, in, sizeof(in), out, outlen);
	+}
	+
	+static int query_esw_vport_cvlan(struct mlx5_core_dev *dev, u32 vport,
	+ u16 vlan, u8 qos)
	+{
	+ u32 out[MLX5_ST_SZ_DW(query_esw_vport_context_out)];
	+ int err;
	+ bool cvlan_strip;
	+ bool cvlan_insert;
	+
	+ memset(out, 0, sizeof(out));
	+
	+ *vlan = 0;
	+ *qos = 0;
	+
	+ if (!MLX5_CAP_ESW(dev, vport_cvlan_strip) \|\|
	+ !MLX5_CAP_ESW(dev, vport_cvlan_insert_if_not_exist))
	+ return -ENOTSUPP;
	+
	+ err = query_esw_vport_context_cmd(dev, vport, out, sizeof(out));
	+ if (err)
	+ goto out;
	+
	+ cvlan_strip = MLX5_GET(query_esw_vport_context_out, out,
	+ esw_vport_context.vport_cvlan_strip);
	+
	+ cvlan_insert = MLX5_GET(query_esw_vport_context_out, out,
	+ esw_vport_context.vport_cvlan_insert);
	+
	+ if (cvlan_strip \|\| cvlan_insert) {
	+ *vlan = MLX5_GET(query_esw_vport_context_out, out,
	+ esw_vport_context.cvlan_id);
	+ *qos = MLX5_GET(query_esw_vport_context_out, out,
	+ esw_vport_context.cvlan_pcp);
	+ }
	+
	+ esw_debug(dev, "Query Vport[%d] cvlan: VLAN %d qos=%d\n",
	+ vport, vlan, qos);
	+out:
	+ return err;
	+}
	+
	+static int modify_esw_vport_context_cmd(struct mlx5_core_dev *dev, u16 vport,
	+ void *in, int inlen)
	+{
	+ u32 out[MLX5_ST_SZ_DW(modify_esw_vport_context_out)];
	+
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(modify_esw_vport_context_in, in, vport_number, vport);
	+ if (vport)
	+ MLX5_SET(modify_esw_vport_context_in, in, other_vport, 1);
	+
	+ MLX5_SET(modify_esw_vport_context_in, in, opcode,
	+ MLX5_CMD_OP_MODIFY_ESW_VPORT_CONTEXT);
	+
	+ return mlx5_cmd_exec_check_status(dev, in, inlen,
	+ out, sizeof(out));
	+}
	+
	+static int modify_esw_vport_cvlan(struct mlx5_core_dev *dev, u32 vport,
	+ u16 vlan, u8 qos, bool set)
	+{
	+ u32 in[MLX5_ST_SZ_DW(modify_esw_vport_context_in)];
	+
	+ memset(in, 0, sizeof(in));
	+
	+ if (!MLX5_CAP_ESW(dev, vport_cvlan_strip) \|\|
	+ !MLX5_CAP_ESW(dev, vport_cvlan_insert_if_not_exist))
	+ return -ENOTSUPP;
	+
	+ esw_debug(dev, "Set Vport[%d] VLAN %d qos %d set=%d\n",
	+ vport, vlan, qos, set);
	+
	+ if (set) {
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ esw_vport_context.vport_cvlan_strip, 1);
	+ /* insert only if no vlan in packet */
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ esw_vport_context.vport_cvlan_insert, 1);
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ esw_vport_context.cvlan_pcp, qos);
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ esw_vport_context.cvlan_id, vlan);
	+ }
	+
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ field_select.vport_cvlan_strip, 1);
	+ MLX5_SET(modify_esw_vport_context_in, in,
	+ field_select.vport_cvlan_insert, 1);
	+
	+ return modify_esw_vport_context_cmd(dev, vport, in, sizeof(in));
	+}
	+
	+/* HW L2 Table (MPFS) management */
	+static int set_l2_table_entry_cmd(struct mlx5_core_dev *dev, u32 index,
	+ u8 *mac, u8 vlan_valid, u16 vlan)
	+{
	+ u32 in[MLX5_ST_SZ_DW(set_l2_table_entry_in)];
	+ u32 out[MLX5_ST_SZ_DW(set_l2_table_entry_out)];
	+ u8 *in_mac_addr;
	+
	+ memset(in, 0, sizeof(in));
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(set_l2_table_entry_in, in, opcode,
	+ MLX5_CMD_OP_SET_L2_TABLE_ENTRY);
	+ MLX5_SET(set_l2_table_entry_in, in, table_index, index);
	+ MLX5_SET(set_l2_table_entry_in, in, vlan_valid, vlan_valid);
	+ MLX5_SET(set_l2_table_entry_in, in, vlan, vlan);
	+
	+ in_mac_addr = MLX5_ADDR_OF(set_l2_table_entry_in, in, mac_address);
	+ ether_addr_copy(&in_mac_addr[2], mac);
	+
	+ return mlx5_cmd_exec_check_status(dev, in, sizeof(in),
	+ out, sizeof(out));
	+}
	+
	+static int del_l2_table_entry_cmd(struct mlx5_core_dev *dev, u32 index)
	+{
	+ u32 in[MLX5_ST_SZ_DW(delete_l2_table_entry_in)];
	+ u32 out[MLX5_ST_SZ_DW(delete_l2_table_entry_out)];
	+
	+ memset(in, 0, sizeof(in));
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(delete_l2_table_entry_in, in, opcode,
	+ MLX5_CMD_OP_DELETE_L2_TABLE_ENTRY);
	+ MLX5_SET(delete_l2_table_entry_in, in, table_index, index);
	+ return mlx5_cmd_exec_check_status(dev, in, sizeof(in),
	+ out, sizeof(out));
	+}
	+
	+static int alloc_l2_table_index(struct mlx5_l2_table l2_table, u32 ix)
	+{
	+ int err = 0;
	+
	+ *ix = find_first_zero_bit(l2_table->bitmap, l2_table->size);
	+ if (*ix >= l2_table->size)
	+ err = -ENOSPC;
	+ else
	+ __set_bit(*ix, l2_table->bitmap);
	+
	+ return err;
	+}
	+
	+static void free_l2_table_index(struct mlx5_l2_table *l2_table, u32 ix)
	+{
	+ __clear_bit(ix, l2_table->bitmap);
	+}
	+
	+static int set_l2_table_entry(struct mlx5_core_dev dev, u8 mac,
	+ u8 vlan_valid, u16 vlan,
	+ u32 *index)
	+{
	+ struct mlx5_l2_table *l2_table = &dev->priv.eswitch->l2_table;
	+ int err;
	+
	+ err = alloc_l2_table_index(l2_table, index);
	+ if (err)
	+ return err;
	+
	+ err = set_l2_table_entry_cmd(dev, *index, mac, vlan_valid, vlan);
	+ if (err)
	+ free_l2_table_index(l2_table, *index);
	+
	+ return err;
	+}
	+
	+static void del_l2_table_entry(struct mlx5_core_dev *dev, u32 index)
	+{
	+ struct mlx5_l2_table *l2_table = &dev->priv.eswitch->l2_table;
	+
	+ del_l2_table_entry_cmd(dev, index);
	+ free_l2_table_index(l2_table, index);
	+}
	+
	+/* E-Switch FDB */
	+static struct mlx5_flow_rule *
	+esw_fdb_set_vport_rule(struct mlx5_eswitch *esw, u8 mac[ETH_ALEN], u32 vport)
	+{
	+ int match_header = MLX5_MATCH_OUTER_HEADERS;
	+ struct mlx5_flow_destination dest;
	+ struct mlx5_flow_rule *flow_rule = NULL;
	+ u32 *match_v;
	+ u32 *match_c;
	+ u8 *dmac_v;
	+ u8 *dmac_c;
	+
	+ match_v = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ match_c = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ if (!match_v \|\| !match_c) {
	+ printf("mlx5_core: WARN: ""FDB: Failed to alloc match parameters\n");
	+ goto out;
	+ }
	+ dmac_v = MLX5_ADDR_OF(fte_match_param, match_v,
	+ outer_headers.dmac_47_16);
	+ dmac_c = MLX5_ADDR_OF(fte_match_param, match_c,
	+ outer_headers.dmac_47_16);
	+
	+ ether_addr_copy(dmac_v, mac);
	+ /* Match criteria mask */
	+ memset(dmac_c, 0xff, 6);
	+
	+ dest.type = MLX5_FLOW_CONTEXT_DEST_TYPE_VPORT;
	+ dest.vport_num = vport;
	+
	+ esw_debug(esw->dev,
	+ "\tFDB add rule dmac_v(%pM) dmac_c(%pM) -> vport(%d)\n",
	+ dmac_v, dmac_c, vport);
	+ flow_rule =
	+ mlx5_add_flow_rule(esw->fdb_table.fdb,
	+ match_header,
	+ match_c,
	+ match_v,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ 0, &dest);
	+ if (IS_ERR_OR_NULL(flow_rule)) {
	+ printf("mlx5_core: WARN: ""FDB: Failed to add flow rule: dmac_v(%pM) dmac_c(%pM) -> vport(%d), err(%ld)\n", dmac_v, dmac_c, vport, PTR_ERR(flow_rule));
	+ flow_rule = NULL;
	+ }
	+out:
	+ kfree(match_v);
	+ kfree(match_c);
	+ return flow_rule;
	+}
	+
	+static int esw_create_fdb_table(struct mlx5_eswitch *esw)
	+{
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ struct mlx5_core_dev *dev = esw->dev;
	+ struct mlx5_flow_namespace *root_ns;
	+ struct mlx5_flow_table *fdb;
	+ struct mlx5_flow_group *g;
	+ void *match_criteria;
	+ int table_size;
	+ u32 *flow_group_in;
	+ u8 *dmac;
	+ int err = 0;
	+
	+ esw_debug(dev, "Create FDB log_max_size(%d)\n",
	+ MLX5_CAP_ESW_FLOWTABLE_FDB(dev, log_max_ft_size));
	+
	+ root_ns = mlx5_get_flow_namespace(dev, MLX5_FLOW_NAMESPACE_FDB);
	+ if (!root_ns) {
	+ esw_warn(dev, "Failed to get FDB flow namespace\n");
	+ return -ENOMEM;
	+ }
	+
	+ flow_group_in = mlx5_vzalloc(inlen);
	+ if (!flow_group_in)
	+ return -ENOMEM;
	+ memset(flow_group_in, 0, inlen);
	+
	+ /* (-2) Since MaorG said so .. */
	+ table_size = BIT(MLX5_CAP_ESW_FLOWTABLE_FDB(dev, log_max_ft_size)) - 2;
	+
	+ fdb = mlx5_create_flow_table(root_ns, 0, "FDB", table_size);
	+ if (IS_ERR_OR_NULL(fdb)) {
	+ err = PTR_ERR(fdb);
	+ esw_warn(dev, "Failed to create FDB Table err %d\n", err);
	+ goto out;
	+ }
	+
	+ MLX5_SET(create_flow_group_in, flow_group_in, match_criteria_enable,
	+ MLX5_MATCH_OUTER_HEADERS);
	+ match_criteria = MLX5_ADDR_OF(create_flow_group_in, flow_group_in, match_criteria);
	+ dmac = MLX5_ADDR_OF(fte_match_param, match_criteria, outer_headers.dmac_47_16);
	+ MLX5_SET(create_flow_group_in, flow_group_in, start_flow_index, 0);
	+ MLX5_SET(create_flow_group_in, flow_group_in, end_flow_index, table_size - 1);
	+ eth_broadcast_addr(dmac);
	+
	+ g = mlx5_create_flow_group(fdb, flow_group_in);
	+ if (IS_ERR_OR_NULL(g)) {
	+ err = PTR_ERR(g);
	+ esw_warn(dev, "Failed to create flow group err(%d)\n", err);
	+ goto out;
	+ }
	+
	+ esw->fdb_table.addr_grp = g;
	+ esw->fdb_table.fdb = fdb;
	+out:
	+ kfree(flow_group_in);
	+ if (err && !IS_ERR_OR_NULL(fdb))
	+ mlx5_destroy_flow_table(fdb);
	+ return err;
	+}
	+
	+static void esw_destroy_fdb_table(struct mlx5_eswitch *esw)
	+{
	+ if (!esw->fdb_table.fdb)
	+ return;
	+
	+ esw_debug(esw->dev, "Destroy FDB Table\n");
	+ mlx5_destroy_flow_group(esw->fdb_table.addr_grp);
	+ mlx5_destroy_flow_table(esw->fdb_table.fdb);
	+ esw->fdb_table.fdb = NULL;
	+ esw->fdb_table.addr_grp = NULL;
	+}
	+
	+/* E-Switch vport UC/MC lists management */
	+typedef int (vport_addr_action)(struct mlx5_eswitch esw,
	+ struct vport_addr *vaddr);
	+
	+static int esw_add_uc_addr(struct mlx5_eswitch esw, struct vport_addr vaddr)
	+{
	+ struct hlist_head *hash = esw->l2_table.l2_hash;
	+ struct esw_uc_addr *esw_uc;
	+ u8 *mac = vaddr->node.addr;
	+ u32 vport = vaddr->vport;
	+ int err;
	+
	+ esw_uc = l2addr_hash_find(hash, mac, struct esw_uc_addr);
	+ if (esw_uc) {
	+ esw_warn(esw->dev,
	+ "Failed to set L2 mac(%pM) for vport(%d), mac is already in use by vport(%d)\n",
	+ mac, vport, esw_uc->vport);
	+ return -EEXIST;
	+ }
	+
	+ esw_uc = l2addr_hash_add(hash, mac, struct esw_uc_addr, GFP_KERNEL);
	+ if (!esw_uc)
	+ return -ENOMEM;
	+ esw_uc->vport = vport;
	+
	+ err = set_l2_table_entry(esw->dev, mac, 0, 0, &esw_uc->table_index);
	+ if (err)
	+ goto abort;
	+
	+ if (esw->fdb_table.fdb) /* SRIOV is enabled: Forward UC MAC to vport */
	+ vaddr->flow_rule = esw_fdb_set_vport_rule(esw, mac, vport);
	+
	+ esw_debug(esw->dev, "\tADDED UC MAC: vport[%d] %pM index:%d fr(%p)\n",
	+ vport, mac, esw_uc->table_index, vaddr->flow_rule);
	+ return err;
	+abort:
	+ l2addr_hash_del(esw_uc);
	+ return err;
	+}
	+
	+static int esw_del_uc_addr(struct mlx5_eswitch esw, struct vport_addr vaddr)
	+{
	+ struct hlist_head *hash = esw->l2_table.l2_hash;
	+ struct esw_uc_addr *esw_uc;
	+ u8 *mac = vaddr->node.addr;
	+ u32 vport = vaddr->vport;
	+
	+ esw_uc = l2addr_hash_find(hash, mac, struct esw_uc_addr);
	+ if (!esw_uc \|\| esw_uc->vport != vport) {
	+ esw_debug(esw->dev,
	+ "MAC(%pM) doesn't belong to vport (%d)\n",
	+ mac, vport);
	+ return -EINVAL;
	+ }
	+ esw_debug(esw->dev, "\tDELETE UC MAC: vport[%d] %pM index:%d fr(%p)\n",
	+ vport, mac, esw_uc->table_index, vaddr->flow_rule);
	+
	+ del_l2_table_entry(esw->dev, esw_uc->table_index);
	+
	+ if (vaddr->flow_rule)
	+ mlx5_del_flow_rule(vaddr->flow_rule);
	+ vaddr->flow_rule = NULL;
	+
	+ l2addr_hash_del(esw_uc);
	+ return 0;
	+}
	+
	+static int esw_add_mc_addr(struct mlx5_eswitch esw, struct vport_addr vaddr)
	+{
	+ struct hlist_head *hash = esw->mc_table;
	+ struct esw_mc_addr *esw_mc;
	+ u8 *mac = vaddr->node.addr;
	+ u32 vport = vaddr->vport;
	+
	+ if (!esw->fdb_table.fdb)
	+ return 0;
	+
	+ esw_mc = l2addr_hash_find(hash, mac, struct esw_mc_addr);
	+ if (esw_mc)
	+ goto add;
	+
	+ esw_mc = l2addr_hash_add(hash, mac, struct esw_mc_addr, GFP_KERNEL);
	+ if (!esw_mc)
	+ return -ENOMEM;
	+
	+ esw_mc->uplink_rule = /* Forward MC MAC to Uplink */
	+ esw_fdb_set_vport_rule(esw, mac, UPLINK_VPORT);
	+add:
	+ esw_mc->refcnt++;
	+ /* Forward MC MAC to vport */
	+ vaddr->flow_rule = esw_fdb_set_vport_rule(esw, mac, vport);
	+ esw_debug(esw->dev,
	+ "\tADDED MC MAC: vport[%d] %pM fr(%p) refcnt(%d) uplinkfr(%p)\n",
	+ vport, mac, vaddr->flow_rule,
	+ esw_mc->refcnt, esw_mc->uplink_rule);
	+ return 0;
	+}
	+
	+static int esw_del_mc_addr(struct mlx5_eswitch esw, struct vport_addr vaddr)
	+{
	+ struct hlist_head *hash = esw->mc_table;
	+ struct esw_mc_addr *esw_mc;
	+ u8 *mac = vaddr->node.addr;
	+ u32 vport = vaddr->vport;
	+
	+ if (!esw->fdb_table.fdb)
	+ return 0;
	+
	+ esw_mc = l2addr_hash_find(hash, mac, struct esw_mc_addr);
	+ if (!esw_mc) {
	+ esw_warn(esw->dev,
	+ "Failed to find eswitch MC addr for MAC(%pM) vport(%d)",
	+ mac, vport);
	+ return -EINVAL;
	+ }
	+ esw_debug(esw->dev,
	+ "\tDELETE MC MAC: vport[%d] %pM fr(%p) refcnt(%d) uplinkfr(%p)\n",
	+ vport, mac, vaddr->flow_rule, esw_mc->refcnt,
	+ esw_mc->uplink_rule);
	+
	+ if (vaddr->flow_rule)
	+ mlx5_del_flow_rule(vaddr->flow_rule);
	+ vaddr->flow_rule = NULL;
	+
	+ if (--esw_mc->refcnt)
	+ return 0;
	+
	+ if (esw_mc->uplink_rule)
	+ mlx5_del_flow_rule(esw_mc->uplink_rule);
	+
	+ l2addr_hash_del(esw_mc);
	+ return 0;
	+}
	+
	+/* Apply vport UC/MC list to HW l2 table and FDB table */
	+static void esw_apply_vport_addr_list(struct mlx5_eswitch *esw,
	+ u32 vport_num, int list_type)
	+{
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+ bool is_uc = list_type == MLX5_NIC_VPORT_LIST_TYPE_UC;
	+ vport_addr_action vport_addr_add;
	+ vport_addr_action vport_addr_del;
	+ struct vport_addr *addr;
	+ struct l2addr_node *node;
	+ struct hlist_head *hash;
	+ struct hlist_node *tmp;
	+ int hi;
	+
	+ vport_addr_add = is_uc ? esw_add_uc_addr :
	+ esw_add_mc_addr;
	+ vport_addr_del = is_uc ? esw_del_uc_addr :
	+ esw_del_mc_addr;
	+
	+ hash = is_uc ? vport->uc_list : vport->mc_list;
	+ for_each_l2hash_node(node, tmp, hash, hi) {
	+ addr = container_of(node, struct vport_addr, node);
	+ switch (addr->action) {
	+ case MLX5_ACTION_ADD:
	+ vport_addr_add(esw, addr);
	+ addr->action = MLX5_ACTION_NONE;
	+ break;
	+ case MLX5_ACTION_DEL:
	+ vport_addr_del(esw, addr);
	+ l2addr_hash_del(addr);
	+ break;
	+ }
	+ }
	+}
	+
	+/* Sync vport UC/MC list from vport context */
	+static void esw_update_vport_addr_list(struct mlx5_eswitch *esw,
	+ u32 vport_num, int list_type)
	+{
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+ bool is_uc = list_type == MLX5_NIC_VPORT_LIST_TYPE_UC;
	+ u8 (*mac_list)[ETH_ALEN];
	+ struct l2addr_node *node;
	+ struct vport_addr *addr;
	+ struct hlist_head *hash;
	+ struct hlist_node *tmp;
	+ int size;
	+ int err;
	+ int hi;
	+ int i;
	+
	+ size = is_uc ? MLX5_MAX_UC_PER_VPORT(esw->dev) :
	+ MLX5_MAX_MC_PER_VPORT(esw->dev);
	+
	+ mac_list = kcalloc(size, ETH_ALEN, GFP_KERNEL);
	+ if (!mac_list)
	+ return;
	+
	+ hash = is_uc ? vport->uc_list : vport->mc_list;
	+
	+ for_each_l2hash_node(node, tmp, hash, hi) {
	+ addr = container_of(node, struct vport_addr, node);
	+ addr->action = MLX5_ACTION_DEL;
	+ }
	+
	+ err = mlx5_query_nic_vport_mac_list(esw->dev, vport_num, list_type,
	+ mac_list, &size);
	+ if (err)
	+ return;
	+ esw_debug(esw->dev, "vport[%d] context update %s list size (%d)\n",
	+ vport_num, is_uc ? "UC" : "MC", size);
	+
	+ for (i = 0; i < size; i++) {
	+ if (is_uc && !is_valid_ether_addr(mac_list[i]))
	+ continue;
	+
	+ if (!is_uc && !is_multicast_ether_addr(mac_list[i]))
	+ continue;
	+
	+ addr = l2addr_hash_find(hash, mac_list[i], struct vport_addr);
	+ if (addr) {
	+ addr->action = MLX5_ACTION_NONE;
	+ continue;
	+ }
	+
	+ addr = l2addr_hash_add(hash, mac_list[i], struct vport_addr,
	+ GFP_KERNEL);
	+ if (!addr) {
	+ esw_warn(esw->dev,
	+ "Failed to add MAC(%pM) to vport[%d] DB\n",
	+ mac_list[i], vport_num);
	+ continue;
	+ }
	+ addr->vport = vport_num;
	+ addr->action = MLX5_ACTION_ADD;
	+ }
	+ kfree(mac_list);
	+}
	+
	+static void esw_vport_change_handler(struct work_struct *work)
	+{
	+ struct mlx5_vport *vport =
	+ container_of(work, struct mlx5_vport, vport_change_handler);
	+ struct mlx5_core_dev *dev = vport->dev;
	+ struct mlx5_eswitch *esw = dev->priv.eswitch;
	+ u8 mac[ETH_ALEN];
	+
	+ mlx5_query_nic_vport_mac_address(dev, vport->vport, mac);
	+ esw_debug(dev, "vport[%d] Context Changed: perm mac: %pM\n",
	+ vport->vport, mac);
	+
	+ if (vport->enabled_events & UC_ADDR_CHANGE) {
	+ esw_update_vport_addr_list(esw, vport->vport,
	+ MLX5_NIC_VPORT_LIST_TYPE_UC);
	+ esw_apply_vport_addr_list(esw, vport->vport,
	+ MLX5_NIC_VPORT_LIST_TYPE_UC);
	+ }
	+
	+ if (vport->enabled_events & MC_ADDR_CHANGE) {
	+ esw_update_vport_addr_list(esw, vport->vport,
	+ MLX5_NIC_VPORT_LIST_TYPE_MC);
	+ esw_apply_vport_addr_list(esw, vport->vport,
	+ MLX5_NIC_VPORT_LIST_TYPE_MC);
	+ }
	+
	+ esw_debug(esw->dev, "vport[%d] Context Changed: Done\n", vport->vport);
	+ if (vport->enabled)
	+ arm_vport_context_events_cmd(dev, vport->vport,
	+ vport->enabled_events);
	+}
	+
	+static void esw_vport_enable_egress_acl(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ struct mlx5_flow_group *vlan_grp = NULL;
	+ struct mlx5_flow_group *drop_grp = NULL;
	+ struct mlx5_core_dev *dev = esw->dev;
	+ struct mlx5_flow_namespace *root_ns;
	+ struct mlx5_flow_table *acl;
	+ void *match_criteria;
	+ char table_name[32];
	+ u32 *flow_group_in;
	+ int table_size = 2;
	+ int err = 0;
	+
	+ if (!MLX5_CAP_ESW_EGRESS_ACL(dev, ft_support))
	+ return;
	+
	+ esw_debug(dev, "Create vport[%d] egress ACL log_max_size(%d)\n",
	+ vport->vport, MLX5_CAP_ESW_EGRESS_ACL(dev, log_max_ft_size));
	+
	+ root_ns = mlx5_get_flow_namespace(dev, MLX5_FLOW_NAMESPACE_ESW_EGRESS);
	+ if (!root_ns) {
	+ esw_warn(dev, "Failed to get E-Switch egress flow namespace\n");
	+ return;
	+ }
	+
	+ flow_group_in = mlx5_vzalloc(inlen);
	+ if (!flow_group_in)
	+ return;
	+
	+ snprintf(table_name, 32, "egress_%d", vport->vport);
	+ acl = mlx5_create_vport_flow_table(root_ns, vport->vport, 0, table_name, table_size);
	+ if (IS_ERR_OR_NULL(acl)) {
	+ err = PTR_ERR(acl);
	+ esw_warn(dev, "Failed to create E-Switch vport[%d] egress flow Table, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ MLX5_SET(create_flow_group_in, flow_group_in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ match_criteria = MLX5_ADDR_OF(create_flow_group_in, flow_group_in, match_criteria);
	+ MLX5_SET_TO_ONES(fte_match_param, match_criteria, outer_headers.cvlan_tag);
	+ MLX5_SET_TO_ONES(fte_match_param, match_criteria, outer_headers.first_vid);
	+ MLX5_SET(create_flow_group_in, flow_group_in, start_flow_index, 0);
	+ MLX5_SET(create_flow_group_in, flow_group_in, end_flow_index, 0);
	+
	+ vlan_grp = mlx5_create_flow_group(acl, flow_group_in);
	+ if (IS_ERR_OR_NULL(vlan_grp)) {
	+ err = PTR_ERR(vlan_grp);
	+ esw_warn(dev, "Failed to create E-Switch vport[%d] egress allowed vlans flow group, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ memset(flow_group_in, 0, inlen);
	+ MLX5_SET(create_flow_group_in, flow_group_in, start_flow_index, 1);
	+ MLX5_SET(create_flow_group_in, flow_group_in, end_flow_index, 1);
	+ drop_grp = mlx5_create_flow_group(acl, flow_group_in);
	+ if (IS_ERR_OR_NULL(drop_grp)) {
	+ err = PTR_ERR(drop_grp);
	+ esw_warn(dev, "Failed to create E-Switch vport[%d] egress drop flow group, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ vport->egress.acl = acl;
	+ vport->egress.drop_grp = drop_grp;
	+ vport->egress.allowed_vlans_grp = vlan_grp;
	+out:
	+ kfree(flow_group_in);
	+ if (err && !IS_ERR_OR_NULL(vlan_grp))
	+ mlx5_destroy_flow_group(vlan_grp);
	+ if (err && !IS_ERR_OR_NULL(acl))
	+ mlx5_destroy_flow_table(acl);
	+}
	+
	+static void esw_vport_cleanup_egress_rules(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ if (!IS_ERR_OR_NULL(vport->egress.allowed_vlan))
	+ mlx5_del_flow_rule(vport->egress.allowed_vlan);
	+
	+ if (!IS_ERR_OR_NULL(vport->egress.drop_rule))
	+ mlx5_del_flow_rule(vport->egress.drop_rule);
	+
	+ vport->egress.allowed_vlan = NULL;
	+ vport->egress.drop_rule = NULL;
	+}
	+
	+static void esw_vport_disable_egress_acl(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ if (IS_ERR_OR_NULL(vport->egress.acl))
	+ return;
	+
	+ esw_debug(esw->dev, "Destroy vport[%d] E-Switch egress ACL\n", vport->vport);
	+
	+ esw_vport_cleanup_egress_rules(esw, vport);
	+ mlx5_destroy_flow_group(vport->egress.allowed_vlans_grp);
	+ mlx5_destroy_flow_group(vport->egress.drop_grp);
	+ mlx5_destroy_flow_table(vport->egress.acl);
	+ vport->egress.allowed_vlans_grp = NULL;
	+ vport->egress.drop_grp = NULL;
	+ vport->egress.acl = NULL;
	+}
	+
	+static void esw_vport_enable_ingress_acl(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ struct mlx5_core_dev *dev = esw->dev;
	+ struct mlx5_flow_namespace *root_ns;
	+ struct mlx5_flow_table *acl;
	+ struct mlx5_flow_group *g;
	+ void *match_criteria;
	+ char table_name[32];
	+ u32 *flow_group_in;
	+ int table_size = 1;
	+ int err = 0;
	+
	+ if (!MLX5_CAP_ESW_INGRESS_ACL(dev, ft_support))
	+ return;
	+
	+ esw_debug(dev, "Create vport[%d] ingress ACL log_max_size(%d)\n",
	+ vport->vport, MLX5_CAP_ESW_INGRESS_ACL(dev, log_max_ft_size));
	+
	+ root_ns = mlx5_get_flow_namespace(dev, MLX5_FLOW_NAMESPACE_ESW_INGRESS);
	+ if (!root_ns) {
	+ esw_warn(dev, "Failed to get E-Switch ingress flow namespace\n");
	+ return;
	+ }
	+
	+ flow_group_in = mlx5_vzalloc(inlen);
	+ if (!flow_group_in)
	+ return;
	+
	+ snprintf(table_name, 32, "ingress_%d", vport->vport);
	+ acl = mlx5_create_vport_flow_table(root_ns, vport->vport, 0, table_name, table_size);
	+ if (IS_ERR_OR_NULL(acl)) {
	+ err = PTR_ERR(acl);
	+ esw_warn(dev, "Failed to create E-Switch vport[%d] ingress flow Table, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ MLX5_SET(create_flow_group_in, flow_group_in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ match_criteria = MLX5_ADDR_OF(create_flow_group_in, flow_group_in, match_criteria);
	+ MLX5_SET_TO_ONES(fte_match_param, match_criteria, outer_headers.cvlan_tag);
	+ MLX5_SET(create_flow_group_in, flow_group_in, start_flow_index, 0);
	+ MLX5_SET(create_flow_group_in, flow_group_in, end_flow_index, 0);
	+
	+ g = mlx5_create_flow_group(acl, flow_group_in);
	+ if (IS_ERR_OR_NULL(g)) {
	+ err = PTR_ERR(g);
	+ esw_warn(dev, "Failed to create E-Switch vport[%d] ingress flow group, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ vport->ingress.acl = acl;
	+ vport->ingress.drop_grp = g;
	+out:
	+ kfree(flow_group_in);
	+ if (err && !IS_ERR_OR_NULL(acl))
	+ mlx5_destroy_flow_table(acl);
	+}
	+
	+static void esw_vport_cleanup_ingress_rules(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ if (!IS_ERR_OR_NULL(vport->ingress.drop_rule))
	+ mlx5_del_flow_rule(vport->ingress.drop_rule);
	+ vport->ingress.drop_rule = NULL;
	+}
	+
	+static void esw_vport_disable_ingress_acl(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ if (IS_ERR_OR_NULL(vport->ingress.acl))
	+ return;
	+
	+ esw_debug(esw->dev, "Destroy vport[%d] E-Switch ingress ACL\n", vport->vport);
	+
	+ esw_vport_cleanup_ingress_rules(esw, vport);
	+ mlx5_destroy_flow_group(vport->ingress.drop_grp);
	+ mlx5_destroy_flow_table(vport->ingress.acl);
	+ vport->ingress.acl = NULL;
	+ vport->ingress.drop_grp = NULL;
	+}
	+
	+static int esw_vport_ingress_config(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ struct mlx5_flow_destination dest;
	+ u32 *match_v;
	+ u32 *match_c;
	+ int err = 0;
	+
	+ if (IS_ERR_OR_NULL(vport->ingress.acl)) {
	+ esw_warn(esw->dev,
	+ "vport[%d] configure ingress rules failed, ingress acl is not initialized!\n",
	+ vport->vport);
	+ return -EPERM;
	+ }
	+
	+ esw_vport_cleanup_ingress_rules(esw, vport);
	+
	+ if (!vport->vlan && !vport->qos)
	+ return 0;
	+
	+ esw_debug(esw->dev,
	+ "vport[%d] configure ingress rules, vlan(%d) qos(%d)\n",
	+ vport->vport, vport->vlan, vport->qos);
	+
	+ match_v = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ match_c = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ if (!match_v \|\| !match_c) {
	+ err = -ENOMEM;
	+ esw_warn(esw->dev, "vport[%d] configure ingress rules failed, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+ MLX5_SET_TO_ONES(fte_match_param, match_c, outer_headers.cvlan_tag);
	+ MLX5_SET_TO_ONES(fte_match_param, match_v, outer_headers.cvlan_tag);
	+
	+ dest.type = MLX5_FLOW_CONTEXT_DEST_TYPE_VPORT;
	+ dest.vport_num = vport->vport;
	+
	+ vport->ingress.drop_rule =
	+ mlx5_add_flow_rule(vport->ingress.acl,
	+ MLX5_MATCH_OUTER_HEADERS,
	+ match_c,
	+ match_v,
	+ MLX5_FLOW_CONTEXT_ACTION_DROP,
	+ 0, &dest);
	+ if (IS_ERR_OR_NULL(vport->ingress.drop_rule)) {
	+ err = PTR_ERR(vport->ingress.drop_rule);
	+ printf("mlx5_core: WARN: ""vport[%d] configure ingress rules, err(%d)\n", vport->vport, err);
	+ vport->ingress.drop_rule = NULL;
	+ }
	+out:
	+ kfree(match_v);
	+ kfree(match_c);
	+ return err;
	+}
	+
	+static int esw_vport_egress_config(struct mlx5_eswitch *esw,
	+ struct mlx5_vport *vport)
	+{
	+ struct mlx5_flow_destination dest;
	+ u32 *match_v;
	+ u32 *match_c;
	+ int err = 0;
	+
	+ if (IS_ERR_OR_NULL(vport->egress.acl)) {
	+ esw_warn(esw->dev, "vport[%d] configure rgress rules failed, egress acl is not initialized!\n",
	+ vport->vport);
	+ return -EPERM;
	+ }
	+
	+ esw_vport_cleanup_egress_rules(esw, vport);
	+
	+ if (!vport->vlan && !vport->qos)
	+ return 0;
	+
	+ esw_debug(esw->dev,
	+ "vport[%d] configure egress rules, vlan(%d) qos(%d)\n",
	+ vport->vport, vport->vlan, vport->qos);
	+
	+ match_v = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ match_c = kzalloc(MLX5_ST_SZ_BYTES(fte_match_param), GFP_KERNEL);
	+ if (!match_v \|\| !match_c) {
	+ err = -ENOMEM;
	+ esw_warn(esw->dev, "vport[%d] configure egress rules failed, err(%d)\n",
	+ vport->vport, err);
	+ goto out;
	+ }
	+
	+ /* Allowed vlan rule */
	+ MLX5_SET_TO_ONES(fte_match_param, match_c, outer_headers.cvlan_tag);
	+ MLX5_SET_TO_ONES(fte_match_param, match_v, outer_headers.cvlan_tag);
	+ MLX5_SET_TO_ONES(fte_match_param, match_c, outer_headers.first_vid);
	+ MLX5_SET(fte_match_param, match_v, outer_headers.first_vid, vport->vlan);
	+
	+ dest.type = MLX5_FLOW_CONTEXT_DEST_TYPE_VPORT;
	+ dest.vport_num = vport->vport;
	+
	+ vport->egress.allowed_vlan =
	+ mlx5_add_flow_rule(vport->egress.acl,
	+ MLX5_MATCH_OUTER_HEADERS,
	+ match_c,
	+ match_v,
	+ MLX5_FLOW_CONTEXT_ACTION_ALLOW,
	+ 0, &dest);
	+ if (IS_ERR_OR_NULL(vport->egress.allowed_vlan)) {
	+ err = PTR_ERR(vport->egress.allowed_vlan);
	+ printf("mlx5_core: WARN: ""vport[%d] configure egress allowed vlan rule failed, err(%d)\n", vport->vport, err);
	+ vport->egress.allowed_vlan = NULL;
	+ goto out;
	+ }
	+
	+ /* Drop others rule (star rule) */
	+ memset(match_c, 0, MLX5_ST_SZ_BYTES(fte_match_param));
	+ memset(match_v, 0, MLX5_ST_SZ_BYTES(fte_match_param));
	+ vport->egress.drop_rule =
	+ mlx5_add_flow_rule(vport->egress.acl,
	+ 0,
	+ match_c,
	+ match_v,
	+ MLX5_FLOW_CONTEXT_ACTION_DROP,
	+ 0, &dest);
	+ if (IS_ERR_OR_NULL(vport->egress.drop_rule)) {
	+ err = PTR_ERR(vport->egress.drop_rule);
	+ printf("mlx5_core: WARN: ""vport[%d] configure egress drop rule failed, err(%d)\n", vport->vport, err);
	+ vport->egress.drop_rule = NULL;
	+ }
	+out:
	+ kfree(match_v);
	+ kfree(match_c);
	+ return err;
	+}
	+
	+static void esw_enable_vport(struct mlx5_eswitch *esw, int vport_num,
	+ int enable_events)
	+{
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+ unsigned long flags;
	+
	+ mutex_lock(&vport->state_lock);
	+ WARN_ON(vport->enabled);
	+
	+ esw_debug(esw->dev, "Enabling VPORT(%d)\n", vport_num);
	+
	+ if (vport_num) { /* Only VFs need ACLs for VST and spoofchk filtering */
	+ esw_vport_enable_ingress_acl(esw, vport);
	+ esw_vport_enable_egress_acl(esw, vport);
	+ esw_vport_ingress_config(esw, vport);
	+ esw_vport_egress_config(esw, vport);
	+ }
	+
	+ mlx5_modify_vport_admin_state(esw->dev,
	+ MLX5_QUERY_VPORT_STATE_IN_OP_MOD_ESW_VPORT,
	+ vport_num,
	+ MLX5_ESW_VPORT_ADMIN_STATE_AUTO);
	+
	+ /* Sync with current vport context */
	+ vport->enabled_events = enable_events;
	+ esw_vport_change_handler(&vport->vport_change_handler);
	+
	+ spin_lock_irqsave(&vport->lock, flags);
	+ vport->enabled = true;
	+ spin_unlock_irqrestore(&vport->lock, flags);
	+
	+ arm_vport_context_events_cmd(esw->dev, vport_num, enable_events);
	+
	+ esw->enabled_vports++;
	+ esw_debug(esw->dev, "Enabled VPORT(%d)\n", vport_num);
	+ mutex_unlock(&vport->state_lock);
	+}
	+
	+static void esw_cleanup_vport(struct mlx5_eswitch *esw, u16 vport_num)
	+{
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+ struct l2addr_node *node;
	+ struct vport_addr *addr;
	+ struct hlist_node *tmp;
	+ int hi;
	+
	+ for_each_l2hash_node(node, tmp, vport->uc_list, hi) {
	+ addr = container_of(node, struct vport_addr, node);
	+ addr->action = MLX5_ACTION_DEL;
	+ }
	+ esw_apply_vport_addr_list(esw, vport_num, MLX5_NIC_VPORT_LIST_TYPE_UC);
	+
	+ for_each_l2hash_node(node, tmp, vport->mc_list, hi) {
	+ addr = container_of(node, struct vport_addr, node);
	+ addr->action = MLX5_ACTION_DEL;
	+ }
	+ esw_apply_vport_addr_list(esw, vport_num, MLX5_NIC_VPORT_LIST_TYPE_MC);
	+}
	+
	+static void esw_disable_vport(struct mlx5_eswitch *esw, int vport_num)
	+{
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+ unsigned long flags;
	+
	+ mutex_lock(&vport->state_lock);
	+ if (!vport->enabled) {
	+ mutex_unlock(&vport->state_lock);
	+ return;
	+ }
	+
	+ esw_debug(esw->dev, "Disabling vport(%d)\n", vport_num);
	+ /* Mark this vport as disabled to discard new events */
	+ spin_lock_irqsave(&vport->lock, flags);
	+ vport->enabled = false;
	+ vport->enabled_events = 0;
	+ spin_unlock_irqrestore(&vport->lock, flags);
	+
	+ mlx5_modify_vport_admin_state(esw->dev,
	+ MLX5_QUERY_VPORT_STATE_IN_OP_MOD_ESW_VPORT,
	+ vport_num,
	+ MLX5_ESW_VPORT_ADMIN_STATE_DOWN);
	+ /* Wait for current already scheduled events to complete */
	+ flush_workqueue(esw->work_queue);
	+ /* Disable events from this vport */
	+ arm_vport_context_events_cmd(esw->dev, vport->vport, 0);
	+ /* We don't assume VFs will cleanup after themselves */
	+ esw_cleanup_vport(esw, vport_num);
	+ if (vport_num) {
	+ esw_vport_disable_egress_acl(esw, vport);
	+ esw_vport_disable_ingress_acl(esw, vport);
	+ }
	+ esw->enabled_vports--;
	+ mutex_unlock(&vport->state_lock);
	+}
	+
	+/* Public E-Switch API */
	+int mlx5_eswitch_enable_sriov(struct mlx5_eswitch *esw, int nvfs)
	+{
	+ int err;
	+ int i;
	+
	+ if (!esw \|\| !MLX5_CAP_GEN(esw->dev, vport_group_manager) \|\|
	+ MLX5_CAP_GEN(esw->dev, port_type) != MLX5_CAP_PORT_TYPE_ETH)
	+ return 0;
	+
	+ if (!MLX5_CAP_GEN(esw->dev, eswitch_flow_table) \|\|
	+ !MLX5_CAP_ESW_FLOWTABLE_FDB(esw->dev, ft_support)) {
	+ esw_warn(esw->dev, "E-Switch FDB is not supported, aborting ...\n");
	+ return -ENOTSUPP;
	+ }
	+
	+ if (!MLX5_CAP_ESW_INGRESS_ACL(esw->dev, ft_support))
	+ esw_warn(esw->dev, "E-Switch ingress ACL is not supported by FW\n");
	+
	+ if (!MLX5_CAP_ESW_EGRESS_ACL(esw->dev, ft_support))
	+ esw_warn(esw->dev, "E-Switch engress ACL is not supported by FW\n");
	+
	+ esw_info(esw->dev, "E-Switch enable SRIOV: nvfs(%d)\n", nvfs);
	+
	+ esw_disable_vport(esw, 0);
	+
	+ err = esw_create_fdb_table(esw);
	+ if (err)
	+ goto abort;
	+
	+ for (i = 0; i <= nvfs; i++)
	+ esw_enable_vport(esw, i, SRIOV_VPORT_EVENTS);
	+
	+ esw_info(esw->dev, "SRIOV enabled: active vports(%d)\n",
	+ esw->enabled_vports);
	+ return 0;
	+
	+abort:
	+ esw_enable_vport(esw, 0, UC_ADDR_CHANGE);
	+ return err;
	+}
	+
	+void mlx5_eswitch_disable_sriov(struct mlx5_eswitch *esw)
	+{
	+ int i;
	+
	+ if (!esw \|\| !MLX5_CAP_GEN(esw->dev, vport_group_manager) \|\|
	+ MLX5_CAP_GEN(esw->dev, port_type) != MLX5_CAP_PORT_TYPE_ETH)
	+ return;
	+
	+ esw_info(esw->dev, "disable SRIOV: active vports(%d)\n",
	+ esw->enabled_vports);
	+
	+ for (i = 0; i < esw->total_vports; i++)
	+ esw_disable_vport(esw, i);
	+
	+ esw_destroy_fdb_table(esw);
	+
	+ /* VPORT 0 (PF) must be enabled back with non-sriov configuration */
	+ esw_enable_vport(esw, 0, UC_ADDR_CHANGE);
	+}
	+
	+int mlx5_eswitch_init(struct mlx5_core_dev *dev)
	+{
	+ int l2_table_size = 1 << MLX5_CAP_GEN(dev, log_max_l2_table);
	+ int total_vports = 1;
	+ struct mlx5_eswitch *esw;
	+ int vport_num;
	+ int err;
	+
	+ if (!MLX5_CAP_GEN(dev, vport_group_manager) \|\|
	+ MLX5_CAP_GEN(dev, port_type) != MLX5_CAP_PORT_TYPE_ETH)
	+ return 0;
	+
	+ esw_info(dev,
	+ "Total vports %d, l2 table size(%d), per vport: max uc(%d) max mc(%d)\n",
	+ total_vports, l2_table_size,
	+ MLX5_MAX_UC_PER_VPORT(dev),
	+ MLX5_MAX_MC_PER_VPORT(dev));
	+
	+ esw = kzalloc(sizeof(*esw), GFP_KERNEL);
	+ if (!esw)
	+ return -ENOMEM;
	+
	+ esw->dev = dev;
	+
	+ esw->l2_table.bitmap = kcalloc(BITS_TO_LONGS(l2_table_size),
	+ sizeof(uintptr_t), GFP_KERNEL);
	+ if (!esw->l2_table.bitmap) {
	+ err = -ENOMEM;
	+ goto abort;
	+ }
	+ esw->l2_table.size = l2_table_size;
	+
	+ esw->work_queue = create_singlethread_workqueue("mlx5_esw_wq");
	+ if (!esw->work_queue) {
	+ err = -ENOMEM;
	+ goto abort;
	+ }
	+
	+ esw->vports = kcalloc(total_vports, sizeof(struct mlx5_vport),
	+ GFP_KERNEL);
	+ if (!esw->vports) {
	+ err = -ENOMEM;
	+ goto abort;
	+ }
	+
	+ for (vport_num = 0; vport_num < total_vports; vport_num++) {
	+ struct mlx5_vport *vport = &esw->vports[vport_num];
	+
	+ vport->vport = vport_num;
	+ vport->dev = dev;
	+ INIT_WORK(&vport->vport_change_handler,
	+ esw_vport_change_handler);
	+ spin_lock_init(&vport->lock);
	+ mutex_init(&vport->state_lock);
	+ }
	+
	+ esw->total_vports = total_vports;
	+ esw->enabled_vports = 0;
	+
	+ dev->priv.eswitch = esw;
	+ esw_enable_vport(esw, 0, UC_ADDR_CHANGE);
	+ /* VF Vports will be enabled when SRIOV is enabled */
	+ return 0;
	+abort:
	+ if (esw->work_queue)
	+ destroy_workqueue(esw->work_queue);
	+ kfree(esw->l2_table.bitmap);
	+ kfree(esw->vports);
	+ kfree(esw);
	+ return err;
	+}
	+
	+void mlx5_eswitch_cleanup(struct mlx5_eswitch *esw)
	+{
	+ if (!esw \|\| !MLX5_CAP_GEN(esw->dev, vport_group_manager) \|\|
	+ MLX5_CAP_GEN(esw->dev, port_type) != MLX5_CAP_PORT_TYPE_ETH)
	+ return;
	+
	+ esw_info(esw->dev, "cleanup\n");
	+ esw_disable_vport(esw, 0);
	+
	+ esw->dev->priv.eswitch = NULL;
	+ destroy_workqueue(esw->work_queue);
	+ kfree(esw->l2_table.bitmap);
	+ kfree(esw->vports);
	+ kfree(esw);
	+}
	+
	+void mlx5_eswitch_vport_event(struct mlx5_eswitch esw, struct mlx5_eqe eqe)
	+{
	+ struct mlx5_eqe_vport_change *vc_eqe = &eqe->data.vport_change;
	+ u16 vport_num = be16_to_cpu(vc_eqe->vport_num);
	+ struct mlx5_vport *vport;
	+
	+ if (!esw) {
	+ printf("mlx5_core: WARN: ""MLX5 E-Switch: vport %d got an event while eswitch is not initialized\n", vport_num);
	+ return;
	+ }
	+
	+ vport = &esw->vports[vport_num];
	+ spin_lock(&vport->lock);
	+ if (vport->enabled)
	+ queue_work(esw->work_queue, &vport->vport_change_handler);
	+ spin_unlock(&vport->lock);
	+}
	+
	+/* Vport Administration */
	+#define ESW_ALLOWED(esw) \
	+ (esw && MLX5_CAP_GEN(esw->dev, vport_group_manager) && mlx5_core_is_pf(esw->dev))
	+#define LEGAL_VPORT(esw, vport) (vport >= 0 && vport < esw->total_vports)
	+
	+static void node_guid_gen_from_mac(u64 *node_guid, u8 mac[ETH_ALEN])
	+{
	+ ((u8 *)node_guid)[7] = mac[0];
	+ ((u8 *)node_guid)[6] = mac[1];
	+ ((u8 *)node_guid)[5] = mac[2];
	+ ((u8 *)node_guid)[4] = 0xff;
	+ ((u8 *)node_guid)[3] = 0xfe;
	+ ((u8 *)node_guid)[2] = mac[3];
	+ ((u8 *)node_guid)[1] = mac[4];
	+ ((u8 *)node_guid)[0] = mac[5];
	+}
	+
	+int mlx5_eswitch_set_vport_mac(struct mlx5_eswitch *esw,
	+ int vport, u8 mac[ETH_ALEN])
	+{
	+ int err = 0;
	+ u64 node_guid;
	+
	+ if (!ESW_ALLOWED(esw))
	+ return -EPERM;
	+ if (!LEGAL_VPORT(esw, vport))
	+ return -EINVAL;
	+
	+ err = mlx5_modify_nic_vport_mac_address(esw->dev, vport, mac);
	+ if (err) {
	+ mlx5_core_warn(esw->dev,
	+ "Failed to mlx5_modify_nic_vport_mac vport(%d) err=(%d)\n",
	+ vport, err);
	+ return err;
	+ }
	+
	+ node_guid_gen_from_mac(&node_guid, mac);
	+ err = mlx5_modify_nic_vport_node_guid(esw->dev, vport, node_guid);
	+ if (err) {
	+ mlx5_core_warn(esw->dev,
	+ "Failed to mlx5_modify_nic_vport_node_guid vport(%d) err=(%d)\n",
	+ vport, err);
	+ return err;
	+ }
	+
	+ return err;
	+}
	+
	+int mlx5_eswitch_set_vport_state(struct mlx5_eswitch *esw,
	+ int vport, int link_state)
	+{
	+ if (!ESW_ALLOWED(esw))
	+ return -EPERM;
	+ if (!LEGAL_VPORT(esw, vport))
	+ return -EINVAL;
	+
	+ return mlx5_modify_vport_admin_state(esw->dev,
	+ MLX5_QUERY_VPORT_STATE_IN_OP_MOD_ESW_VPORT,
	+ vport, link_state);
	+}
	+
	+int mlx5_eswitch_get_vport_config(struct mlx5_eswitch *esw,
	+ int vport, struct mlx5_esw_vport_info *ivi)
	+{
	+ u16 vlan;
	+ u8 qos;
	+
	+ if (!ESW_ALLOWED(esw))
	+ return -EPERM;
	+ if (!LEGAL_VPORT(esw, vport))
	+ return -EINVAL;
	+
	+ memset(ivi, 0, sizeof(*ivi));
	+ ivi->vf = vport - 1;
	+
	+ mlx5_query_nic_vport_mac_address(esw->dev, vport, ivi->mac);
	+ ivi->linkstate = mlx5_query_vport_admin_state(esw->dev,
	+ MLX5_QUERY_VPORT_STATE_IN_OP_MOD_ESW_VPORT,
	+ vport);
	+ query_esw_vport_cvlan(esw->dev, vport, &vlan, &qos);
	+ ivi->vlan = vlan;
	+ ivi->qos = qos;
	+ ivi->spoofchk = 0;
	+
	+ return 0;
	+}
	+
	+int mlx5_eswitch_set_vport_vlan(struct mlx5_eswitch *esw,
	+ int vport, u16 vlan, u8 qos)
	+{
	+ struct mlx5_vport *evport;
	+ int err = 0;
	+ int set = 0;
	+
	+ if (!ESW_ALLOWED(esw))
	+ return -EPERM;
	+ if (!LEGAL_VPORT(esw, vport) \|\| (vlan > 4095) \|\| (qos > 7))
	+ return -EINVAL;
	+
	+ if (vlan \|\| qos)
	+ set = 1;
	+
	+ evport = &esw->vports[vport];
	+
	+ err = modify_esw_vport_cvlan(esw->dev, vport, vlan, qos, set);
	+ if (err)
	+ return err;
	+
	+ mutex_lock(&evport->state_lock);
	+ evport->vlan = vlan;
	+ evport->qos = qos;
	+ if (evport->enabled) {
	+ esw_vport_ingress_config(esw, evport);
	+ esw_vport_egress_config(esw, evport);
	+ }
	+ mutex_unlock(&evport->state_lock);
	+ return err;
	+}
	+
	Index: sys/dev/mlx5/mlx5_core/mlx5_fs_cmd.c
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/mlx5_core/mlx5_fs_cmd.c
	@@ -0,0 +1,301 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#include <linux/types.h>
	+#include <linux/module.h>
	+#include <dev/mlx5/mlx5_ifc.h>
	+#include <dev/mlx5/device.h>
	+#include <dev/mlx5/fs.h>
	+
	+#include "fs_core.h"
	+#include "mlx5_core.h"
	+
	+int mlx5_cmd_update_root_ft(struct mlx5_core_dev *dev,
	+ enum fs_ft_type type,
	+ unsigned int id)
	+{
	+ u32 in[MLX5_ST_SZ_DW(set_flow_table_root_in)];
	+ u32 out[MLX5_ST_SZ_DW(set_flow_table_root_out)];
	+
	+ if (!dev)
	+ return -EINVAL;
	+ memset(in, 0, sizeof(in));
	+
	+ MLX5_SET(set_flow_table_root_in, in, opcode,
	+ MLX5_CMD_OP_SET_FLOW_TABLE_ROOT);
	+ MLX5_SET(set_flow_table_root_in, in, table_type, type);
	+ MLX5_SET(set_flow_table_root_in, in, table_id, id);
	+
	+ memset(out, 0, sizeof(out));
	+ return mlx5_cmd_exec_check_status(dev, in, sizeof(in), out,
	+ sizeof(out));
	+}
	+
	+int mlx5_cmd_fs_create_ft(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int level,
	+ unsigned int log_size, unsigned int *table_id)
	+{
	+ u32 in[MLX5_ST_SZ_DW(create_flow_table_in)];
	+ u32 out[MLX5_ST_SZ_DW(create_flow_table_out)];
	+ int err;
	+
	+ if (!dev)
	+ return -EINVAL;
	+ memset(in, 0, sizeof(in));
	+
	+ MLX5_SET(create_flow_table_in, in, opcode,
	+ MLX5_CMD_OP_CREATE_FLOW_TABLE);
	+
	+ MLX5_SET(create_flow_table_in, in, table_type, type);
	+ MLX5_SET(create_flow_table_in, in, level, level);
	+ MLX5_SET(create_flow_table_in, in, log_size, log_size);
	+ if (vport) {
	+ MLX5_SET(create_flow_table_in, in, vport_number, vport);
	+ MLX5_SET(create_flow_table_in, in, other_vport, 1);
	+ }
	+
	+ memset(out, 0, sizeof(out));
	+ err = mlx5_cmd_exec_check_status(dev, in, sizeof(in), out,
	+ sizeof(out));
	+ if (err)
	+ return err;
	+
	+ *table_id = MLX5_GET(create_flow_table_out, out, table_id);
	+
	+ return 0;
	+}
	+
	+int mlx5_cmd_fs_destroy_ft(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id)
	+{
	+ u32 in[MLX5_ST_SZ_DW(destroy_flow_table_in)];
	+ u32 out[MLX5_ST_SZ_DW(destroy_flow_table_out)];
	+
	+ if (!dev)
	+ return -EINVAL;
	+ memset(in, 0, sizeof(in));
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(destroy_flow_table_in, in, opcode,
	+ MLX5_CMD_OP_DESTROY_FLOW_TABLE);
	+ MLX5_SET(destroy_flow_table_in, in, table_type, type);
	+ MLX5_SET(destroy_flow_table_in, in, table_id, table_id);
	+ if (vport) {
	+ MLX5_SET(destroy_flow_table_in, in, vport_number, vport);
	+ MLX5_SET(destroy_flow_table_in, in, other_vport, 1);
	+ }
	+
	+ return mlx5_cmd_exec_check_status(dev, in, sizeof(in), out, sizeof(out));
	+}
	+
	+int mlx5_cmd_fs_create_fg(struct mlx5_core_dev *dev,
	+ u32 *in,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int *group_id)
	+{
	+ u32 out[MLX5_ST_SZ_DW(create_flow_group_out)];
	+ int err;
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ if (!dev)
	+ return -EINVAL;
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(create_flow_group_in, in, opcode,
	+ MLX5_CMD_OP_CREATE_FLOW_GROUP);
	+ MLX5_SET(create_flow_group_in, in, table_type, type);
	+ MLX5_SET(create_flow_group_in, in, table_id, table_id);
	+ if (vport) {
	+ MLX5_SET(create_flow_group_in, in, vport_number, vport);
	+ MLX5_SET(create_flow_group_in, in, other_vport, 1);
	+ }
	+
	+ err = mlx5_cmd_exec_check_status(dev, in,
	+ inlen, out,
	+ sizeof(out));
	+ if (!err)
	+ *group_id = MLX5_GET(create_flow_group_out, out, group_id);
	+
	+ return err;
	+}
	+
	+int mlx5_cmd_fs_destroy_fg(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int group_id)
	+{
	+ u32 in[MLX5_ST_SZ_DW(destroy_flow_group_in)];
	+ u32 out[MLX5_ST_SZ_DW(destroy_flow_group_out)];
	+
	+ if (!dev)
	+ return -EINVAL;
	+ memset(in, 0, sizeof(in));
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(destroy_flow_group_in, in, opcode,
	+ MLX5_CMD_OP_DESTROY_FLOW_GROUP);
	+ MLX5_SET(destroy_flow_group_in, in, table_type, type);
	+ MLX5_SET(destroy_flow_group_in, in, table_id, table_id);
	+ MLX5_SET(destroy_flow_group_in, in, group_id, group_id);
	+ if (vport) {
	+ MLX5_SET(destroy_flow_group_in, in, vport_number, vport);
	+ MLX5_SET(destroy_flow_group_in, in, other_vport, 1);
	+ }
	+
	+ return mlx5_cmd_exec_check_status(dev, in, sizeof(in), out, sizeof(out));
	+}
	+
	+int mlx5_cmd_fs_set_fte(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_fte_status *fte_status,
	+ u32 *match_val,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int index, unsigned int group_id,
	+ unsigned int flow_tag,
	+ unsigned short action, int dest_size,
	+ struct list_head dests) / mlx5_flow_desination */
	+{
	+ u32 out[MLX5_ST_SZ_DW(set_fte_out)];
	+ u32 *in;
	+ unsigned int inlen;
	+ struct mlx5_flow_rule *dst;
	+ void *in_flow_context;
	+ void *in_match_value;
	+ void *in_dests;
	+ int err;
	+ int opmod = 0;
	+ int modify_mask = 0;
	+ int atomic_mod_cap;
	+
	+ if (action != MLX5_FLOW_CONTEXT_ACTION_FWD_DEST)
	+ dest_size = 0;
	+
	+ inlen = MLX5_ST_SZ_BYTES(set_fte_in) +
	+ dest_size * MLX5_ST_SZ_BYTES(dest_format_struct);
	+
	+ if (!dev)
	+ return -EINVAL;
	+
	+ if (*fte_status & FS_FTE_STATUS_EXISTING) {
	+ atomic_mod_cap = MLX5_CAP_FLOWTABLE(dev,
	+ flow_table_properties_nic_receive.
	+ flow_modify_en);
	+ if (!atomic_mod_cap)
	+ return -ENOTSUPP;
	+ opmod = 1;
	+ modify_mask = 1 <<
	+ MLX5_SET_FTE_MODIFY_ENABLE_MASK_DESTINATION_LIST;
	+ }
	+
	+ in = mlx5_vzalloc(inlen);
	+ if (!in) {
	+ mlx5_core_warn(dev, "failed to allocate inbox\n");
	+ return -ENOMEM;
	+ }
	+
	+ MLX5_SET(set_fte_in, in, opcode, MLX5_CMD_OP_SET_FLOW_TABLE_ENTRY);
	+ MLX5_SET(set_fte_in, in, op_mod, opmod);
	+ MLX5_SET(set_fte_in, in, modify_enable_mask, modify_mask);
	+ MLX5_SET(set_fte_in, in, table_type, type);
	+ MLX5_SET(set_fte_in, in, table_id, table_id);
	+ MLX5_SET(set_fte_in, in, flow_index, index);
	+ if (vport) {
	+ MLX5_SET(set_fte_in, in, vport_number, vport);
	+ MLX5_SET(set_fte_in, in, other_vport, 1);
	+ }
	+
	+ in_flow_context = MLX5_ADDR_OF(set_fte_in, in, flow_context);
	+ MLX5_SET(flow_context, in_flow_context, group_id, group_id);
	+ MLX5_SET(flow_context, in_flow_context, flow_tag, flow_tag);
	+ MLX5_SET(flow_context, in_flow_context, action, action);
	+ MLX5_SET(flow_context, in_flow_context, destination_list_size,
	+ dest_size);
	+ in_match_value = MLX5_ADDR_OF(flow_context, in_flow_context,
	+ match_value);
	+ memcpy(in_match_value, match_val, MLX5_ST_SZ_BYTES(fte_match_param));
	+ if (dest_size) {
	+ in_dests = MLX5_ADDR_OF(flow_context, in_flow_context, destination);
	+ list_for_each_entry(dst, dests, base.list) {
	+ unsigned int id;
	+
	+ MLX5_SET(dest_format_struct, in_dests, destination_type,
	+ dst->dest_attr.type);
	+ if (dst->dest_attr.type ==
	+ MLX5_FLOW_CONTEXT_DEST_TYPE_FLOW_TABLE)
	+ id = dst->dest_attr.ft->id;
	+ else
	+ id = dst->dest_attr.tir_num;
	+ MLX5_SET(dest_format_struct, in_dests, destination_id, id);
	+ in_dests += MLX5_ST_SZ_BYTES(dest_format_struct);
	+ }
	+ }
	+ memset(out, 0, sizeof(out));
	+ err = mlx5_cmd_exec_check_status(dev, in, inlen, out,
	+ sizeof(out));
	+ if (!err)
	+ *fte_status \|= FS_FTE_STATUS_EXISTING;
	+
	+ kvfree(in);
	+
	+ return err;
	+}
	+
	+int mlx5_cmd_fs_delete_fte(struct mlx5_core_dev *dev,
	+ u16 vport,
	+ enum fs_fte_status *fte_status,
	+ enum fs_ft_type type, unsigned int table_id,
	+ unsigned int index)
	+{
	+ u32 in[MLX5_ST_SZ_DW(delete_fte_in)];
	+ u32 out[MLX5_ST_SZ_DW(delete_fte_out)];
	+ int err;
	+
	+ if (!(*fte_status & FS_FTE_STATUS_EXISTING))
	+ return 0;
	+
	+ if (!dev)
	+ return -EINVAL;
	+ memset(in, 0, sizeof(in));
	+ memset(out, 0, sizeof(out));
	+
	+ MLX5_SET(delete_fte_in, in, opcode, MLX5_CMD_OP_DELETE_FLOW_TABLE_ENTRY);
	+ MLX5_SET(delete_fte_in, in, table_type, type);
	+ MLX5_SET(delete_fte_in, in, table_id, table_id);
	+ MLX5_SET(delete_fte_in, in, flow_index, index);
	+ if (vport) {
	+ MLX5_SET(delete_fte_in, in, vport_number, vport);
	+ MLX5_SET(delete_fte_in, in, other_vport, 1);
	+ }
	+
	+ err = mlx5_cmd_exec_check_status(dev, in, sizeof(in), out, sizeof(out));
	+ if (!err)
	+ *fte_status = 0;
	+
	+ return err;
	+}
	Index: sys/dev/mlx5/mlx5_core/mlx5_fs_tree.c
	===================================================================
	--- /dev/null
	+++ sys/dev/mlx5/mlx5_core/mlx5_fs_tree.c
	@@ -0,0 +1,2721 @@
	+/*-
	+ * Copyright (c) 2013-2015, Mellanox Technologies, Ltd. All rights reserved.
	+ *
	+ * Redistribution and use in source and binary forms, with or without
	+ * modification, are permitted provided that the following conditions
	+ * are met:
	+ * 1. Redistributions of source code must retain the above copyright
	+ * notice, this list of conditions and the following disclaimer.
	+ * 2. Redistributions in binary form must reproduce the above copyright
	+ * notice, this list of conditions and the following disclaimer in the
	+ * documentation and/or other materials provided with the distribution.
	+ *
	+ * THIS SOFTWARE IS PROVIDED BY AUTHOR AND CONTRIBUTORS `AS IS' AND
	+ * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
	+ * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
	+ * ARE DISCLAIMED. IN NO EVENT SHALL AUTHOR OR CONTRIBUTORS BE LIABLE
	+ * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
	+ * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
	+ * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
	+ * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
	+ * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
	+ * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
	+ * SUCH DAMAGE.
	+ *
	+ * $FreeBSD$
	+ */
	+
	+#include <linux/module.h>
	+#include <dev/mlx5/driver.h>
	+#include "mlx5_core.h"
	+#include "fs_core.h"
	+#include <linux/string.h>
	+#include <linux/compiler.h>
	+
	+#define INIT_TREE_NODE_ARRAY_SIZE(...) (sizeof((struct init_tree_node[]){__VA_ARGS__}) /\
	+ sizeof(struct init_tree_node))
	+
	+#define ADD_PRIO(name_val, flags_val, min_level_val, max_ft_val, caps_val, \
	+ ...) {.type = FS_TYPE_PRIO,\
	+ .name = name_val,\
	+ .min_ft_level = min_level_val,\
	+ .flags = flags_val,\
	+ .max_ft = max_ft_val,\
	+ .caps = caps_val,\
	+ .children = (struct init_tree_node[]) {__VA_ARGS__},\
	+ .ar_size = INIT_TREE_NODE_ARRAY_SIZE(__VA_ARGS__) \
	+}
	+
	+#define ADD_FT_PRIO(name_val, flags_val, max_ft_val, ...)\
	+ ADD_PRIO(name_val, flags_val, 0, max_ft_val, {},\
	+ __VA_ARGS__)\
	+
	+#define ADD_NS(name_val, ...) {.type = FS_TYPE_NAMESPACE,\
	+ .name = name_val,\
	+ .children = (struct init_tree_node[]) {__VA_ARGS__},\
	+ .ar_size = INIT_TREE_NODE_ARRAY_SIZE(__VA_ARGS__) \
	+}
	+
	+#define INIT_CAPS_ARRAY_SIZE(...) (sizeof((long[]){__VA_ARGS__}) /\
	+ sizeof(long))
	+
	+#define FS_CAP(cap) (__mlx5_bit_off(flow_table_nic_cap, cap))
	+
	+#define FS_REQUIRED_CAPS(...) {.arr_sz = INIT_CAPS_ARRAY_SIZE(__VA_ARGS__), \
	+ .caps = (long[]) {__VA_ARGS__}}
	+
	+#define BYPASS_MAX_FT 5
	+#define BYPASS_PRIO_MAX_FT 1
	+#define KERNEL_MAX_FT 3
	+#define LEFTOVER_MAX_FT 1
	+#define KENREL_MIN_LEVEL 3
	+#define LEFTOVER_MIN_LEVEL KENREL_MIN_LEVEL + 1
	+#define BYPASS_MIN_LEVEL MLX5_NUM_BYPASS_FTS + LEFTOVER_MIN_LEVEL
	+struct node_caps {
	+ size_t arr_sz;
	+ long *caps;
	+};
	+
	+struct init_tree_node {
	+ enum fs_type type;
	+ const char *name;
	+ struct init_tree_node *children;
	+ int ar_size;
	+ struct node_caps caps;
	+ u8 flags;
	+ int min_ft_level;
	+ int prio;
	+ int max_ft;
	+} root_fs = {
	+ .type = FS_TYPE_NAMESPACE,
	+ .name = "root",
	+ .ar_size = 3,
	+ .children = (struct init_tree_node[]) {
	+ ADD_PRIO("by_pass_prio", 0, BYPASS_MIN_LEVEL, 0,
	+ FS_REQUIRED_CAPS(FS_CAP(flow_table_properties_nic_receive.flow_modify_en),
	+ FS_CAP(flow_table_properties_nic_receive.modify_root)),
	+ ADD_NS("by_pass_ns",
	+ ADD_FT_PRIO("prio0", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio1", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio2", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio3", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio4", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio5", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio6", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio7", 0,
	+ BYPASS_PRIO_MAX_FT),
	+ ADD_FT_PRIO("prio-mcast", 0,
	+ BYPASS_PRIO_MAX_FT))),
	+ ADD_PRIO("kernel_prio", 0, KENREL_MIN_LEVEL, 0, {},
	+ ADD_NS("kernel_ns",
	+ ADD_FT_PRIO("prio_kernel-0", 0,
	+ KERNEL_MAX_FT))),
	+ ADD_PRIO("leftovers_prio", MLX5_CORE_FS_PRIO_SHARED,
	+ LEFTOVER_MIN_LEVEL, 0,
	+ FS_REQUIRED_CAPS(FS_CAP(flow_table_properties_nic_receive.flow_modify_en),
	+ FS_CAP(flow_table_properties_nic_receive.modify_root)),
	+ ADD_NS("leftover_ns",
	+ ADD_FT_PRIO("leftovers_prio-0",
	+ MLX5_CORE_FS_PRIO_SHARED,
	+ LEFTOVER_MAX_FT)))
	+ }
	+};
	+
	+/* Tree creation functions */
	+
	+static struct mlx5_flow_root_namespace find_root(struct fs_base node)
	+{
	+ struct fs_base *parent;
	+
	+ /* Make sure we only read it once while we go up the tree */
	+ while ((parent = node->parent))
	+ node = parent;
	+
	+ if (node->type != FS_TYPE_NAMESPACE) {
	+ printf("mlx5_core: WARN: ""mlx5: flow steering node %s is not in tree or garbaged\n", node->name);
	+ return NULL;
	+ }
	+
	+ return container_of(container_of(node,
	+ struct mlx5_flow_namespace,
	+ base),
	+ struct mlx5_flow_root_namespace,
	+ ns);
	+}
	+
	+static inline struct mlx5_core_dev fs_get_dev(struct fs_base node)
	+{
	+ struct mlx5_flow_root_namespace *root = find_root(node);
	+
	+ if (root)
	+ return root->dev;
	+ return NULL;
	+}
	+
	+static void fs_init_node(struct fs_base *node,
	+ unsigned int refcount)
	+{
	+ kref_init(&node->refcount);
	+ atomic_set(&node->users_refcount, refcount);
	+ init_completion(&node->complete);
	+ INIT_LIST_HEAD(&node->list);
	+ mutex_init(&node->lock);
	+}
	+
	+static void _fs_add_node(struct fs_base *node,
	+ const char *name,
	+ struct fs_base *parent)
	+{
	+ if (parent)
	+ atomic_inc(&parent->users_refcount);
	+ node->name = kstrdup_const(name, GFP_KERNEL);
	+ node->parent = parent;
	+}
	+
	+static void fs_add_node(struct fs_base *node,
	+ struct fs_base parent, const char name,
	+ unsigned int refcount)
	+{
	+ fs_init_node(node, refcount);
	+ _fs_add_node(node, name, parent);
	+}
	+
	+static void _fs_put(struct fs_base node, void (kref_cb)(struct kref *kref),
	+ bool parent_locked);
	+
	+static void fs_del_dst(struct mlx5_flow_rule *dst);
	+static void _fs_del_ft(struct mlx5_flow_table *ft);
	+static void fs_del_fg(struct mlx5_flow_group *fg);
	+static void fs_del_fte(struct fs_fte *fte);
	+
	+static void cmd_remove_node(struct fs_base *base)
	+{
	+ switch (base->type) {
	+ case FS_TYPE_FLOW_DEST:
	+ fs_del_dst(container_of(base, struct mlx5_flow_rule, base));
	+ break;
	+ case FS_TYPE_FLOW_TABLE:
	+ _fs_del_ft(container_of(base, struct mlx5_flow_table, base));
	+ break;
	+ case FS_TYPE_FLOW_GROUP:
	+ fs_del_fg(container_of(base, struct mlx5_flow_group, base));
	+ break;
	+ case FS_TYPE_FLOW_ENTRY:
	+ fs_del_fte(container_of(base, struct fs_fte, base));
	+ break;
	+ default:
	+ break;
	+ }
	+}
	+
	+static void __fs_remove_node(struct kref *kref)
	+{
	+ struct fs_base *node = container_of(kref, struct fs_base, refcount);
	+
	+ if (node->parent)
	+ mutex_lock(&node->parent->lock);
	+ mutex_lock(&node->lock);
	+ cmd_remove_node(node);
	+ mutex_unlock(&node->lock);
	+ complete(&node->complete);
	+ if (node->parent) {
	+ mutex_unlock(&node->parent->lock);
	+ _fs_put(node->parent, _fs_remove_node, false);
	+ }
	+}
	+
	+void _fs_remove_node(struct kref *kref)
	+{
	+ struct fs_base *node = container_of(kref, struct fs_base, refcount);
	+
	+ __fs_remove_node(kref);
	+ kfree_const(node->name);
	+ kfree(node);
	+}
	+
	+static void fs_get(struct fs_base *node)
	+{
	+ atomic_inc(&node->users_refcount);
	+}
	+
	+static void _fs_put(struct fs_base node, void (kref_cb)(struct kref *kref),
	+ bool parent_locked)
	+{
	+ struct fs_base *parent_node = node->parent;
	+
	+ if (parent_node && !parent_locked)
	+ mutex_lock(&parent_node->lock);
	+ if (atomic_dec_and_test(&node->users_refcount)) {
	+ if (parent_node) {
	+ /remove from parent's list/
	+ list_del_init(&node->list);
	+ mutex_unlock(&parent_node->lock);
	+ }
	+ kref_put(&node->refcount, kref_cb);
	+ if (parent_node && parent_locked)
	+ mutex_lock(&parent_node->lock);
	+ } else if (parent_node && !parent_locked) {
	+ mutex_unlock(&parent_node->lock);
	+ }
	+}
	+
	+static void fs_put(struct fs_base *node)
	+{
	+ _fs_put(node, __fs_remove_node, false);
	+}
	+
	+static void fs_put_parent_locked(struct fs_base *node)
	+{
	+ _fs_put(node, __fs_remove_node, true);
	+}
	+
	+static void fs_remove_node(struct fs_base *node)
	+{
	+ fs_put(node);
	+ wait_for_completion(&node->complete);
	+ kfree_const(node->name);
	+ kfree(node);
	+}
	+
	+static void fs_remove_node_parent_locked(struct fs_base *node)
	+{
	+ fs_put_parent_locked(node);
	+ wait_for_completion(&node->complete);
	+ kfree_const(node->name);
	+ kfree(node);
	+}
	+
	+static struct fs_fte *fs_alloc_fte(u8 action,
	+ u32 flow_tag,
	+ u32 *match_value,
	+ unsigned int index)
	+{
	+ struct fs_fte *fte;
	+
	+
	+ fte = kzalloc(sizeof(*fte), GFP_KERNEL);
	+ if (!fte)
	+ return ERR_PTR(-ENOMEM);
	+
	+ memcpy(fte->val, match_value, sizeof(fte->val));
	+ fte->base.type = FS_TYPE_FLOW_ENTRY;
	+ fte->dests_size = 0;
	+ fte->flow_tag = flow_tag;
	+ fte->index = index;
	+ INIT_LIST_HEAD(&fte->dests);
	+ fte->action = action;
	+
	+ return fte;
	+}
	+
	+static struct fs_fte alloc_star_ft_entry(struct mlx5_flow_table ft,
	+ struct mlx5_flow_group *fg,
	+ u32 *match_value,
	+ unsigned int index)
	+{
	+ int err;
	+ struct fs_fte *fte;
	+ struct mlx5_flow_rule *dst;
	+
	+ if (fg->num_ftes == fg->max_ftes)
	+ return ERR_PTR(-ENOSPC);
	+
	+ fte = fs_alloc_fte(MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_DEFAULT_FLOW_TAG, match_value, index);
	+ if (IS_ERR(fte))
	+ return fte;
	+
	+ /create dst/
	+ dst = kzalloc(sizeof(*dst), GFP_KERNEL);
	+ if (!dst) {
	+ err = -ENOMEM;
	+ goto free_fte;
	+ }
	+
	+ fte->base.parent = &fg->base;
	+ fte->dests_size = 1;
	+ dst->dest_attr.type = MLX5_FLOW_CONTEXT_DEST_TYPE_FLOW_TABLE;
	+ dst->base.parent = &fte->base;
	+ list_add(&dst->base.list, &fte->dests);
	+ /* assumed that the callee creates the star rules sorted by index */
	+ list_add_tail(&fte->base.list, &fg->ftes);
	+ fg->num_ftes++;
	+
	+ return fte;
	+
	+free_fte:
	+ kfree(fte);
	+ return ERR_PTR(err);
	+}
	+
	+/* assume that fte can't be changed */
	+static void free_star_fte_entry(struct fs_fte *fte)
	+{
	+ struct mlx5_flow_group *fg;
	+ struct mlx5_flow_rule dst, temp;
	+
	+ fs_get_parent(fg, fte);
	+
	+ list_for_each_entry_safe(dst, temp, &fte->dests, base.list) {
	+ fte->dests_size--;
	+ list_del(&dst->base.list);
	+ kfree(dst);
	+ }
	+
	+ list_del(&fte->base.list);
	+ fg->num_ftes--;
	+ kfree(fte);
	+}
	+
	+static struct mlx5_flow_group fs_alloc_fg(u32 create_fg_in)
	+{
	+ struct mlx5_flow_group *fg;
	+ void *match_criteria = MLX5_ADDR_OF(create_flow_group_in,
	+ create_fg_in, match_criteria);
	+ u8 match_criteria_enable = MLX5_GET(create_flow_group_in,
	+ create_fg_in,
	+ match_criteria_enable);
	+ fg = kzalloc(sizeof(*fg), GFP_KERNEL);
	+ if (!fg)
	+ return ERR_PTR(-ENOMEM);
	+
	+ INIT_LIST_HEAD(&fg->ftes);
	+ fg->mask.match_criteria_enable = match_criteria_enable;
	+ memcpy(&fg->mask.match_criteria, match_criteria,
	+ sizeof(fg->mask.match_criteria));
	+ fg->base.type = FS_TYPE_FLOW_GROUP;
	+ fg->start_index = MLX5_GET(create_flow_group_in, create_fg_in,
	+ start_flow_index);
	+ fg->max_ftes = MLX5_GET(create_flow_group_in, create_fg_in,
	+ end_flow_index) - fg->start_index + 1;
	+ return fg;
	+}
	+
	+static struct mlx5_flow_table find_next_ft(struct fs_prio prio);
	+static struct mlx5_flow_table find_prev_ft(struct mlx5_flow_table curr,
	+ struct fs_prio *prio);
	+
	+/* assumed src_ft and dst_ft can't be freed */
	+static int fs_set_star_rule(struct mlx5_core_dev *dev,
	+ struct mlx5_flow_table *src_ft,
	+ struct mlx5_flow_table *dst_ft)
	+{
	+ struct mlx5_flow_rule *src_dst;
	+ struct fs_fte *src_fte;
	+ int err = 0;
	+ u32 *match_value;
	+ int match_len = MLX5_ST_SZ_BYTES(fte_match_param);
	+
	+ src_dst = list_first_entry(&src_ft->star_rule.fte->dests,
	+ struct mlx5_flow_rule, base.list);
	+ match_value = mlx5_vzalloc(match_len);
	+ if (!match_value) {
	+ mlx5_core_warn(dev, "failed to allocate inbox\n");
	+ return -ENOMEM;
	+ }
	+ /Create match context/
	+
	+ fs_get_parent(src_fte, src_dst);
	+
	+ src_dst->dest_attr.ft = dst_ft;
	+ if (dst_ft) {
	+ err = mlx5_cmd_fs_set_fte(dev,
	+ src_ft->vport,
	+ &src_fte->status,
	+ match_value, src_ft->type,
	+ src_ft->id, src_fte->index,
	+ src_ft->star_rule.fg->id,
	+ src_fte->flow_tag,
	+ src_fte->action,
	+ src_fte->dests_size,
	+ &src_fte->dests);
	+ if (err)
	+ goto free;
	+
	+ fs_get(&dst_ft->base);
	+ } else {
	+ mlx5_cmd_fs_delete_fte(dev,
	+ src_ft->vport,
	+ &src_fte->status,
	+ src_ft->type, src_ft->id,
	+ src_fte->index);
	+ }
	+
	+free:
	+ kvfree(match_value);
	+ return err;
	+}
	+
	+static int connect_prev_fts(struct fs_prio *locked_prio,
	+ struct fs_prio *prev_prio,
	+ struct mlx5_flow_table *next_ft)
	+{
	+ struct mlx5_flow_table *iter;
	+ int err = 0;
	+ struct mlx5_core_dev *dev = fs_get_dev(&prev_prio->base);
	+
	+ if (!dev)
	+ return -ENODEV;
	+
	+ mutex_lock(&prev_prio->base.lock);
	+ fs_for_each_ft(iter, prev_prio) {
	+ struct mlx5_flow_rule *src_dst =
	+ list_first_entry(&iter->star_rule.fte->dests,
	+ struct mlx5_flow_rule, base.list);
	+ struct mlx5_flow_table *prev_ft = src_dst->dest_attr.ft;
	+
	+ if (prev_ft == next_ft)
	+ continue;
	+
	+ err = fs_set_star_rule(dev, iter, next_ft);
	+ if (err) {
	+ mlx5_core_warn(dev,
	+ "mlx5: flow steering can't connect prev and next\n");
	+ goto unlock;
	+ } else {
	+ /* Assume ft's prio is locked */
	+ if (prev_ft) {
	+ struct fs_prio *prio;
	+
	+ fs_get_parent(prio, prev_ft);
	+ if (prio == locked_prio)
	+ fs_put_parent_locked(&prev_ft->base);
	+ else
	+ fs_put(&prev_ft->base);
	+ }
	+ }
	+ }
	+
	+unlock:
	+ mutex_unlock(&prev_prio->base.lock);
	+ return 0;
	+}
	+
	+static int create_star_rule(struct mlx5_flow_table ft, struct fs_prio prio)
	+{
	+ struct mlx5_flow_group *fg;
	+ int err;
	+ u32 *fg_in;
	+ u32 *match_value;
	+ struct mlx5_flow_table *next_ft;
	+ struct mlx5_flow_table *prev_ft;
	+ struct mlx5_flow_root_namespace *root = find_root(&prio->base);
	+ int fg_inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ int match_len = MLX5_ST_SZ_BYTES(fte_match_param);
	+
	+ fg_in = mlx5_vzalloc(fg_inlen);
	+ if (!fg_in) {
	+ mlx5_core_warn(root->dev, "failed to allocate inbox\n");
	+ return -ENOMEM;
	+ }
	+
	+ match_value = mlx5_vzalloc(match_len);
	+ if (!match_value) {
	+ mlx5_core_warn(root->dev, "failed to allocate inbox\n");
	+ kvfree(fg_in);
	+ return -ENOMEM;
	+ }
	+
	+ MLX5_SET(create_flow_group_in, fg_in, start_flow_index, ft->max_fte);
	+ MLX5_SET(create_flow_group_in, fg_in, end_flow_index, ft->max_fte);
	+ fg = fs_alloc_fg(fg_in);
	+ if (IS_ERR(fg)) {
	+ err = PTR_ERR(fg);
	+ goto out;
	+ }
	+ ft->star_rule.fg = fg;
	+ err = mlx5_cmd_fs_create_fg(fs_get_dev(&prio->base),
	+ fg_in, ft->vport, ft->type,
	+ ft->id,
	+ &fg->id);
	+ if (err)
	+ goto free_fg;
	+
	+ ft->star_rule.fte = alloc_star_ft_entry(ft, fg,
	+ match_value,
	+ ft->max_fte);
	+ if (IS_ERR(ft->star_rule.fte))
	+ goto free_star_rule;
	+
	+ mutex_lock(&root->fs_chain_lock);
	+ next_ft = find_next_ft(prio);
	+ err = fs_set_star_rule(root->dev, ft, next_ft);
	+ if (err) {
	+ mutex_unlock(&root->fs_chain_lock);
	+ goto free_star_rule;
	+ }
	+ if (next_ft) {
	+ struct fs_prio *parent;
	+
	+ fs_get_parent(parent, next_ft);
	+ fs_put(&next_ft->base);
	+ }
	+ prev_ft = find_prev_ft(ft, prio);
	+ if (prev_ft) {
	+ struct fs_prio *prev_parent;
	+
	+ fs_get_parent(prev_parent, prev_ft);
	+
	+ err = connect_prev_fts(NULL, prev_parent, ft);
	+ if (err) {
	+ mutex_unlock(&root->fs_chain_lock);
	+ goto destroy_chained_star_rule;
	+ }
	+ fs_put(&prev_ft->base);
	+ }
	+ mutex_unlock(&root->fs_chain_lock);
	+ kvfree(fg_in);
	+ kvfree(match_value);
	+
	+ return 0;
	+
	+destroy_chained_star_rule:
	+ fs_set_star_rule(fs_get_dev(&prio->base), ft, NULL);
	+ if (next_ft)
	+ fs_put(&next_ft->base);
	+free_star_rule:
	+ free_star_fte_entry(ft->star_rule.fte);
	+ mlx5_cmd_fs_destroy_fg(fs_get_dev(&ft->base), ft->vport,
	+ ft->type, ft->id,
	+ fg->id);
	+free_fg:
	+ kfree(fg);
	+out:
	+ kvfree(fg_in);
	+ kvfree(match_value);
	+ return err;
	+}
	+
	+static void destroy_star_rule(struct mlx5_flow_table ft, struct fs_prio prio)
	+{
	+ int err;
	+ struct mlx5_flow_root_namespace *root;
	+ struct mlx5_core_dev *dev = fs_get_dev(&prio->base);
	+ struct mlx5_flow_table prev_ft, next_ft;
	+ struct fs_prio *prev_prio;
	+
	+ WARN_ON(!dev);
	+
	+ root = find_root(&prio->base);
	+ if (!root)
	+ printf("mlx5_core: ERR: ""mlx5: flow steering failed to find root of priority %s", prio->base.name);
	+
	+ /* In order to ensure atomic deletion, first update
	+ * prev ft to point on the next ft.
	+ */
	+ mutex_lock(&root->fs_chain_lock);
	+ prev_ft = find_prev_ft(ft, prio);
	+ next_ft = find_next_ft(prio);
	+ if (prev_ft) {
	+ fs_get_parent(prev_prio, prev_ft);
	+ /Prev is connected to ft, only if ft is the first(last) in the prio/
	+ err = connect_prev_fts(prio, prev_prio, next_ft);
	+ if (err)
	+ mlx5_core_warn(root->dev,
	+ "flow steering can't connect prev and next of flow table\n");
	+ fs_put(&prev_ft->base);
	+ }
	+
	+ err = fs_set_star_rule(root->dev, ft, NULL);
	+ /One put is for fs_get in find next ft/
	+ if (next_ft) {
	+ fs_put(&next_ft->base);
	+ if (!err)
	+ fs_put(&next_ft->base);
	+ }
	+
	+ mutex_unlock(&root->fs_chain_lock);
	+ err = mlx5_cmd_fs_destroy_fg(dev, ft->vport, ft->type, ft->id,
	+ ft->star_rule.fg->id);
	+ if (err)
	+ mlx5_core_warn(dev,
	+ "flow steering can't destroy star entry group(index:%d) of ft:%s\n", ft->star_rule.fg->start_index,
	+ ft->base.name);
	+ free_star_fte_entry(ft->star_rule.fte);
	+
	+ kfree(ft->star_rule.fg);
	+ ft->star_rule.fg = NULL;
	+}
	+
	+static struct fs_prio find_prio(struct mlx5_flow_namespace ns,
	+ unsigned int prio)
	+{
	+ struct fs_prio *iter_prio;
	+
	+ fs_for_each_prio(iter_prio, ns) {
	+ if (iter_prio->prio == prio)
	+ return iter_prio;
	+ }
	+
	+ return NULL;
	+}
	+
	+static unsigned int _alloc_new_level(struct fs_prio *prio,
	+ struct mlx5_flow_namespace *match);
	+
	+static unsigned int __alloc_new_level(struct mlx5_flow_namespace *ns,
	+ struct fs_prio *prio)
	+{
	+ unsigned int level = 0;
	+ struct fs_prio *p;
	+
	+ if (!ns)
	+ return 0;
	+
	+ mutex_lock(&ns->base.lock);
	+ fs_for_each_prio(p, ns) {
	+ if (p != prio)
	+ level += p->max_ft;
	+ else
	+ break;
	+ }
	+ mutex_unlock(&ns->base.lock);
	+
	+ fs_get_parent(prio, ns);
	+ if (prio)
	+ WARN_ON(prio->base.type != FS_TYPE_PRIO);
	+
	+ return level + _alloc_new_level(prio, ns);
	+}
	+
	+/* Called under lock of priority, hence locking all upper objects */
	+static unsigned int _alloc_new_level(struct fs_prio *prio,
	+ struct mlx5_flow_namespace *match)
	+{
	+ struct mlx5_flow_namespace *ns;
	+ struct fs_base *it;
	+ unsigned int level = 0;
	+
	+ if (!prio)
	+ return 0;
	+
	+ mutex_lock(&prio->base.lock);
	+ fs_for_each_ns_or_ft_reverse(it, prio) {
	+ if (it->type == FS_TYPE_NAMESPACE) {
	+ struct fs_prio *p;
	+
	+ fs_get_obj(ns, it);
	+
	+ if (match != ns) {
	+ mutex_lock(&ns->base.lock);
	+ fs_for_each_prio(p, ns)
	+ level += p->max_ft;
	+ mutex_unlock(&ns->base.lock);
	+ } else {
	+ break;
	+ }
	+ } else {
	+ struct mlx5_flow_table *ft;
	+
	+ fs_get_obj(ft, it);
	+ mutex_unlock(&prio->base.lock);
	+ return level + ft->level + 1;
	+ }
	+ }
	+
	+ fs_get_parent(ns, prio);
	+ mutex_unlock(&prio->base.lock);
	+ return __alloc_new_level(ns, prio) + level;
	+}
	+
	+static unsigned int alloc_new_level(struct fs_prio *prio)
	+{
	+ return _alloc_new_level(prio, NULL);
	+}
	+
	+static int update_root_ft_create(struct mlx5_flow_root_namespace *root,
	+ struct mlx5_flow_table *ft)
	+{
	+ int err = 0;
	+ int min_level = INT_MAX;
	+
	+ if (root->root_ft)
	+ min_level = root->root_ft->level;
	+
	+ if (ft->level < min_level)
	+ err = mlx5_cmd_update_root_ft(root->dev, ft->type,
	+ ft->id);
	+ else
	+ return err;
	+
	+ if (err)
	+ mlx5_core_warn(root->dev, "Update root flow table of id=%u failed\n",
	+ ft->id);
	+ else
	+ root->root_ft = ft;
	+
	+ return err;
	+}
	+
	+static struct mlx5_flow_table _create_ft_common(struct mlx5_flow_namespace ns,
	+ u16 vport,
	+ struct fs_prio *fs_prio,
	+ int max_fte,
	+ const char *name)
	+{
	+ struct mlx5_flow_table *ft;
	+ int err;
	+ int log_table_sz;
	+ int ft_size;
	+ char gen_name[20];
	+ struct mlx5_flow_root_namespace *root =
	+ find_root(&ns->base);
	+
	+ if (!root) {
	+ printf("mlx5_core: ERR: ""mlx5: flow steering failed to find root of namespace %s", ns->base.name);
	+ return ERR_PTR(-ENODEV);
	+ }
	+
	+ if (fs_prio->num_ft == fs_prio->max_ft)
	+ return ERR_PTR(-ENOSPC);
	+
	+ ft = kzalloc(sizeof(*ft), GFP_KERNEL);
	+ if (!ft)
	+ return ERR_PTR(-ENOMEM);
	+
	+ fs_init_node(&ft->base, 1);
	+ INIT_LIST_HEAD(&ft->fgs);
	+
	+ /* Temporarily WA until we expose the level set in the API */
	+ if (root->table_type == FS_FT_ESW_EGRESS_ACL \|\|
	+ root->table_type == FS_FT_ESW_INGRESS_ACL)
	+ ft->level = 0;
	+ else
	+ ft->level = alloc_new_level(fs_prio);
	+
	+ ft->base.type = FS_TYPE_FLOW_TABLE;
	+ ft->vport = vport;
	+ ft->type = root->table_type;
	+ /Two entries are reserved for star rules/
	+ ft_size = roundup_pow_of_two(max_fte + 2);
	+ /User isn't aware to those rules/
	+ ft->max_fte = ft_size - 2;
	+ log_table_sz = ilog2(ft_size);
	+ err = mlx5_cmd_fs_create_ft(root->dev, ft->vport, ft->type,
	+ ft->level, log_table_sz, &ft->id);
	+ if (err)
	+ goto free_ft;
	+
	+ err = create_star_rule(ft, fs_prio);
	+ if (err)
	+ goto del_ft;
	+
	+ if ((root->table_type == FS_FT_NIC_RX) && MLX5_CAP_FLOWTABLE(root->dev,
	+ flow_table_properties_nic_receive.modify_root)) {
	+ err = update_root_ft_create(root, ft);
	+ if (err)
	+ goto destroy_star_rule;
	+ }
	+
	+ if (!name \|\| !strlen(name)) {
	+ snprintf(gen_name, 20, "flow_table_%u", ft->id);
	+ _fs_add_node(&ft->base, gen_name, &fs_prio->base);
	+ } else {
	+ _fs_add_node(&ft->base, name, &fs_prio->base);
	+ }
	+ list_add_tail(&ft->base.list, &fs_prio->objs);
	+ fs_prio->num_ft++;
	+
	+ return ft;
	+
	+destroy_star_rule:
	+ destroy_star_rule(ft, fs_prio);
	+del_ft:
	+ mlx5_cmd_fs_destroy_ft(root->dev, ft->vport, ft->type, ft->id);
	+free_ft:
	+ kfree(ft);
	+ return ERR_PTR(err);
	+}
	+
	+static struct mlx5_flow_table create_ft_common(struct mlx5_flow_namespace ns,
	+ u16 vport,
	+ unsigned int prio,
	+ int max_fte,
	+ const char *name)
	+{
	+ struct fs_prio *fs_prio = NULL;
	+ fs_prio = find_prio(ns, prio);
	+ if (!fs_prio)
	+ return ERR_PTR(-EINVAL);
	+
	+ return _create_ft_common(ns, vport, fs_prio, max_fte, name);
	+}
	+
	+
	+static struct mlx5_flow_table find_first_ft_in_ns(struct mlx5_flow_namespace ns,
	+ struct list_head *start);
	+
	+static struct mlx5_flow_table find_first_ft_in_prio(struct fs_prio prio,
	+ struct list_head *start);
	+
	+static struct mlx5_flow_table mlx5_create_autogrouped_shared_flow_table(struct fs_prio fs_prio)
	+{
	+ struct mlx5_flow_table *ft;
	+
	+ ft = find_first_ft_in_prio(fs_prio, &fs_prio->objs);
	+ if (ft) {
	+ ft->shared_refcount++;
	+ return ft;
	+ }
	+
	+ return NULL;
	+}
	+
	+struct mlx5_flow_table mlx5_create_auto_grouped_flow_table(struct mlx5_flow_namespace ns,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries,
	+ int max_num_groups)
	+{
	+ struct mlx5_flow_table *ft = NULL;
	+ struct fs_prio *fs_prio;
	+ bool is_shared_prio;
	+
	+ fs_prio = find_prio(ns, prio);
	+ if (!fs_prio)
	+ return ERR_PTR(-EINVAL);
	+
	+ is_shared_prio = fs_prio->flags & MLX5_CORE_FS_PRIO_SHARED;
	+ if (is_shared_prio) {
	+ mutex_lock(&fs_prio->shared_lock);
	+ ft = mlx5_create_autogrouped_shared_flow_table(fs_prio);
	+ }
	+
	+ if (ft)
	+ goto return_ft;
	+
	+ ft = create_ft_common(ns, 0, prio, num_flow_table_entries,
	+ name);
	+ if (IS_ERR(ft))
	+ goto return_ft;
	+
	+ ft->autogroup.active = true;
	+ ft->autogroup.max_types = max_num_groups;
	+ if (is_shared_prio)
	+ ft->shared_refcount = 1;
	+
	+return_ft:
	+ if (is_shared_prio)
	+ mutex_unlock(&fs_prio->shared_lock);
	+ return ft;
	+}
	+EXPORT_SYMBOL(mlx5_create_auto_grouped_flow_table);
	+
	+struct mlx5_flow_table mlx5_create_vport_flow_table(struct mlx5_flow_namespace ns,
	+ u16 vport,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries)
	+{
	+ return create_ft_common(ns, vport, prio, num_flow_table_entries, name);
	+}
	+EXPORT_SYMBOL(mlx5_create_vport_flow_table);
	+
	+struct mlx5_flow_table mlx5_create_flow_table(struct mlx5_flow_namespace ns,
	+ int prio,
	+ const char *name,
	+ int num_flow_table_entries)
	+{
	+ return create_ft_common(ns, 0, prio, num_flow_table_entries, name);
	+}
	+EXPORT_SYMBOL(mlx5_create_flow_table);
	+
	+static void _fs_del_ft(struct mlx5_flow_table *ft)
	+{
	+ int err;
	+ struct mlx5_core_dev *dev = fs_get_dev(&ft->base);
	+ struct fs_prio *prio;
	+
	+ err = mlx5_cmd_fs_destroy_ft(dev, ft->vport, ft->type, ft->id);
	+ if (err)
	+ mlx5_core_warn(dev, "flow steering can't destroy ft %s\n",
	+ ft->base.name);
	+
	+ fs_get_parent(prio, ft);
	+ prio->num_ft--;
	+}
	+
	+static int update_root_ft_destroy(struct mlx5_flow_root_namespace *root,
	+ struct mlx5_flow_table *ft)
	+{
	+ int err = 0;
	+ struct fs_prio *prio;
	+ struct mlx5_flow_table *next_ft = NULL;
	+ struct mlx5_flow_table *put_ft = NULL;
	+
	+ if (root->root_ft != ft)
	+ return 0;
	+
	+ fs_get_parent(prio, ft);
	+ /*Assuming objs containis only flow tables and
	+ * flow tables are sorted by level.
	+ */
	+ if (!list_is_last(&ft->base.list, &prio->objs)) {
	+ next_ft = list_next_entry(ft, base.list);
	+ } else {
	+ next_ft = find_next_ft(prio);
	+ put_ft = next_ft;
	+ }
	+
	+ if (next_ft) {
	+ err = mlx5_cmd_update_root_ft(root->dev, next_ft->type,
	+ next_ft->id);
	+ if (err)
	+ mlx5_core_warn(root->dev, "Update root flow table of id=%u failed\n",
	+ ft->id);
	+ }
	+ if (!err)
	+ root->root_ft = next_ft;
	+
	+ if (put_ft)
	+ fs_put(&put_ft->base);
	+
	+ return err;
	+}
	+
	+/Objects in the same prio are destroyed in the reverse order they were createrd/
	+int mlx5_destroy_flow_table(struct mlx5_flow_table *ft)
	+{
	+ int err = 0;
	+ struct fs_prio *prio;
	+ struct mlx5_flow_root_namespace *root;
	+ bool is_shared_prio;
	+
	+ fs_get_parent(prio, ft);
	+ root = find_root(&prio->base);
	+
	+ if (!root) {
	+ printf("mlx5_core: ERR: ""mlx5: flow steering failed to find root of priority %s", prio->base.name);
	+ return -ENODEV;
	+ }
	+
	+ is_shared_prio = prio->flags & MLX5_CORE_FS_PRIO_SHARED;
	+ if (is_shared_prio) {
	+ mutex_lock(&prio->shared_lock);
	+ if (ft->shared_refcount > 1) {
	+ --ft->shared_refcount;
	+ fs_put(&ft->base);
	+ mutex_unlock(&prio->shared_lock);
	+ return 0;
	+ }
	+ }
	+
	+ mutex_lock(&prio->base.lock);
	+ mutex_lock(&ft->base.lock);
	+
	+ err = update_root_ft_destroy(root, ft);
	+ if (err)
	+ goto unlock_ft;
	+
	+ /* delete two last entries */
	+ destroy_star_rule(ft, prio);
	+
	+ mutex_unlock(&ft->base.lock);
	+ fs_remove_node_parent_locked(&ft->base);
	+ mutex_unlock(&prio->base.lock);
	+ if (is_shared_prio)
	+ mutex_unlock(&prio->shared_lock);
	+
	+ return err;
	+
	+unlock_ft:
	+ mutex_unlock(&ft->base.lock);
	+ mutex_unlock(&prio->base.lock);
	+ if (is_shared_prio)
	+ mutex_unlock(&prio->shared_lock);
	+
	+ return err;
	+}
	+EXPORT_SYMBOL(mlx5_destroy_flow_table);
	+
	+static struct mlx5_flow_group fs_create_fg(struct mlx5_core_dev dev,
	+ struct mlx5_flow_table *ft,
	+ struct list_head *prev,
	+ u32 *fg_in,
	+ int refcount)
	+{
	+ struct mlx5_flow_group *fg;
	+ int err;
	+ unsigned int end_index;
	+ char name[20];
	+
	+ fg = fs_alloc_fg(fg_in);
	+ if (IS_ERR(fg))
	+ return fg;
	+
	+ end_index = fg->start_index + fg->max_ftes - 1;
	+ err = mlx5_cmd_fs_create_fg(dev, fg_in,
	+ ft->vport, ft->type, ft->id,
	+ &fg->id);
	+ if (err)
	+ goto free_fg;
	+
	+ mutex_lock(&ft->base.lock);
	+ if (ft->autogroup.active)
	+ ft->autogroup.num_types++;
	+
	+ snprintf(name, sizeof(name), "group_%u", fg->id);
	+ /Add node to tree/
	+ fs_add_node(&fg->base, &ft->base, name, refcount);
	+ /Add node to group list/
	+ list_add(&fg->base.list, prev);
	+ mutex_unlock(&ft->base.lock);
	+
	+ return fg;
	+
	+free_fg:
	+ kfree(fg);
	+ return ERR_PTR(err);
	+}
	+
	+struct mlx5_flow_group mlx5_create_flow_group(struct mlx5_flow_table ft,
	+ u32 *in)
	+{
	+ struct mlx5_flow_group *fg;
	+ struct mlx5_core_dev *dev = fs_get_dev(&ft->base);
	+
	+ if (!dev)
	+ return ERR_PTR(-ENODEV);
	+
	+ if (ft->autogroup.active)
	+ return ERR_PTR(-EPERM);
	+
	+ fg = fs_create_fg(dev, ft, ft->fgs.prev, in, 1);
	+
	+ return fg;
	+}
	+EXPORT_SYMBOL(mlx5_create_flow_group);
	+
	+/Group is destoyed when all the rules in the group were removed/
	+static void fs_del_fg(struct mlx5_flow_group *fg)
	+{
	+ struct mlx5_flow_table *parent_ft;
	+ struct mlx5_core_dev *dev;
	+
	+ fs_get_parent(parent_ft, fg);
	+ dev = fs_get_dev(&parent_ft->base);
	+ WARN_ON(!dev);
	+
	+ if (parent_ft->autogroup.active)
	+ parent_ft->autogroup.num_types--;
	+
	+ if (mlx5_cmd_fs_destroy_fg(dev, parent_ft->vport,
	+ parent_ft->type,
	+ parent_ft->id, fg->id))
	+ mlx5_core_warn(dev, "flow steering can't destroy fg\n");
	+}
	+
	+void mlx5_destroy_flow_group(struct mlx5_flow_group *fg)
	+{
	+ fs_remove_node(&fg->base);
	+}
	+EXPORT_SYMBOL(mlx5_destroy_flow_group);
	+
	+static bool _fs_match_exact_val(void mask, void val1, void *val2, size_t size)
	+{
	+ unsigned int i;
	+
	+ /* TODO: optimize by comparing 64bits when possible */
	+ for (i = 0; i < size; i++, mask++, val1++, val2++)
	+ if ((((u8 )val1) & ((u8 )mask)) !=
	+ (((u8 )val2) & ((u8 )mask)))
	+ return false;
	+
	+ return true;
	+}
	+
	+bool fs_match_exact_val(struct mlx5_core_fs_mask *mask,
	+ void val1, void val2)
	+{
	+ if (mask->match_criteria_enable &
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_OUTER_HEADERS) {
	+ void *fte_match1 = MLX5_ADDR_OF(fte_match_param,
	+ val1, outer_headers);
	+ void *fte_match2 = MLX5_ADDR_OF(fte_match_param,
	+ val2, outer_headers);
	+ void *fte_mask = MLX5_ADDR_OF(fte_match_param,
	+ mask->match_criteria, outer_headers);
	+
	+ if (!_fs_match_exact_val(fte_mask, fte_match1, fte_match2,
	+ MLX5_ST_SZ_BYTES(fte_match_set_lyr_2_4)))
	+ return false;
	+ }
	+
	+ if (mask->match_criteria_enable &
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_MISC_PARAMETERS) {
	+ void *fte_match1 = MLX5_ADDR_OF(fte_match_param,
	+ val1, misc_parameters);
	+ void *fte_match2 = MLX5_ADDR_OF(fte_match_param,
	+ val2, misc_parameters);
	+ void *fte_mask = MLX5_ADDR_OF(fte_match_param,
	+ mask->match_criteria, misc_parameters);
	+
	+ if (!_fs_match_exact_val(fte_mask, fte_match1, fte_match2,
	+ MLX5_ST_SZ_BYTES(fte_match_set_misc)))
	+ return false;
	+ }
	+ if (mask->match_criteria_enable &
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_INNER_HEADERS) {
	+ void *fte_match1 = MLX5_ADDR_OF(fte_match_param,
	+ val1, inner_headers);
	+ void *fte_match2 = MLX5_ADDR_OF(fte_match_param,
	+ val2, inner_headers);
	+ void *fte_mask = MLX5_ADDR_OF(fte_match_param,
	+ mask->match_criteria, inner_headers);
	+
	+ if (!_fs_match_exact_val(fte_mask, fte_match1, fte_match2,
	+ MLX5_ST_SZ_BYTES(fte_match_set_lyr_2_4)))
	+ return false;
	+ }
	+ return true;
	+}
	+
	+bool fs_match_exact_mask(u8 match_criteria_enable1,
	+ u8 match_criteria_enable2,
	+ void mask1, void mask2)
	+{
	+ return match_criteria_enable1 == match_criteria_enable2 &&
	+ !memcmp(mask1, mask2, MLX5_ST_SZ_BYTES(fte_match_param));
	+}
	+
	+static struct mlx5_flow_table find_first_ft_in_ns_reverse(struct mlx5_flow_namespace ns,
	+ struct list_head *start);
	+
	+static struct mlx5_flow_table _find_first_ft_in_prio_reverse(struct fs_prio prio,
	+ struct list_head *start)
	+{
	+ struct fs_base *it = container_of(start, struct fs_base, list);
	+
	+ if (!prio)
	+ return NULL;
	+
	+ fs_for_each_ns_or_ft_continue_reverse(it, prio) {
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5_flow_table *ft;
	+
	+ if (it->type == FS_TYPE_FLOW_TABLE) {
	+ fs_get_obj(ft, it);
	+ fs_get(&ft->base);
	+ return ft;
	+ }
	+
	+ fs_get_obj(ns, it);
	+ WARN_ON(ns->base.type != FS_TYPE_NAMESPACE);
	+
	+ ft = find_first_ft_in_ns_reverse(ns, &ns->prios);
	+ if (ft)
	+ return ft;
	+ }
	+
	+ return NULL;
	+}
	+
	+static struct mlx5_flow_table find_first_ft_in_prio_reverse(struct fs_prio prio,
	+ struct list_head *start)
	+{
	+ struct mlx5_flow_table *ft;
	+
	+ if (!prio)
	+ return NULL;
	+
	+ mutex_lock(&prio->base.lock);
	+ ft = _find_first_ft_in_prio_reverse(prio, start);
	+ mutex_unlock(&prio->base.lock);
	+
	+ return ft;
	+}
	+
	+static struct mlx5_flow_table find_first_ft_in_ns_reverse(struct mlx5_flow_namespace ns,
	+ struct list_head *start)
	+{
	+ struct fs_prio *prio;
	+
	+ if (!ns)
	+ return NULL;
	+
	+ fs_get_obj(prio, container_of(start, struct fs_base, list));
	+ mutex_lock(&ns->base.lock);
	+ fs_for_each_prio_continue_reverse(prio, ns) {
	+ struct mlx5_flow_table *ft;
	+
	+ ft = find_first_ft_in_prio_reverse(prio, &prio->objs);
	+ if (ft) {
	+ mutex_unlock(&ns->base.lock);
	+ return ft;
	+ }
	+ }
	+ mutex_unlock(&ns->base.lock);
	+
	+ return NULL;
	+}
	+
	+/* Returned a held ft, assumed curr is protected, assumed curr's parent is
	+ * locked
	+ */
	+static struct mlx5_flow_table find_prev_ft(struct mlx5_flow_table curr,
	+ struct fs_prio *prio)
	+{
	+ struct mlx5_flow_table *ft = NULL;
	+ struct fs_base *curr_base;
	+
	+ if (!curr)
	+ return NULL;
	+
	+ /* prio has either namespace or flow-tables, but not both */
	+ if (!list_empty(&prio->objs) &&
	+ list_first_entry(&prio->objs, struct mlx5_flow_table, base.list) !=
	+ curr)
	+ return NULL;
	+
	+ while (!ft && prio) {
	+ struct mlx5_flow_namespace *ns;
	+
	+ fs_get_parent(ns, prio);
	+ ft = find_first_ft_in_ns_reverse(ns, &prio->base.list);
	+ curr_base = &ns->base;
	+ fs_get_parent(prio, ns);
	+
	+ if (prio && !ft)
	+ ft = find_first_ft_in_prio_reverse(prio,
	+ &curr_base->list);
	+ }
	+ return ft;
	+}
	+
	+static struct mlx5_flow_table _find_first_ft_in_prio(struct fs_prio prio,
	+ struct list_head *start)
	+{
	+ struct fs_base *it = container_of(start, struct fs_base, list);
	+
	+ if (!prio)
	+ return NULL;
	+
	+ fs_for_each_ns_or_ft_continue(it, prio) {
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5_flow_table *ft;
	+
	+ if (it->type == FS_TYPE_FLOW_TABLE) {
	+ fs_get_obj(ft, it);
	+ fs_get(&ft->base);
	+ return ft;
	+ }
	+
	+ fs_get_obj(ns, it);
	+ WARN_ON(ns->base.type != FS_TYPE_NAMESPACE);
	+
	+ ft = find_first_ft_in_ns(ns, &ns->prios);
	+ if (ft)
	+ return ft;
	+ }
	+
	+ return NULL;
	+}
	+
	+static struct mlx5_flow_table find_first_ft_in_prio(struct fs_prio prio,
	+ struct list_head *start)
	+{
	+ struct mlx5_flow_table *ft;
	+
	+ if (!prio)
	+ return NULL;
	+
	+ mutex_lock(&prio->base.lock);
	+ ft = _find_first_ft_in_prio(prio, start);
	+ mutex_unlock(&prio->base.lock);
	+
	+ return ft;
	+}
	+
	+static struct mlx5_flow_table find_first_ft_in_ns(struct mlx5_flow_namespace ns,
	+ struct list_head *start)
	+{
	+ struct fs_prio *prio;
	+
	+ if (!ns)
	+ return NULL;
	+
	+ fs_get_obj(prio, container_of(start, struct fs_base, list));
	+ mutex_lock(&ns->base.lock);
	+ fs_for_each_prio_continue(prio, ns) {
	+ struct mlx5_flow_table *ft;
	+
	+ ft = find_first_ft_in_prio(prio, &prio->objs);
	+ if (ft) {
	+ mutex_unlock(&ns->base.lock);
	+ return ft;
	+ }
	+ }
	+ mutex_unlock(&ns->base.lock);
	+
	+ return NULL;
	+}
	+
	+/* returned a held ft, assumed curr is protected, assumed curr's parent is
	+ * locked
	+ */
	+static struct mlx5_flow_table find_next_ft(struct fs_prio prio)
	+{
	+ struct mlx5_flow_table *ft = NULL;
	+ struct fs_base *curr_base;
	+
	+ while (!ft && prio) {
	+ struct mlx5_flow_namespace *ns;
	+
	+ fs_get_parent(ns, prio);
	+ ft = find_first_ft_in_ns(ns, &prio->base.list);
	+ curr_base = &ns->base;
	+ fs_get_parent(prio, ns);
	+
	+ if (!ft && prio)
	+ ft = _find_first_ft_in_prio(prio, &curr_base->list);
	+ }
	+ return ft;
	+}
	+
	+
	+/* called under ft mutex lock */
	+static struct mlx5_flow_group create_autogroup(struct mlx5_flow_table ft,
	+ u8 match_criteria_enable,
	+ u32 *match_criteria)
	+{
	+ unsigned int group_size;
	+ unsigned int candidate_index = 0;
	+ unsigned int candidate_group_num = 0;
	+ struct mlx5_flow_group *g;
	+ struct mlx5_flow_group *ret;
	+ struct list_head *prev = &ft->fgs;
	+ struct mlx5_core_dev *dev;
	+ u32 *in;
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ void *match_criteria_addr;
	+
	+ if (!ft->autogroup.active)
	+ return ERR_PTR(-ENOENT);
	+
	+ dev = fs_get_dev(&ft->base);
	+ if (!dev)
	+ return ERR_PTR(-ENODEV);
	+
	+ in = mlx5_vzalloc(inlen);
	+ if (!in) {
	+ mlx5_core_warn(dev, "failed to allocate inbox\n");
	+ return ERR_PTR(-ENOMEM);
	+ }
	+
	+
	+ if (ft->autogroup.num_types < ft->autogroup.max_types)
	+ group_size = ft->max_fte / (ft->autogroup.max_types + 1);
	+ else
	+ group_size = 1;
	+
	+ if (group_size == 0) {
	+ mlx5_core_warn(dev,
	+ "flow steering can't create group size of 0\n");
	+ ret = ERR_PTR(-EINVAL);
	+ goto out;
	+ }
	+
	+ /* sorted by start_index */
	+ fs_for_each_fg(g, ft) {
	+ candidate_group_num++;
	+ if (candidate_index + group_size > g->start_index)
	+ candidate_index = g->start_index + g->max_ftes;
	+ else
	+ break;
	+ prev = &g->base.list;
	+ }
	+
	+ if (candidate_index + group_size > ft->max_fte) {
	+ ret = ERR_PTR(-ENOSPC);
	+ goto out;
	+ }
	+
	+ MLX5_SET(create_flow_group_in, in, match_criteria_enable,
	+ match_criteria_enable);
	+ MLX5_SET(create_flow_group_in, in, start_flow_index, candidate_index);
	+ MLX5_SET(create_flow_group_in, in, end_flow_index, candidate_index +
	+ group_size - 1);
	+ match_criteria_addr = MLX5_ADDR_OF(create_flow_group_in,
	+ in, match_criteria);
	+ memcpy(match_criteria_addr, match_criteria,
	+ MLX5_ST_SZ_BYTES(fte_match_param));
	+
	+ ret = fs_create_fg(dev, ft, prev, in, 0);
	+out:
	+ kvfree(in);
	+ return ret;
	+}
	+
	+static struct mlx5_flow_namespace get_ns_with_notifiers(struct fs_base node)
	+{
	+ struct mlx5_flow_namespace *ns = NULL;
	+
	+ while (node && (node->type != FS_TYPE_NAMESPACE \|\|
	+ list_empty(&container_of(node, struct
	+ mlx5_flow_namespace,
	+ base)->list_notifiers)))
	+ node = node->parent;
	+
	+ if (node)
	+ fs_get_obj(ns, node);
	+
	+ return ns;
	+}
	+
	+
	+/Assumption- fte is locked/
	+static void call_to_add_rule_notifiers(struct mlx5_flow_rule *dst,
	+ struct fs_fte *fte)
	+{
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5_flow_handler *iter_handler;
	+ struct fs_client_priv_data *iter_client;
	+ void *data;
	+ bool is_new_rule = list_first_entry(&fte->dests,
	+ struct mlx5_flow_rule,
	+ base.list) == dst;
	+ int err;
	+
	+ ns = get_ns_with_notifiers(&fte->base);
	+ if (!ns)
	+ return;
	+
	+ down_read(&ns->notifiers_rw_sem);
	+ list_for_each_entry(iter_handler, &ns->list_notifiers,
	+ list) {
	+ if (iter_handler->add_dst_cb) {
	+ data = NULL;
	+ mutex_lock(&dst->clients_lock);
	+ list_for_each_entry(
	+ iter_client, &dst->clients_data, list) {
	+ if (iter_client->fs_handler == iter_handler) {
	+ data = iter_client->client_dst_data;
	+ break;
	+ }
	+ }
	+ mutex_unlock(&dst->clients_lock);
	+ err = iter_handler->add_dst_cb(dst,
	+ is_new_rule,
	+ NULL,
	+ iter_handler->client_context);
	+ if (err)
	+ break;
	+ }
	+ }
	+ up_read(&ns->notifiers_rw_sem);
	+}
	+
	+static void call_to_del_rule_notifiers(struct mlx5_flow_rule *dst,
	+ struct fs_fte *fte)
	+{
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5_flow_handler *iter_handler;
	+ struct fs_client_priv_data *iter_client;
	+ void *data;
	+ bool ctx_changed = (fte->dests_size == 0);
	+
	+ ns = get_ns_with_notifiers(&fte->base);
	+ if (!ns)
	+ return;
	+ down_read(&ns->notifiers_rw_sem);
	+ list_for_each_entry(iter_handler, &ns->list_notifiers,
	+ list) {
	+ data = NULL;
	+ mutex_lock(&dst->clients_lock);
	+ list_for_each_entry(iter_client, &dst->clients_data, list) {
	+ if (iter_client->fs_handler == iter_handler) {
	+ data = iter_client->client_dst_data;
	+ break;
	+ }
	+ }
	+ mutex_unlock(&dst->clients_lock);
	+ if (iter_handler->del_dst_cb) {
	+ iter_handler->del_dst_cb(dst, ctx_changed, data,
	+ iter_handler->client_context);
	+ }
	+ }
	+ up_read(&ns->notifiers_rw_sem);
	+}
	+
	+/* fte should not be deleted while calling this function */
	+static struct mlx5_flow_rule _fs_add_dst_fte(struct fs_fte fte,
	+ struct mlx5_flow_group *fg,
	+ struct mlx5_flow_destination *dest)
	+{
	+ struct mlx5_flow_table *ft;
	+ struct mlx5_flow_rule *dst;
	+ int err;
	+
	+ dst = kzalloc(sizeof(*dst), GFP_KERNEL);
	+ if (!dst)
	+ return ERR_PTR(-ENOMEM);
	+
	+ memcpy(&dst->dest_attr, dest, sizeof(*dest));
	+ dst->base.type = FS_TYPE_FLOW_DEST;
	+ INIT_LIST_HEAD(&dst->clients_data);
	+ mutex_init(&dst->clients_lock);
	+ fs_get_parent(ft, fg);
	+ /Add dest to dests list- added as first element after the head/
	+ list_add_tail(&dst->base.list, &fte->dests);
	+ fte->dests_size++;
	+ err = mlx5_cmd_fs_set_fte(fs_get_dev(&ft->base),
	+ ft->vport,
	+ &fte->status,
	+ fte->val, ft->type,
	+ ft->id, fte->index, fg->id, fte->flow_tag,
	+ fte->action, fte->dests_size, &fte->dests);
	+ if (err)
	+ goto free_dst;
	+
	+ list_del(&dst->base.list);
	+
	+ return dst;
	+
	+free_dst:
	+ list_del(&dst->base.list);
	+ kfree(dst);
	+ fte->dests_size--;
	+ return ERR_PTR(err);
	+}
	+
	+static char get_dest_name(struct mlx5_flow_destination dest)
	+{
	+ char name = kzalloc(sizeof(char) 20, GFP_KERNEL);
	+
	+ switch (dest->type) {
	+ case MLX5_FLOW_CONTEXT_DEST_TYPE_FLOW_TABLE:
	+ snprintf(name, 20, "dest_%s_%u", "flow_table",
	+ dest->ft->id);
	+ return name;
	+ case MLX5_FLOW_CONTEXT_DEST_TYPE_VPORT:
	+ snprintf(name, 20, "dest_%s_%u", "vport",
	+ dest->vport_num);
	+ return name;
	+ case MLX5_FLOW_CONTEXT_DEST_TYPE_TIR:
	+ snprintf(name, 20, "dest_%s_%u", "tir", dest->tir_num);
	+ return name;
	+ }
	+
	+ return NULL;
	+}
	+
	+/* assumed fg is locked */
	+static unsigned int fs_get_free_fg_index(struct mlx5_flow_group *fg,
	+ struct list_head **prev)
	+{
	+ struct fs_fte *fte;
	+ unsigned int start = fg->start_index;
	+
	+ if (prev)
	+ *prev = &fg->ftes;
	+
	+ /* assumed list is sorted by index */
	+ fs_for_each_fte(fte, fg) {
	+ if (fte->index != start)
	+ return start;
	+ start++;
	+ if (prev)
	+ *prev = &fte->base.list;
	+ }
	+
	+ return start;
	+}
	+
	+
	+static struct fs_fte fs_create_fte(struct mlx5_flow_group fg,
	+ u32 *match_value,
	+ u8 action,
	+ u32 flow_tag,
	+ struct list_head **prev)
	+{
	+ struct fs_fte *fte;
	+ int index = 0;
	+
	+ index = fs_get_free_fg_index(fg, prev);
	+ fte = fs_alloc_fte(action, flow_tag, match_value, index);
	+ if (IS_ERR(fte))
	+ return fte;
	+
	+ return fte;
	+}
	+
	+static void add_rule_to_tree(struct mlx5_flow_rule *rule,
	+ struct fs_fte *fte)
	+{
	+ char *dest_name;
	+
	+ dest_name = get_dest_name(&rule->dest_attr);
	+ fs_add_node(&rule->base, &fte->base, dest_name, 1);
	+ /* re-add to list, since fs_add_node reset our list */
	+ list_add_tail(&rule->base.list, &fte->dests);
	+ kfree(dest_name);
	+ call_to_add_rule_notifiers(rule, fte);
	+}
	+
	+static void fs_del_dst(struct mlx5_flow_rule *dst)
	+{
	+ struct mlx5_flow_table *ft;
	+ struct mlx5_flow_group *fg;
	+ struct fs_fte *fte;
	+ u32 *match_value;
	+ struct mlx5_core_dev *dev = fs_get_dev(&dst->base);
	+ int match_len = MLX5_ST_SZ_BYTES(fte_match_param);
	+ int err;
	+
	+ WARN_ON(!dev);
	+
	+ match_value = mlx5_vzalloc(match_len);
	+ if (!match_value) {
	+ mlx5_core_warn(dev, "failed to allocate inbox\n");
	+ return;
	+ }
	+
	+ fs_get_parent(fte, dst);
	+ fs_get_parent(fg, fte);
	+ mutex_lock(&fg->base.lock);
	+ memcpy(match_value, fte->val, sizeof(fte->val));
	+ /* ft can't be changed as fg is locked */
	+ fs_get_parent(ft, fg);
	+ list_del(&dst->base.list);
	+ fte->dests_size--;
	+ if (fte->dests_size) {
	+ err = mlx5_cmd_fs_set_fte(dev, ft->vport,
	+ &fte->status, match_value, ft->type,
	+ ft->id, fte->index, fg->id,
	+ fte->flow_tag, fte->action,
	+ fte->dests_size, &fte->dests);
	+ if (err) {
	+ mlx5_core_warn(dev, "%s can't delete dst %s\n",
	+ __func__, dst->base.name);
	+ goto err;
	+ }
	+ }
	+ call_to_del_rule_notifiers(dst, fte);
	+err:
	+ mutex_unlock(&fg->base.lock);
	+ kvfree(match_value);
	+}
	+
	+static void fs_del_fte(struct fs_fte *fte)
	+{
	+ struct mlx5_flow_table *ft;
	+ struct mlx5_flow_group *fg;
	+ int err;
	+ struct mlx5_core_dev *dev;
	+
	+ fs_get_parent(fg, fte);
	+ fs_get_parent(ft, fg);
	+
	+ dev = fs_get_dev(&ft->base);
	+ WARN_ON(!dev);
	+
	+ err = mlx5_cmd_fs_delete_fte(dev, ft->vport, &fte->status,
	+ ft->type, ft->id, fte->index);
	+ if (err)
	+ mlx5_core_warn(dev, "flow steering can't delete fte %s\n",
	+ fte->base.name);
	+
	+ fg->num_ftes--;
	+}
	+
	+/* assuming parent fg is locked */
	+/* Add dst algorithm */
	+static struct mlx5_flow_rule fs_add_dst_fg(struct mlx5_flow_group fg,
	+ u32 *match_value,
	+ u8 action,
	+ u32 flow_tag,
	+ struct mlx5_flow_destination *dest)
	+{
	+ struct fs_fte *fte;
	+ struct mlx5_flow_rule *dst;
	+ struct mlx5_flow_table *ft;
	+ struct list_head *prev;
	+ char fte_name[20];
	+
	+ mutex_lock(&fg->base.lock);
	+ fs_for_each_fte(fte, fg) {
	+ /* TODO: Check of size against PRM max size */
	+ mutex_lock(&fte->base.lock);
	+ if (fs_match_exact_val(&fg->mask, match_value, &fte->val) &&
	+ action == fte->action && flow_tag == fte->flow_tag) {
	+ dst = _fs_add_dst_fte(fte, fg, dest);
	+ mutex_unlock(&fte->base.lock);
	+ if (IS_ERR(dst))
	+ goto unlock_fg;
	+ goto add_rule;
	+ }
	+ mutex_unlock(&fte->base.lock);
	+ }
	+
	+ fs_get_parent(ft, fg);
	+ if (fg->num_ftes == fg->max_ftes) {
	+ dst = ERR_PTR(-ENOSPC);
	+ goto unlock_fg;
	+ }
	+
	+ fte = fs_create_fte(fg, match_value, action, flow_tag, &prev);
	+ if (IS_ERR(fte)) {
	+ dst = (void *)fte;
	+ goto unlock_fg;
	+ }
	+ dst = _fs_add_dst_fte(fte, fg, dest);
	+ if (IS_ERR(dst)) {
	+ kfree(fte);
	+ goto unlock_fg;
	+ }
	+
	+ fg->num_ftes++;
	+
	+ snprintf(fte_name, sizeof(fte_name), "fte%u", fte->index);
	+ /* Add node to tree */
	+ fs_add_node(&fte->base, &fg->base, fte_name, 0);
	+ list_add(&fte->base.list, prev);
	+add_rule:
	+ add_rule_to_tree(dst, fte);
	+unlock_fg:
	+ mutex_unlock(&fg->base.lock);
	+ return dst;
	+}
	+
	+static struct mlx5_flow_rule fs_add_dst_ft(struct mlx5_flow_table ft,
	+ u8 match_criteria_enable,
	+ u32 *match_criteria,
	+ u32 *match_value,
	+ u8 action, u32 flow_tag,
	+ struct mlx5_flow_destination *dest)
	+{
	+ /? where dst_entry is allocated/
	+ struct mlx5_flow_group *g;
	+ struct mlx5_flow_rule *dst;
	+
	+ fs_get(&ft->base);
	+ mutex_lock(&ft->base.lock);
	+ fs_for_each_fg(g, ft)
	+ if (fs_match_exact_mask(g->mask.match_criteria_enable,
	+ match_criteria_enable,
	+ g->mask.match_criteria,
	+ match_criteria)) {
	+ mutex_unlock(&ft->base.lock);
	+
	+ dst = fs_add_dst_fg(g, match_value,
	+ action, flow_tag, dest);
	+ if (PTR_ERR(dst) && PTR_ERR(dst) != -ENOSPC)
	+ goto unlock;
	+ }
	+ mutex_unlock(&ft->base.lock);
	+
	+ g = create_autogroup(ft, match_criteria_enable, match_criteria);
	+ if (IS_ERR(g)) {
	+ dst = (void *)g;
	+ goto unlock;
	+ }
	+
	+ dst = fs_add_dst_fg(g, match_value,
	+ action, flow_tag, dest);
	+ if (IS_ERR(dst)) {
	+ /* Remove assumes refcount > 0 and autogroup creates a group
	+ * with a refcount = 0.
	+ */
	+ fs_get(&g->base);
	+ fs_remove_node(&g->base);
	+ goto unlock;
	+ }
	+
	+unlock:
	+ fs_put(&ft->base);
	+ return dst;
	+}
	+
	+struct mlx5_flow_rule *
	+mlx5_add_flow_rule(struct mlx5_flow_table *ft,
	+ u8 match_criteria_enable,
	+ u32 *match_criteria,
	+ u32 *match_value,
	+ u32 action,
	+ u32 flow_tag,
	+ struct mlx5_flow_destination *dest)
	+{
	+ struct mlx5_flow_rule *dst;
	+ struct mlx5_flow_namespace *ns;
	+
	+ ns = get_ns_with_notifiers(&ft->base);
	+ if (ns)
	+ down_read(&ns->dests_rw_sem);
	+ dst = fs_add_dst_ft(ft, match_criteria_enable, match_criteria,
	+ match_value, action, flow_tag, dest);
	+ if (ns)
	+ up_read(&ns->dests_rw_sem);
	+
	+ return dst;
	+
	+
	+}
	+EXPORT_SYMBOL(mlx5_add_flow_rule);
	+
	+void mlx5_del_flow_rule(struct mlx5_flow_rule *dst)
	+{
	+ struct mlx5_flow_namespace *ns;
	+
	+ ns = get_ns_with_notifiers(&dst->base);
	+ if (ns)
	+ down_read(&ns->dests_rw_sem);
	+ fs_remove_node(&dst->base);
	+ if (ns)
	+ up_read(&ns->dests_rw_sem);
	+}
	+EXPORT_SYMBOL(mlx5_del_flow_rule);
	+
	+#define MLX5_CORE_FS_ROOT_NS_NAME "root"
	+#define MLX5_CORE_FS_ESW_EGRESS_ACL "esw_egress_root"
	+#define MLX5_CORE_FS_ESW_INGRESS_ACL "esw_ingress_root"
	+#define MLX5_CORE_FS_FDB_ROOT_NS_NAME "fdb_root"
	+#define MLX5_CORE_FS_SNIFFER_RX_ROOT_NS_NAME "sniffer_rx_root"
	+#define MLX5_CORE_FS_SNIFFER_TX_ROOT_NS_NAME "sniffer_tx_root"
	+#define MLX5_CORE_FS_PRIO_MAX_FT 4
	+#define MLX5_CORE_FS_PRIO_MAX_NS 1
	+
	+static struct fs_prio fs_create_prio(struct mlx5_flow_namespace ns,
	+ unsigned prio, int max_ft,
	+ const char *name, u8 flags)
	+{
	+ struct fs_prio *fs_prio;
	+
	+ fs_prio = kzalloc(sizeof(*fs_prio), GFP_KERNEL);
	+ if (!fs_prio)
	+ return ERR_PTR(-ENOMEM);
	+
	+ fs_prio->base.type = FS_TYPE_PRIO;
	+ fs_add_node(&fs_prio->base, &ns->base, name, 1);
	+ fs_prio->max_ft = max_ft;
	+ fs_prio->max_ns = MLX5_CORE_FS_PRIO_MAX_NS;
	+ fs_prio->prio = prio;
	+ fs_prio->flags = flags;
	+ list_add_tail(&fs_prio->base.list, &ns->prios);
	+ INIT_LIST_HEAD(&fs_prio->objs);
	+ mutex_init(&fs_prio->shared_lock);
	+
	+ return fs_prio;
	+}
	+
	+static void cleanup_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct mlx5_flow_root_namespace *root_ns = dev->root_ns;
	+ struct fs_prio *iter_prio;
	+
	+ if (!root_ns)
	+ return;
	+
	+ /* stage 1 */
	+ fs_for_each_prio(iter_prio, &root_ns->ns) {
	+ struct mlx5_flow_namespace *iter_ns;
	+
	+ fs_for_each_ns(iter_ns, iter_prio) {
	+ while (!list_empty(&iter_ns->prios)) {
	+ struct fs_base *iter_prio2 =
	+ list_first_entry(&iter_ns->prios,
	+ struct fs_base,
	+ list);
	+
	+ fs_remove_node(iter_prio2);
	+ }
	+ }
	+ }
	+
	+ /* stage 2 */
	+ fs_for_each_prio(iter_prio, &root_ns->ns) {
	+ while (!list_empty(&iter_prio->objs)) {
	+ struct fs_base *iter_ns =
	+ list_first_entry(&iter_prio->objs,
	+ struct fs_base,
	+ list);
	+
	+ fs_remove_node(iter_ns);
	+ }
	+ }
	+ /* stage 3 */
	+ while (!list_empty(&root_ns->ns.prios)) {
	+ struct fs_base *iter_prio =
	+ list_first_entry(&root_ns->ns.prios,
	+ struct fs_base,
	+ list);
	+
	+ fs_remove_node(iter_prio);
	+ }
	+
	+ fs_remove_node(&root_ns->ns.base);
	+ dev->root_ns = NULL;
	+}
	+
	+static void cleanup_single_prio_root_ns(struct mlx5_core_dev *dev,
	+ struct mlx5_flow_root_namespace *root_ns)
	+{
	+ struct fs_base *prio;
	+
	+ if (!root_ns)
	+ return;
	+
	+ if (!list_empty(&root_ns->ns.prios)) {
	+ prio = list_first_entry(&root_ns->ns.prios,
	+ struct fs_base,
	+ list);
	+ fs_remove_node(prio);
	+ }
	+ fs_remove_node(&root_ns->ns.base);
	+ root_ns = NULL;
	+}
	+
	+void mlx5_cleanup_fs(struct mlx5_core_dev *dev)
	+{
	+ cleanup_root_ns(dev);
	+ cleanup_single_prio_root_ns(dev, dev->sniffer_rx_root_ns);
	+ cleanup_single_prio_root_ns(dev, dev->sniffer_tx_root_ns);
	+ cleanup_single_prio_root_ns(dev, dev->fdb_root_ns);
	+ cleanup_single_prio_root_ns(dev, dev->esw_egress_root_ns);
	+ cleanup_single_prio_root_ns(dev, dev->esw_ingress_root_ns);
	+}
	+
	+static struct mlx5_flow_namespace *fs_init_namespace(struct mlx5_flow_namespace
	+ *ns)
	+{
	+ ns->base.type = FS_TYPE_NAMESPACE;
	+ init_rwsem(&ns->dests_rw_sem);
	+ init_rwsem(&ns->notifiers_rw_sem);
	+ INIT_LIST_HEAD(&ns->prios);
	+ INIT_LIST_HEAD(&ns->list_notifiers);
	+
	+ return ns;
	+}
	+
	+static struct mlx5_flow_root_namespace create_root_ns(struct mlx5_core_dev dev,
	+ enum fs_ft_type
	+ table_type,
	+ char *name)
	+{
	+ struct mlx5_flow_root_namespace *root_ns;
	+ struct mlx5_flow_namespace *ns;
	+
	+ /* create the root namespace */
	+ root_ns = mlx5_vzalloc(sizeof(*root_ns));
	+ if (!root_ns)
	+ goto err;
	+
	+ root_ns->dev = dev;
	+ root_ns->table_type = table_type;
	+ mutex_init(&root_ns->fs_chain_lock);
	+
	+ ns = &root_ns->ns;
	+ fs_init_namespace(ns);
	+ fs_add_node(&ns->base, NULL, name, 1);
	+
	+ return root_ns;
	+err:
	+ return NULL;
	+}
	+
	+static int init_fdb_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct fs_prio *prio;
	+
	+ dev->fdb_root_ns = create_root_ns(dev, FS_FT_FDB,
	+ MLX5_CORE_FS_FDB_ROOT_NS_NAME);
	+ if (!dev->fdb_root_ns)
	+ return -ENOMEM;
	+
	+ /* create 1 prio*/
	+ prio = fs_create_prio(&dev->fdb_root_ns->ns, 0, 1, "fdb_prio", 0);
	+ if (IS_ERR(prio))
	+ return PTR_ERR(prio);
	+ else
	+ return 0;
	+}
	+
	+#define MAX_VPORTS 128
	+
	+static int init_egress_acl_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct fs_prio *prio;
	+
	+ dev->esw_egress_root_ns = create_root_ns(dev, FS_FT_ESW_EGRESS_ACL,
	+ MLX5_CORE_FS_ESW_EGRESS_ACL);
	+ if (!dev->esw_egress_root_ns)
	+ return -ENOMEM;
	+
	+ /* create 1 prio*/
	+ prio = fs_create_prio(&dev->esw_egress_root_ns->ns, 0, MAX_VPORTS,
	+ "esw_egress_prio", 0);
	+ if (IS_ERR(prio))
	+ return PTR_ERR(prio);
	+ else
	+ return 0;
	+}
	+
	+static int init_ingress_acl_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct fs_prio *prio;
	+
	+ dev->esw_ingress_root_ns = create_root_ns(dev, FS_FT_ESW_INGRESS_ACL,
	+ MLX5_CORE_FS_ESW_INGRESS_ACL);
	+ if (!dev->esw_ingress_root_ns)
	+ return -ENOMEM;
	+
	+ /* create 1 prio*/
	+ prio = fs_create_prio(&dev->esw_ingress_root_ns->ns, 0, MAX_VPORTS,
	+ "esw_ingress_prio", 0);
	+ if (IS_ERR(prio))
	+ return PTR_ERR(prio);
	+ else
	+ return 0;
	+}
	+
	+static int init_sniffer_rx_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct fs_prio *prio;
	+
	+ dev->sniffer_rx_root_ns = create_root_ns(dev, FS_FT_SNIFFER_RX,
	+ MLX5_CORE_FS_SNIFFER_RX_ROOT_NS_NAME);
	+ if (!dev->sniffer_rx_root_ns)
	+ return -ENOMEM;
	+
	+ /* create 1 prio*/
	+ prio = fs_create_prio(&dev->sniffer_rx_root_ns->ns, 0, 1,
	+ "sniffer_prio", 0);
	+ if (IS_ERR(prio))
	+ return PTR_ERR(prio);
	+ else
	+ return 0;
	+}
	+
	+
	+static int init_sniffer_tx_root_ns(struct mlx5_core_dev *dev)
	+{
	+ struct fs_prio *prio;
	+
	+ dev->sniffer_tx_root_ns = create_root_ns(dev, FS_FT_SNIFFER_TX,
	+ MLX5_CORE_FS_SNIFFER_TX_ROOT_NS_NAME);
	+ if (!dev->sniffer_tx_root_ns)
	+ return -ENOMEM;
	+
	+ /* create 1 prio*/
	+ prio = fs_create_prio(&dev->sniffer_tx_root_ns->ns, 0, 1,
	+ "sniffer_prio", 0);
	+ if (IS_ERR(prio))
	+ return PTR_ERR(prio);
	+ else
	+ return 0;
	+}
	+
	+static struct mlx5_flow_namespace fs_create_namespace(struct fs_prio prio,
	+ const char *name)
	+{
	+ struct mlx5_flow_namespace *ns;
	+
	+ ns = kzalloc(sizeof(*ns), GFP_KERNEL);
	+ if (!ns)
	+ return ERR_PTR(-ENOMEM);
	+
	+ fs_init_namespace(ns);
	+ fs_add_node(&ns->base, &prio->base, name, 1);
	+ list_add_tail(&ns->base.list, &prio->objs);
	+
	+ return ns;
	+}
	+
	+#define FLOW_TABLE_BIT_SZ 1
	+#define GET_FLOW_TABLE_CAP(dev, offset) \
	+ ((be32_to_cpu(((__be32 )(dev->hca_caps_cur[MLX5_CAP_FLOW_TABLE]) + \
	+ offset / 32)) >> \
	+ (32 - FLOW_TABLE_BIT_SZ - (offset & 0x1f))) & FLOW_TABLE_BIT_SZ)
	+
	+static bool has_required_caps(struct mlx5_core_dev dev, struct node_caps caps)
	+{
	+ int i;
	+
	+ for (i = 0; i < caps->arr_sz; i++) {
	+ if (!GET_FLOW_TABLE_CAP(dev, caps->caps[i]))
	+ return false;
	+ }
	+ return true;
	+}
	+
	+static int _init_root_tree(struct mlx5_core_dev *dev, int max_ft_level,
	+ struct init_tree_node node, struct fs_base base_parent,
	+ struct init_tree_node *tree_parent)
	+{
	+ struct mlx5_flow_namespace *fs_ns;
	+ struct fs_prio *fs_prio;
	+ int priority;
	+ struct fs_base *base;
	+ int i;
	+ int err = 0;
	+
	+ if (node->type == FS_TYPE_PRIO) {
	+ if ((node->min_ft_level > max_ft_level) \|\|
	+ !has_required_caps(dev, &node->caps))
	+ goto out;
	+
	+ fs_get_obj(fs_ns, base_parent);
	+ priority = node - tree_parent->children;
	+ fs_prio = fs_create_prio(fs_ns, priority,
	+ node->max_ft,
	+ node->name, node->flags);
	+ if (IS_ERR(fs_prio)) {
	+ err = PTR_ERR(fs_prio);
	+ goto out;
	+ }
	+ base = &fs_prio->base;
	+ } else if (node->type == FS_TYPE_NAMESPACE) {
	+ fs_get_obj(fs_prio, base_parent);
	+ fs_ns = fs_create_namespace(fs_prio, node->name);
	+ if (IS_ERR(fs_ns)) {
	+ err = PTR_ERR(fs_ns);
	+ goto out;
	+ }
	+ base = &fs_ns->base;
	+ } else {
	+ return -EINVAL;
	+ }
	+ for (i = 0; i < node->ar_size; i++) {
	+ err = _init_root_tree(dev, max_ft_level, &node->children[i], base,
	+ node);
	+ if (err)
	+ break;
	+ }
	+out:
	+ return err;
	+}
	+
	+static int init_root_tree(struct mlx5_core_dev *dev, int max_ft_level,
	+ struct init_tree_node node, struct fs_base parent)
	+{
	+ int i;
	+ struct mlx5_flow_namespace *fs_ns;
	+ int err = 0;
	+
	+ fs_get_obj(fs_ns, parent);
	+ for (i = 0; i < node->ar_size; i++) {
	+ err = _init_root_tree(dev, max_ft_level,
	+ &node->children[i], &fs_ns->base, node);
	+ if (err)
	+ break;
	+ }
	+ return err;
	+}
	+
	+static int sum_max_ft_in_prio(struct fs_prio *prio);
	+static int sum_max_ft_in_ns(struct mlx5_flow_namespace *ns)
	+{
	+ struct fs_prio *prio;
	+ int sum = 0;
	+
	+ fs_for_each_prio(prio, ns) {
	+ sum += sum_max_ft_in_prio(prio);
	+ }
	+ return sum;
	+}
	+
	+static int sum_max_ft_in_prio(struct fs_prio *prio)
	+{
	+ int sum = 0;
	+ struct fs_base *it;
	+ struct mlx5_flow_namespace *ns;
	+
	+ if (prio->max_ft)
	+ return prio->max_ft;
	+
	+ fs_for_each_ns_or_ft(it, prio) {
	+ if (it->type == FS_TYPE_FLOW_TABLE)
	+ continue;
	+
	+ fs_get_obj(ns, it);
	+ sum += sum_max_ft_in_ns(ns);
	+ }
	+ prio->max_ft = sum;
	+ return sum;
	+}
	+
	+static void set_max_ft(struct mlx5_flow_namespace *ns)
	+{
	+ struct fs_prio *prio;
	+
	+ if (!ns)
	+ return;
	+
	+ fs_for_each_prio(prio, ns)
	+ sum_max_ft_in_prio(prio);
	+}
	+
	+static int init_root_ns(struct mlx5_core_dev *dev)
	+{
	+ int max_ft_level = MLX5_CAP_FLOWTABLE(dev,
	+ flow_table_properties_nic_receive.
	+ max_ft_level);
	+
	+ dev->root_ns = create_root_ns(dev, FS_FT_NIC_RX,
	+ MLX5_CORE_FS_ROOT_NS_NAME);
	+ if (IS_ERR_OR_NULL(dev->root_ns))
	+ goto err;
	+
	+
	+ if (init_root_tree(dev, max_ft_level, &root_fs, &dev->root_ns->ns.base))
	+ goto err;
	+
	+ set_max_ft(&dev->root_ns->ns);
	+
	+ return 0;
	+err:
	+ return -ENOMEM;
	+}
	+
	+u8 mlx5_get_match_criteria_enable(struct mlx5_flow_rule *rule)
	+{
	+ struct fs_base *pbase;
	+ struct mlx5_flow_group *fg;
	+
	+ pbase = rule->base.parent;
	+ WARN_ON(!pbase);
	+ pbase = pbase->parent;
	+ WARN_ON(!pbase);
	+
	+ fs_get_obj(fg, pbase);
	+ return fg->mask.match_criteria_enable;
	+}
	+
	+void mlx5_get_match_value(u32 *match_value,
	+ struct mlx5_flow_rule *rule)
	+{
	+ struct fs_base *pbase;
	+ struct fs_fte *fte;
	+
	+ pbase = rule->base.parent;
	+ WARN_ON(!pbase);
	+ fs_get_obj(fte, pbase);
	+
	+ memcpy(match_value, fte->val, sizeof(fte->val));
	+}
	+
	+void mlx5_get_match_criteria(u32 *match_criteria,
	+ struct mlx5_flow_rule *rule)
	+{
	+ struct fs_base *pbase;
	+ struct mlx5_flow_group *fg;
	+
	+ pbase = rule->base.parent;
	+ WARN_ON(!pbase);
	+ pbase = pbase->parent;
	+ WARN_ON(!pbase);
	+
	+ fs_get_obj(fg, pbase);
	+ memcpy(match_criteria, &fg->mask.match_criteria,
	+ sizeof(fg->mask.match_criteria));
	+}
	+
	+int mlx5_init_fs(struct mlx5_core_dev *dev)
	+{
	+ int err;
	+
	+ if (MLX5_CAP_GEN(dev, nic_flow_table)) {
	+ err = init_root_ns(dev);
	+ if (err)
	+ goto err;
	+ }
	+
	+ err = init_fdb_root_ns(dev);
	+ if (err)
	+ goto err;
	+
	+ err = init_egress_acl_root_ns(dev);
	+ if (err)
	+ goto err;
	+
	+ err = init_ingress_acl_root_ns(dev);
	+ if (err)
	+ goto err;
	+
	+ err = init_sniffer_tx_root_ns(dev);
	+ if (err)
	+ goto err;
	+
	+ err = init_sniffer_rx_root_ns(dev);
	+ if (err)
	+ goto err;
	+
	+ return 0;
	+err:
	+ mlx5_cleanup_fs(dev);
	+ return err;
	+}
	+
	+struct mlx5_flow_namespace mlx5_get_flow_namespace(struct mlx5_core_dev dev,
	+ enum mlx5_flow_namespace_type type)
	+{
	+ struct mlx5_flow_root_namespace *root_ns = dev->root_ns;
	+ int prio;
	+ static struct fs_prio *fs_prio;
	+ struct mlx5_flow_namespace *ns;
	+
	+ switch (type) {
	+ case MLX5_FLOW_NAMESPACE_BYPASS:
	+ prio = 0;
	+ break;
	+ case MLX5_FLOW_NAMESPACE_KERNEL:
	+ prio = 1;
	+ break;
	+ case MLX5_FLOW_NAMESPACE_LEFTOVERS:
	+ prio = 2;
	+ break;
	+ case MLX5_FLOW_NAMESPACE_FDB:
	+ if (dev->fdb_root_ns)
	+ return &dev->fdb_root_ns->ns;
	+ else
	+ return NULL;
	+ case MLX5_FLOW_NAMESPACE_ESW_EGRESS:
	+ if (dev->esw_egress_root_ns)
	+ return &dev->esw_egress_root_ns->ns;
	+ else
	+ return NULL;
	+ case MLX5_FLOW_NAMESPACE_ESW_INGRESS:
	+ if (dev->esw_ingress_root_ns)
	+ return &dev->esw_ingress_root_ns->ns;
	+ else
	+ return NULL;
	+ case MLX5_FLOW_NAMESPACE_SNIFFER_RX:
	+ if (dev->sniffer_rx_root_ns)
	+ return &dev->sniffer_rx_root_ns->ns;
	+ else
	+ return NULL;
	+ case MLX5_FLOW_NAMESPACE_SNIFFER_TX:
	+ if (dev->sniffer_tx_root_ns)
	+ return &dev->sniffer_tx_root_ns->ns;
	+ else
	+ return NULL;
	+ default:
	+ return NULL;
	+ }
	+
	+ if (!root_ns)
	+ return NULL;
	+
	+ fs_prio = find_prio(&root_ns->ns, prio);
	+ if (!fs_prio)
	+ return NULL;
	+
	+ ns = list_first_entry(&fs_prio->objs,
	+ typeof(*ns),
	+ base.list);
	+
	+ return ns;
	+}
	+EXPORT_SYMBOL(mlx5_get_flow_namespace);
	+
	+
	+int mlx5_set_rule_private_data(struct mlx5_flow_rule *rule,
	+ struct mlx5_flow_handler *fs_handler,
	+ void *client_data)
	+{
	+ struct fs_client_priv_data *priv_data;
	+
	+ mutex_lock(&rule->clients_lock);
	+ /Check that hanlder isn't exists in the list already/
	+ list_for_each_entry(priv_data, &rule->clients_data, list) {
	+ if (priv_data->fs_handler == fs_handler) {
	+ priv_data->client_dst_data = client_data;
	+ goto unlock;
	+ }
	+ }
	+ priv_data = kzalloc(sizeof(*priv_data), GFP_KERNEL);
	+ if (!priv_data) {
	+ mutex_unlock(&rule->clients_lock);
	+ return -ENOMEM;
	+ }
	+
	+ priv_data->client_dst_data = client_data;
	+ priv_data->fs_handler = fs_handler;
	+ list_add(&priv_data->list, &rule->clients_data);
	+
	+unlock:
	+ mutex_unlock(&rule->clients_lock);
	+
	+ return 0;
	+}
	+
	+static int remove_from_clients(struct mlx5_flow_rule *rule,
	+ bool ctx_changed,
	+ void *client_data,
	+ void *context)
	+{
	+ struct fs_client_priv_data *iter_client;
	+ struct fs_client_priv_data *temp_client;
	+ struct mlx5_flow_handler *handler = (struct
	+ mlx5_flow_handler*)context;
	+
	+ mutex_lock(&rule->clients_lock);
	+ list_for_each_entry_safe(iter_client, temp_client,
	+ &rule->clients_data, list) {
	+ if (iter_client->fs_handler == handler) {
	+ list_del(&iter_client->list);
	+ kfree(iter_client);
	+ break;
	+ }
	+ }
	+ mutex_unlock(&rule->clients_lock);
	+
	+ return 0;
	+}
	+
	+struct mlx5_flow_handler mlx5_register_rule_notifier(struct mlx5_core_dev dev,
	+ enum mlx5_flow_namespace_type ns_type,
	+ rule_event_fn add_cb,
	+ rule_event_fn del_cb,
	+ void *context)
	+{
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5_flow_handler *handler;
	+
	+ ns = mlx5_get_flow_namespace(dev, ns_type);
	+ if (!ns)
	+ return ERR_PTR(-EINVAL);
	+
	+ handler = kzalloc(sizeof(*handler), GFP_KERNEL);
	+ if (!handler)
	+ return ERR_PTR(-ENOMEM);
	+
	+ handler->add_dst_cb = add_cb;
	+ handler->del_dst_cb = del_cb;
	+ handler->client_context = context;
	+ handler->ns = ns;
	+ down_write(&ns->notifiers_rw_sem);
	+ list_add_tail(&handler->list, &ns->list_notifiers);
	+ up_write(&ns->notifiers_rw_sem);
	+
	+ return handler;
	+}
	+
	+static void iterate_rules_in_ns(struct mlx5_flow_namespace *ns,
	+ rule_event_fn add_rule_cb,
	+ void *context);
	+
	+void mlx5_unregister_rule_notifier(struct mlx5_flow_handler *handler)
	+{
	+ struct mlx5_flow_namespace *ns = handler->ns;
	+
	+ /Remove from dst's clients/
	+ down_write(&ns->dests_rw_sem);
	+ down_write(&ns->notifiers_rw_sem);
	+ iterate_rules_in_ns(ns, remove_from_clients, handler);
	+ list_del(&handler->list);
	+ up_write(&ns->notifiers_rw_sem);
	+ up_write(&ns->dests_rw_sem);
	+ kfree(handler);
	+}
	+
	+static void iterate_rules_in_ft(struct mlx5_flow_table *ft,
	+ rule_event_fn add_rule_cb,
	+ void *context)
	+{
	+ struct mlx5_flow_group *iter_fg;
	+ struct fs_fte *iter_fte;
	+ struct mlx5_flow_rule *iter_rule;
	+ int err = 0;
	+ bool is_new_rule;
	+
	+ mutex_lock(&ft->base.lock);
	+ fs_for_each_fg(iter_fg, ft) {
	+ mutex_lock(&iter_fg->base.lock);
	+ fs_for_each_fte(iter_fte, iter_fg) {
	+ mutex_lock(&iter_fte->base.lock);
	+ is_new_rule = true;
	+ fs_for_each_dst(iter_rule, iter_fte) {
	+ fs_get(&iter_rule->base);
	+ err = add_rule_cb(iter_rule,
	+ is_new_rule,
	+ NULL,
	+ context);
	+ fs_put_parent_locked(&iter_rule->base);
	+ if (err)
	+ break;
	+ is_new_rule = false;
	+ }
	+ mutex_unlock(&iter_fte->base.lock);
	+ if (err)
	+ break;
	+ }
	+ mutex_unlock(&iter_fg->base.lock);
	+ if (err)
	+ break;
	+ }
	+ mutex_unlock(&ft->base.lock);
	+}
	+
	+static void iterate_rules_in_ns(struct mlx5_flow_namespace *ns,
	+ rule_event_fn add_rule_cb,
	+ void *context);
	+
	+static void iterate_rules_in_prio(struct fs_prio *prio,
	+ rule_event_fn add_rule_cb,
	+ void *context)
	+{
	+ struct fs_base *it;
	+
	+ mutex_lock(&prio->base.lock);
	+ fs_for_each_ns_or_ft(it, prio) {
	+ if (it->type == FS_TYPE_FLOW_TABLE) {
	+ struct mlx5_flow_table *ft;
	+
	+ fs_get_obj(ft, it);
	+ iterate_rules_in_ft(ft, add_rule_cb, context);
	+ } else {
	+ struct mlx5_flow_namespace *ns;
	+
	+ fs_get_obj(ns, it);
	+ iterate_rules_in_ns(ns, add_rule_cb, context);
	+ }
	+ }
	+ mutex_unlock(&prio->base.lock);
	+}
	+
	+static void iterate_rules_in_ns(struct mlx5_flow_namespace *ns,
	+ rule_event_fn add_rule_cb,
	+ void *context)
	+{
	+ struct fs_prio *iter_prio;
	+
	+ mutex_lock(&ns->base.lock);
	+ fs_for_each_prio(iter_prio, ns) {
	+ iterate_rules_in_prio(iter_prio, add_rule_cb, context);
	+ }
	+ mutex_unlock(&ns->base.lock);
	+}
	+
	+void mlx5_flow_iterate_existing_rules(struct mlx5_flow_namespace *ns,
	+ rule_event_fn add_rule_cb,
	+ void *context)
	+{
	+ down_write(&ns->dests_rw_sem);
	+ down_read(&ns->notifiers_rw_sem);
	+ iterate_rules_in_ns(ns, add_rule_cb, context);
	+ up_read(&ns->notifiers_rw_sem);
	+ up_write(&ns->dests_rw_sem);
	+}
	+
	+
	+void mlx5_del_flow_rules_list(struct mlx5_flow_rules_list *rules_list)
	+{
	+ struct mlx5_flow_rule_node *iter_node;
	+ struct mlx5_flow_rule_node *temp_node;
	+
	+ list_for_each_entry_safe(iter_node, temp_node, &rules_list->head, list) {
	+ list_del(&iter_node->list);
	+ kfree(iter_node);
	+ }
	+
	+ kfree(rules_list);
	+}
	+
	+#define ROCEV1_ETHERTYPE 0x8915
	+static int set_rocev1_rules(struct list_head *rules_list)
	+{
	+ struct mlx5_flow_rule_node *rocev1_rule;
	+
	+ rocev1_rule = kzalloc(sizeof(*rocev1_rule), GFP_KERNEL);
	+ if (!rocev1_rule)
	+ return -ENOMEM;
	+
	+ rocev1_rule->match_criteria_enable =
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_OUTER_HEADERS;
	+ MLX5_SET(fte_match_set_lyr_2_4, rocev1_rule->match_criteria, ethertype,
	+ 0xffff);
	+ MLX5_SET(fte_match_set_lyr_2_4, rocev1_rule->match_value, ethertype,
	+ ROCEV1_ETHERTYPE);
	+
	+ list_add_tail(&rocev1_rule->list, rules_list);
	+
	+ return 0;
	+}
	+
	+#define ROCEV2_UDP_PORT 4791
	+static int set_rocev2_rules(struct list_head *rules_list)
	+{
	+ struct mlx5_flow_rule_node *ipv4_rule;
	+ struct mlx5_flow_rule_node *ipv6_rule;
	+
	+ ipv4_rule = kzalloc(sizeof(*ipv4_rule), GFP_KERNEL);
	+ if (!ipv4_rule)
	+ return -ENOMEM;
	+
	+ ipv6_rule = kzalloc(sizeof(*ipv6_rule), GFP_KERNEL);
	+ if (!ipv6_rule) {
	+ kfree(ipv4_rule);
	+ return -ENOMEM;
	+ }
	+
	+ ipv4_rule->match_criteria_enable =
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_OUTER_HEADERS;
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_criteria, ethertype,
	+ 0xffff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_value, ethertype,
	+ 0x0800);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_criteria, ip_protocol,
	+ 0xff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_value, ip_protocol,
	+ IPPROTO_UDP);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_criteria, udp_dport,
	+ 0xffff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv4_rule->match_value, udp_dport,
	+ ROCEV2_UDP_PORT);
	+
	+ ipv6_rule->match_criteria_enable =
	+ 1 << MLX5_CREATE_FLOW_GROUP_IN_MATCH_CRITERIA_ENABLE_OUTER_HEADERS;
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_criteria, ethertype,
	+ 0xffff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_value, ethertype,
	+ 0x86dd);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_criteria, ip_protocol,
	+ 0xff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_value, ip_protocol,
	+ IPPROTO_UDP);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_criteria, udp_dport,
	+ 0xffff);
	+ MLX5_SET(fte_match_set_lyr_2_4, ipv6_rule->match_value, udp_dport,
	+ ROCEV2_UDP_PORT);
	+
	+ list_add_tail(&ipv4_rule->list, rules_list);
	+ list_add_tail(&ipv6_rule->list, rules_list);
	+
	+ return 0;
	+}
	+
	+
	+struct mlx5_flow_rules_list *get_roce_flow_rules(u8 roce_mode)
	+{
	+ int err = 0;
	+ struct mlx5_flow_rules_list *rules_list =
	+ kzalloc(sizeof(*rules_list), GFP_KERNEL);
	+
	+ if (!rules_list)
	+ return NULL;
	+
	+ INIT_LIST_HEAD(&rules_list->head);
	+
	+ if (roce_mode & MLX5_ROCE_VERSION_1_CAP) {
	+ err = set_rocev1_rules(&rules_list->head);
	+ if (err)
	+ goto free_list;
	+ }
	+ if (roce_mode & MLX5_ROCE_VERSION_2_CAP)
	+ err = set_rocev2_rules(&rules_list->head);
	+ if (err)
	+ goto free_list;
	+
	+ return rules_list;
	+
	+free_list:
	+ mlx5_del_flow_rules_list(rules_list);
	+ return NULL;
	+}
	Index: sys/dev/mlx5/mlx5_core/mlx5_main.c
	===================================================================
	--- sys/dev/mlx5/mlx5_core/mlx5_main.c
	+++ sys/dev/mlx5/mlx5_core/mlx5_main.c
	@@ -42,6 +42,7 @@
	#include <linux/delay.h>
	#include <dev/mlx5/mlx5_ifc.h>
	#include "mlx5_core.h"
	+#include "fs_core.h"

	MODULE_AUTHOR("Eli Cohen <eli@mellanox.com>");
	MODULE_DESCRIPTION("Mellanox Connect-IB, ConnectX-4 core driver");
	@@ -794,8 +795,21 @@
	mlx5_init_srq_table(dev);
	mlx5_init_mr_table(dev);

	+ err = mlx5_init_fs(dev);
	+ if (err) {
	+ mlx5_core_err(dev, "flow steering init %d\n", err);
	+ goto err_init_tables;
	+ }
	+
	return 0;

	+err_init_tables:
	+ mlx5_cleanup_mr_table(dev);
	+ mlx5_cleanup_srq_table(dev);
	+ mlx5_cleanup_qp_table(dev);
	+ mlx5_cleanup_cq_table(dev);
	+ unmap_bf_area(dev);
	+
	err_stop_eqs:
	mlx5_stop_eqs(dev);

	@@ -848,6 +862,7 @@
	{
	struct mlx5_priv *priv = &dev->priv;

	+ mlx5_cleanup_fs(dev);
	mlx5_cleanup_mr_table(dev);
	mlx5_cleanup_srq_table(dev);
	mlx5_cleanup_qp_table(dev);
	@@ -1060,6 +1075,12 @@
	kfree(dev);
	}

	+static void shutdown_one(struct pci_dev *pdev)
	+{
	+ /* prevent device from accessing host memory after shutdown */
	+ pci_clear_master(pdev);
	+}
	+
	static const struct pci_device_id mlx5_core_pci_table[] = {
	{ PCI_VDEVICE(MELLANOX, 4113) }, /* Connect-IB */
	{ PCI_VDEVICE(MELLANOX, 4114) }, /* Connect-IB VF */
	@@ -1101,6 +1122,7 @@
	static struct pci_driver mlx5_core_driver = {
	.name = DRIVER_NAME,
	.id_table = mlx5_core_pci_table,
	+ .shutdown = shutdown_one,
	.probe = init_one,
	.remove = remove_one
	};
	Index: sys/dev/mlx5/mlx5_en/en.h
	===================================================================
	--- sys/dev/mlx5/mlx5_en/en.h
	+++ sys/dev/mlx5/mlx5_en/en.h
	@@ -582,10 +582,13 @@
	MLX5E_NUM_RQT = 2,
	};

	+struct mlx5_flow_rule;
	+
	struct mlx5e_eth_addr_info {
	u8 addr [ETH_ALEN + 2];
	u32 tt_vec;
	- u32 ft_ix[MLX5E_NUM_TT]; /* flow table index per traffic type */
	+ /* flow table rule per traffic type */
	+ struct mlx5_flow_rule *ft_rule[MLX5E_NUM_TT];
	};

	#define MLX5E_ETH_ADDR_HASH_SIZE (1 << BITS_PER_BYTE)
	@@ -614,15 +617,24 @@

	struct mlx5e_vlan_db {
	unsigned long active_vlans[BITS_TO_LONGS(VLAN_N_VID)];
	- u32 active_vlans_ft_ix[VLAN_N_VID];
	- u32 untagged_rule_ft_ix;
	- u32 any_vlan_rule_ft_ix;
	+ struct mlx5_flow_rule *active_vlans_ft_rule[VLAN_N_VID];
	+ struct mlx5_flow_rule *untagged_ft_rule;
	+ struct mlx5_flow_rule *any_cvlan_ft_rule;
	+ struct mlx5_flow_rule *any_svlan_ft_rule;
	bool filter_disabled;
	};

	struct mlx5e_flow_table {
	- void *vlan;
	- void *main;
	+ int num_groups;
	+ struct mlx5_flow_table *t;
	+ struct mlx5_flow_group **g;
	+};
	+
	+struct mlx5e_flow_tables {
	+ struct mlx5_flow_namespace *ns;
	+ struct mlx5e_flow_table vlan;
	+ struct mlx5e_flow_table main;
	+ struct mlx5e_flow_table inner_rss;
	};

	struct mlx5e_priv {
	@@ -649,7 +661,7 @@
	u32 rqtn;
	u32 tirn[MLX5E_NUM_TT];

	- struct mlx5e_flow_table ft;
	+ struct mlx5e_flow_tables fts;
	struct mlx5e_eth_addr_db eth_addr;
	struct mlx5e_vlan_db vlan;

	Index: sys/dev/mlx5/mlx5_en/mlx5_en_flow_table.c
	===================================================================
	--- sys/dev/mlx5/mlx5_en/mlx5_en_flow_table.c
	+++ sys/dev/mlx5/mlx5_en/mlx5_en_flow_table.c
	@@ -28,7 +28,9 @@
	#include "en.h"

	#include <linux/list.h>
	-#include <dev/mlx5/flow_table.h>
	+#include <dev/mlx5/fs.h>
	+
	+#define MLX5_SET_CFG(p, f, v) MLX5_SET(create_flow_group_in, p, f, v)

	enum {
	MLX5E_FULLMATCH = 0,
	@@ -97,28 +99,38 @@
	mlx5e_del_eth_addr_from_flow_table(struct mlx5e_priv *priv,
	struct mlx5e_eth_addr_info *ai)
	{
	- void *ft = priv->ft.main;
	+ if (ai->tt_vec & (1 << MLX5E_TT_IPV6_IPSEC_ESP))
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV6_IPSEC_ESP]);
	+
	+ if (ai->tt_vec & (1 << MLX5E_TT_IPV4_IPSEC_ESP))
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV4_IPSEC_ESP]);
	+
	+ if (ai->tt_vec & (1 << MLX5E_TT_IPV6_IPSEC_AH))
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV6_IPSEC_AH]);
	+
	+ if (ai->tt_vec & (1 << MLX5E_TT_IPV4_IPSEC_AH))
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV4_IPSEC_AH]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV6_TCP))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV6_TCP]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV6_TCP]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV4_TCP))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV4_TCP]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV4_TCP]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV6_UDP))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV6_UDP]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV6_UDP]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV4_UDP))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV4_UDP]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV4_UDP]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV6))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV6]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV6]);

	if (ai->tt_vec & (1 << MLX5E_TT_IPV4))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_IPV4]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_IPV4]);

	if (ai->tt_vec & (1 << MLX5E_TT_ANY))
	- mlx5_del_flow_table_entry(ft, ai->ft_ix[MLX5E_TT_ANY]);
	+ mlx5_del_flow_rule(ai->ft_rule[MLX5E_TT_ANY]);
	}

	static int
	@@ -213,42 +225,33 @@
	static int
	mlx5e_add_eth_addr_rule_sub(struct mlx5e_priv *priv,
	struct mlx5e_eth_addr_info *ai, int type,
	- void flow_context, void match_criteria)
	-{
	- u8 match_criteria_enable = 0;
	- void *match_value;
	- void *dest;
	- u8 *dmac;
	- u8 *match_criteria_dmac;
	- void *ft = priv->ft.main;
	+ u32 mc, u32 mv)
	+{
	+ struct mlx5_flow_destination dest;
	+ u8 mc_enable = 0;
	+ struct mlx5_flow_rule **rule_p;
	+ struct mlx5_flow_table *ft = priv->fts.main.t;
	+ u8 *mc_dmac = MLX5_ADDR_OF(fte_match_param, mc,
	+ outer_headers.dmac_47_16);
	+ u8 *mv_dmac = MLX5_ADDR_OF(fte_match_param, mv,
	+ outer_headers.dmac_47_16);
	u32 *tirn = priv->tirn;
	u32 tt_vec;
	- int err;
	+ int err = 0;

	- match_value = MLX5_ADDR_OF(flow_context, flow_context, match_value);
	- dmac = MLX5_ADDR_OF(fte_match_param, match_value,
	- outer_headers.dmac_47_16);
	- match_criteria_dmac = MLX5_ADDR_OF(fte_match_param, match_criteria,
	- outer_headers.dmac_47_16);
	- dest = MLX5_ADDR_OF(flow_context, flow_context, destination);
	-
	- MLX5_SET(flow_context, flow_context, action,
	- MLX5_FLOW_CONTEXT_ACTION_FWD_DEST);
	- MLX5_SET(flow_context, flow_context, destination_list_size, 1);
	- MLX5_SET(dest_format_struct, dest, destination_type,
	- MLX5_FLOW_CONTEXT_DEST_TYPE_TIR);
	+ dest.type = MLX5_FLOW_DESTINATION_TYPE_TIR;

	switch (type) {
	case MLX5E_FULLMATCH:
	- match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- memset(match_criteria_dmac, 0xff, ETH_ALEN);
	- ether_addr_copy(dmac, ai->addr);
	+ mc_enable = MLX5_MATCH_OUTER_HEADERS;
	+ memset(mc_dmac, 0xff, ETH_ALEN);
	+ ether_addr_copy(mv_dmac, ai->addr);
	break;

	case MLX5E_ALLMULTI:
	- match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- match_criteria_dmac[0] = 0x01;
	- dmac[0] = 0x01;
	+ mc_enable = MLX5_MATCH_OUTER_HEADERS;
	+ mc_dmac[0] = 0x01;
	+ mv_dmac[0] = 0x01;
	break;

	case MLX5E_PROMISC:
	@@ -259,134 +262,192 @@

	tt_vec = mlx5e_get_tt_vec(ai, type);

	- if (tt_vec & (1 << MLX5E_TT_ANY)) {
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_ANY]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_ANY]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_ANY);
	- }
	- match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, match_criteria,
	- outer_headers.ethertype);
	-
	- if (tt_vec & (1 << MLX5E_TT_IPV4)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IP);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV4]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV4]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV4);
	- }
	- if (tt_vec & (1 << MLX5E_TT_IPV6)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IPV6);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV6]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV6]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV6);
	- }
	- MLX5_SET_TO_ONES(fte_match_param, match_criteria,
	- outer_headers.ip_protocol);
	- MLX5_SET(fte_match_param, match_value, outer_headers.ip_protocol,
	- IPPROTO_UDP);
	-
	- if (tt_vec & (1 << MLX5E_TT_IPV4_UDP)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IP);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV4_UDP]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV4_UDP]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV4_UDP);
	- }
	- if (tt_vec & (1 << MLX5E_TT_IPV6_UDP)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IPV6);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV6_UDP]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV6_UDP]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV6_UDP);
	- }
	- MLX5_SET(fte_match_param, match_value, outer_headers.ip_protocol,
	- IPPROTO_TCP);
	-
	- if (tt_vec & (1 << MLX5E_TT_IPV4_TCP)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IP);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV4_TCP]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV4_TCP]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV4_TCP);
	- }
	- if (tt_vec & (1 << MLX5E_TT_IPV6_TCP)) {
	- MLX5_SET(fte_match_param, match_value, outer_headers.ethertype,
	- ETHERTYPE_IPV6);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- tirn[MLX5E_TT_IPV6_TCP]);
	- err = mlx5_add_flow_table_entry(ft, match_criteria_enable,
	- match_criteria, flow_context, &ai->ft_ix[MLX5E_TT_IPV6_TCP]);
	- if (err) {
	- mlx5e_del_eth_addr_from_flow_table(priv, ai);
	- return (err);
	- }
	- ai->tt_vec \|= (1 << MLX5E_TT_IPV6_TCP);
	+ if (tt_vec & BIT(MLX5E_TT_ANY)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_ANY];
	+ dest.tir_num = tirn[MLX5E_TT_ANY];
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_ANY);
	}
	- return (0);
	+
	+ mc_enable = MLX5_MATCH_OUTER_HEADERS;
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV4)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV4];
	+ dest.tir_num = tirn[MLX5E_TT_IPV4];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IP);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV4);
	+ }
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV6)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV6];
	+ dest.tir_num = tirn[MLX5E_TT_IPV6];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IPV6);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV6);
	+ }
	+
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ip_protocol);
	+ MLX5_SET(fte_match_param, mv, outer_headers.ip_protocol, IPPROTO_UDP);
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV4_UDP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV4_UDP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV4_UDP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IP);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV4_UDP);
	+ }
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV6_UDP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV6_UDP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV6_UDP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IPV6);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV6_UDP);
	+ }
	+
	+ MLX5_SET(fte_match_param, mv, outer_headers.ip_protocol, IPPROTO_TCP);
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV4_TCP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV4_TCP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV4_TCP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IP);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV4_TCP);
	+ }
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV6_TCP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV6_TCP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV6_TCP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IPV6);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV6_TCP);
	+ }
	+
	+ MLX5_SET(fte_match_param, mv, outer_headers.ip_protocol, IPPROTO_AH);
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV4_IPSEC_AH)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV4_IPSEC_AH];
	+ dest.tir_num = tirn[MLX5E_TT_IPV4_IPSEC_AH];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IP);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV4_IPSEC_AH);
	+ }
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV6_IPSEC_AH)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV6_IPSEC_AH];
	+ dest.tir_num = tirn[MLX5E_TT_IPV6_IPSEC_AH];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IPV6);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV6_IPSEC_AH);
	+ }
	+
	+ MLX5_SET(fte_match_param, mv, outer_headers.ip_protocol, IPPROTO_ESP);
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV4_IPSEC_ESP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV4_IPSEC_ESP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV4_IPSEC_ESP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IP);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV4_IPSEC_ESP);
	+ }
	+
	+ if (tt_vec & BIT(MLX5E_TT_IPV6_IPSEC_ESP)) {
	+ rule_p = &ai->ft_rule[MLX5E_TT_IPV6_IPSEC_ESP];
	+ dest.tir_num = tirn[MLX5E_TT_IPV6_IPSEC_ESP];
	+ MLX5_SET(fte_match_param, mv, outer_headers.ethertype,
	+ ETHERTYPE_IPV6);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG, &dest);
	+ if (IS_ERR_OR_NULL(*rule_p))
	+ goto err_del_ai;
	+ ai->tt_vec \|= BIT(MLX5E_TT_IPV6_IPSEC_ESP);
	+ }
	+
	+ return 0;
	+
	+err_del_ai:
	+ err = PTR_ERR(*rule_p);
	+ *rule_p = NULL;
	+ mlx5e_del_eth_addr_from_flow_table(priv, ai);
	+
	+ return err;
	}

	static int
	mlx5e_add_eth_addr_rule(struct mlx5e_priv *priv,
	struct mlx5e_eth_addr_info *ai, int type)
	{
	- u32 *flow_context;
	u32 *match_criteria;
	- int err;
	+ u32 *match_value;
	+ int err = 0;

	- flow_context = mlx5_vzalloc(MLX5_ST_SZ_BYTES(flow_context) +
	- MLX5_ST_SZ_BYTES(dest_format_struct));
	- match_criteria = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	- if (!flow_context \|\| !match_criteria) {
	+ match_value = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	+ match_criteria = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	+ if (!match_value \|\| !match_criteria) {
	if_printf(priv->ifp, "%s: alloc failed\n", __func__);
	err = -ENOMEM;
	goto add_eth_addr_rule_out;
	}
	- err = mlx5e_add_eth_addr_rule_sub(priv, ai, type, flow_context,
	- match_criteria);
	- if (err)
	- if_printf(priv->ifp, "%s: failed\n", __func__);
	+ err = mlx5e_add_eth_addr_rule_sub(priv, ai, type, match_criteria,
	+ match_value);

	add_eth_addr_rule_out:
	kvfree(match_criteria);
	- kvfree(flow_context);
	+ kvfree(match_value);
	+
	return (err);
	}

	@@ -435,106 +496,156 @@

	enum mlx5e_vlan_rule_type {
	MLX5E_VLAN_RULE_TYPE_UNTAGGED,
	- MLX5E_VLAN_RULE_TYPE_ANY_VID,
	+ MLX5E_VLAN_RULE_TYPE_ANY_CTAG_VID,
	+ MLX5E_VLAN_RULE_TYPE_ANY_STAG_VID,
	MLX5E_VLAN_RULE_TYPE_MATCH_VID,
	};

	static int
	-mlx5e_add_vlan_rule(struct mlx5e_priv *priv,
	- enum mlx5e_vlan_rule_type rule_type, u16 vid)
	+mlx5e_add_vlan_rule_sub(struct mlx5e_priv *priv,
	+ enum mlx5e_vlan_rule_type rule_type, u16 vid,
	+ u32 mc, u32 mv)
	{
	- u8 match_criteria_enable = 0;
	- u32 *flow_context;
	- void *match_value;
	- void *dest;
	- u32 *match_criteria;
	- u32 *ft_ix;
	- int err;
	+ struct mlx5_flow_table *ft = priv->fts.vlan.t;
	+ struct mlx5_flow_destination dest;
	+ u8 mc_enable = 0;
	+ struct mlx5_flow_rule **rule_p;
	+ int err = 0;

	- flow_context = mlx5_vzalloc(MLX5_ST_SZ_BYTES(flow_context) +
	- MLX5_ST_SZ_BYTES(dest_format_struct));
	- match_criteria = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	- if (!flow_context \|\| !match_criteria) {
	- if_printf(priv->ifp, "%s: alloc failed\n", __func__);
	- err = -ENOMEM;
	- goto add_vlan_rule_out;
	- }
	- match_value = MLX5_ADDR_OF(flow_context, flow_context, match_value);
	- dest = MLX5_ADDR_OF(flow_context, flow_context, destination);
	-
	- MLX5_SET(flow_context, flow_context, action,
	- MLX5_FLOW_CONTEXT_ACTION_FWD_DEST);
	- MLX5_SET(flow_context, flow_context, destination_list_size, 1);
	- MLX5_SET(dest_format_struct, dest, destination_type,
	- MLX5_FLOW_CONTEXT_DEST_TYPE_FLOW_TABLE);
	- MLX5_SET(dest_format_struct, dest, destination_id,
	- mlx5_get_flow_table_id(priv->ft.main));
	+ dest.type = MLX5_FLOW_DESTINATION_TYPE_FLOW_TABLE;
	+ dest.ft = priv->fts.main.t;

	- match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, match_criteria,
	- outer_headers.cvlan_tag);
	+ mc_enable = MLX5_MATCH_OUTER_HEADERS;

	switch (rule_type) {
	case MLX5E_VLAN_RULE_TYPE_UNTAGGED:
	- ft_ix = &priv->vlan.untagged_rule_ft_ix;
	+ rule_p = &priv->vlan.untagged_ft_rule;
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.cvlan_tag);
	break;
	- case MLX5E_VLAN_RULE_TYPE_ANY_VID:
	- ft_ix = &priv->vlan.any_vlan_rule_ft_ix;
	- MLX5_SET(fte_match_param, match_value, outer_headers.cvlan_tag,
	- 1);
	+ case MLX5E_VLAN_RULE_TYPE_ANY_CTAG_VID:
	+ rule_p = &priv->vlan.any_cvlan_ft_rule;
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.cvlan_tag);
	+ MLX5_SET(fte_match_param, mv, outer_headers.cvlan_tag, 1);
	break;
	- default: /* MLX5E_VLAN_RULE_TYPE_MATCH_VID */
	- ft_ix = &priv->vlan.active_vlans_ft_ix[vid];
	- MLX5_SET(fte_match_param, match_value, outer_headers.cvlan_tag,
	- 1);
	- MLX5_SET_TO_ONES(fte_match_param, match_criteria,
	- outer_headers.first_vid);
	- MLX5_SET(fte_match_param, match_value, outer_headers.first_vid,
	- vid);
	+ case MLX5E_VLAN_RULE_TYPE_ANY_STAG_VID:
	+ rule_p = &priv->vlan.any_svlan_ft_rule;
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.svlan_tag);
	+ MLX5_SET(fte_match_param, mv, outer_headers.svlan_tag, 1);
	+ break;
	+ default: /* MLX5E_VLAN_RULE_TYPE_MATCH_VID */
	+ rule_p = &priv->vlan.active_vlans_ft_rule[vid];
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.cvlan_tag);
	+ MLX5_SET(fte_match_param, mv, outer_headers.cvlan_tag, 1);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.first_vid);
	+ MLX5_SET(fte_match_param, mv, outer_headers.first_vid, vid);
	mlx5e_vport_context_update_vlans(priv);
	break;
	}

	- err = mlx5_add_flow_table_entry(priv->ft.vlan, match_criteria_enable,
	- match_criteria, flow_context, ft_ix);
	- if (err)
	- if_printf(priv->ifp, "%s: failed\n", __func__);
	+ *rule_p = mlx5_add_flow_rule(ft, mc_enable, mc, mv,
	+ MLX5_FLOW_CONTEXT_ACTION_FWD_DEST,
	+ MLX5_FS_ETH_FLOW_TAG,
	+ &dest);
	+
	+ if (IS_ERR(*rule_p)) {
	+ err = PTR_ERR(*rule_p);
	+ *rule_p = NULL;
	+ if_printf(priv->ifp, "%s: add rule failed\n", __func__);
	+ }
	+
	+ return (err);
	+}
	+
	+static int
	+mlx5e_add_vlan_rule(struct mlx5e_priv *priv,
	+ enum mlx5e_vlan_rule_type rule_type, u16 vid)
	+{
	+ u32 *match_criteria;
	+ u32 *match_value;
	+ int err = 0;
	+
	+ match_value = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	+ match_criteria = mlx5_vzalloc(MLX5_ST_SZ_BYTES(fte_match_param));
	+ if (!match_value \|\| !match_criteria) {
	+ if_printf(priv->ifp, "%s: alloc failed\n", __func__);
	+ err = -ENOMEM;
	+ goto add_vlan_rule_out;
	+ }
	+
	+ err = mlx5e_add_vlan_rule_sub(priv, rule_type, vid, match_criteria,
	+ match_value);

	add_vlan_rule_out:
	kvfree(match_criteria);
	- kvfree(flow_context);
	+ kvfree(match_value);
	+
	return (err);
	}

	+
	static void
	mlx5e_del_vlan_rule(struct mlx5e_priv *priv,
	enum mlx5e_vlan_rule_type rule_type, u16 vid)
	{
	switch (rule_type) {
	case MLX5E_VLAN_RULE_TYPE_UNTAGGED:
	- mlx5_del_flow_table_entry(priv->ft.vlan,
	- priv->vlan.untagged_rule_ft_ix);
	+ if (priv->vlan.untagged_ft_rule) {
	+ mlx5_del_flow_rule(priv->vlan.untagged_ft_rule);
	+ priv->vlan.untagged_ft_rule = NULL;
	+ }
	break;
	- case MLX5E_VLAN_RULE_TYPE_ANY_VID:
	- mlx5_del_flow_table_entry(priv->ft.vlan,
	- priv->vlan.any_vlan_rule_ft_ix);
	+ case MLX5E_VLAN_RULE_TYPE_ANY_CTAG_VID:
	+ if (priv->vlan.any_cvlan_ft_rule) {
	+ mlx5_del_flow_rule(priv->vlan.any_cvlan_ft_rule);
	+ priv->vlan.any_cvlan_ft_rule = NULL;
	+ }
	+ break;
	+ case MLX5E_VLAN_RULE_TYPE_ANY_STAG_VID:
	+ if (priv->vlan.any_svlan_ft_rule) {
	+ mlx5_del_flow_rule(priv->vlan.any_svlan_ft_rule);
	+ priv->vlan.any_svlan_ft_rule = NULL;
	+ }
	break;
	case MLX5E_VLAN_RULE_TYPE_MATCH_VID:
	- mlx5_del_flow_table_entry(priv->ft.vlan,
	- priv->vlan.active_vlans_ft_ix[vid]);
	+ if (priv->vlan.active_vlans_ft_rule[vid]) {
	+ mlx5_del_flow_rule(priv->vlan.active_vlans_ft_rule[vid]);
	+ priv->vlan.active_vlans_ft_rule[vid] = NULL;
	+ }
	mlx5e_vport_context_update_vlans(priv);
	break;
	+ default:
	+ break;
	}
	}

	+static void
	+mlx5e_del_any_vid_rules(struct mlx5e_priv *priv)
	+{
	+ mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_CTAG_VID, 0);
	+ mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_STAG_VID, 0);
	+}
	+
	+static int
	+mlx5e_add_any_vid_rules(struct mlx5e_priv *priv)
	+{
	+ int err;
	+
	+ err = mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_CTAG_VID, 0);
	+ if (err)
	+ return (err);
	+
	+ return (mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_STAG_VID, 0));
	+}
	+
	void
	mlx5e_enable_vlan_filter(struct mlx5e_priv *priv)
	{
	if (priv->vlan.filter_disabled) {
	priv->vlan.filter_disabled = false;
	+ if (priv->ifp->if_flags & IFF_PROMISC)
	+ return;
	if (test_bit(MLX5E_STATE_OPENED, &priv->state))
	- mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_VID,
	- 0);
	+ mlx5e_del_any_vid_rules(priv);
	}
	}

	@@ -543,9 +654,10 @@
	{
	if (!priv->vlan.filter_disabled) {
	priv->vlan.filter_disabled = true;
	+ if (priv->ifp->if_flags & IFF_PROMISC)
	+ return;
	if (test_bit(MLX5E_STATE_OPENED, &priv->state))
	- mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_VID,
	- 0);
	+ mlx5e_add_any_vid_rules(priv);
	}
	}

	@@ -558,8 +670,8 @@
	return;

	PRIV_LOCK(priv);
	- set_bit(vid, priv->vlan.active_vlans);
	- if (test_bit(MLX5E_STATE_OPENED, &priv->state))
	+ if (!test_and_set_bit(vid, priv->vlan.active_vlans) &&
	+ test_bit(MLX5E_STATE_OPENED, &priv->state))
	mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_MATCH_VID, vid);
	PRIV_UNLOCK(priv);
	}
	@@ -582,12 +694,12 @@
	int
	mlx5e_add_all_vlan_rules(struct mlx5e_priv *priv)
	{
	- u16 vid;
	int err;
	+ int i;

	- for_each_set_bit(vid, priv->vlan.active_vlans, VLAN_N_VID) {
	+ for_each_set_bit(i, priv->vlan.active_vlans, VLAN_N_VID) {
	err = mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_MATCH_VID,
	- vid);
	+ i);
	if (err)
	return (err);
	}
	@@ -597,8 +709,7 @@
	return (err);

	if (priv->vlan.filter_disabled) {
	- err = mlx5e_add_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_VID,
	- 0);
	+ err = mlx5e_add_any_vid_rules(priv);
	if (err)
	return (err);
	}
	@@ -608,15 +719,15 @@
	void
	mlx5e_del_all_vlan_rules(struct mlx5e_priv *priv)
	{
	- u16 vid;
	+ int i;

	if (priv->vlan.filter_disabled)
	- mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_ANY_VID, 0);
	+ mlx5e_del_any_vid_rules(priv);

	mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_UNTAGGED, 0);

	- for_each_set_bit(vid, priv->vlan.active_vlans, VLAN_N_VID)
	- mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_MATCH_VID, vid);
	+ for_each_set_bit(i, priv->vlan.active_vlans, VLAN_N_VID)
	+ mlx5e_del_vlan_rule(priv, MLX5E_VLAN_RULE_TYPE_MATCH_VID, i);
	}

	#define mlx5e_for_each_hash_node(hn, tmp, hash, i) \
	@@ -812,8 +923,11 @@
	ether_addr_copy(priv->eth_addr.broadcast.addr,
	priv->ifp->if_broadcastaddr);

	- if (enable_promisc)
	+ if (enable_promisc) {
	mlx5e_add_eth_addr_rule(priv, &ea->promisc, MLX5E_PROMISC);
	+ if (!priv->vlan.filter_disabled)
	+ mlx5e_add_any_vid_rules(priv);
	+ }
	if (enable_allmulti)
	mlx5e_add_eth_addr_rule(priv, &ea->allmulti, MLX5E_ALLMULTI);
	if (enable_broadcast)
	@@ -825,8 +939,11 @@
	mlx5e_del_eth_addr_from_flow_table(priv, &ea->broadcast);
	if (disable_allmulti)
	mlx5e_del_eth_addr_from_flow_table(priv, &ea->allmulti);
	- if (disable_promisc)
	+ if (disable_promisc) {
	+ if (!priv->vlan.filter_disabled)
	+ mlx5e_del_any_vid_rules(priv);
	mlx5e_del_eth_addr_from_flow_table(priv, &ea->promisc);
	+ }

	ea->promisc_enabled = promisc_enabled;
	ea->allmulti_enabled = allmulti_enabled;
	@@ -847,127 +964,487 @@
	PRIV_UNLOCK(priv);
	}

	-static int
	-mlx5e_create_main_flow_table(struct mlx5e_priv *priv)
	+static void
	+mlx5e_destroy_groups(struct mlx5e_flow_table *ft)
	{
	- struct mlx5_flow_table_group *g;
	- u8 *dmac;
	-
	- g = malloc(9 * sizeof(*g), M_MLX5EN, M_WAITOK \| M_ZERO);
	- if (g == NULL)
	- return (-ENOMEM);
	+ int i;

	- g[0].log_sz = 2;
	- g[0].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, g[0].match_criteria,
	- outer_headers.ethertype);
	- MLX5_SET_TO_ONES(fte_match_param, g[0].match_criteria,
	- outer_headers.ip_protocol);
	+ for (i = ft->num_groups - 1; i >= 0; i--) {
	+ if (!IS_ERR_OR_NULL(ft->g[i]))
	+ mlx5_destroy_flow_group(ft->g[i]);
	+ ft->g[i] = NULL;
	+ }
	+ ft->num_groups = 0;
	+}

	- g[1].log_sz = 1;
	- g[1].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, g[1].match_criteria,
	- outer_headers.ethertype);
	+static void
	+mlx5e_destroy_flow_table(struct mlx5e_flow_table *ft)
	+{
	+ mlx5e_destroy_groups(ft);
	+ kfree(ft->g);
	+ mlx5_destroy_flow_table(ft->t);
	+ ft->t = NULL;
	+}

	- g[2].log_sz = 0;
	+#define MLX5E_NUM_MAIN_GROUPS 10
	+#define MLX5E_MAIN_GROUP0_SIZE BIT(4)
	+#define MLX5E_MAIN_GROUP1_SIZE BIT(3)
	+#define MLX5E_MAIN_GROUP2_SIZE BIT(1)
	+#define MLX5E_MAIN_GROUP3_SIZE BIT(0)
	+#define MLX5E_MAIN_GROUP4_SIZE BIT(14)
	+#define MLX5E_MAIN_GROUP5_SIZE BIT(13)
	+#define MLX5E_MAIN_GROUP6_SIZE BIT(11)
	+#define MLX5E_MAIN_GROUP7_SIZE BIT(2)
	+#define MLX5E_MAIN_GROUP8_SIZE BIT(1)
	+#define MLX5E_MAIN_GROUP9_SIZE BIT(0)
	+#define MLX5E_MAIN_TABLE_SIZE (MLX5E_MAIN_GROUP0_SIZE +\
	+ MLX5E_MAIN_GROUP1_SIZE +\
	+ MLX5E_MAIN_GROUP2_SIZE +\
	+ MLX5E_MAIN_GROUP3_SIZE +\
	+ MLX5E_MAIN_GROUP4_SIZE +\
	+ MLX5E_MAIN_GROUP5_SIZE +\
	+ MLX5E_MAIN_GROUP6_SIZE +\
	+ MLX5E_MAIN_GROUP7_SIZE +\
	+ MLX5E_MAIN_GROUP8_SIZE +\
	+ MLX5E_MAIN_GROUP9_SIZE +\
	+ 0)

	- g[3].log_sz = 14;
	- g[3].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[3].match_criteria,
	- outer_headers.dmac_47_16);
	+static int
	+mlx5e_create_main_groups_sub(struct mlx5e_flow_table ft, u32 in,
	+ int inlen)
	+{
	+ u8 *mc = MLX5_ADDR_OF(create_flow_group_in, in, match_criteria);
	+ u8 *dmac = MLX5_ADDR_OF(create_flow_group_in, in,
	+ match_criteria.outer_headers.dmac_47_16);
	+ int err;
	+ int ix = 0;
	+
	+ /* Tunnel rules need to be first in this list of groups */
	+
	+ /* Start tunnel rules */
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ip_protocol);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.udp_dport);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP0_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+ /* End Tunnel Rules */
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ip_protocol);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP1_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP2_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP3_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ip_protocol);
	memset(dmac, 0xff, ETH_ALEN);
	- MLX5_SET_TO_ONES(fte_match_param, g[3].match_criteria,
	- outer_headers.ethertype);
	- MLX5_SET_TO_ONES(fte_match_param, g[3].match_criteria,
	- outer_headers.ip_protocol);
	-
	- g[4].log_sz = 13;
	- g[4].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[4].match_criteria,
	- outer_headers.dmac_47_16);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP4_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	memset(dmac, 0xff, ETH_ALEN);
	- MLX5_SET_TO_ONES(fte_match_param, g[4].match_criteria,
	- outer_headers.ethertype);
	-
	- g[5].log_sz = 11;
	- g[5].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[5].match_criteria,
	- outer_headers.dmac_47_16);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP5_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	memset(dmac, 0xff, ETH_ALEN);
	-
	- g[6].log_sz = 2;
	- g[6].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[6].match_criteria,
	- outer_headers.dmac_47_16);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP6_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ip_protocol);
	dmac[0] = 0x01;
	- MLX5_SET_TO_ONES(fte_match_param, g[6].match_criteria,
	- outer_headers.ethertype);
	- MLX5_SET_TO_ONES(fte_match_param, g[6].match_criteria,
	- outer_headers.ip_protocol);
	-
	- g[7].log_sz = 1;
	- g[7].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[7].match_criteria,
	- outer_headers.dmac_47_16);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP7_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.ethertype);
	dmac[0] = 0x01;
	- MLX5_SET_TO_ONES(fte_match_param, g[7].match_criteria,
	- outer_headers.ethertype);
	-
	- g[8].log_sz = 0;
	- g[8].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- dmac = MLX5_ADDR_OF(fte_match_param, g[8].match_criteria,
	- outer_headers.dmac_47_16);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP8_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	dmac[0] = 0x01;
	- priv->ft.main = mlx5_create_flow_table(priv->mdev, 1,
	- MLX5_FLOW_TABLE_TYPE_NIC_RCV,
	- 0, 9, g);
	- free(g, M_MLX5EN);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_MAIN_GROUP9_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ return (0);
	+
	+err_destory_groups:
	+ err = PTR_ERR(ft->g[ft->num_groups]);
	+ ft->g[ft->num_groups] = NULL;
	+ mlx5e_destroy_groups(ft);

	- return (priv->ft.main ? 0 : -ENOMEM);
	+ return (err);
	}

	-static void
	-mlx5e_destroy_main_flow_table(struct mlx5e_priv *priv)
	+static int
	+mlx5e_create_main_groups(struct mlx5e_flow_table *ft)
	+{
	+ u32 *in;
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ int err;
	+
	+ in = mlx5_vzalloc(inlen);
	+ if (!in)
	+ return (-ENOMEM);
	+
	+ err = mlx5e_create_main_groups_sub(ft, in, inlen);
	+
	+ kvfree(in);
	+ return (err);
	+}
	+
	+static int mlx5e_create_main_flow_table(struct mlx5e_priv *priv)
	+{
	+ struct mlx5e_flow_table *ft = &priv->fts.main;
	+ int err;
	+
	+ ft->num_groups = 0;
	+ ft->t = mlx5_create_flow_table(priv->fts.ns, 0, "main",
	+ MLX5E_MAIN_TABLE_SIZE);
	+
	+ if (IS_ERR(ft->t)) {
	+ err = PTR_ERR(ft->t);
	+ ft->t = NULL;
	+ return (err);
	+ }
	+ ft->g = kcalloc(MLX5E_NUM_MAIN_GROUPS, sizeof(*ft->g), GFP_KERNEL);
	+ if (!ft->g) {
	+ err = -ENOMEM;
	+ goto err_destroy_main_flow_table;
	+ }
	+
	+ err = mlx5e_create_main_groups(ft);
	+ if (err)
	+ goto err_free_g;
	+ return (0);
	+
	+err_free_g:
	+ kfree(ft->g);
	+
	+err_destroy_main_flow_table:
	+ mlx5_destroy_flow_table(ft->t);
	+ ft->t = NULL;
	+
	+ return (err);
	+}
	+
	+static void mlx5e_destroy_main_flow_table(struct mlx5e_priv *priv)
	{
	- mlx5_destroy_flow_table(priv->ft.main);
	- priv->ft.main = NULL;
	+ mlx5e_destroy_flow_table(&priv->fts.main);
	}

	+#define MLX5E_NUM_VLAN_GROUPS 3
	+#define MLX5E_VLAN_GROUP0_SIZE BIT(12)
	+#define MLX5E_VLAN_GROUP1_SIZE BIT(1)
	+#define MLX5E_VLAN_GROUP2_SIZE BIT(0)
	+#define MLX5E_VLAN_TABLE_SIZE (MLX5E_VLAN_GROUP0_SIZE +\
	+ MLX5E_VLAN_GROUP1_SIZE +\
	+ MLX5E_VLAN_GROUP2_SIZE +\
	+ 0)
	+
	static int
	-mlx5e_create_vlan_flow_table(struct mlx5e_priv *priv)
	+mlx5e_create_vlan_groups_sub(struct mlx5e_flow_table ft, u32 in,
	+ int inlen)
	+{
	+ int err;
	+ int ix = 0;
	+ u8 *mc = MLX5_ADDR_OF(create_flow_group_in, in, match_criteria);
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.cvlan_tag);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.first_vid);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_VLAN_GROUP0_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.cvlan_tag);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_VLAN_GROUP1_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_OUTER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, outer_headers.svlan_tag);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_VLAN_GROUP2_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ return (0);
	+
	+err_destory_groups:
	+ err = PTR_ERR(ft->g[ft->num_groups]);
	+ ft->g[ft->num_groups] = NULL;
	+ mlx5e_destroy_groups(ft);
	+
	+ return (err);
	+}
	+
	+static int
	+mlx5e_create_vlan_groups(struct mlx5e_flow_table *ft)
	{
	- struct mlx5_flow_table_group *g;
	+ u32 *in;
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ int err;

	- g = malloc(2 * sizeof(*g), M_MLX5EN, M_WAITOK \| M_ZERO);
	- if (g == NULL)
	+ in = mlx5_vzalloc(inlen);
	+ if (!in)
	return (-ENOMEM);

	- g[0].log_sz = 12;
	- g[0].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, g[0].match_criteria,
	- outer_headers.cvlan_tag);
	- MLX5_SET_TO_ONES(fte_match_param, g[0].match_criteria,
	- outer_headers.first_vid);
	+ err = mlx5e_create_vlan_groups_sub(ft, in, inlen);
	+
	+ kvfree(in);
	+ return (err);
	+}
	+
	+static int
	+mlx5e_create_vlan_flow_table(struct mlx5e_priv *priv)
	+{
	+ struct mlx5e_flow_table *ft = &priv->fts.vlan;
	+ int err;
	+
	+ ft->num_groups = 0;
	+ ft->t = mlx5_create_flow_table(priv->fts.ns, 0, "vlan",
	+ MLX5E_VLAN_TABLE_SIZE);
	+
	+ if (IS_ERR(ft->t)) {
	+ err = PTR_ERR(ft->t);
	+ ft->t = NULL;
	+ return (err);
	+ }
	+ ft->g = kcalloc(MLX5E_NUM_VLAN_GROUPS, sizeof(*ft->g), GFP_KERNEL);
	+ if (!ft->g) {
	+ err = -ENOMEM;
	+ goto err_destroy_vlan_flow_table;
	+ }
	+
	+ err = mlx5e_create_vlan_groups(ft);
	+ if (err)
	+ goto err_free_g;
	+
	+ return (0);

	- /* untagged + any vlan id */
	- g[1].log_sz = 1;
	- g[1].match_criteria_enable = MLX5_MATCH_OUTER_HEADERS;
	- MLX5_SET_TO_ONES(fte_match_param, g[1].match_criteria,
	- outer_headers.cvlan_tag);
	+err_free_g:
	+ kfree(ft->g);

	- priv->ft.vlan = mlx5_create_flow_table(priv->mdev, 0,
	- MLX5_FLOW_TABLE_TYPE_NIC_RCV,
	- 0, 2, g);
	- free(g, M_MLX5EN);
	+err_destroy_vlan_flow_table:
	+ mlx5_destroy_flow_table(ft->t);
	+ ft->t = NULL;

	- return (priv->ft.vlan ? 0 : -ENOMEM);
	+ return (err);
	}

	static void
	mlx5e_destroy_vlan_flow_table(struct mlx5e_priv *priv)
	{
	- mlx5_destroy_flow_table(priv->ft.vlan);
	- priv->ft.vlan = NULL;
	+ mlx5e_destroy_flow_table(&priv->fts.vlan);
	+}
	+
	+#define MLX5E_NUM_INNER_RSS_GROUPS 3
	+#define MLX5E_INNER_RSS_GROUP0_SIZE BIT(3)
	+#define MLX5E_INNER_RSS_GROUP1_SIZE BIT(1)
	+#define MLX5E_INNER_RSS_GROUP2_SIZE BIT(0)
	+#define MLX5E_INNER_RSS_TABLE_SIZE (MLX5E_INNER_RSS_GROUP0_SIZE +\
	+ MLX5E_INNER_RSS_GROUP1_SIZE +\
	+ MLX5E_INNER_RSS_GROUP2_SIZE +\
	+ 0)
	+
	+static int
	+mlx5e_create_inner_rss_groups_sub(struct mlx5e_flow_table ft, u32 in,
	+ int inlen)
	+{
	+ u8 *mc = MLX5_ADDR_OF(create_flow_group_in, in, match_criteria);
	+ int err;
	+ int ix = 0;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_INNER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, inner_headers.ethertype);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, inner_headers.ip_protocol);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_INNER_RSS_GROUP0_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, match_criteria_enable, MLX5_MATCH_INNER_HEADERS);
	+ MLX5_SET_TO_ONES(fte_match_param, mc, inner_headers.ethertype);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_INNER_RSS_GROUP1_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ memset(in, 0, inlen);
	+ MLX5_SET_CFG(in, start_flow_index, ix);
	+ ix += MLX5E_INNER_RSS_GROUP2_SIZE;
	+ MLX5_SET_CFG(in, end_flow_index, ix - 1);
	+ ft->g[ft->num_groups] = mlx5_create_flow_group(ft->t, in);
	+ if (IS_ERR(ft->g[ft->num_groups]))
	+ goto err_destory_groups;
	+ ft->num_groups++;
	+
	+ return (0);
	+
	+err_destory_groups:
	+ err = PTR_ERR(ft->g[ft->num_groups]);
	+ ft->g[ft->num_groups] = NULL;
	+ mlx5e_destroy_groups(ft);
	+
	+ return (err);
	+}
	+
	+static int
	+mlx5e_create_inner_rss_groups(struct mlx5e_flow_table *ft)
	+{
	+ u32 *in;
	+ int inlen = MLX5_ST_SZ_BYTES(create_flow_group_in);
	+ int err;
	+
	+ in = mlx5_vzalloc(inlen);
	+ if (!in)
	+ return (-ENOMEM);
	+
	+ err = mlx5e_create_inner_rss_groups_sub(ft, in, inlen);
	+
	+ kvfree(in);
	+ return (err);
	+}
	+
	+static int
	+mlx5e_create_inner_rss_flow_table(struct mlx5e_priv *priv)
	+{
	+ struct mlx5e_flow_table *ft = &priv->fts.inner_rss;
	+ int err;
	+
	+ ft->num_groups = 0;
	+ ft->t = mlx5_create_flow_table(priv->fts.ns, 0, "inner_rss",
	+ MLX5E_INNER_RSS_TABLE_SIZE);
	+
	+ if (IS_ERR(ft->t)) {
	+ err = PTR_ERR(ft->t);
	+ ft->t = NULL;
	+ return (err);
	+ }
	+ ft->g = kcalloc(MLX5E_NUM_INNER_RSS_GROUPS, sizeof(*ft->g),
	+ GFP_KERNEL);
	+ if (!ft->g) {
	+ err = -ENOMEM;
	+ goto err_destroy_inner_rss_flow_table;
	+ }
	+
	+ err = mlx5e_create_inner_rss_groups(ft);
	+ if (err)
	+ goto err_free_g;
	+
	+ return (0);
	+
	+err_free_g:
	+ kfree(ft->g);
	+
	+err_destroy_inner_rss_flow_table:
	+ mlx5_destroy_flow_table(ft->t);
	+ ft->t = NULL;
	+
	+ return (err);
	+}
	+
	+static void mlx5e_destroy_inner_rss_flow_table(struct mlx5e_priv *priv)
	+{
	+ mlx5e_destroy_flow_table(&priv->fts.inner_rss);
	}

	int
	@@ -975,11 +1452,18 @@
	{
	int err;

	- err = mlx5e_create_main_flow_table(priv);
	+ priv->fts.ns = mlx5_get_flow_namespace(priv->mdev,
	+ MLX5_FLOW_NAMESPACE_KERNEL);
	+
	+ err = mlx5e_create_vlan_flow_table(priv);
	if (err)
	return (err);

	- err = mlx5e_create_vlan_flow_table(priv);
	+ err = mlx5e_create_main_flow_table(priv);
	+ if (err)
	+ goto err_destroy_vlan_flow_table;
	+
	+ err = mlx5e_create_inner_rss_flow_table(priv);
	if (err)
	goto err_destroy_main_flow_table;

	@@ -987,6 +1471,8 @@

	err_destroy_main_flow_table:
	mlx5e_destroy_main_flow_table(priv);
	+err_destroy_vlan_flow_table:
	+ mlx5e_destroy_vlan_flow_table(priv);

	return (err);
	}
	@@ -994,6 +1480,7 @@
	void
	mlx5e_close_flow_table(struct mlx5e_priv *priv)
	{
	- mlx5e_destroy_vlan_flow_table(priv);
	+ mlx5e_destroy_inner_rss_flow_table(priv);
	mlx5e_destroy_main_flow_table(priv);
	+ mlx5e_destroy_vlan_flow_table(priv);
	}
	Index: sys/dev/mlx5/mlx5_en/mlx5_en_main.c
	===================================================================
	--- sys/dev/mlx5/mlx5_en/mlx5_en_main.c
	+++ sys/dev/mlx5/mlx5_en/mlx5_en_main.c
	@@ -30,7 +30,7 @@
	#include <sys/sockio.h>
	#include <machine/atomic.h>

	-#define ETH_DRIVER_VERSION "3.1.0-dev"
	+#define ETH_DRIVER_VERSION "3.2-rc1"
	char mlx5e_version[] = "Mellanox Ethernet driver"
	" (" ETH_DRIVER_VERSION ")";

	Index: sys/dev/mlx5/qp.h
	===================================================================
	--- sys/dev/mlx5/qp.h
	+++ sys/dev/mlx5/qp.h
	@@ -66,6 +66,7 @@
	MLX5_QP_OPTPAR_CQN_RCV = 1 << 19,
	MLX5_QP_OPTPAR_DC_HS = 1 << 20,
	MLX5_QP_OPTPAR_DC_KEY = 1 << 21,
	+
	};

	enum mlx5_qp_state {
	Index: sys/modules/mlx5/Makefile
	===================================================================
	--- sys/modules/mlx5/Makefile
	+++ sys/modules/mlx5/Makefile
	@@ -7,8 +7,8 @@
	mlx5_cmd.c \
	mlx5_cq.c \
	mlx5_eq.c \
	-mlx5_eswitch_vacl.c \
	-mlx5_flow_table.c \
	+mlx5_fs_cmd.c \
	+mlx5_fs_tree.c \
	mlx5_fw.c \
	mlx5_health.c \
	mlx5_mad.c \

File Metadata

Mime Type: text/plain
Expires: Mon, Nov 17, 2:52 AM (51 m, 9 s)
Storage Engine: blob
Storage Format: Raw Data
Storage Handle: 25402402
Default Alt Text: D5798.id21892.diff (186 KB)

D5798.id21892.diffNo OneTemporaryActions

D5798.id21892.diffView Options

File Metadata

Event Timeline

D5798.id21892.diff
No OneTemporary
Actions

D5798.id21892.diff
View Options