使用Go语言实现优先级队列:基于container/heap的实践指南

使用Go语言实现优先级队列:基于container/heap的实践指南

本教程详细介绍了如何在go语言中利用container/heap包实现一个自定义的优先级队列。通过定义满足heap.interface接口结构体,并结合构造函数创建节点指针,可以高效管理数据。文章深入探讨了跨包传递结构体值时可能遇到的“未导出字段隐式赋值”错误,并提供了规避该问题的最佳实践,确保代码的健壮性和可维护性。

1. Go语言中优先级队列的实现原理

go语言中,标准库container/heap提供了一个通用的操作接口,允许任何满足heap.Interface的类型实现堆数据结构。要实现一个优先级队列,核心是定义一个自定义类型,使其满足以下五个方法:

  • len() int:返回堆中元素的数量。
  • less(i, j int) bool:如果索引为i的元素优先级低于索引为j的元素,则返回true。这是决定堆序的关键方法。
  • Swap(i, j int):交换索引为i和j的两个元素。
  • Push(x interface{}):向堆中添加一个元素。此方法由heap.Push调用,用于在底层切片中追加元素。
  • Pop() interface{}:从堆中移除并返回最小(或最高优先级)的元素。此方法由heap.Pop调用,用于从底层切片中移除最后一个元素。

通过实现这些方法,我们就可以将自定义类型作为container/heap包的参数,从而获得堆的各种操作(如初始化、插入、删除最小元素等)。

2. 定义节点结构体

在优先级队列中,每个元素通常包含其数据和用于优先级排序的值。以下是一个示例节点结构体Node,它包含行、列、自身值和累加值,以及一个父节点指针(在路径查找算法中可能用到)。

// pqueue/node.go package pqueue  import "fmt"  // Node 代表优先级队列中的一个元素 type Node struct {     row    int // 行索引 (未导出字段)     col    int // 列索引 (未导出字段)     myVal  int // 节点自身的值 (未导出字段)     sumVal int // 从起点到当前节点的累加值 (未导出字段)     parent *Node // 指向父节点的指针 }  // NewNode 是 Node 的构造函数,返回一个 Node 的指针。 // 推荐使用构造函数来创建结构体实例,尤其是在跨包使用时。 func NewNode(r, c, mv, sv int, p *Node) *Node {     return &Node{r, c, mv, sv, p} }  // Eq 检查两个节点是否相等(基于行和列) func (n *Node) Eq(o *Node) bool {     return n.row == o.row && n.col == o.col }  // String 返回节点的字符串表示 func (n *Node) String() string {     return fmt.Sprintf("{%d, %d, %d, %d}", n.row, n.col, n.myVal, n.sumVal) }  // 以下是 Node 字段的访问器方法 func (n *Node) Row() int {     return n.row }  func (n *Node) Col() int {     return n.col }  func (n *Node) SetParent(p *Node) {     n.parent = p }  func (n *Node) Parent() *Node {     return n.parent }  func (n *Node) MyVal() int {     return n.myVal }  func (n *Node) SumVal() int {     return n.sumVal }  func (n *Node) SetSumVal(sv int) {     n.sumVal = sv }

注意事项:

  • Node结构体中的字段(如row, col, myVal, sumVal)都是小写字母开头,这意味着它们是未导出字段(unexported fields)。它们只能在pqueue包内部直接访问。
  • 我们提供了NewNode构造函数,它返回*Node类型(即Node结构体的指针)。这是Go语言中创建复杂结构体实例的推荐方式,尤其是在跨包使用时。

3. 实现优先级队列结构体

接下来,我们定义PQueue结构体,它将作为container/heap的底层数据结构。PQueue本质上是一个*Node切片。

立即学习go语言免费学习笔记(深入)”;

// pqueue/pqueue.go package pqueue  import "container/heap" // 引入 container/heap 包  // PQueue 是一个 []*Node 类型的别名,它将作为堆的底层数据结构。 // PQueue 实现了 heap.Interface 接口。 type PQueue []*Node  // Len 返回堆中元素的数量。 func (pq PQueue) Len() int {     return len(pq) }  // Less 比较两个节点的优先级。 // 这里以 (sumVal + myVal) 的和作为优先级,值越小优先级越高。 func (pq PQueue) Less(i, j int) bool {     // 注意:这里直接访问了 Node 的未导出字段 sumVal 和 myVal。     // 这是因为 PQueue 和 Node 都在同一个 pqueue 包中。     return (pq[i].sumVal + pq[i].myVal) < (pq[j].sumVal + pq[j].myVal) }  // Swap 交换堆中两个元素的位置。 func (pq PQueue) Swap(i, j int) {     pq[i], pq[j] = pq[j], pq[i] }  // Push 向堆中添加一个元素。 // 这个方法由 heap.Push 调用。 func (pq *PQueue) Push(x interface{}) {     // 类型断言,确保 x 是 *Node 类型     *pq = append(*pq, x.(*Node)) }  // Pop 从堆中移除并返回优先级最高的元素。 // 这个方法由 heap.Pop 调用。 func (pq *PQueue) Pop() interface{} {     old := *pq     n := len(old)     item := old[n-1] // 获取最后一个元素     *pq = old[0 : n-1] // 截断切片,移除最后一个元素     return item }  // NewPQueue 是 PQueue 的构造函数,返回一个已初始化为堆的 PQueue 指针。 func NewPQueue() *PQueue {     pq := make(PQueue, 0) // 创建一个空的 PQueue 切片     heap.Init(&pq)        // 对切片进行堆初始化     return &pq }  // IsEmpty 检查优先级队列是否为空。 func (pq *PQueue) IsEmpty() bool {     return len(*pq) == 0 }  // String 返回优先级队列的字符串表示。 func (pq *PQueue) String() string {     var build string = "{"     for _, v := range *pq {         build += v.String()     }     build += "}"     return build }

关键点:

  • PQueue被定义为[]*Node,这意味着它是一个存储Node指针的切片。
  • Push和Pop方法接收interface{}类型的参数,并在内部进行类型断言,将其转换为*Node。
  • NewPQueue构造函数在返回PQueue指针之前,调用了heap.Init(&pq)来初始化堆。

4. 在主程序中使用优先级队列

现在,我们可以在main包中使用我们定义的pqueue包。

// main.go package main  import (     "fmt"     "io/ioutil"     "strconv"     "strings"      "./pqueue" // 导入 pqueue 包 )  const MATSIZE = 5 const MATNAME = "matrix_small.txt"  func main() {     var matrix [MATSIZE][MATSIZE]int     contents, err := ioutil.ReadFile(MATNAME)     if err != nil {         panic("FILE IO ERROR!")     }     inFileStr := string(contents)     byrows := strings.Split(inFileStr, "n") // 修正 Split 参数     if len(byrows) > MATSIZE { // 处理文件末尾空行         byrows = byrows[:MATSIZE]     }      for row := 0; row < MATSIZE; row++ {         // 移除行末的可能的空白字符或回车符         byrows[row] = strings.TrimSpace(byrows[row])         if len(byrows[row]) == 0 {             continue // 跳过空行         }         bycols := strings.Split(byrows[row], ",")         for col := 0; col < MATSIZE; col++ {             matrix[row][col], _ = strconv.Atoi(bycols[col])         }     }      PrintMatrix(matrix)     sum, length := SolveMatrix(matrix) // 修改变量名 len 为 length,避免与内置函数冲突     fmt.Printf("length: %d, sum: %dn", length, sum) }  func PrintMatrix(mat [MATSIZE][MATSIZE]int) {     for r := 0; r < MATSIZE; r++ {         for c := 0; c < MATSIZE; c++ {             fmt.Printf("%d ", mat[r][c])         }         fmt.Print("n")     } }  func SolveMatrix(mat [MATSIZE][MATSIZE]int) (int, int) {     // 使用 NewPQueue 构造函数创建优先级队列实例     PQ := pqueue.NewPQueue()      // 使用 NewNode 构造函数创建 Node 实例,并得到其指针     firstNode := pqueue.NewNode(0, 0, mat[0][0], 0, nil)     // endNode := pqueue.NewNode(MATSIZE-1, MATSIZE-1, mat[MATSIZE-1][MATSIZE-1], 0, nil) // 未使用      // 检查优先级队列是否为空     if PQ.IsEmpty() {         fmt.Println("Priority Queue is empty initially.")     }      // 将 firstNode (一个 *pqueue.Node) 推入优先级队列     // heap.Push 接受一个 heap.Interface 类型和一个 interface{} 类型的元素     heap.Push(PQ, firstNode) // 正确的用法:直接调用 heap.Push      fmt.Printf("After pushing firstNode, PQ: %sn", PQ.String())      // 示例:从队列中取出元素     if !PQ.IsEmpty() {         poppedNode := heap.Pop(PQ).(*pqueue.Node) // heap.Pop 返回 interface{},需要类型断言         fmt.Printf("Popped node: %sn", poppedNode.String())     }      return 0, 0 }

5. 常见错误解析:“未导出字段隐式赋值”

原始问题中遇到的错误信息: main.go:58: implicit assignment of unexported field ‘row’ of pqueue.Node in function argument

这个错误发生在尝试将pqueue.Node的(而不是指针)从main包传递给pqueue包中的函数时,例如: var firstNode pqueue.NodePQ.Push(firstNode)

错误原因:

  1. pqueue.Node结构体内部包含row, col等未导出字段(小写字母开头)。
  2. 当你在main包中声明var firstNode pqueue.Node时,firstNode是一个Node的值类型实例。
  3. 当你调用PQ.Push(firstNode)时,Go语言会尝试将firstNode这个复制一份作为函数参数传递。
  4. 由于main包与pqueue包是不同的包,main包没有权限直接访问pqueue.Node的未导出字段。在进行跨包的值类型复制时,Go编译器会检查目标类型的所有字段是否可访问。如果值类型包含未导出字段,并且尝试在其他包中进行隐式赋值(即复制),就会触发此错误。编译器认为你试图在不拥有该字段的包中对其进行操作。

解决方案: 避免此问题的最佳实践是:

  1. 使用指针传递结构体实例:如上面修正后的代码所示,通过pqueue.NewNode()构造函数返回*pqueue.Node指针,然后将这个指针传递给heap.Push。指针传递的是地址,而不是整个结构体的副本,因此不会触发未导出字段的隐式赋值检查。
  2. 提供构造函数:为包含未导出字段的结构体提供一个公开的构造函数(如NewNode),它返回该结构体的指针。这样,外部包可以通过构造函数安全地创建和获取结构体实例的引用。

通过使用pqueue.NewNode()创建*pqueue.Node实例并将其推入堆,我们不仅解决了“未导出字段隐式赋值”的编译错误,还遵循了Go语言中处理结构体和包可见性的最佳实践。

总结

在Go语言中使用container/heap实现优先级队列是一个强大且灵活的模式。关键在于:

  1. 定义节点结构体:包含必要的数据和优先级字段,通常使用未导出字段以封装内部实现细节。
  2. 提供构造函数:对于包含未导出字段的结构体,提供一个返回指针的构造函数,以方便外部包安全地创建实例。
  3. 实现heap.Interface

以上就是使用Go语言实现优先级队列:基于cont

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享