
本文旨在深入探讨 go 语言的 并发 模型,重点解析 Goroutine、channel的工作原理及其与 Go 调度器的交互。通过分析一个具体的并发代码示例,我们将揭示 Go 程序执行顺序的非确定性,理解通道的阻塞特性,并提供实现“只接收第一个结果并立即退出”的解决方案,帮助读者更好地掌握 Go并发编程 的精髓。
Go 语言 以其内置的并发原语——Goroutine 和 Channel——而闻名,它们使得编写并发程序变得简单而高效。然而,对于初学者来说,理解这些原语如何协同工作,以及 Go 运行时调度器如何管理 Goroutine 的执行,常常会遇到困惑。本教程将通过一个实际案例,深入剖析 Go 并发的这些核心概念。
Go 并发基础:Goroutine 与 Channel
在 Go 中,Goroutine 是轻量级的执行 线程 ,由 Go 运行时管理。它们比 操作系统 线程的开销小得多,使得我们可以在一个程序中轻松创建成千上万个 Goroutine。通过在函数调用前加上 go 关键字,即可启动一个新的 Goroutine。
Channel 是 Goroutine 之间进行通信的管道,它提供了一种安全、同步的方式来传递数据。Channel 的设计理念是“不要通过共享内存来通信,而是通过通信来共享内存”,这有助于避免传统 并发编程 中常见的竞态条件。
Channel 可以分为两类:
- 无缓冲 Channel(Unbuffered Channel):创建时未指定容量或容量为 0。发送操作会阻塞,直到有接收方准备好接收;接收操作会阻塞,直到有发送方准备好发送。这意味着发送和接收是同步进行的。
- 有缓冲 Channel(Buffered Channel):创建时指定了容量。发送操作只有在 Channel 满时才会阻塞;接收操作只有在 Channel 空时才会阻塞。
Go 调度器的工作原理
Go 调度器是 Go 运行时的一个核心组件,负责在 操作系统 线程上调度和运行 Goroutine。它的主要特点包括:
- 非确定性(Non-deterministic):调度器在 Goroutine 之间切换的精确时机是不可预测的。它会根据内部启发式 算法、Goroutine 的状态(如是否阻塞)、以及操作系统线程的可用性来决定哪个 Goroutine 应该运行。这意味着程序的输出顺序可能因多次运行而异。
- 并发与并行:调度器尝试在单核 CPU 上通过时间片轮转实现 Goroutine 的并发执行(快速切换),在多核 CPU 上则可以实现真正的并行执行(同时运行多个 Goroutine)。
- 协作式调度:Goroutine 会在某些点(如 I / O 操作、Channel 操作、函数调用等)主动或被动地将控制权交还给调度器,以便其他 Goroutine 有机会运行。
案例分析:理解 Goroutine 与 Channel 的交互
让我们分析以下代码,并解释其输出为何可能与预期不同:
package main import "fmt" func display(msg string, c chan bool){fmt.Println("display first message:", msg) c <- true // 尝试向通道发送数据 } func sum(c chan bool){s := 0 for i:=0; i < 10000000000; i++ { // 模拟长时间计算 s++} fmt.Println(s) c <- true // 尝试向通道发送数据 } func main(){ c := make(chan bool) // 创建一个无缓冲通道 go display("hello", c) // 启动 display Goroutine go sum(c) // 启动 sum Goroutine <-c // main Goroutine 等待从通道接收数据 }
预期的困惑:用户可能认为,display Goroutine 会很快打印消息并向通道 c 发送 true,由于 m ain Goroutine 正在等待接收,程序应该在 display 发送后立即接收并退出,从而阻止 sum Goroutine 完成其长时间的计算和打印。
实际输出及解释:观察到的输出可能是:
display first message: hello 10000000000
这表明 sum Goroutine 也完成了其计算和打印。这背后的原因正是 Go 调度器的非确定性以及无缓冲 Channel 的阻塞特性:
- main Goroutine 启动:main 函数首先创建了一个无缓冲通道 c,然后启动了 display 和 sum 两个新的 Goroutine。
- display Goroutine 执行 :调度器可能会选择先运行 display。display Goroutine 打印出 “display first message: hello”。接着,它尝试执行 c <- true。由于 c 是一个无缓冲通道,并且此时 main Goroutine 还没有执行到 <-c 来接收数据,display Goroutine 会在此处 阻塞,等待一个接收者。
- sum Goroutine 执行 :当 display Goroutine 阻塞后,调度器会切换到其他可运行的 Goroutine,例如 sum。sum Goroutine 开始执行其长时间的 循环 计算。在计算完成后,它打印出计算结果 10000000000。然后,sum Goroutine 也尝试执行 c <- true。此时,main Goroutine 仍然没有准备好接收,而且 display Goroutine 也还在尝试发送,因此 sum Goroutine 也会在此处 阻塞。
- main Goroutine 接收并退出:现在,display 和 sum 都已阻塞在向通道 c 发送数据上。调度器最终会切换回 main Goroutine。main Goroutine 执行 <-c,它会从通道 c 中接收一个值。由于 display 和 sum 都在等待发送,调度器会选择其中一个 Goroutine(例如 display)进行通信。main 成功从 display 接收到 true。
- 程序终止:main Goroutine 在接收到值后,其后续语句执行完毕,main 函数返回。当 main Goroutine 退出时,Go 运行时会终止所有剩余的 Goroutine,包括 sum Goroutine(它可能仍然阻塞在 c <- true 上)。
因此,sum Goroutine 的打印发生在 main Goroutine 接收并退出之前,是因为调度器在 display 阻塞后给了 sum 运行的机会。
关键点总结:
- Go 调度器是非确定性的,Goroutine 的执行顺序和切换时机无法保证。
- 无缓冲 Channel 的发送和接收操作是同步阻塞的。
- main Goroutine 的 <-c 只会接收一个值。即使有多个 Goroutine 尝试向同一个通道发送数据,也只有一个能成功。一旦 main 接收到值并退出,所有其他 Goroutine 都会被终止。
实现“只接收第一个结果并立即退出”
如果我们的目标是只获取第一个完成任务的 Goroutine 的结果,并立即终止程序,而不等待其他 Goroutine,我们可以修改代码如下:
package main import ("fmt" "time" "os" // 引入 os 包用于程序退出) // display Goroutine 向结果通道发送其消息 func display(msg string, result chan string) {// 模拟一些工作,确保它有机会在 sum 之前完成 time.Sleep(50 * time.Millisecond) result <- "Display: " + msg // 将结果作为 字符串 发送到通道 } // sum Goroutine 计算并向结果通道发送其和 func sum(result chan string) {s := 0 for i := 0; i < 1000000000; i++ { // 模拟长时间计算 s++} result <- fmt.Sprintf("Sum: %d", s) // 将结果作为字符串发送到通道 } func main() { resultChan := make(chan string) // 创建一个用于接收结果的通道 go display("hello", resultChan) // 启动 display Goroutine go sum(resultChan) // 启动 sum Goroutine // 接收第一个到达的结果 firstResult := <-resultChan fmt.Println("Received first result:", firstResult) // 立即终止程序。// 如果不使用 os.Exit(0),程序会等待 main Goroutine 自然结束,// 但其他 Goroutine 可能仍在后台运行。// os.Exit(0)确保程序立即退出,防止其他 Goroutine 继续执行或打印。os.Exit(0) }
在这个修改后的版本中:
- 我们创建了一个 resultChan 来专门传递结果字符串。
- display 和 sum Goroutine 不再发送简单的 bool 值,而是发送它们各自的 实际结果(


