3.1 变量以及声明

Go 语言中有四类标记:标识符(identifiers),关键字(keywords),运算符(operators )和标点符号(punctuation)以及字面量(literals) 。

Go 语言变量标识符由字母、数字、下划线组成,其中首个字母不能为数字,同一字母的大小写在Go语言中代表不同标识,注意区分A 和a 是不同的标识。

根据Go语言规范,标识符命名程序实体,例如变量和类型。 标识符是一个或多个Unicode字母和数字的序列。 标识符中的第一个字符必须是Unicode字母。标识符:

identifier = letter { letter | unicode_digit } .

Go语言规范中,下划线“_”也被认为是字母:

The underscore character _ (U+005F) is considered a letter.
letter        = unicode_letter | "_" .
unicode_digit  = /* a Unicode code point classified as "Number, decimal digit" */ .

在Unicode标准8.0中,第4.5节“常规类别”定义了一组字符类别。 Go语言将Unicode中任何字母类别Lu,Ll,Lt,Lm或Lo中的所有字符视为Unicode字母,将数字类别Nd中的字符视为Unicode数字。

据统计,Go语言视为Unicode的字母(含下划线_)一共20871个,这里面包括中文,详情见表:

字母类别 含义 数量
Lu 字母,大写 1781
Ll 字母,小写 2145
Lt 字母,词首字母大写 31
Lm 字母,修饰符 250
Lo 字母,其他 16053
Nd 数字,十进制数 610

一般习惯上,在Go语言命名标识符时,我们还是选择英文的52个大小写字母以及0-9数字和下划线来组合成合适的标识符。上表中其他的字符也可以用于标识符,但不在上表中的字符是不能用在Go语言标识符中。后面我们提到大写字母,主要是指Lu类别中的1781个字母。

另外,Go语言中关键字是保留字,不能作为变量标识符,如下表所示:

break default func interface select
case defer go map struct
chan else goto package switch
const fallthrough if range type
continue for import return var

Go语言变量声明使用关键字var,下面我们声明了几个变量:

var (
    a int
    b bool
    str string
    浮点 float32    // 没错,中文可以作为变量标识符
)

这种因式分解关键字的写法一般用于声明全局变量,一般在func 外定义。

当一个变量被var声明之后,系统自动赋予它该类型的零值:

  • int 为 0
  • float 为 0.0
  • bool 为 false
  • string 为空字符串""
  • 指针为 nil

记住,这些变量Go 中都是经过初始化的。

变量可以在同一行进行赋值,也称为 并行 或 同时 或 平行赋值。如:

a, b, c = 5, 7, "abc"

简式声明:

a, b, c := 5, 7, "abc"  // 注意等号前的冒号

右边的这些值以相同的顺序赋值给左边的变量,所以 a 的值是 5, b 的值是 7,c 的值是 "abc"。

简式声明一般用在func内,要注意的是:全局变量和简式声明的变量尽量不要同名,否则很容易产生偶然的变量隐藏Accidental Variable Shadowing。

即使对于经验丰富的Go开发者而言,这也是一个非常常见的陷阱。这个坑很容易挖,但又很难发现。

func main() {  
    x := 1
    fmt.Println(x)     // prints 1
    {
        fmt.Println(x) // prints 1
        x := 2
        fmt.Println(x) // prints 2
    }
    fmt.Println(x)     // prints 1 (不是2)
}

如果你想要交换两个变量的值,则可以简单地使用:

 a, b = b, a  

(在 Go 语言中,这样省去了使用交换函数的必要)

空白标识符 _ 也被用于抛弃值,如值 5 在:_, b = 5, 7 中被抛弃。

_, b = 5, 7

_ 实际上是一个只写变量,你不能得到它的值。这样做是因为 Go 语言中你必须使用所有被声明的变量,但有时你并不需要使用从一个函数得到的所有返回值。

由于Go语言有个强制规定,在函数内一定要使用声明的变量,但未使用的全局变量是没问题的。为了避免有未使用的变量,代码将编译失败,我们可以将该未使用的变量改为 _。

另外,在Go语言中,如果引入的包未使用,也不能通过编译。有时我们需要引入的包,比如需要init(),或者调试代码时我们可能去掉了某些包的功能使用,你可以添加一个下划线标记符,_,来作为这个包的名字,从而避免编译失败。下滑线标记符用于引入,但不使用。

package main
import (  
    _ "fmt"
    "log"
    "time"
)
var _ = log.Println
func main() {  
    _ = time.Now
}

并行赋值也被用于当一个函数返回多个返回值时,比如这里的 val 和错误 err 是通过调用 Func1 函数同时得到:

val, err = Func1(var1)

对于布尔值的好的命名能够很好地提升代码的可读性,例如以 is 或者 Is 开头的 isSorted、isFinished、isVisible,使用这样的命名能够在阅读代码的获得阅读正常语句一样的良好体验,例如标准库中的 unicode.IsDigit(ch)。

Go 语言中,指针属于引用类型,其它的引用类型还包括 slices,maps和 channel。

注意,Go中的数组是数值,因此当你向函数中传递数组时,函数会得到原始数组数据的一份复制。如果你打算更新数组的数据,可以考虑使用数组指针类型。

package main
import "fmt"
func main() {  
    x := [3]int{1, 2, 3}
    func(arr *[3]int) {
        (*arr)[0] = 7
        fmt.Println(arr) // prints &[7 2 3]
    }(&x)
    fmt.Println(x) // prints [7 2 3]
}

被引用的变量会存储在堆中,以便进行垃圾回收,且比栈拥有更大的内存空间。

引申:

编译器会做逃逸分析,所以由Go的编译器决定在哪(堆or栈)分配内存,保证程序的正确性。