Go 学习笔记(十)简单数据类型

本文原创地址:博客园骏马金龙Go 基础系列:简单数据类型

每一个变量都有数据类型,Go 中的数据类型有:

  • 简单数据类型 :int、float、complex、bool 和 string
  • 数据结构或组合 (composite) :struct、array、slice、map 和 channel
  • 接口 (interface)

当声明变量的时候,会做默认的赋 0 初始化。每种数据类型的默认赋 0 初始化的 0 值不同,例如 int 类型的 0 值为数值 0,float 的 0 值为 0.0,string 类型的 0 值为空 "",bool 类型的 0 值为 false,数据结构的 0 值为 nil,struct 的 0 值为字段全部赋 0。

其实函数也有类型,不过一般称之为返回类型。例如,下面的函数 foo 的返回类型是 int:

func foo() int {
	...CODE...
	return INT_TYPE_VALUE
}

函数允许有多个返回值,它们使用逗号分隔,括号包围

func foo() (int,bool)

Number 类型

Integer

Integer 类型是整型数据,例如3 22 0 1 -3 -22等。

Go 中的 Integer 有以下几种细分的类型:

  • int8,int16,int32,int64
  • uint8,uint16,uint32,uint64
  • byte
  • rune
  • int,uint

其中8 16 32 64表示该数据类型能存储的 bit 位数。例如 int8 表示能存储 8 位数值,所以这个类型占用 1 字节,也表示最大能存储的整型数共2^8=256个,所以 int8 类型允许的最大正数为 127,允许的最小负数为 -128,共 256 个数值。

uint 中的 u 表示 unsigned,即无符号整数,只保存 0 和正数。所以 uint8 能存储 256 个数的时候,允许的最小值为 0,允许的最大值为 255。

额外的两种 Integer 是 byte 和 rune,它们分别等价于 uint8(即一个字节大小的正数)、int32。从 builtin 包中的定义就可以知道:

$ go doc builtin | grep -E "byte|rune"
type byte = uint8
type rune = int32

byte 类型后面会详细解释。

还有两种依赖于 CPU 位数的类型 int 和 uint,它们分别表示一个机器字长。在 32 位 CPU 上,一个机器字长为 32bit,共 4 字节,在 64 位 CPU 上,一个机器字长为 64bit,共 8 字节。除了 int 和 uint 依赖于 CPU 架构,还有一种 uintptr 也是依赖于机器字长的。

一般来说,需要使用整型数据的时候,指定 int 即可,有明确的额外需求时再考虑是否换成其它整数类型。

在整数加上 0 前缀表示这是 8 进制,例如077。加上前缀0x表示这是 16 进制,例如0x0c,使用 e 符号可以表示这是一个科学计数法,如1e3 = 1000,6.023e23 = 6.023 x 10^23

可以使用 TYPE(N) 的方式来生成一个数值,例如a := uint64(5)。实际上这是类型转换,将 int 类型的 5 转换成 int64 类型的 5。

byte 类型

byte 类型等价于 uint8 类型,表示无符号的 1 字节整数。

实际上它一般用来表示字符和数值的转换关系。例如,ASCII 的字母 a 表示 97。下面这种定义方式是允许的:

var a byte = 'A'  // a=65
var b uint8 = 'a' // b=97

注意,字符必须使用单引号,且必须只能是单个字符。所以 byte 类型经常被称为 character 类型。

以下也都是允许的:

var a = 'A'
var a uint32 = 'A'
var a int64 = 'A'

所以,Integer 类型当存储的是以单引号包围的字符时,它会将字符转换成它二进制值对应的数值。同样适用于 unicode 字符,它将用来存放各字节对应的二进制的数值:

var a int64 = '我'  // a=25105

由于在 Go 中占用 3 字节,所以保存到 byte 中是报错的:

var a byte = '我'

可以保存它的 unicode 字符的代码点:

var a byte = '\u0041'  // a=65,代表的字符A

如果想将 byte 值转换为字符,可以使用 string() 函数做简单的类型转换:

var a = 'A'
println(string(a))     // 输出:A

float 和 complex

float 是浮点数 (俗称小数),例如0.0 3.0 -3.12 -3.120等。

Go 中的浮点数类型 float 有两种:float32 和 float64。

complex 表示复数类型 (虚数),有 complex64 和 complex128。

浮点数在计算机系统中非常复杂,对于学习来说,只需将其认为是数学中的一种小数即可。但以下几个注意点需要谨记心中:

  1. 浮点数是不精确的。例如1.01-0.99从数学运算的角度上得到的值是 0.02,但实际上的结果是 0.020000000000000018(python 运算的结果),在 Go 中会将其表示为+2.000000e-002。这个结果是一种极限趋近于我们期待值的结果。
  2. float32 的精度 (7 个小数位) 低于 float64(15 个小数位),所以 float64 类型的值比 float32 类型的值更精确。
  3. 因为浮点数不精确,所以尽量不要对两个浮点数数进行等值==和不等值!=比较,例如(3.2-2.8) == 0.4返回 Flase。如果非要比较,应该通过它们的减法求绝对值,再与一个足够小 (不会影响结果) 的值做不等比较,例如abs((3.2-2.8)-0.4) < 0.0002返回 True。

一般来说,在程序中需要使用浮点数的时候都使用 float64 类型,不仅因为精确,更因为几乎所有包中需要 float 参数的类型都是 float64。

在 Go 的数学运算中,默认取的是整型数据,如果想要得到浮点数结果,必须至少让运算的一方写成浮点数格式:

var a := 3/2     // a得到截断的整数:a=1
var b := 3/2.0   // b为浮点数b=+1.500000e+000
var c := 3 + 2.0 // c为浮点数

string 类型

Go 中的 string 用于保存 UTF-8 字符序列,它是动态大小的。对于字母和英文字母,它占用一个字节,对于其它 unicode 字符,按需占用 2-4 个字节。例如中文字符占用 3 个字节。

Go 中的 string 类型要使用双引号或反引号包围,它们的区别是:

  • 双引号是弱引用,其内可以使用反斜线转义符号,如ab\ncd表示 ab 后换行加 cd
  • 反引号是强引用,其内任何符号都被强制解释为字面意义,包括字面的换行。也就是所谓的裸字符串。
func main() {
	println("abc\ndef")
	println(`ABC
	DEF`)
}

上面的结果将输出:

abc
def
ABC
	DEF

不能使用单引号包围,单引号包围的表示它的二进制值转换成十进制的数值。例如字母对应的是 ASCII 码。这个在前面 byte 类型中介绍过。所以, 使用单引号包围的字符实际上是整数数值 。例如'a'等价于 97。

string 的底层是 byte 数组,每个 string 其实只占用两个机器字长:一个指针和一个长度 。只不过这个指针在 Go 中完全不可见,所以对我们来说,string 是一个底层 byte 数组的值类型而非指针类型。

733013-20181028111937000-1012391443.png

所以,可以将一个 string 使用 append()或 copy() 拷贝到一个给定的 byte slice 中,也可以使用 slice 的切片功能截取 string 中的片段。

func main() {
	var a = "Hello Gaoxiaofang"
	println(a[2:3])      // 输出:l

	s1 := make([]byte,30)
	copy(s1,a)          // 将字符串保存到slice中
	println(string(s1)) // 输出"Hello Gaoxiaofang"
}

字符串串接

使用加号+连接两段字符串:"Hello" + "World" 等价于 "HelloWorld"。

可以通过+的方式将多行连接起来。例如:

str := "Beginning string "+
	   "second string"

字符串连接+操作符强制认为它两边的都是 string 类型,所以"abcd" + 2将报错。需要先将 int 类型的 2 转换为字符串类型 ( 不能使用string(2)的方式转换,因为这种转换方式不能跨大类型转换,只能使用strconv包中的函数转换 )。

另一种更高效的字符串串接方式是使用strings包中的 Join() 函数,它可以在缓冲中将字符串串接起来。

字符串长度

使用 len() 取 字节数量 (不是字符数量)。

例如len("abcde")返回 5,size(我是中国人)返回 15。

字符串截取

可以将字符串当作数组,使用索引号取部分字符串 (按字节计算),索引号从 0 开始计算,如"abcd"[1]

从字符串取字符的时候,需要注意的是 index 按字节计算而非按字符计算。两种取数据方式:

"string"[x]
"string"[x:y]

第一种方式将返回第 (x+1) 个 字节 对应字符的 二进制数值 ,例如字母将转换为 ASCII 码,unicode 将取对应字节的二进制转换为数值。

第二种方式将返回第 (x+1) 字节 到第 y 字节中间的 字符 ,Go 中采取 "左闭右开" 的方式,所以所截取部分包括 index=x,但不包括 index=y。

例如:

func main() {
	println("abcde"[1])          // (1).输出"98"
	println("我是中国人"[1])       // (2).输出"136"
	println("abcde"[0:2])        // (3).输出"ab"
	println("我是中国人"[0:3])     // (4).输出"我"
	println("abcde"[3:4])        // (5).输出"d"
}

分析每一行语句:

  • (1). 取第 2 个字节的二进制值,即字符 b 对应的值,其 ASCII 为 98
  • (2). 取第 2 个字节的二进制值,因为中文占用 3 个字节,所以取第一个字符 "我" 的第二个字节部分,转换为二进制值,为 136
  • (3). 取第 1 个字节到第 3 个字节 (不包括) 中间的字符,所以输出 "ab"
  • (4). 取前三个字节对应的字符,所以输出 "我"
  • (5). 取第 4 个字节对应的字符,所以输出 d

字符串比较

可以使用< <= > >= == !=对字符串进行比较,它将一个字符一个字符地比对。字母以A-Za-z的 ASCII 方式排列。

// 字符串比较
println("a" < "B")  // false

// 数值比较,不是字符串比较
println('a' == 97)  // true

修改字符串

字符串是一个不可变对象,所以对字符串 s 截取后赋值的方式s[1]="c"会报错。

要想修改字符串中的字符,必须先将字符串拷贝到一个 byte slice 中,然后修改指定索引位置的字符,最后将 byte slice 转换回 string 类型。

例如,将 "gaoxiaofang" 改为 "maoxiaofang":

s := "gaoxiaofang"
bs := []byte(s)
bs[0] = 'm'     // 必须使用单引号
s = string(bs)
println(s)

注意修改字符的时候,必须使用单引号,因为它是 byte 类型。

布尔类型 (bool)

bool 类型的值只有两种:true 和 false。

有 3 种布尔逻辑运算符:&& || !,分别别是逻辑与,逻辑或,取反。

func main() {
	println(true && true)    // true
	println(true && false)   // false
	println(true || true)    // true
	println(true || false)   // true
	println(!true)           // false
}

Go 是一门非常严格的怨言,在使用==进行等值比较的时候,要求两边的数据类型必须相同,否则报错。如果两边数据类型是接口类型,则它们必须实现相同的接口函数。如果是常量比较,则两边必须是能够兼容的数据类型。

在 printf 类的函数的格式中,占位符%t用于代表布尔值。

布尔类型的变量、函数名应该以 is 或 Is 的方式开头来表明这是一个布尔类型的东西。例如isSorted()函数用于检测内容是否已经排序,IsFinished()用于判断是否完成。

type 关键字:类型别名

可以使用 type 定义自己的数据类型,例如 struct、interface。

还可以使用 type 定义类型的别名。例如,定义一个 int 类型的别名 INT:

type INT int

这样 INT 类型的底层数据结构还是 int 类型。可以将它和 int 一样使用:

var a INT = 5

type 中可以一次性声明多个别名:

type (
	CT int
	IT int32
	DT float32
)

获取数据类型

reflect 包的 TypeOf()。

package main

import (
	"reflect"
	"fmt"
)

type IT int32
func main() {
	var a IT = 322
	var b = 22
	fmt.Println(reflect.TypeOf(a))   // main.IT
	fmt.Println(reflect.TypeOf(b))   // int
}

上一篇 Go 学习笔记(九)常量和变量
Go 学习笔记(目录)
下一篇 Go 学习笔记(十一)数据类型转换 (strconv 包)