Go语言学习之剖析slice底层实现
在Go语言中,slice(切片)是Gopher开发中最常用到的一种数据结构,又称为动态数组,其长度并不固定,我们可以向切片中追加元素,它会在容量不足时自动扩容。本文将结合Go1.15源码 + windows amd64位机,对slice的底层实现进行深入剖析。
slice创建
在Go语言中,创建切片的方式有一下几种 :
| 序号 | 方式 | 示例 |
|---|---|---|
| 1 | 直接声明 | var slice []int |
| 2 | new | *new([]int) |
| 3 | 字面量 | []int{1, 2, 3} |
| 4 | make | make([]int, 1, 2) |
| 5 | 从切片/数组截取 | array[:] / sourceSlice[:] |
不同的创建方式对应的底层实现也有一定的区别,在后文笔者会从汇编层面上对这几种方式的汇编实现进行剖析,如有偏颇之处,敬请指正。
前置知识
为了方便读者理解,也为了行文结构清晰,在正式介绍slice源码之前,笔者想先对后面涉及到的一些内置类型和常量进行说明
unsafe.Pointer
该类型是一个指针类型,并且任何类型的指针值都可以转换为该类型,该类型可以转换为任何类型的指针值。更多介绍可以直接查看src/unsafe/unsafe.go中对Pointer的注释,非常详细
_type
用于记录slice一些信息,其中的size字段就记录了该slice类型的大小(int64类型slice中size字段为8)
uintptr
该类型是GoLang的内置类型,在64位机上可以理解为一个64位无符号整数,能够表示64位机上所有的地址
PtrSize
src/runtime/internal/sys中定义的常量:
const PtrSize = 4 << (^uintptr(0) >> 63) // 在64位机上值为 8
MaxUintptr
runtime/internal/math/math.go中定义的常量:
const MaxUintptr = ^uintptr(0) // 在64位机上值为0xffff ffff ffff ffff ffff ffff ffff ffff
maxAlloc
runtime/malloc.go中定义的常量,根据源码注释:在64位机上取值为2^32 - 1
receenabled
是否开启race竞态检测,默认为false,当使用build -race时为true
msanenabled
使用build -msan时为true,windows amd64位机不支持该命令
到此,笔者对后面所有需要用到的类型,常量都做了简单了介绍,如果读者对某些地方有疑问或者不理解,不妨直接查看源码或写一写demo测试验证一下自己的疑惑;另外,笔者也会在后文用到以上类型/常量时再次进行介绍,希望能够解决读者的问题。
slice源码
slice相关源码位于/src/runtime/slice.go下,在本节笔者将对slice源码文件进行全面解读,本节内容是笔者基于自己理解并结合相关资料总结的来,难免会出现偏颇甚至错误之处,请读者批评指正。
slice底层结构
slice底层由runtime/slice.go中的结构体slice表示
type slice struct {
array unsafe.Pointer // 指向一块连续内存,该内存中存放的是slice中的数据
len int // 记录slice当前长度
cap int // 记录slice当前容量
} 至此我们可以用下图来表示一个slice示例
构造切片-makeslice()
该函数用来构造一个slice对象,源码如下
// input: et: slice类型元信息,slice长度,slice容量
func makeslice(et *_type, len, cap int) unsafe.Pointer {
// 调用MulUintptr函数:获取创建该切片需要的内存,是否溢出(超过2^64)
// 2^64是64位机能够表示的最大内存地址
mem, overflow := math.MulUintptr(et.size, uintptr(cap))
// 如果溢出 | 超过能够分配的最大内存(2^32 - 1) | 非法输入, 报错并返回
if overflow || mem > maxAlloc || len < 0 || len > cap {
mem, overflow := math.MulUintptr(et.size, uintptr(len))
if overflow || mem > maxAlloc || len < 0 {
panicmakeslicelen()
}
panicmakeslicecap()
}
// 调用mallocgc函数分配一块连续内存并返回该内存的首地址
// 该函数实现涉及到了go语言内存管理,比较复杂,不是本文的主题
// 后面会单独介绍
return mallocgc(mem, et, true)
} 可以看到makeslice()函数的源码逻辑非常简单:根据slice类型,长度以及容量计算出需要的内存大小,如果合法则调用mallocgc申请相应的连续内存并返回首地址。那么是如何计算出所需的内存大小呢?让我们再看看MulUintptr()函数
func MulUintptr(a, b uintptr) (uintptr, bool) {
// 如果slice类型大小为0(如struct{}类型) 或 (a | b) < 2 ^ 32,肯定不会发生溢出
if a|b < 1<<(4*sys.PtrSize) || a == 0 {
return a * b, false
}
// 如果a * b > 2 ^64,说明发生了溢出
overflow := b > MaxUintptr/a
return a * b, overflow
} MulUintptr函数的实现也比较简单,利用一些已有常量计算所需内存大小并判断是否溢出。
切片扩容-growslice()
切片是一个动态数组,当容量不足时会自动扩容,自动扩容实际上就是调用growslice()函数
func growslice(et *_type, old slice, cap int) slice {
// 默认为false, 如果go build 时添加了 -race参数, raceenabled = true
if raceenabled {
callerpc := getcallerpc()
racereadrangepc(old.array, uintptr(old.len*int(et.size)), callerpc, funcPC(growslice))
}
// 默认为false, 如果go build 时添加了 -msan参数, msanenabled = true
if msanenabled {
msanread(old.array, uintptr(old.len*int(et.size)))
}
// 如果cap < old.cap,说明cap溢出
if cap < old.cap {
panic(errorString("growslice: cap out of range"))
}
// 如果et.size, 说明类型大小为0, 直接返回 zerobase 类型的新切片
if et.size == 0 {
return slice{unsafe.Pointer(&zerobase), old.len, cap}
}
newcap := old.cap
doublecap := newcap + newcap
// 如果需要的容量大于老容量的2倍, 直接将扩容后新容量设置为需要的容量大小
// 也就是不需要进行2倍或者1.25倍的增长
if cap > doublecap {
newcap = cap
} else {
// 如果老容量小于1024, 2倍扩容
if old.len < 1024 {
newcap = doublecap
} else {
// 以1.25倍增大新容量, 直到溢出或者新容量大于需要的容量为止
for 0 < newcap && newcap < cap {
newcap += newcap / 4
}
// 如果溢出,那么将新容量设置为需要的容量
if newcap <= 0 {
newcap = cap
}
}
}
var overflow bool
var lenmem, newlenmem, capmem uintptr
switch {
// 当类型大小为1时,不需要乘除计算就能够得到所需要的值
case et.size == 1:
lenmem = uintptr(old.len)
newlenmem = uintptr(cap)
// 内存对齐
capmem = roundupsize(uintptr(newcap))
// 判断是否溢出
overflow = uintptr(newcap) > maxAlloc
newcap = int(capmem)
// 当类型大小是8个字节时
case et.size == sys.PtrSize:
lenmem = uintptr(old.len) * sys.PtrSize
newlenmem = uintptr(cap) * sys.PtrSize
capmem = roundupsize(uintptr(newcap) * sys.PtrSize)
overflow = uintptr(newcap) > maxAlloc/sys.PtrSize
newcap = int(capmem / sys.PtrSize)
// 当类型大小是2的幂次方时
case isPowerOfTwo(et.size):
var shift uintptr
if sys.PtrSize == 8 {
// Mask shift for better code generation.
shift = uintptr(sys.Ctz64(uint64(et.size))) & 63
} else {
shift = uintptr(sys.Ctz32(uint32(et.size))) & 31
}
lenmem = uintptr(old.len) << shift
newlenmem = uintptr(cap) << shift
capmem = roundupsize(uintptr(newcap) << shift)
overflow = uintptr(newcap) > (maxAlloc >> shift)
newcap = int(capmem >> shift)
// 当大小不是上面任何一种时
default:
lenmem = uintptr(old.len) * et.size
newlenmem = uintptr(cap) * et.size
capmem, overflow = math.MulUintptr(et.size, uintptr(newcap))
capmem = roundupsize(capmem)
newcap = int(capmem / et.size)
}
// 如果发生了溢出
if overflow || capmem > maxAlloc {
panic(errorString("growslice: cap out of range"))
}
var p unsafe.Pointer
// 如果是切片类型是指针类型,那么会调用memclrNoHeapPointers将
// newlenmem以后的capmem-newlenmem全部置0
if et.ptrdata == 0 {
// 申请一块capmem大小的连续内存并返回首地址
p = mallocgc(capmem, nil, false)
memclrNoHeapPointers(add(p, newlenmem), capmem-newlenmem)
} else {
p = mallocgc(capmem, et, true)
if lenmem > 0 && writeBarrier.enabled {
bulkBarrierPreWriteSrcOnly(uintptr(p), uintptr(old.array), lenmem-et.size+et.ptrdata)
}
}
// 将老切片上的元素移动到新的内存中
memmove(p, old.array, lenmem)
// 返回新的切片
return slice{p, old.len, newcap}
} growslice扩容逻辑如下:下面笔者用: needCap代表需要的容量,oldCap代表老切片容量,newCap代表新切片内存对齐前的容量
- 如果切片类型大小为0,直接返回新切片
- 如果
needCap > oldCap * 2,则newCap = needCap - 如果
oldCap < 1024,则newCap = oldCap * 2 oldCap = oldCap * 1.25,直到oldCap>needCap或oldCap < 0为止,如果没有发生溢出,此时的oldCap就是newCap- 根据切片类型的大小(1、8、2的幂次方、普通)求得 新切片得长度,容量
- 将老切片中的内容拷贝到新切片
- 返回新切片
从源码可以看出,newCap并不是新切片真正的cap,还需要进行内存对齐操作,目的是为了提高内存的分配效率并减少碎片。内存对齐操作由roundupsize实现,源码如下:
func roundupsize(size uintptr) uintptr {
// 如果size < 32768(2的15次方)
if size < _MaxSmallSize {
// 如果size < 1024 - 8(2的10次方 - 8)
if size <= smallSizeMax-8 {
return uintptr(class_to_size[size_to_class8[divRoundUp(size, smallSizeDiv)]])
} else {
return uintptr(class_to_size[size_to_class128[divRoundUp(size-smallSizeMax, largeSizeDiv)]])
}
}
if size+_PageSize < size {
return size
}
return alignUp(size, _PageSize)
} 该函数实现比较简单,根据当前大小,利用代码中硬编的一些参数来进行内存扩容
切片拷贝-copy()
当我们使用copy(src, dst)来进行切片拷贝时,编译器会根据是否是运行时调用分情况进行处理(具体逻辑见src/cmd/compile/internal/walk.go中copyany()函数):
非运行时调用,copy会被转换
memmove函数,该函数使用汇编实现,并且和平台相关,其源码文件位于src/runtime/memmove_*.s中。运行时调用,copy会被转换为
src/runtime/slice.go中的slicecopy()函数,该函数源码如下
func slicecopy(toPtr unsafe.Pointer, toLen int, fmPtr unsafe.Pointer, fmLen int, width uintptr) int {
if fmLen == 0 || toLen == 0 {
return 0
}
n := fmLen
if toLen < n {
n = toLen
}
if width == 0 {
return n
}
if raceenabled {
callerpc := getcallerpc()
pc := funcPC(slicecopy)
racereadrangepc(fmPtr, uintptr(n*int(width)), callerpc, pc)
racewriterangepc(toPtr, uintptr(n*int(width)), callerpc, pc)
}
if msanenabled {
msanread(fmPtr, uintptr(n*int(width)))
msanwrite(toPtr, uintptr(n*int(width)))
}
size := uintptr(n) * width
if size == 1 { // common case worth about 2x to do here
// TODO: is this still worth it with new memmove impl?
*(*byte)(toPtr) = *(*byte)(fmPtr) // known to be a byte pointer
} else {
memmove(toPtr, fmPtr, size)
}
return n
} 可以看到该函数实际上还是调用了memmove函数来实现copy。
结合Plan9汇编
到此为止,src/runtime/slice.go中slice源码的重要部分笔者已经介绍完毕了,下面就结合Plan9汇编来看一下slice汇编层面上的一些实现,从而帮助读者更好的理解slice的实现。
获取汇编代码
再开始之前,读者需要了解一下两个获取汇编代码的命令
go tool compile -S -N -l xxx.go:该命令接受一个.go源码文件,并且能够在控制台打印出该源码文件的汇编代码go tool objdump xxx.exe:该命令接受一个可执行文件(windows下是.exe),对其反汇编得到相应的汇编代码,使用该命令前需要使用go build -gcflags="-N -l" xxx.go获取可执行文件,其中-gcflags="-N -l"能够禁止编译器在编译期间进行优化,以确保反汇编得到的汇编代码最大程度上和源码对应。
深入汇编实现
笔者将通过汇编代码,探究以不同方式创建slice时汇编实现的不同以及slice在汇编代码中的表示。
声明方式
当我们以如下方式创建slice时
func main() {
var slice []int
_ = slice
} 查看汇编代码如下
"".main STEXT nosplit size=40 args=0x0 locals=0x20
0x0000 00000 (main.go:3) TEXT "".main(SB), NOSPLIT|ABIInternal, $32-0 // 局部变量+可能需要的额外调用函数的参数空间的总大小为32(不包括调用其它函数时的 ret address 的大小), 0表示函数的参数 + 返回值大小为0
0x0000 00000 (main.go:3) SUBQ $32, SP // 当前函数栈为32字节
0x0004 00004 (main.go:3) MOVQ BP, 24(SP)
0x0009 00009 (main.go:3) LEAQ 24(SP), BP // 存放调用者BP
... // 省略部分GC相关汇编
0x000e 00014 (main.go:6) MOVQ $0, "".slice(SP) // 存放sliceHeader的array字段
0x0016 00022 (main.go:6) XORPS X0, X0 // X0是一个128位寄存器,将X0寄存器清0
0x0019 00025 (main.go:6) MOVUPS X0, "".slice+8(SP) // 将SP + 8开始的16个字节赋值为0,即len = 0, cap = 0
0x001e 00030 (main.go:15) MOVQ 24(SP), BP // 恢复调用者BP
0x0023 00035 (main.go:15) ADDQ $32, SP // 清除当前函数栈帧
0x0027 00039 (main.go:15) RET // 返回 通过以上汇编代码我们发现,当使用声明方式创建slice时,底层并没有调用makeslice函数,而是简单的使用栈中的三个值
(SP, SP + 8, SP + 16)来表示一个slice的array, len和cap。如下图:
new关键字
当我们以如下方式创建slice时
func main() {
slice := *new([]int)
_ = slice
} 由于new()函数返回对象指针,因此我们需要使用*对返回值进行取值操作从而获取slice对象,查看汇编代码如下
"".main STEXT nosplit size=82 args=0x0 locals=0x40
0x0000 00000 (main.go:3) TEXT "".main(SB), NOSPLIT|ABIInternal, $64-0 // 局部变量+可能需要的额外调用函数的参数空间的总大小为64(不包括调用其它函数时的 ret address 的大小), 0表示函数的参数 + 返回值大小为0
0x0000 00000 (main.go:3) SUBQ $64, SP // main函数栈大小为64字节
0x0004 00004 (main.go:3) MOVQ BP, 56(SP)
0x0009 00009 (main.go:3) LEAQ 56(SP), BP // 存储调用者BP,并修改BP为当前main函数BP
... // 省略部分GC相关汇编代码
0x000e 00014 (main.go:4) MOVQ $0, ""..autotmp_2+32(SP) // 将SP + 32位置的8个字节置0
0x0017 00023 (main.go:4) XORPS X0, X0 // 将128位X0寄存器清0
0x001a 00026 (main.go:4) MOVUPS X0, ""..autotmp_2+40(SP) // 将SP + 40位置的16个字节置0,用于表示sliceHeader的len和cap
... // 省略GC相关汇编,下面GC相关汇编全被省略
0x001f 00031 (main.go:4) LEAQ ""..autotmp_2+32(SP), AX
0x0024 00036 (main.go:4) MOVQ AX, ""..autotmp_1(SP) // 这两条汇编将sliceHeader开始的地址值赋值给SP开始的8个字节
0x0028 00040 (main.go:4) TESTB AL, (AX)
0x002a 00042 (main.go:4) MOVQ ""..autotmp_2+32(SP), AX
0x002f 00047 (main.go:4) MOVQ ""..autotmp_2+40(SP), CX
0x0034 00052 (main.go:4) MOVQ ""..autotmp_2+48(SP), DX
0x0039 00057 (main.go:4) MOVQ AX, "".slice+8(SP) // sliceHeader的array字段
0x003e 00062 (main.go:4) MOVQ CX, "".slice+16(SP) // sliceHeader的len字段
0x0043 00067 (main.go:4) MOVQ DX, "".slice+24(SP) // sliceHeader的cap字段
0x0048 00072 (main.go:5) MOVQ 56(SP), BP
0x004d 00077 (main.go:5) ADDQ $64, SP // 恢复调用者BP,清除当前栈帧
0x0051 00081 (main.go:5) RET // 返回
字面量
当我们以如下方式创建slice时
func main() {
slice := []int{1, 2, 3}
_ = slice
} 查看汇编代码如下
"".main STEXT nosplit size=108 args=0x0 locals=0x40
0x0000 00000 (main.go:3) TEXT "".main(SB), NOSPLIT|ABIInternal, $64-0
0x0000 00000 (main.go:3) SUBQ $64, SP
0x0004 00004 (main.go:3) MOVQ BP, 56(SP)
0x0009 00009 (main.go:3) LEAQ 56(SP), BP // 构造main函数栈帧并存储调用者BP
... // 省略GC相关汇编,下面直接省略不做提示
0x000e 00014 (main.go:4) MOVQ $0, ""..autotmp_3(SP)
0x0016 00022 (main.go:4) XORPS X0, X0
0x0019 00025 (main.go:4) MOVUPS X0, ""..autotmp_3+8(SP) // 将SP开始的24字节置0, 该内存用于后面存储切片元素
0x001e 00030 (main.go:4) LEAQ ""..autotmp_3(SP), AX
0x0022 00034 (main.go:4) MOVQ AX, ""..autotmp_1+24(SP) // 将SP + 24开始的8个字节置为sliceHeader中array的首地址
0x0027 00039 (main.go:4) TESTB AL, (AX)
0x0029 00041 (main.go:4) MOVQ $1, ""..autotmp_3(SP) // 存储切片元素1
0x0031 00049 (main.go:4) TESTB AL, (AX)
0x0033 00051 (main.go:4) MOVQ $2, ""..autotmp_3+8(SP) // 存储切片元素2
0x003c 00060 (main.go:4) TESTB AL, (AX)
0x003e 00062 (main.go:4) MOVQ $3, ""..autotmp_3+16(SP) // 存储切片元素3
0x0047 00071 (main.go:4) TESTB AL, (AX)
0x0049 00073 (main.go:4) JMP 75
0x004b 00075 (main.go:4) MOVQ AX, "".slice+32(SP) // 存储sliceHeader的array字段
0x0050 00080 (main.go:4) MOVQ $3, "".slice+40(SP) // 存储sliceHeader的len字段
0x0059 00089 (main.go:4) MOVQ $3, "".slice+48(SP) // 存储sliceHeader的cap字段
0x0062 00098 (main.go:5) MOVQ 56(SP), BP
0x0067 00103 (main.go:5) ADDQ $64, SP // 恢复调用者BP并清除当前函数栈帧
0x006b 00107 (main.go:5) RET // 返回 由于进行了逃逸分析后发现当前slice切片可以在栈上分配,所以编译器再将slice的内容{1, 2, 3}都分配在了栈上。
make方式
当我们以如下方式创建slice时
func main() {
slice := make([]int, 1, 2)
_ = slice
} 查看汇编代码如下
"".main STEXT nosplit size=64 args=0x0 locals=0x30
0x0000 00000 (main.go:3) TEXT "".main(SB), NOSPLIT|ABIInternal, $48-0
0x0000 00000 (main.go:3) SUBQ $48, SP
0x0004 00004 (main.go:3) MOVQ BP, 40(SP)
0x0009 00009 (main.go:3) LEAQ 40(SP), BP // 创建main函数栈帧并保存调用者BP
... // 省略GC相关汇编
0x000e 00014 (main.go:4) XORPS X0, X0
0x0011 00017 (main.go:4) MOVUPS X0, ""..autotmp_1(SP)
0x0015 00021 (main.go:4) LEAQ ""..autotmp_1(SP), AX
0x0019 00025 (main.go:4) TESTB AL, (AX)
0x001f 00031 (main.go:4) MOVQ AX, "".slice+16(SP) // sliceHeader的array字段
0x0024 00036 (main.go:4) MOVQ $1, "".slice+24(SP) // len字段
0x002d 00045 (main.go:4) MOVQ $2, "".slice+32(SP) // cap字段
0x0036 00054 (main.go:5) MOVQ 40(SP), BP
0x003b 00059 (main.go:5) ADDQ $48, SP // 恢复调用者BP,清除当前栈帧
0x003f 00063 (main.go:5) RET // 返回
可以看到,这里虽然使用了make关键字,但是实际执行时却并没有调用makeslice函数,这是什么原因呢?这是因为编译器在编译时会进行一个判断:如果切片足够小并且没有发生逃逸,编译器会在栈上或者静态存储区开辟一块内存,并不会调用makeslice在堆上分配。下面来看一下调用makeslice在堆上分配的例子:
我们创建一个大切片,从而达到堆上分配的目的,代码如下
func main() {
slice := make([]int, 1, 10000)
_ = slice
} 汇编代码如下所示
"".main STEXT size=115 args=0x0 locals=0x40
0x0000 00000 (main.go:3) TEXT "".main(SB), ABIInternal, $64-0
... // 省略栈分裂,GC相关汇编
0x0016 00022 (main.go:3) SUBQ $64, SP
0x001a 00026 (main.go:3) MOVQ BP, 56(SP)
0x001f 00031 (main.go:3) LEAQ 56(SP), BP // 开辟当前main函数栈帧并保存调用者BP
... // 省略GC相关代码
0x0024 00036 (main.go:4) LEAQ type.int(SB), AX // 获取int类型大小
0x002b 00043 (main.go:4) MOVQ AX, (SP)
0x002f 00047 (main.go:4) MOVQ $1, 8(SP)
0x0038 00056 (main.go:4) MOVQ $10000, 16(SP) // 分别将size, len, cap作为调用makeslice参数压栈
0x0041 00065 (main.go:4) CALL runtime.makeslice(SB) // 调用makeslice创建slice
0x0046 00070 (main.go:4) MOVQ 24(SP), AX // 将makeslice函数返回值保存到AX中
0x004b 00075 (main.go:4) PCDATA $0, $0
0x004b 00075 (main.go:4) MOVQ AX, "".slice+32(SP)
0x0050 00080 (main.go:4) MOVQ $1, "".slice+40(SP)
0x0059 00089 (main.go:4) MOVQ $10000, "".slice+48(SP) // 将sliceHeader的array, len, cap字段保存在SP + 32开始的24个字节中
0x0062 00098 (main.go:15) MOVQ 56(SP), BP
0x0067 00103 (main.go:15) ADDQ $64, SP // 恢复调用者BP,清除当前栈帧
0x006b 00107 (main.go:15) RET // 返回 可以看到,这里笔者特意将slice的cap设为10000,这样编译器在处理时就会选择在堆上创建slice而不是在栈上。
从数组中获取
当我们以如下方式创建slice时
func main() {
array := [3]int{1, 2, 3}
slice := array[:1]
_ = slice
} 查看汇编代码如下
"".main STEXT nosplit size=99 args=0x0 locals=0x38
0x0000 00000 (main.go:3) TEXT "".main(SB), NOSPLIT|ABIInternal, $56-0
0x0000 00000 (main.go:3) SUBQ $56, SP
0x0004 00004 (main.go:3) MOVQ BP, 48(SP)
0x0009 00009 (main.go:3) LEAQ 48(SP), BP // 开辟main函数栈帧并保存调用者BP
0x000e 00014 (main.go:4) MOVQ $0, "".array(SP)
0x0016 00022 (main.go:4) XORPS X0, X0
0x0019 00025 (main.go:4) MOVUPS X0, "".array+8(SP) // 将SP开始的24个字节置0
0x001e 00030 (main.go:4) MOVQ $1, "".array(SP)
0x0026 00038 (main.go:4) MOVQ $2, "".array+8(SP)
0x002f 00047 (main.go:4) MOVQ $3, "".array+16(SP) // 为数组元素赋值
0x0038 00056 (main.go:5) LEAQ "".array(SP), AX // 将数组首地址赋值给AX
0x003c 00060 (main.go:5) TESTB AL, (AX)
0x0042 00066 (main.go:5) MOVQ AX, "".slice+24(SP)
0x0047 00071 (main.go:5) MOVQ $1, "".slice+32(SP)
0x0050 00080 (main.go:5) MOVQ $3, "".slice+40(SP) // 分别将array, len, cap填充到栈
0x0059 00089 (main.go:17) MOVQ 48(SP), BP
0x005e 00094 (main.go:17) ADDQ $56, SP // 恢复调用者BP并清楚栈帧
0x0062 00098 (main.go:17) RET // 返回 可以看到当我们从数组中获取slice时,数组和slice底层实际上共用了一块连续内存来存储数据。这里由于编译器判断数据量比较小且并没有发生逃逸,因此将数据分配在了栈上,下面来看一看分配在堆上的示例
func main() {
getSlice()
}
func getSlice() []int {
array := [3]int{1, 2, 3}
slice := array[:1]
return slice
} 可以看到这里笔者在getSlice()函数中创建一个slice并返回给main函数,使其发生逃逸,下面来看一看getSlice的汇编代码
"".getSlice STEXT size=181 args=0x18 locals=0x38
0x0000 00000 (main.go:16) TEXT "".getSlice(SB), ABIInternal, $56-24 // 局部变量+可能需要的额外调用函数的参数空间的总大小为56(不包括调用其它函数时的 ret address 的大小), 24表示函数的参数 + 返回值大小为24,由于getSlice函数没有参数,24就是返回值,即sliceHeader三个字段的大小
// 省略GC和栈分裂相关汇编
0x001a 00026 (main.go:16) SUBQ $56, SP
0x001e 00030 (main.go:16) MOVQ BP, 48(SP)
0x0023 00035 (main.go:16) LEAQ 48(SP), BP // 开辟getSlice函数栈帧,保存调用者(main函数)BP
... // 省略GC相关汇编
0x0028 00040 (main.go:16) MOVQ $0, "".~r0+64(SP)
0x0031 00049 (main.go:16) XORPS X0, X0
0x0034 00052 (main.go:16) MOVUPS X0, "".~r0+72(SP) // 将main函数中局部变量slice的三个字段置0
0x0039 00057 (main.go:17) LEAQ type.[3]int(SB), AX // 获取[3]int类型数组大小
0x0040 00064 (main.go:17) MOVQ AX, (SP)
0x0044 00068 (main.go:17) CALL runtime.newobject(SB) // 调用newobject在堆上创建数组
0x0049 00073 (main.go:17) MOVQ 8(SP), AX
0x004e 00078 (main.go:17) MOVQ AX, "".&array+16(SP) // 将数组首地址保存在SP + 16开始的8个字节中
0x0053 00083 (main.go:17) MOVQ ""..stmp_0(SB), CX
0x005a 00090 (main.go:17) MOVQ CX, (AX)
0x005d 00093 (main.go:17) MOVUPS ""..stmp_0+8(SB), X0
0x0064 00100 (main.go:17) MOVUPS X0, 8(AX)
0x0068 00104 (main.go:18) MOVQ "".&array+16(SP), AX // 为数组赋值{1, 2, 3}
0x0073 00115 (main.go:18) MOVQ AX, "".slice+24(SP)
0x0078 00120 (main.go:18) MOVQ $1, "".slice+32(SP)
0x0081 00129 (main.go:18) MOVQ $3, "".slice+40(SP) // 从数组创建slice切片
0x008a 00138 (main.go:19) MOVQ AX, "".~r0+64(SP)
0x008f 00143 (main.go:19) MOVQ $1, "".~r0+72(SP)
0x0098 00152 (main.go:19) MOVQ $3, "".~r0+80(SP) // 设置main函数局部变量slice的三个字段
0x00a1 00161 (main.go:19) MOVQ 48(SP), BP
0x00a6 00166 (main.go:19) ADDQ $56, SP // 恢复main函数BP,清除getSlice函数栈帧
0x00aa 00170 (main.go:19) RET // 返回
""..stmp_0 SRODATA size=24
0x0000 01 00 00 00 00 00 00 00 02 00 00 00 00 00 00 00 ................
0x0010 03 00 00 00 00 00 00 00 可以看到当发生逃逸时,就会调用newobject在堆上创建一个数组,然后slice和该数组共享底层的连续内存
总结
在本节中通过汇编代码可以很清楚的看到,slice在底层实现是通过三个变量::
- array : 保存数据的连续内存首地址
- len: 数据长度
- cap: 连续内存大小
并且当slice较小且没有发生逃逸时,编译器会选择在栈上分配而不是在堆上来保证效率。
查看8道真题和解析