当你声明一个变量时中都发生了什么?
当你在一个.Net应用程序中声明一个变量时,首先要分配一些快到RAM,它包括三样东西,第一个是变量名,第二个是变量的数据类型,最后一个是变量的值。
这只是一个很简单的解释,根据变量的数据类型不同,有两种分配类型:堆栈和堆。
图2 声明变量后的结构堆栈(stack)和堆(heap)
为了帮助理解堆栈和堆,让我们了解下面的代码内部究竟发生了什么。
这个方法内部只有三行代码,下面我就逐行解释内部发生了什么事情。
第一行:执行该行时,编译器分配一小块叫做堆栈的,堆栈负责保持跟踪应用程序运行需要的。
第二行:现在执行移动到下一步,正如堆栈的名称所暗示的那样,这个分配时叠放在前一个分配顶部的,你可以将堆栈理解为一系列隔间或盒子的逐层堆积。
分配和解除分配使用LIFO(Last in first out,后进先出)逻辑,换句话说就是是在的末尾(如堆栈的顶部)分配和解除分配的。
第三行:在第三行我们创建了一个对象,执行该行时,它在堆栈上创建一个指针,真实的对象是存储一个不同类型的分配(叫做堆)中,堆不会跟踪运行的,它只是对象的堆积,堆用于动态分配。
退出方法(有趣):执行完最后一行代码后就该退出这个方法了,当它传递结束控制时,它就会清除分配到堆栈上的所有变量,换句话说就是所有与int数据类型关联的变量按照LIFO方式从堆栈中解除分配。
但不会解除堆分配,这部分要通过GARBAGE COLLECTOR(垃圾回收器)解除分配。
很多人现在可能要问为什么要设置两种分配形式呢?难道就不能用一种分配形式完成分配吗?
如果你仔细观察上图,你就会知道int变量是分配在堆栈上的,因为编译器已经知道它们可以存储多少数据(-2,147,483,648到2,147,483,647),涉及到对象时,编译器不知道需要多少内部空间,因此在堆上分配相同大小的空间。
换句话说就是,如果不知道数据大小或是动态变化的,就需要分配到堆上,如果数据大小是确定的,就分配到堆栈上。
图4 知道变量大小时分配到堆栈上,不知道变量大小时分配到堆上值类型和引用类型
值类型指的是在相同的位置同时容纳数据和的类型,而引用类型是借助一个指针指向位置。下面是一个简单的命名为i的整数数据类型,其值是由另一个命名为j的整数数据类型赋予的,这两个值都是基于堆栈分配的。
当我们将一个int值赋给另一个int值时,它创建一个完全不同的拷贝,换句话说就是,你修改其中一个值不会引起另一个值也发生变化,这种数据类型就叫做值类型。
图5 值类型:一个值的变化不会引起另一个值变化当我们将一个对象赋值给另一个对象时,它们指向相同的位置,如下图所示,当我们将obj赋值给obj1时,它们指向的位置是一样的。换句话说就是,如果我们修改了其中一个对象,另一个对象也会受到影响,这种类型就叫做引用类型。
图 6 引用类型:一个对象的变化会引起另一个对象的变化哪一个数据类型是值类型和引用类型呢?
在.Net中,根据数据类型不同,变量可能是基于堆栈分配的,也可能是基于堆分配的,String和Objects是引用类型,其它.Net数据类型是基于堆栈分配的,下图更详细地进行了解释。
图 7 引用类型和值类型对应.Net中的数据类型
装箱(boxing)和拆箱(unboxing)
说了这么多,在实际编程时怎么使用它们呢?最大的问题是要弄清楚数据从堆栈移到堆的性能损失,反之亦然。
如下图所示,当我们将一个值类型移到引用类型时,数据也从堆栈移到堆中,当我们将引用类型移到值类型时,数据就从堆移到堆栈中。数据从堆栈移到堆,或是从堆移到堆栈,都会产生较大的性能损失。数据从值类型移到引用类型的过程叫做装箱,从引用类型移到值类型叫做拆箱。
图 8 装箱和拆箱过程示意如果你编译上面的代码,在相同的ILDASM中,你会看到在IL中的代码是如何装箱和拆箱的,如下图所示。
图9 装箱和拆箱装箱和拆箱的性能影响
为了查看性能的影响,我们将下面两个函数运行了1000次,如下图所示,左边的函数有装箱拆箱操作,右边的函数没有,我们使用了一个秒表对象监控所花的时间。
图10 有装箱拆箱和无装箱拆箱执行时间对比从上图我们看到,有装修拆箱需要花3542毫秒,无装修拆箱只需2477毫秒,因此对性能的影响还是蛮大的。
现在你对这两个重要的.Net概念是否都理解了呢?
我的理解:
1.堆用来存放动态数据,即所需内存大小未知的变量;栈用来存放静态数据,即所需内存大小已知的变量
2.引用类型包括对象和用&创建的引用类型.引用类型的变量是存在堆中的.
创建一个引用类型时就需要为他在堆中创建一片空间,或者为其指定空间(某些需要直接赋值).
把一个值类型的变量赋给一个引用类型时会在栈中创建一个与值类型所需内存大小相同的空间,然后把值存放在这个空间中.这就是装箱
把引用类型的值放到值类型中就叫拆箱
3.与C#不同.在c++中,line:int& j = i 引用类型会在栈中创建一个空间用来存放i的地址,每次对j进行操作的时候实际上还是对i进行的操作,j只是i的一个别名,那么存他们的地址是相同的吗?