内存对齐的原因

大部分的参考资料都是如是说的:

  • 平台原因(移植原因):不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定类型的数据,否则抛出硬件异常。
  • 性能原因:数据结构(尤其是栈)应该尽可能地在自然边界上对齐。原因在于,为了访问未对齐的内存,处理器需要作两次内存访问;而对齐的内存访问仅需要一次访问。

内存对齐规则

  • 成员的起始位置必须大于先前成员的终止位置,并且是“自身所占字节数”的整数倍;
  • 如果成员也是结构体,那么这个子结构体的起始位置就是“这个子结构体中的最大成员所占字节数”的整数倍;
  • 最后,结构体所占内存的字节数必须是“最大成员所占字节数”的整数倍,不足需补齐。

看下面几个例子就清楚了

假设在32位机器上,结构体中第一个成员: 起始位置 = 0,那么终止位置 = 起始位置 + 成员自身所占的字节数。 例子1:

typedef struct _AA
{
    char c; // 0 (第一个成员的起始位置为0)
    int n; // 4 - 7 (int占四个字节) 规则一
    short s; // 8 - 9 (short占两个字节,但不是最大成员的整数倍,所以需补齐) 10 - 11 规则三
}AA; // 最后,这个结构体所占字节数就是12

例子2:

typedef struct _CC
{
    char name[2]; // 0 - 1
    int id; // 4 - 7 规则一
    double score; // 8 - 15
    short grade; // 16 - 17
    AA aa; // 20 - 31 (本来起始位置是从18开始,但是18并不是最大成员int的整数倍,所以需从20开始) 规则二
}CC; // 最后,所占字节数为32

#pragma pack(n)

通过上面这条语句可以改变“对齐系数”,对以上对齐规则的影响是: 规则一中的“自身所占字节数”,规则二中的“这个子结构体中的最大成员所占字节数”,规则三中的“最大成员所占字节数”都要与 “对齐系数n”进行比较,取小者。 例子3:

// 不指定对齐系数,即采用默认对齐系数
typedef struct _DD
{
    char c; // 0
    double d; // 8 - 15
    short s; // 16 - 17 18 - 23
}DD; // 大小是24

例子4:

// 指定对齐系数为4
#pragma pack(4)
typedef struct _DD
{
    char c; // 0
    double d; // 4 - 11 (double自身字节数是8个字节,与4进行比较,取4的倍数)
    short s; // 12 - 13 14 - 15 (最大成员字节数8也与4进行比较,补齐时取4的倍数)
}DD; // 大小是16

以上就简单的介绍了一下结构体大小的计算方法,如有不正确的地方欢迎指正。

2011-07-09

聊天