字节序和位序
一、基本概念
1、字节序
字节序是指多字节的数据在内存中的排列顺序,按照排列顺序分为大端字节序和小端字节序。
1.1 大小端字节序
大端字节序:内存的低地址存放数据的高位部分。
小端字节序:内存的低地址存放数据的低位部分。
内存地址空间:CPU的最小寻址空间是字节,内存中每个字节都有唯一的地址编号,在32位的机器上,寻址宽度是32位,寻址空间为(0x00000000~0xFFFFFFFF),地址从0x00000000到0xFFFFFFFF增长;地址小的即为低地址空间,地址大的为高地址。
数据的低位和高位:指的是数据的逻辑位,按照正常的表述方式,靠左边的数据部分是高位,靠右边的数据部分相对低位,如123456。
举例说明:
对于一个占据4个字节的数据0x12345678,假设存储在从0x00000000到0x00000003的内存空间中,按照大端和小端方式存储在内存中的形式如下,
地址空间 | 0x00000000 | 0x00000001 | 0x00000002 | 0x00000003 |
大端存储 | 78 | 56 | 34 | 12 |
小端存储 | 12 | 34 | 56 | 78 |
1.2 网络字节序
为了保证大小端不同的主机之间的网络通信 ,统一规定网络字节序为大端字节序。
注意,网络中发送报文的顺序是从低地址开始发送,按字节依次发送。
如果发送的是一段字节间相互”独立“的数据(如一串由ascii码编码的字符串),发送数据时不需要做大小端转换处理。
那发送什么数据的时候,需要注意大小端呢?发送由多个字节组成的数据时要注意处理字节序,我们比较熟悉的socket通信api中有个struct sockaddr_in结构,当给sin_port成员赋值的时候我们需要用htons函数给端口值做个字节序转换,这个端口值正是一个short类型的数据,占用两个字节的空间。
2、位序
一个字节是由8个比特位构成的,那么在不同的机器上,这8个比特的顺序有差异吗?也是有的。
2.1 大端字节序和小端字节序
一个字节中的比特位也分为高比特位和低比特位,高位比特又叫MSB,低位叫做LSB。注意,高位比特和低位比特是按照比特位在字节中的逻辑位来区分的,比如十进制数字2,二进制码是10,其中MSB是1,LSB是0。
虽然计算机的最小寻址单位是字节,但是字节内的每个比特位空间也是有先后顺序的,尽管这个空间我们无法直接访问,为了方便解释,我们记字节内的比特空间由低到高依次为bit0、bit1、bit2、bit3、bit4、bit5、bit6、bit7。
大端位序:低比特空间存放MSB。
小端位序:低比特空间存放LSB。
大端字节序的主机也是大端位序,小端字节序的主机也是小端位序。
例子:
对于一个二进制数据(MSB)1100 1111(LSB),存放在大端位序和小端位序的内存中,结构如下
比特空间 | bit0 | bit1 | bit2 | bit3 | bit4 | bit5 | bit6 | bit7 |
大端位序 | 1 | 1 | 0 | 0 | 1 | 1 | 1 | 1 |
小端位序 | 1 | 1 | 1 | 1 | 0 | 0 | 1 | 1 |
2.2 网络比特序
网络中发送每个字节也是按bit位依次发送的,但是注意,并不是从低比特空间(bit0)到高比特空间(bit7)的顺序发送,而是默认先发送MSB,最后发送LSB。这就要求在小端位序的机器上先发送bit7,而在大端位序的主机上先发送bit0,但这些都由计算机自身处理,和我们没有关系。但是我们在定义位域的时候需要注意了,因为先定义的数据存放在低比特空间,所以在小端机器上LSB要先定义,在大端机器上MSB要先定义,一句话概括就是,定义的位域要符合自身机器的比特序。
二、应用
1、 C语言中的位域
2、 websocket协议头定义
参考博文:一文带你秒懂 字节序(byte order),比特序(bit order),位域(bit field)_byteorder-****博客
上一篇: 比特、字节和字之间的区别
下一篇: 在一篇文章中详细解释字节序!
推荐阅读
-
字节序和位序
-
位、字节、半字、字和内存位宽的概念
-
字、字节、字长和位的概念和区别
-
位、字节、WORD、DWORD 的区别和联系 - Unicode 和 ANSI 的区别就像输入法中 "全宽 "和 "半宽 "的区别一样。 由于不同的 ANSI 编码有不同的标准(不同的字符集),对于给定的多字节字符串,我们必须知道它使用的是哪种字符集,才能知道它包含哪些 "字符"。对于 UNICODE 字符串来说,无论环境如何,它所代表的 "字符 "内容始终是相同的。Unicode 有一个统一的标准,定义了世界上大多数字符的编码,因此拉丁文、数字、简体中文、繁体中文和日文都可以存储在一个编码中。统一码是一个统一的标准,定义了世界上大多数字符的编码。 比特(Bit)和字节(Byte)的区别:例如USB2.0 标准接口的传输速率为 480Mbps,有一些人误认为是每秒 480 兆比特,同样网络带宽为 2MB,就容易误认为是每秒 2 兆比特。其实,480Mbps 应该是 480 兆比特/秒或 480 兆字节/秒,它等于 "60 兆字节/秒";同样,2MB,应该是 256 兆字节/秒。 Bit 和 Byte 译为 "比特",都是数据计量单位,比特="位 "或 "比特"。 Byte = 字节,即 1byte = 8bits,两者的换算关系为 1:8。 Mbps = mega bits per second(兆位/秒)是速率单位,因此 2M 带宽应为 2 兆位/秒,即 2MBps。MB = 兆字节(Megabytes,兆字节)是单位量,1MB/S(兆字节/秒)= 8MBPS(兆字节/秒)。 通常所说的硬盘容量是指 40GB、80GB、100GB,其中的 B 是指 Byte 也称为 "字节"。 1 KB=1024 字节 1 MB=1024 KB=1024*1024 字节 1 GB=1024 MB=1024*1024*1024 字节 例如,以前所谓的 56KB MODEM 转换过来的 56KBps 除以 8 就是 7Kbyte,所以真正从网上下载文件存在硬盘上的速度也是每秒 7Kbyte;也就是说,用 B 表示传输速度一般指 Bit;用 B 表示容量一般指 Byte。比特、字节、WORD、DWORD 的本质。
-
= 0; i--) {
printf("%5d", *(p + i));
}
printf("\n");
return 0;
}
```
2. 利用指针计算奇数索引数组元素之和
```c
// 使用指针计算奇数索引数组元素之和
#include
int main() { int arr[] = {1, 2, 3, 4, 5, 6, 7, 8, 9}; int n = sizeof(arr) / sizeof(arr[0]); printf("数组元素: "); for (int i = 0; i < n; i++) { printf("%3d", arr[i]); // 宽度为3,右对齐 } printf("\n"); printf("数组下标: "); for (int i = 0; i < n; i++) { printf("%3d", i); // 宽度为3,右对齐 } printf("\n"); int sum = 0; int *p = arr; // 声明指向整数的指针 for (int i = 0; i < n; i++) { if (i % 2 != 0) { sum += *(p + i); // 若索引i为奇数,累加对应元素值 } } printf("奇数索引数组元素之和: %d\n", sum); return 0; } ``` 3. 查看不同类型指针在Linux Ubuntu gcc下的字节大小 ```c // 在Linux Ubuntu gcc环境下查看不同类型指针的字节大小 #include #include int main() { printf("int指针大小: %zu bytes\n", sizeof(int *)); printf("char指针大小: %zu bytes\n", sizeof(char *)); printf("float指针大小: %zu bytes\n", sizeof(float *)); printf("double指针大小: %zu bytes\n", sizeof(double *)); return 0; } ``` 请注意,对于现代64位系统(如Linux),`int`、`char`、`float`和`double`指针通常都是8字节。但在某些特定情况下(如32位系统或特定编译环境),可能有所不同。 4. 使用指针遍历并打印字符数组 ```c // 使用指针遍历并打印字符数组 #include #include // 引入strlen函数 int main() { char str[] = "Hello, World"; // 字符串常量 int len = strlen(str); // 获取字符串长度 char *ptr = str; // 定义指向字符的指针 printf("输出字符串: %s\n", str); // 输出原始字符串 printf("遍历并打印字符数组: "); for (int i = 0; i < len; i++) { printf("%c", *ptr); // 输出当前字符 ptr++; // 移动指针到下一个字符 } printf("\n"); return 0; } ``` 对于用户自定义输入字符串的情况,请参考以下代码: ```c #include #include int main() { char input[100]; // 用于存放用户输入的字符串,假设最大长度为100 printf("请输入字符串: "); fgets(input, sizeof(input), stdin); // 从标准输入读取字符串,fgets会保留换行符 int len = strlen(input) - 1; // 去掉fgets读取的换行符 char *ptr = input; // 定义指向字符的指针 printf("输入的字符串: %s\n", input); printf("遍历并打印字符数组: "); for (int i = 0; i < len; i++) { printf("%c", *ptr); // 输出当前字符 ptr++; // 移动指针到下一个字符 } printf("\n"); return 0; } ```"> 1. 使用指针倒序显示整数数组内容 ```c // 通过指针逆序打印整数数组 #include
#include #include int main() { int arr[10] = {0}; int n = sizeof(arr) / sizeof(arr[0]); srand(time(NULL)); printf("原始数组: "); for (int i = 0; i < n; i++) { arr[i] = rand() % 100; printf("%5d", arr[i]); } printf("\n"); int *p = arr; // 指针指向数组元素 printf("反转打印数组元素: "); for (int i = n - 1; i >= 0; i--) { printf("%5d", *(p + i)); } printf("\n"); return 0; } ``` 2. 利用指针计算奇数索引数组元素之和 ```c // 使用指针计算奇数索引数组元素之和 #include int main() { int arr[] = {1, 2, 3, 4, 5, 6, 7, 8, 9}; int n = sizeof(arr) / sizeof(arr[0]); printf("数组元素: "); for (int i = 0; i < n; i++) { printf("%3d", arr[i]); // 宽度为3,右对齐 } printf("\n"); printf("数组下标: "); for (int i = 0; i < n; i++) { printf("%3d", i); // 宽度为3,右对齐 } printf("\n"); int sum = 0; int *p = arr; // 声明指向整数的指针 for (int i = 0; i < n; i++) { if (i % 2 != 0) { sum += *(p + i); // 若索引i为奇数,累加对应元素值 } } printf("奇数索引数组元素之和: %d\n", sum); return 0; } ``` 3. 查看不同类型指针在Linux Ubuntu gcc下的字节大小 ```c // 在Linux Ubuntu gcc环境下查看不同类型指针的字节大小 #include #include int main() { printf("int指针大小: %zu bytes\n", sizeof(int *)); printf("char指针大小: %zu bytes\n", sizeof(char *)); printf("float指针大小: %zu bytes\n", sizeof(float *)); printf("double指针大小: %zu bytes\n", sizeof(double *)); return 0; } ``` 请注意,对于现代64位系统(如Linux),`int`、`char`、`float`和`double`指针通常都是8字节。但在某些特定情况下(如32位系统或特定编译环境),可能有所不同。 4. 使用指针遍历并打印字符数组 ```c // 使用指针遍历并打印字符数组 #include #include // 引入strlen函数 int main() { char str[] = "Hello, World"; // 字符串常量 int len = strlen(str); // 获取字符串长度 char *ptr = str; // 定义指向字符的指针 printf("输出字符串: %s\n", str); // 输出原始字符串 printf("遍历并打印字符数组: "); for (int i = 0; i < len; i++) { printf("%c", *ptr); // 输出当前字符 ptr++; // 移动指针到下一个字符 } printf("\n"); return 0; } ``` 对于用户自定义输入字符串的情况,请参考以下代码: ```c #include #include int main() { char input[100]; // 用于存放用户输入的字符串,假设最大长度为100 printf("请输入字符串: "); fgets(input, sizeof(input), stdin); // 从标准输入读取字符串,fgets会保留换行符 int len = strlen(input) - 1; // 去掉fgets读取的换行符 char *ptr = input; // 定义指向字符的指针 printf("输入的字符串: %s\n", input); printf("遍历并打印字符数组: "); for (int i = 0; i < len; i++) { printf("%c", *ptr); // 输出当前字符 ptr++; // 移动指针到下一个字符 } printf("\n"); return 0; } ``` -
ARM汇编(2)(指令)-跳转指令B与BL都可以使程序跳转到指定的地址执行程序。指令BL的作用是跳转的同时将下一条指令的地址复制到R14(即返回地址连接寄存器LR)寄存器中。需要注意的是,这两条指令和目标地址处的指令都要属于ARM指令集。两条指令都可以根据CPSR中的条件标志位的值决定指令是否执行。 MOVEQ PC, LR B LAB1 (1)指令格式 B {L} {<cond>} <target_address> (2)指令的例子 循环10次的例子 MOV R1, #0 BL MOV R2, #1 ...... LAB1: ADD R1, R1, #1 CMP R1, #10 @带连接的分支 load_new_format: BL switch_screen_mode BL get_screen_info BL load_palette new_loop: MOV R1, R5 BL read_byte CMP R0, #255 BLEQ read_loop STRB R0, [R2, #1]! Load/Store指令 *LDR指令 (1)指令语法格式 LDR指令用于从内存中将一个32位的字读取到目标寄存器。 指令的编码格式如图所示。 LDR指令编码格式 LDR{<cond>} <Rd>,<addr_mode> (2)指令举例 LDR r1,[r0,#0x12] ;将r0+12地址处的数据读出,保存到r1中(r0的值不变) LDR r1,[r0] ;将r0地址处的数据读出,保存到r1中(零偏移) LDR r1,[r0,r2] ;将r0+r2地址的数据读出,保存到r1中(r0的值不变) LDR r1,[r0,r2,LSL #2] ;将r0+r2×4地址处的数据读出,保存到r1中(r0,r2的值不变) LDR Rd,label ;label为程序标号,label必须是当前指令的±4KB范围内 LDR Rd,[Rn],#0x04 ;Rn的值用作传输数据的存储地址。在数据传送后将偏移量0x04与 Rn相加,结果写回到Rn中。Rn不允许是r15 注意:(1)地址对齐问题:大多数情况下,必须保证用于32位传送的地址是32位对齐的。 (2)LDR有两种形式,一种是指令,一种是伪指令,使用LDR的伪指令时,在第二个操作数前加"=" *STR指令用于将一个32位的字写入到指令中指定的内存单元 (1) 指令的语法格式 STR {<cond>} <Rd>, <addr_mode> (2) 指令举例 LDR/STR指令用于对内存变量的访问、内存缓冲区数据的访问、查表、外围部件的控制操作等。 ① 变量访问 NumCount EQU 0x40003000 ;定义变量NumCount LDR R0,=NumCount ;使用LDR伪指令装载NumCount的地址到R0 LDR R1,[R0] ;取出变量值 ADD R1,R1,#1 ;NumCount=NumCount+1 STR R1,[R0] ;保存变量 单数据交换指令 单数据交换指令是Load/Store指令的一种特例,它把一个内存单元中的内容与寄存器中的内容进行交换,交换指令是一个原子操作,也就是说,在连续的总线操作中读/写一个存储单元,在操作期间阻止其他任何指令对该存储单元的读/写。 SWP指令一般有两种形式: (1), SWP 字交换 tmp=mem32[Rn]; mem32[Rn] = Rm; Rd = tmp 指令的格式: SWP {<cond>} <Rd>, <Rm>, [<Rn>] SWP R1, R1, [R0] ;将R1的内容与R0指向的存储单元内容进行交换。 (2), SWPB 字节交换 状态寄存器传输指令 ARM指令集提供了两条指令,用于读写程序状态寄存器,MRS指令用于把CPSR或SPSR的值传送到一个寄存器中;MSR相反,把一个寄存器的内容传送到CPSR或SPSR中,这两条指令结合起来,可用于对CPSR和SPSR进行读/写操作。 MRS 把程序状态寄存器的值传送给一个通用寄存器, Rd=SPSR MSR 把通用寄存器的值传送给程序状态寄存器或把一个立即数传送给程序状态寄存器 (1)MRS指令 在ARM指令集中,只有MRS指令可以 将状态寄存器中的值读取到通用寄存器中。 格式: MRS {<cond>} Rd, CPSR/SPSR 其中,Rd为目标寄存器,Rd不允许为程序计数器(R15)。 (2) MSR指令 在ARM指令集中,只有MSR指令可以直接设置 状态寄存器的值 格式: MSR {<cond>} SPSR/CPSR , #immed Msr {<cond>} CPSR/SPSR , Rm 3,LDM和STM的配对规则 LDMFD--STMFD LDMED--STMED LDMFA--STMFA LDMEA--STMEA LDMIA--STMDB LDMIB--STMDA LDMDA--STMIB LDMDB--STMIA 指令代码如下: .global _start_start: