2.4 变量
变量可分为整型变量、实型变量、字符型变量等。整型变量按照有无符号可分为有符号整型(signed)和无符号整型(unsigned)两类。按照所表达的数值范围和占内存字节数可分为短整型(short int)、基本整型(int)和长整型(long),某些系统还支持长长整型(long long)。同时,各类型又分为有符号和无符号两类。实型变量主要有两种形式:单精度浮点型(float)和双精度浮点型(double)。
2.4.1 变量与内存结构
对于整型变量而言,通常的操作系统默认都是有符号类型,如果定义无符号类型,需在前面加unsigned。
1. 计算机操作系统位长
计算机的内存结构是以字节为单位进行信息存储的。每个字节都有一个唯一的数字标识,通常将这个标识称为地址或物理地址。地址有长有短,从1字节到8字节不等。计算机操作系统按照内存地址的长度可分为8位机、16位机、32位机以及64位机等。
8位机指内存地址为1字节数,地址值通常使用十六进制数表示,如0xFB,0x12等。通常较简单的单片机采用8位地址方式,称为8位机。
目前最常用的是32位机,即地址长度为32位,共4字节。例如:0x0012ff65,0x001B56FF。32位机的取址范围为0x00000000~0xFFFFFFFF,共4 GB内存。通常C语言中会使用其中一部分。如无特别说明,本书程序全部基于32位机。
2. 32位机计算机操作系统
32位机中,短整型(short)在内存中占2字节,基本整型(int)在内存中占4字节,长整型(long)在内存中占4字节等。64位机中还有长长整型(long long),在内存中占8字节。单精度浮点型(float)在内存中占8字节,双精度浮点型(double)在内存中占16字节。字符型变量可分为有符号和无符号两种类型:有符号字符型(char)和无符号字符型(unsigned char),两者在内存均占1字节。如表2-4所示为不同类型变量在内存中所占字节数。
表2-4 数据类型内存字节分配表
C语言中可通过运算符sizeof获取数据类型所占的内存字节数。
范例2.15 MemoryTypeByte.c
MemoryTypeByte.c使用运算符sizeof获取不同数据类型在内存中所占的字节数,然后输出打印,由此可以直观地显示各种数据类型所占的内存字节数。(光盘\chat2\MemoryTypeByte.c)
01 #include<stdio.h> 02 main() 03 { 04 printf("%d %d %d\n",sizeof(short),sizeof(int),sizeof(long)); //格式输出 05 printf("%d %d\n",sizeof(float),sizeof(double)); //输出float,double型内存字节数 06 printf("%d",sizeof(char)); //输出char型内存字节数 07 }
程序中第4、5和6行分别使用了sizeof运算符,用于获取对象在内存中所占的字节数,对象可以是变量、常量、指针、结构体等,后续章节将对该函数的应用做详细介绍。执行上述代码,输出结果为:
2 4 4 4 16 1
2.4.2 变量的定义
C语言规定,变量必须先定义后使用,未经定义的变量在使用时会提示错误而导致程序编译无法通过。合理定义和利用变量,可以提高程序的执行效率。
1. 怎样定义变量
变量在使用前需要先定义,其定义的一般形式有如下两种。
类型说明符 变量名;
类型说明符 变量名表列;
类型说明符是指要定义的变量类型,例如整型变量的类型说明符为int、short或long等。如定义整型变量i,j,k可以这样定义:
int i; int j; int k;
C语言中,这种表达叫做语句,分别表示定义三个int型的变量i,j,k。语句是C语言中的基本程序结构,并且必须以;作为语句的结束符,分号不可省略。
也可以将定义放在同一个语句中:
int i,j,k;
变量名也称为用户标识符,变量名的定义应遵循一定的规则。
(1)由字母、数字和下画线组成。
(2)变量名不能和关键字相同。
(3)第一个字符必须是字母或下画线。
关键字是由C语言规定的具有特定意义的字符串,通常也称为保留字。用户定义的变量等标识符不应与关键字相同。C语言的关键字主要分为类型说明关键字和流程控制关键字两类。如表2-5所示为关键字表。
对每个关键字的详细说明,请参看附录B,本书将在后续章节中依次讲解每个关键字的作用和用法。注意,最新的C语言语法版本中,将bool也列为关键字之一。
用户定义的变量名(用户标识符)不得与关键字相同,同时必须满足上述的另外两个条件,如下列变量名均是非法的变量名:3i,int,ysl@163.com,_myname!,bool等。
表2-5 关键字表
2. 变量赋初值
在变量定义的同时,还可以进行赋值操作,称作变量赋初值。如下定义:
int i=10; int a=0;
像这种在定义变量的同时并赋予其一定值的操作称为变量赋初值。等价于下面语句:
int i; int a; i = 10; a = 0;
当在一条语句中定义多个变量时,可以使用逗号表达式作如下定义。
int i=10,j=100,k=1000;
关于逗号表达式的概念将在第3章中予以介绍,需要注意的是,不能使用如下方法给不同变量赋相同的值。
int i=j=k=0;
但可以在定义之后进行赋值操作,如:
int i,j,k; i = j = k = 0;
此外,对于单个变量的赋值,可以在定义时进行,也可以在定义之后进行。
2.4.3 整型变量
前面已经讲过,整型变量按照在内存中所占的字节长度分为:短整型(short)、基本整型(int)、长整型(long)等。其中short、int和long称为类型说明符。C语言系统通过这些关键字判断不同类型的变量,从而为其分配相应的内存空间。
范例2.16 IntegerVariableDefine.c
IntegerVariableDefine.c分别定义short、int和long型的整型变量,打印输出各个变量的值,并输出各种整型变量在内存中所占的字节数。(光盘\chat2\ IntegerVariableDefine.c)
01 #include<stdio.h> 02 main() 03 { 04 short i=10; //定义short型变量i 05 int j=10; //定义int型变量j 06 long k=10; //定义long型变量k 07 printf("%4d %4d %4d\n",i,j,k); //输出i,j,k的值 08 printf("%4d %4d %4d\n",sizeof(i),sizeof(j),sizeof(k)); 09 }
程序第4、5和6行分别定义三种类型的变量i,j和k并赋初值。程序第7行输出三个参数的值,第8行分别输出三个参数的内存长度。程序运行输出结果为:
10 10 10 2 4 4
虽然变量i,j,k的值相同,但它们在内存中的存储结构却不尽相同,如图2-3所示为不同类型变量在内存中的结构示意图。
需要注意的是,在内存中,数值以二进制形式存放,并以十六进制形式显示,所以,对于十进制数10,在内存中会以十六进制0a显示。
注意,变量在使用前应先定义,若未定义就使用某变量,程序编译时将出现错误,若去掉程序第4行,在编译时将出现如下错误。
图2-3 不同类型变量内存结构
D:\chapt2\shang\ IntegerVariableDefine.c(6) : error C2065: 'i' : undeclared identifier
错误原因是使用了未定义的标识符i。因此,在使用变量前一定记住先定义该变量,这是程序初学者经常犯的错误。
变量在使用前除了先定义,还要赋初值。赋值方式可以先定义后赋值,也可以在定义的同时赋初值。若使用了未经赋值的变量,则将出现不可预期的结果。
范例2.17 InitialVariable.c
InitialVariable.c定义整型变量i、j和k,未给变量i赋值便使用该变量,输出i、j和k的值,检查使用未赋值变量的输出结果。(光盘\chat2\ InitialVariable.c)
01 #include<stdio.h> 02 main() 03 { 04 short i; //定义short型变量i 05 int j=10; //定义int型变量j 06 long k=10; //定义long型变量k 07 printf("%4d %4d %4d %4d\n",i,j,k,i+j+k); //输出i,j,k的值 08 }
程序第7行最后一个输出格式输出控制表达式i+j+k,用以验证未赋值参数参与运算后的输出结果。程序输出结果为:
-13108 10 10 -13088
程序输出了无法预料的结果-13108和-13088,这是由于变量i未经赋值便进行了引用。通常称这种不确定值为垃圾值。为避免这类垃圾值影响程序正确结果,一般在变量定义时赋初值0,如无特别说明,本书后续章节都将遵循这一约定。
2.4.4 实型变量
实型变量分为单精度型(float)和双精度型(double)两类。单精度型变量占4个字节,精确位数为7位有效数字。双精度型变量占8个字节,精确位数为16位有效数字。实型变量的定义和整型变量类似,如:
float p1,p2,p3; double x1,x2,x3;
分别表示定义单精度型变量p1, p2, p3和双精度型变量x1, x2, x3。
范例2.18 RealTypeVariable.c
RealTypeVariable.c分别定义float和double型的变量,为两变量赋相同的值,并打印输出,检查两者输出值的差别。(光盘\chat2\ RealTypeVariable.c)
01 #include<stdio.h> 02 main() 03 { 04 float i; //定义float型变量i 05 double j; //定义double型变量j 06 i=3.14159265358979323846; 07 j=3.14159265358979323846; 08 printf("i=%.10f j=%.10f\n",i,j);//输出i,j,k的值 09 }
程序第4行和第5行分别定义了float型和double型变量i和j,程序第6行和第7行分别对这两个变量赋初值以验证不同类型的精度。程序运行输出结果为:
i=3.1415927410 j=3.1415926536
程序第8行输出语句中%.10f格式为输出小数点后10位数字。导致出现不同结果的原因是float型和double型的精确度不同。
实型变量在内存中的数据存储格式包括符号位、指数位和尾数三部分。符号位表示数字的正负,指数位表示数字的指数大小,尾数部分表示小数点后能够精确的位数。如图2-4所示为float型和double型变量在内存中的存储结构。
图2-4中(a)图表示float型变量在内存中的存储结构,最高位为符号位,前23位(第0到第22位)为尾数位,中间8位(第22到第30位)为指数位。(b)图表示double型变量在内存中的存储结构,最高位为符号位,前52位(第0到第51位)为尾数位,中间11位(第52到第62位)为指数位。
图2-4 float型和double型变量存储结构
需要说明的是,在计算机中数据以二进制形式存储,因此上述各位值同样以二进制形式存储在计算机中,并且以规范化的指数形式存放。float型中,23位二进制值可表示十进制小数部分7位;double型中,52位二进制小数可表示十进制小数部分16位。
因此,范例2.18中,float型只能精确到小数点后7位,其中第7位采用四舍五入,而double型则能精确到小数点后16位,因此能够准确输出所表达数据。
2.4.5 字符变量
字符变量在内存中占1个字节,类型说明符为char。与整型变量和实型变量的定义类似,字符型变量的定义格式为:
char a;
表示定义了一个字符变量a,变量a可以被赋予任何字符常量和整型值。由于字符变量只占用1个字节,因此只能存放1个字符数据。在内存空间中,字符是以ASCII码值存放的,例如字符'a'在内存中存放的是其ASCII码值97。正因为字符在内存中的这种存储模式,通常也把字符变量当作取值在0~127之间的整型量看待,并且字符变量也可以参与算术运算。
范例2.19 CharacterVariableCalc.c
CharacterVariableCalc.c分别定义整型和字符型变量,以整型和字符型打印输出,检查输出结果。(光盘\chat2\ CharacterVariableCalc.c)
01 #include<stdio.h> 02 main() 03 { 04 char c='A'; //定义char型变量c 05 int i=32; //定义int型变量i 06 printf("c=%d i=%d\n",c,i); 07 printf("c=%c i+c=%c\n",c,i+c); 08 }
程序第4行和第5行分别定义了char型和int型变量c和i,程序第6行和第7行分别按不同的输出格式输出这两个变量,以验证两种数据类型的通用性。程序运行输出结果为:
c=65 i=32 c=A i+c=a
因为在ASCII码表中,大写字母A是65,小写字母a是97,两者相差32,程序正是利用这一规律实现了使用算术运算进行大小写字母转换。这一方法在工程应用中被广泛采用。