![SPSS统计分析从入门到精通(第五版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/116/47216116/b_47216116.jpg)
3.3.3 实验操作
下面以数据文件“3-3”为例,说明探索分析的具体操作过程。
1.实验数据描述
数据文件“3-3”记录了两个班级学生的数学成绩、语文成绩,以此数据文件为例,利用探索分析该数据文件中的数学和语文成绩的最大值、最小值、众数、平均数等,并检验样本数据的正态性。原始Excel数据文件如图3-22所示。
在SPSS的变量视图中建立变量“id”“Math”“CHINESE”和“SEX”,分别表示学生班级、数学成绩、语文成绩和性别,在“id”变量中将“一班”和“二班”分别赋值为“1”和“2”;在“SEX”变量中将“男”和“女”分别赋值为“1”和“0”,如图3-23所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P87_5234.jpg?sign=1739396546-zg19Aspoyj2xkXfHVkgrSjskePqTOOOr-0-336e909763b7af17b644c57fef83a070)
图3-22 数据文件“3-3”的原始数据
在SPSS活动数据文件的数据视图中,把相关数据输入到各个变量中。输入后部分数据如图3-24所示。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5240.jpg?sign=1739396546-RrrippmAVNgwXUuMXvVBPaxzqIDXzpAp-0-e630caeea6925652ae66ffd7b6e0f4c0)
图3-23 数据文件“3-3”的变量视图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P88_5244.jpg?sign=1739396546-5aslbIgEV1Lij2qlqKHRivhSJJ3p8tzn-0-1b558c9f3e7882531ebd5c42d1d6801f)
图3-24 数据文件“3-3”的数据视图
2.实验操作步骤
打开数据文件“3-3”,进入SPSS Statistics数据编辑器窗口,然后在菜单栏中选择“分析”|“描述统计”|“探索”命令,打开“探索”对话框。
将变量“Math”选入“因变量列表”列表框,将“SEX”选入“因子列表”列表框,将“班级”选入“个案标注依据”列表框。
单击“统计”按钮,在弹出的“探索:统计”对话框中选中“描述”复选框;单击“图”按钮,在弹出的“探索:图”对话框中选中“箱图”选项组的“因子级别并置”单选按钮、“描述”选项组的“茎叶图”复选框以及“含检验的正态图”复选框。
在“探索”对话框中选中“输出”选项组的“两者”单选按钮,然后单击“确定”按钮就可以输出探索分析的结果。
3.实验结果及分析
单击“确定”按钮,SPSS Statistics查看器窗口的输出结果如图3-25~图3-31所示。
图3-25给出了探索分析中的变量样本数据的有效个数和百分比、缺失个数和百分比及总计个数和百分比。通过“个案处理摘要”可以看出本实验中无数据缺失。
图3-26给出了数学成绩按照性别分类的一些统计量,如均值、中值、方差、标准差等。通过该图可以看出女生数学成绩均值要比男生大,而女生数学成绩中值却小于男生的中值。
图3-27给出了因变量样本数据按照因子变量分类的正态性检验结果。列中“统计”表示检验统计量的值,“自由度”表示检验的自由度,“显著性”表示检验的显著水平。对本实验而言,正态检验的原假设是:数据服从正态分布。从“正态性检验”中柯尔莫戈洛夫-斯米诺夫统计量、夏皮洛-威尔克统计量可以看出,女生和男生的数学成绩的显著水平都大于5%,接受原假设,即都服从正态分布。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5268.jpg?sign=1739396546-cQTtDYuK39guhtKQU4rJnTQZKCj7YxAK-0-3f9934fd0c7ae461247a07b4512e59fe)
图3-25 个案处理摘要
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5253.jpg?sign=1739396546-JsUgfT1LXmS2S6IvrK7FNeseDu1oNtFO-0-67e6fc934cd1493fdca1d3b08e66f177)
图3-26 变量描述
图3-28给出了女生数学成绩的茎叶图。图中“频率”表示相应数据的频数,“Stem”即茎,“叶”即叶子,两者分别表示数据的整数部分和小数部分,“主干宽度”表示茎宽。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5257.jpg?sign=1739396546-EgJ73HQPpIXb9IIRT2EuMpO5R1R5KR3j-0-8359a3c3dd39473022059a911df86fc2)
图3-27 正态性检验
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P89_5258.jpg?sign=1739396546-wqn1Ix9kVCidzmGsL8SxErRPWkEheVMi-0-d06f56f3fe724cd587b149d972b80577)
图3-28 茎叶图
图3-29和图3-30分别给出了女生数学成绩的标准Q-Q图和趋降Q-Q图。标准Q-Q图中的观察点都分布在直线附近,趋降Q-Q图中的点除了极个别点外都分布在0值横线附近,因此显示样本数据服从正态分布,这个结论和正态性检验的结论一致。
图3-31给出了按因子变量性别区分的数学成绩的箱图,其中箱图两头的两条实线分别表示最大值和最小值,中间的黑色实线表示中位数,箱体的上下两端为四分位数。在本实验中女生数学成绩有一个编号为1的异常点或离群值。
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5272.jpg?sign=1739396546-xQuLvYHhrl0S1irFn5jmSzNKg1m95gE2-0-493067c1035015d92ab8927dd194b0cf)
图3-29 标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5273.jpg?sign=1739396546-Z3SbjyCWMcYSaVBqGDoC47ksoLrZd9zh-0-2838f48f27f44662c33af4587c22c23c)
图3-30 趋降标准Q-Q图
![](https://epubservercos.yuewen.com/961D9C/26580911609076506/epubprivate/OEBPS/Images/Figure-P90_5276.jpg?sign=1739396546-Bak0Dsd9FPOkjVfqaHbkhb5Vd8iiH8bw-0-eb9ab0bea45efd8354ff8b28abc77ed8)
图3-31 箱图