郑杭生《社会学概论新修》(第4版)笔记和课后习题(含考研真题)详解【赠10套名校考研真题及详解】
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第五章 社会学的研究方法

5.1 复习笔记

一、社会学方法论

1.社会学方法体系

(1)社会学的方法体系的层次

方法论原则,具有指导研究方向的意义;

具体研究方法,与研究实践和过程相统一;

技术手段,是研究过程中所运用的主要工具。

(2)方法论原则

哲学世界观和方法论

哲学世界观和方法论的意义在于引导人们对世界形成一种基本观念,而且这种观念会影响其他认识活动和实践活动。

逻辑思维方法

逻辑方法原则是指导人们进行正常思维的基本规则。遵循逻辑规则既是进行研究活动的最基本保证,同时也有助于科学研究活动的深入。

社会学的一般化理论

学科的发展一方面取决于学科研究的不断创新,不断超越已有的知识范围;另一方面,学科的知识积累也非常重要,创新和超越是在知识积累的基础上进行的。所以,在社会学的研究中,已经成型的学科一般化理论对研究实践同样具有方法原则的指导意义。

2.社会学研究方法的特征

(1)动态性

社会学的立场和视野是动态的,它关心的是变动中的尤其是现实社会的各种事实和关系的动态过程。

(2)整体性

社会学对社会的认识和理解,首先是从整体论高度出发的,把社会视为有机统一的整体,然后从静态和动态两个维度来考察和分析社会运行和社会变迁过程。

(3)经验性

社会学注重对社会事实和现实的考察,并在此基础上来理解社会行为和社会运行。

3.社会学研究的范式

(1)定义

范式概念是由库恩首先提出来的,用来表达科学研究活动的一般特征和规律。范式是指一定时期内,科学研究共同体成员在进行常规科学研究过程中所共同遵循的规范和理论与方法论模式。

常规科学研究是指某一时期内科学研究者所积累、传授的知识以及所进行的一般性研究。

(2)社会学研究的范式类型

社会学的范式大体可概括为实证范式、解释范式和批判范式三大类型,如表5-1所示。

表5-1  社会学主要范式

二、社会学研究的过程

研究过程是指研究者从提出问题,到分析问题和提出研究结论的完整的科学活动过程,包括研究的逻辑过程和具体研究的实施过程两种。

1.研究的逻辑过程

科学研究的逻辑过程是从理论问题经过研究验证最终回到得出理论的循环过程,连接这一过程的逻辑方法就是演绎和归纳、经验观察和概括综合。

根据华莱士的“科学之环”原理,研究的逻辑过程是由问题、理论、假设、操作化和假设检验等几个环节构成的。

(1)研究起始于问题,研究者一般要根据自己的兴趣、理念以及相关理论,寻找、发现和提出问题,这些问题必须是和理论相关的问题,而不是常识问题。

(2)提出理论问题之后,就需要了解和掌握其他相关理论的解释,然后根据相关理论解释,提出自己的理论假设。

(3)为了证明自己所提出的理论假设,需要针对理论假设所包含的解释模型,设计操作化的变量,并对变量进行测量。

(4)在测量或观察结果的基础上,检验理论假设和拟合解释模型,并最终概括出理论结论。

2.社会学的解释

在社会学的研究中,对社会运行及协调发展理论的解释过程主要包括:概念和变量、假设、变量测量和分析、假设检验。

(1)概念和变量

概念和变量是理论研究的基础和思维的基本形式之一。

概念

社会学概念是将社会中的同一类现象和过程以及共同特征抽出来,加以概括的结果。概念包括实体性概念和非实体性概念,它们是对具体的事物或人进行的概括性表达;非实体性概念,是对非具体现象的概括。研究者在使用概念时,需要明确概念的内涵和外延。

变量

变量是指含有数值变动的量。在社会科学研究中,为了解释事物或现象之间的关系,通常需要用变量来加以衡量和说明。通过对操作化变量的测量和分析,可以概括和解释现象和过程的本质及规律。变量可分为:

a.因变量,又称依变量,是要解释的现象或过程;

b.自变量或独立变量,是自己独立发生变化的变量,用来解释现象或过程的原因。

(2)假设

含义

假设是指研究者预先设想或猜测判断所要解释的变量之间可能会存在什么样的关系,并运用这种预设关系作尝试性解释。

分类

假设分为研究假设(H1)和虚无假设(H0),研究假设就是研究者所要验证的假设,是研究目的,虚无假设是指和研究假设相对立的假设。

意义

假设在经验材料验证之后,无论是被证实或是被证伪,都具有理论的贡献。理论假设的意义在于,研究者可以更加明确地关注几个变量之间的某种关系,从而找到研究的切入点,为研究的展开和取得研究结论奠定基础。

(3)变量测量和分析

变量测量

测量是运用一些指标来衡量某类现象或过程的特征和变动情况。变量测量具有四个高低不同的层次,由低向高分别是:定类测量、定序测量、定距测量、定比测量。

变量分析

变量分析是指研究者为了发现两个或两个以上变量之间的具体关系,常常需要对其他变量加以控制,然后通过统计分析,确认所要考察的变量之间的关系。

(4)假设检验

假设检验是根据抽样分布的原理,运用抽样调查的样本统计值来对研究假设加以验证。

原则

假设检验的原则一般采用显著度和否定域,即根据统计值分布在此范围内的比例来确定是否否定虚无假设,以确认研究假设是否成立。如果能够在显著度很小的情况下否定虚无假设,就能够证明研究假设成立;反之亦然。

检验方法

在社会学定量研究中,检验假设一般可以用显著度p≤0.05作为准则,有些研究也运用p≤0.01或p≤0.001。检验方法主要是非参数检验,包括卡方(χ2)检验和方差(F)检验。

3.研究的基本程序

具体研究阶段是进行一项研究的完整过程,包括研究的具体方案和研究的具体实施程序或步骤。一般来说,具体研究大致可分为八个主要阶段:

(1)提出和界定问题

提出问题的基本原则:

问题必须具有理论导向。理论导向,是指所提出的问题是由该研究领域的核心概念构成的,而且问题能够通过经验来证实或证伪。

问题最好具有一定现实意义。在选择研究问题时,最好考虑现实中人们关注较多的、与实践关系更为密切的问题。

提出的问题必须具有研究可行性。衡量问题的可研究性的标准有:a.问题具有明确的范围;b.问题能切合实际;c.问题与研究者自身条件相符合。

(2)针对所提出的问题,回顾别人是如何研究的

了解和掌握别人的相关研究,一方面可以知道自己的问题是否有了解答,或已经解决到何种程度,这样就可以避免重复劳动,有利于理论和知识创新;另一方面也能够拓展自己的视野,为自己回答问题提供借鉴和参考。

(3)进行研究设计

研究设计是指为了解答所提出的问题,实现研究目的,对研究中所涉及的资料收集、整理、分析和检验所作的具体计划。

(4)收集资料

资料收集需要注意的问题包括:

资料必须具有可信性,即资料来源是可靠的,值得信赖的;

资料必须具有针对性,即收集的资料应针对所要解答的问题,对证明问题具有有效性;

收集资料要注意时效性,即所收集的资料应该是新的;

所收集的资料必须具有系统性,即资料必须是完整的,而不是断章取义的,它能够用来系统证明所研究的问题。

(5)整理和分析资料

整理资料主要是对收集起来的资料加以汇总、分类、补充完善和加工清理,以便为分析工作做好准备。资料整理完毕之后,就需要对资料进行分析,从中探寻新的发现。

(6)解释从资料中获得的新发现

在资料分析中发现新问题之后,就需要对这些新的发现寻找理论解释,即对所看到的变量之间的关系,从理论和实际的角度去加以解释。

(7)得出结论

研究者根据各种解释的有效性和完备性,最后提出解答问题的最终结论。结论的特点有:

研究的结论具有概括性,能够概括研究所发现的规律;

结论要具有完备性,即所作的结论一般是能够自圆其说的理论解释,其逻辑结构是完备的;

结论必须具有有效性,即能够说明所要研究的问题。

(8)发表或出版研究成果

发表或出版研究成果的意义包括:

公布研究结论以便于其他研究者加以检验和评估;

促进学术研究成果的传播和应用;

有利于知识积累;

帮助研究者确立学术地位。

三、社会学主要研究方法

定量研究方法是指通过对变量的数量特征和数量变化的测量,以及对数量关系的分析,来解释社会现象或过程的方法;

定性研究方法是指注重描述、剖析和揭示现象或过程的特性和本质的研究方法。

1.问卷调查法

问卷调查法是向研究对象系统询问社会背景、态度和行为,以发现社会现象和过程的原因或影响因素。调查研究法包括全面调查和抽样调查。全面调查是指对所要研究的对象的每一个个体都进行调查。抽样调查是指根据一定抽样原则,从所要研究的对象中选取一些个体作为样本,然后对这些样本进行调查。

问卷调查法的基本步骤包括:确定调查总体、选择抽样方案、设计调查问卷、实施调查、汇总和录入数据、分析数据等。

(1)识别和确定调查总体。

调查总体是指所要研究的对象的全体或所有个体。明确调查总体一是为了掌握研究对象的总体情况,二是为抽样确立框架。

(2)根据抽样总体的特征以及具体研究的需要,选择和确定抽样方案。

(3)着手设计调查问卷。

问卷的含义

问卷是指由各种问题组成的、用来向被调查者提问的卷子。社会调查研究中的问卷设计通常需要在一定的理论指导下进行,所设计问题带有检验理论假设的目的,能够测量出被访者的社会经济状况、态度和行为等。

问卷问题的分类

根据问答形式的不同,可分为封闭式问题和开放式问题。封闭式问题是指向被访者提供了选择答案的问题。开放式的问题是指让被访者自己给出答案的问题。

根据问题内容的不同,问卷中的问题一般包括三大类:a.事实性问题;b.行为性问题;c.态度性问题。

注意事项

a.问卷作为一种测量工具,在设计过程中,需要考虑其信度和效度。信度是指同一测量工具重复测量,所得结果的一致性程度;效度是指测量工具是否适合用来测量所要测量的对象。

b.问卷在定稿之前,通常需要进行一些试调查,即用问卷初稿去做访谈,以便发现问卷中是否还存在不准确、模糊和不切合现实的问题。

(4)实施调查。

实施调查是调查研究的关键步骤,大型的问卷调查都需要招募调查员来执行入户访谈任务。

有些问卷调查是通过邮寄或人员发放问卷,然后由被调查者自己填写问卷。这种调查实施方式虽然能节省人力和财力,但是,在问卷回收率、样本的偏差、缺损值和作答准确性等方面,都存在较大的局限性。

(5)调查问卷回收起来之后,需要将这些资料汇总,并将结果录入数据库以便进行分析。

数据录入是指将问卷中被访者的作答内容,按照一定的编码,录入编制好的数据库结构之中。全部问卷数据录入完之后,一般还需要对数据进行逻辑检验和查错,数据检验和查错是为了查出被访者、调查员或录入员在回答、记录和录入时出现的明显逻辑错误或偏差。

(6)数据库整理完毕后,要根据研究目标,运用合适的数据分析的统计方法,对资料进行分析,以此来验证或证明自己的研究假设,并根据资料分析的结果,来对所研究的问题加以解释。

2.田野调查法

(1)含义

田野调查是指研究者深入研究对象所生活的场域,在与研究对象一起生活的过程中,进行细致观察和深度访谈,以求达到对研究对象及其文化的全貌性研究和深刻理解。

田野调查的主要任务是解答这样一些问题:谁、什么、何时、何地、为什么。

(2)参与观察法

参与观察法是指观察者进入观察对象的生活或工作场所,参与他们的生活和工作活动,在参与过程中观察研究对象的各种行为及其变化情况。

优势

参与观察法在探寻研究对象的深层思想意识和内部相互关系方面具有较大的优势,能让研究者在理解被研究者的社会情境的基础上,认识他们的思想意识发展的轨迹。

需注意的问题

a.要明确观察的理论目标,做到参与而不深陷其中。研究者在观察之前,需要进行研究设计,明白观察所要检验的理论问题,计划要观察对象的什么,以及如何进行观察。同时在参与过程中,需要清醒地明确自己的理论目的,围绕理论目标而观察。

b.为了使观察资料具有更高的准确性和可信度,观察者在观察过程中,需要在控制观察环境和变量的同时,尽量避免影响被观察者的常规反应。否则,观察的结果极有可能出现偏差。

(3)深度访谈

深度访谈一般要有选择地进行,要根据研究的主题选择有典型意义的对象来与之交流、建立感情,以达到深刻谈心;有时,选择当地的信息灵通人士或当地“明白人”作为深度访谈的对象,对研究可能有较大帮助。

(4)主位取向和客位取向

主位取向是指研究对象所倾向于认为的观念或态度;客位取向是指研究者或局外人所倾向于认为的原因或动机。

研究者在田野中一方面要细致观察,认真体会,弄懂并理解当地人的主位观念;另一方面,研究者还要站在局外人的角度分析这些主位观念的意义和形成原因。研究者应把主位取向与客位取向结合起来,全面看待田野中获得的信息。

(5)田野调查报告

结束田野调查后,研究者需要撰写田野调查报告。田野调查报告的写作方式主要是民族志的写作方式。

民族志是指详细、全面描述研究对象各个方面形态和特征的田野调查报告。民族志的特点是以描述、记事的手法为主,以展示研究对象的整体特征和活动全过程为目的,向人们勾画出特定社区和人群的文化图像。

3.实验法

(1)定义

实验法是指在控制某些条件的情况下研究变量之间因果关系的方法。为了控制某些自变量可能对因变量产生的影响,实验法常常在实验中将被试或实验对象分为两个组:一组是实验组,另一组是控制组。通过对两组实验结果的比较,检验某些变量之间是否存在因果关系。

(2)实验组和控制组的划分和建立的方法

随机分组法,即将实验对象随机地分配到实验组和控制组中;

配对法,即根据变量相对应的原则,分别将实验对象一一分配在实验组和控制组。

(3)分类

实验法分为自然实验法和实验室实验法。

自然实验法是利用社会情境的自然状态,将其中的一种情境作为实验组,将另一种情境作为控制组,然后观察和比较它们的异同,以解释变量之间的关系。在社会科学研究中,通常采用自然实验法。

实验室实验法是科学研究典型的实验法,即通过设置实验室环境,将想要控制的变量加以控制,以便观察和发现某些变量之间的关系。

4.历史比较法

(1)历史比较法的资料来源

历史比较法的资料来源主要有两种:

政府文献资料,包括政府和机构文件档案材料、统计资料和保存下来的其他历史资料;

民间历史资料,包括民间流传下来的地方史志材料,以及民间口述史资料。

(2)资料分析方法

在历史比较法中,较为常用的分析历史资料的方法有:

类比分析法,是指在分类的基础上对某类现象或事件在不同阶段的表现和特征进行对比,并由此类推出现象产生的原因和变化规律。

理想类型分析法,是韦伯创立并运用的研究方法。理想类型是一种分析概念或逻辑工具,是经过高度抽象出来的、反映事物本质特征的分类概念。

对理想类型的分析,主要包括比较不同理想类型的本质特征,分析不同类型之间的结构关系,并根据结构一致性的原则,来理解和解释事物或现象的原因。

(3)历史比较法的价值和广泛适用性的具体表现

社会运行与社会变迁的纵向比较研究;

社会结构与社会运行的横向比较研究;

社会意识和社会事实的比较研究。

(4)局限性

历史比较法的局限在于历史资料或历史事实的不可证实性。由于资料的不可证实性,历史比较和推理常常建立在想象和类比的基础上,从而使得其结论可能带有主观性和选择性。

四、社会指标

社会指标是对受规范约束的直接利害关系所作的一种统计,它便于人们对社会主要方面的状况做出简明的、综合的和公平的判断。

1.社会指标的类型和功能

(1)社会指标的类型

描述性指标与评价性指标

描述性指标是对社会客观现象的描述。由于这些指标没有与一定的理论、模型、目标相联系,因而它们仅仅能反映出社会事实本身,并不能说明其价值状况。

评价性指标又称分析性或诊断性指标。它是指能反映出社会发展、社会效果、社会影响在某些方面的利弊得失的指标。这类指标通常是人们按照某种目的将两种以上的社会现象做比较而得出的,它们实施说明社会现象的功能。

观察性指标与计划性指标

观察性指标又称信息性指标,是指人们对于现状或已经发生了的社会现象的描述或评价。它的作用在于理解过去和及时反映现在。

计划性指标是指人们在了解过去和现在的基础上对未来的预测,因而又称作预测性指标。

投入指标、生产量指标与产出指标

投入指标是指在某一社会过程中发挥作用的“可供资源”。

生产量指标通常是指工作量或承担的次数。

产出指标又称结果性指标,它主要用以评价社会政策或措施的结果。

肯定指标、否定指标和中性指标

肯定指标又称社会进步或发展指标。它们反映了社会的好的一面,是人们所希望发展的指标。

否定指标又称问题性指标。这类指标是人们不希望发展的,它们的上升标志着社会否定因素的增加。

中性指标是指与人们的价值取向、人们的愿望没有直接利害关系的指标。它们本身并不能说明社会进步与否。

客观指标与主观指标

客观指标又称非感觉指标,是指反映客观社会现象的指标。

主观指标是人们对客观社会现象的感受。它表现为人们的心理状态、情绪、愿望和满意程度等。

经济指标与非经济指标

(2)社会指标的功能

反映社会状态功能

反映社会状态是社会指标最基本的功能。社会指标的作用在于,它集中了最重要和最具典型意义的现象,并使之具有一定条理,从而将社会或某一方面的状况清楚地再现出来,使人们易于了解和把握。

社会监测功能

通过指标的测量,可以监测社会运行状态。监测的功能可以分为对社会状态的监测和对社会目标的监测。两者的侧重点不同,对社会状况的监测是指人们通过对社会指标的比较、分析而定期或随时监视社会或某一方面的运行。

预测功能

预测功能是指根据已占有的材料,在对过去、现在进行分析的基础上,摸索出社会指标的变化规律,进而对未来的结果加以测算。

社会指标的预测功能主要有两个方面:一是预测发展;二是预测问题,即提早发现那些将会给人们或社会带来危害的问题。

比较和评价功能

通过比较,可以对社会运行与发展、社会计划与政策进行评价,分析利弊得失,得出正确结论。比较有横向与纵向之分。

横向比较是指时间序列上同一时期的社会指标的比较;纵向比较是指对社会不同发展时期的历史比较。

2.社会指标体系的建立

社会指标体系是指为综合反映与说明社会或社会某方面状况而设计的一组具有内在联系的社会指标。社会指标体系的建立主要有三种方式:

(1)根据规划建立指标体系

这是政府利用公共机构的相应分类而建立起来的,由于能得到政府和各部门的协助,因而按此方式建立指标体系方法简便,成本也不算高。

(2)根据社会目标建立社会指标体系

这一方式是从一个总的或一系列社会目标出发,逐级发展子目标,最终确定各项社会指标。这是一种从一般到特殊的方法。与规划性社会指标体系相比较,根据社会目标建立的社会指标体系的最重要的特点是,具有明显的、内在的逻辑一致性。

(3)依据理论建立社会指标体系

这是非官方建立社会指标体系的基本途径。一些研究人员、学者根据他们所提出的理论和假说,将社会现象编制成指标体系,并且用他们的理论来说明这些指标。

3.社会指标体系的应用

(1)社会指标体系最直接的应用是定期提供社会报告

社会报告是指根据社会指标体系所提供的数据,经过分析而得出的关于社会状况及其发展趋势的总结性评价。

(2)在生活质量研究中的应用

生活质量是指满足人们生活需要的全部社会与自然条件的综合水平。它既包括物质生活条件,也包括精神生活条件;既包括经济条件,也包括广泛的政治、文化、思想条件。

(3)在社会运行研究中的应用

社会指标在社会运行的协调性研究中的应用,主要表现为社会运行的投入—产出分析。投入性指标又称结构性指标,多与社会运行的结构相关联;产出指标又称功能性指标,多与社会运行的功能相关联。

结构性指标

结构性指标主要有三个方面:

a.基础总量指标。它是对社会基本状况的反映,这一类指标是整个指标体系的基础。

b.基础相对指标。它是直接利用基础总量指标而得出的比例数字。

c.政策性指标。政策的变化也是一种投入,是一种信息性投入,在社会运行过程中发挥巨大作用。

功能性指标

功能性指标也有三个方面:

a.结果性指标。它是一定的基础性指标(基础总量指标、基础相对指标)在政策等变量的影响下产生的结果。

b.行为性指标。它也是一种结果,但它是通过人或人们的行为表现出来的结果。

c.感觉性指标。

(4)在社会决策中的应用

社会指标体系是科学决策的各阶段所必需的重要工具。现代的科学决策有一定的程序,而社会指标贯穿了决策程序的各个阶段。

目标阶段。即确立决策的目标,需要决策者将一种理论构想或目的具体化为一系列的指标或指标体系;同时,又要为目标规定限度或边界条件,即所需获得的最低限度的成果,这也需要通过社会指标来说明。

信息阶段。一般说来,大量的信息都是以社会指标的形式出现的。

设计阶段。即要找出关键性的指标,确定各种指标之间的关系,建立起指标模型或预选方案。

评估阶段。即根据指标的定性、定量、定时分析,比较各种不同的方案。

选择阶段。它是由领导者与专家通过对社会指标的权衡而得出的最终结论,指标值高的方案总是比指标值低的方案容易中选。

试验阶段。即要获得在实际应用中可能出现的各项数据和指标。

实施阶段。这是决策的最后一个阶段,由于社会现象的复杂性,在这一阶段常会出现一些事前未料到的变化,要求建立起反馈系统,随时了解实施中各项社会指标的进度,从而控制局势的发展。

五、抽样技术与数据分析基础

1.抽样技术

抽样是按照一定的方式,从总体中抽取能代表总体的一部分元素,即样本,然后根据样本中所包含的信息对总体的状况进行估计和推算的过程。

(1)相关概念

总体和样本

总体是指所研究对象的全体;样本是指从总体中抽取的部分个体(或单位)。

抽样单元和抽样框

抽样单元是指把总体划分成的有限个互不重叠的部分。

抽样框是指在设计概率抽样的方案时的一份关于全部抽样单元的资料,如名单、地图、规模等。

抽样误差和非抽样误差

抽样误差是指用样本估计总体产生的误差。

非抽样误差是指在抽样调查中由于人为的差错或一些不可控制的因素所造成的误差。

总体指标

总体指标是调查的目标量,即有关的总体参数,因而又称总体值或参数值。

(2)分类

根据从总体中抽取样本的方式,抽样分为概率抽样与非概率抽样。

概率抽样依据概率论的基本原理,按照随机的方式进行,它充分考虑等概率的原则,可以避免抽样过程中的人为影响,可以对样本的误差加以控制,以保证样本的代表性。概率抽样包括简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样等具体方式。

概率抽样的过程一般包括界定总体、制定抽样框、决定抽样方案、实际抽取样本和评估样本质量等几个基本的步骤。

非概率抽样主要是按照抽取样本的方便性、主观判断、主观意愿来选取研究对象,与概率抽样相比,其最大的区别是非概率抽样无法保证抽取样本的等概率性质,样本误差无法控制和估计。非概率抽样有偶遇抽样、主观抽样、配额抽样、滚雪球抽样。

2.简单随机抽样

(1)简单随机抽样

含义

简单随机抽样是指按照等概率原则,从含有N个抽样元素的总体中抽取n个元素(N>n)组成样本的方式。简单随机抽样所得到的样本称为简单随机样本。

抽样方法

简单随机抽样所采用的办法通常有抽签法和随机数表方法。

抽签法是先将总体中的每个单元都编上号,写在签上。将签充分混合均匀后,每次抽一个签,签上的号码即表示样本中的一个单元。

随机数表法又称乱数表。随机数表是随机形成的,表中的数码和排列没有任何规律性。

样本规模的确定

样本规模又称样本容量,确定样本规模是抽样设计的重要环节。在简单随机抽样过程中,当估计参数为总体均值时,最小样本规模的确定公式是:

式中,Δ为绝对抽样误差,t为规定的绝对抽样误的t值范围,S2为总体元素的方差。

当估计参数为比例P时,样本规模可从以下方式得到:

因为,所以有:

在上述公式中,绝对抽样误差“Δ”是人为规定的,t值则对应于所要求的置信度,可以从t分布表中查出。

(2)概率与规模成比例抽样

概率与规模成比例抽样(PPS)是社会学调查研究中最常用的一种抽样方法。PPS抽样使用多级抽样的形式,它根据元素的层级划分特征,依次由高到低抽取各层级的样本单位。

不论初级抽样单位(PSU)大小,都从中抽取固定的样本单位,因此PPS抽样的样本规模的变动得到了控制。同时,PPS抽样在抽取较高层级的样本单位(即是对群或层的抽样)时,每个群中选的概率与群规模的大小成正比关系。因而对于总体每一元素来说,中选的概率仍然是相同的,保证了抽样的等概率特性。

3.数据分析

(1)单变量分析

单变量的统计描述

a.单变量的样本集中趋势

描述单变量的样本集中趋势,常用的统计描述方式主要有均值、众数和中位数。其中,均值即样本平均数,其基本公式为:

b.单变量的离散程度

常见的离散统计量包括全距、标准差、四分位差。标准差是指一组数据相对于均值的偏差平方的算术平均数的平方根,用公式表示为:

标准差与平均数百分比值称为离散系数,用公式表示为:离散系数

单变量的统计推断

区间估计是单变量统计推断的一种主要情形,是指在一定的置信度范围下对总体的取值区间的估计。常见的区间估计有总体均值的区间估计和总体百分数估计。置信度又称区间估计的把握性程度,社会统计一般取三种置信度:90%、95%、99%。

a.总体均值的区间估计,其计算公式为:。式中,S为标准差, 为均值,n为样本量,Z(1-α)为置信度为1-α的z值。

b.总体百分数估计。当从样本百分比来估计总体百分比的区间时,公式为:p±Z(1-α) 。式中,p为样本中的百分比。

(2)双变量分析

定类—定类数据

测量和检验两个定类数据之间的关系,有对称和非对称的Lambda测量以及tau-y测量。对称Lambda测量表示两个变量相互预测时可以减少的误差比例,非对称Lambda测量以及tau-y测量值则表示用一个变量预测另一个变量时可消减的误差比例。

两个定类变量是否相关,还可用卡方(χ2)检验来表示。卡方计算公式为:

式中,f0为列联表单元格中的实际观测频数,fe为单元格的期望频数。

定序—定序数据

两个定序变量之间的相关关系通常可以采用Gamma系数、萨默斯的dy系数以及斯皮尔曼相关系数(rho系数)来测量。

a.Gamma系数和dy系数都是根据两个定序变量数据的级序关系来测量它们的相关性,它们的具体含义是,根据某个变量任何两个个案的等级高低关系去预测它们在另一个变量上的等级关系时,可消减的误差比例。在分析对称定序变量关系时,原则上采用Gamma系数,而对非对称关系的两个变量则采用萨默斯dy系数。

b.斯皮尔曼相关系数不仅要计算每个个案在两个变量上的等级高低关系,而且还要计算高低差异的确切数量值,其公式为:,式中,D表示某个个案在两个定序变量上的等级差异值,n为全部个案数。

对于定序—定序变量关系的检验,可采用Z值检验法。例如,对Gamma系数的检验,公式为:

定类—定距数据

社会学研究中,定类与定距数据关系多为以定距数据为因变量、以定类数据为自变量的非对称关系,对此常常采用相关比率来测量。相关比率又称eta平方系数(记为E2),计算公式为:

式中,Y为因变量数值, 为均值, 为在自变量每类取值上的因变量均值。

对于相关比率eta平方系数(E2)的检验,可采用F检验法,计算公式为:

式中,k为自变量的分类数,n为样本规模,k-1为自变量的自由度df1,n-k为因变量的自由度df2

定距—定距数据

对于两个定距变量之间的相关关系的测量,可以采用皮尔逊相关系数和回归分析的方法进行。

a.皮尔逊相关系数

皮尔逊相关又称积距相关,它假定两个定距变量X、Y之间具有直线相关的关系,其公式为:

式中,X、Y分别为两个变量的取值, 分别为两个变量的均值。相关系数r的取值区间为[-1,+1],既表明两个变量的相关程度,也表明相关的方向,当|r|=1时,两个变量完全一致或完全相反,当r=0时,两个变量完全不相关。

b.回归分析

一般回归分析通过回归方程的形式来描述变量之间的关系,用最小平方准则来求解回归方程中变量系数,从而近似地表达变量之间的平均变化关系,并依据回归方程对未知的情况进行预测和估计。