如何spss处理调查问卷问卷调查中的数据

点击联系发帖人 时间：2016-11-30 18:42

调查问卷处理方法

调查问卷法中数据和资料的收集及分析
您要打印的文件是：调查问卷法中数据和资料的收集及分析
调查问卷法中数据和资料的收集及分析
作者：陶昌书&&&&转贴自：转载
问卷法是在科学研究的过程中向研究对象收集研究资料和数据的一种方法，问卷法总是为一定的研究目的服务的，我们大多数时候难以做到对所研究的总体进行调查，但为了保证所做研究的或实验效果的普遍性和应用性，在用使用调查问卷法时，就要从取样（选取具有足够代表性的样本）、了解问卷测量的准确性、根据统计学的理论对数据进行有效的统计分析等方面去研究和控制，由于这其中所涉及的方法的理论性较强，知识也大多超出了学生的知识水平，所以只对学生能力范围之内的一些内容加以讲解，使学生对较简单的问卷调查研究方法有所了解，并能有意识的使用就可以了。
一、同学在设计问卷中应注意的问题：⒈问卷法是研究过程的一个关节，它是为一定的研究目的服务的，应该首先有一个明确的研究内容、主题或目标，例如：我们曾在课堂上做的一份问卷，这份问卷是为一个课题服务的《首都现代化进程中学校、社区教育一体化发展研究》，目的是调查一下新、旧价值观对学生的影响。所以问卷的设计不是随意的，是有目的的，是有服务对象的，而且研究某一课题时通常是有一个事先的猜想，并且设定自变量和因变量，研究它们之间的因果关系。⒉一份问卷在设计完了以后不是马上就可以去发放的，要考虑问卷的设计是否能达到研究的要求，应该有一个调整、修改的过程，我们所做过的问卷就曾经在某个学校进行试测，并且根据所得到的结果进行了必要的修改才大量的发放到学校中进行调查的。⒊问卷设计好以后不是随意的发给一些人就可以了，让人去回答问卷并收集上来的过程就是我们在研究中取样的过程，无目的的做法必然造成资源的浪费，并且也不能取得有用和可靠的数据和资料。⒋问卷的设计、取样、数据的收集和分析是一个系列的工作，哪一个环节的缺失都不能完成研究工作。⒌问卷法只是收集研究资料和数据的方法之一，我们今天所要讲的内容不仅仅限于问卷法，其它收集数据的方法也可以参考使用。
二、问卷法数据和资料的收集的有关方法：⒈取样研究的取样问题是研究的关键环节，样本并不一定是"越大越好"，抽取有充分代表性的小样本，即可取得反映总体特征的可靠资料与数据，这样不但能接生人力、物力，而且能显著的提高研究的效率，取样还能起到减少损耗、保护总体的作用，（因为被测对象受到"污染"不利于作进一步的研究）。以缺乏代表性的样本进行的研究，其结果的可应用性是十分有限的，不少研究结果之所以至尽颇有争议而且应用甚少，其中一个原因是由于与这些理论有关的研究在取样方面存在严重缺陷，使这些研究难以重复或验证。取样所应该事先考虑的问题是：所研究的是什么总体？需要多大的样本？样本的主要特点是什么？如何选取这种样本？如何使样本具有足够的代表性？如何减少取样的误差？等等。取样的过程实际上包括三个方面（1）规定总体，对总体作出明确的定义；（2）选取样本，运用适当取样方法抽取样本；（3）统计推论，从样本的统计数据估算出总体的有关参数。样本是有偏或者无偏的，采用无偏的样本，统计推论才能得出符合实际的参数值。取样的方法很多，这里介绍四种学生比较好掌握的方法：①简单随机取样法（simple random sampling）：在随机取样中，总体中每一个体被抽选的机会是均等的，运用随机取样方法所选取的样本称为"随机样本"。可以使用严格制作的随机数字表，随意的"进入"包含总体数目的随机数字区，选取所需要的样本数目。在研究者对所研究的总体中各类个体的比例不了解的况下，简单随机取样是最好的取样方法，但如果样本较小，简单随机取样就可能发生偏向，例如：从1000名学生中抽取20名学生，有可能抽到的都是男生，补救的方法是加大样本数量。②分层随机取样（stratified random sampling）：先把总体分成若干层次或子总体，然后独立、随机的从每一层次选取样本，所谓层次，就是指不同类型的个体。例如：高一、高二、高三三个不同层次。为使所取样本是比较理想的"无偏"样本，最好采用非比例分层取样的方法，例如：高一学生350人，高二学生270人，高三学生200人，若按同比例取样，高三的学生数目就会少，而高一学生数目就会很多，所以可按10%，13%，17%的比例分层抽样，可获得"无偏"样本。还应注意的是，对于非比例样本，还应以各层次数目与总体数目的比例值对结果进行加权。③系统取样法（systematic sampling）：是从总体中取一随机起点，从该起点开始选取每k项元素（个体或分数等），直至取满所需要的样本量，k值一般以样本量与总体量的比值来确定。例如：在1000名学生中抽取100名，样本与总体的比值是1/10，在系统中取样时就从随机起点开始分别选取第10名、第20名……。此方法比较简单，而且样本更为准确，但应注意：以随机数字表（这种数字表在大多数统计书中都可以找到）决定第一样本元素；此外，要是在总体中也存在周期性波动或变化，所取样本易发生系统性偏差。④聚类取样法：在研究不知道或不很了解总体的特征时，可以采用聚类取样法，即先把总体分成若干群类，然后在各群类内进行取样，这种方法成本较低。并且，为了提高精度，必须把总体细分，尽量做到减少群类间的差异，尽可能加大群类内的差异，而上面所讲的分层取样发则尽量加大层次间的差异而缩小层次内的差异，相比之下，聚类取样更为有效。此外，还有非随机取样法、方便取样法、顺序取样法等等，可以根据研究所涉及的学科的不同适当选用取样方法的。
⒉问卷测量的准确性：问卷设计必须使问卷的测量具有一定的准确性，问卷测量的准确性包括五个方面的特点：效度、测量工具之间的相关、同质性、信度和分数的分布。以上每一项的测量都有相关的公式和方法，它们所涉及的数学知识比较简单，但专业知识都超出了现在学生的知识范围，如果需要的时候可以到相关的统计书中进行查找，但需要说明的是，每一项指标的评定方法都不止一种，要视问卷的具体情况而定，这是一个比较复杂的过程，前面学生所做的调查问卷都存在着问题，其中最重要的问题就在于，问卷调查的目的与问卷的设计之间的因果关系还不是很清楚，对问卷的设计也没有理论依据，只是凭借对调查问卷的一般认识而设计的，内容只是出于同学对某问题的兴趣，没有研究的方向和课题，对于如果真正进行问卷调查之后的又要做些什么也没有考虑，应该说这些问题的产生是很正常的，当我们知道了一项研究的设计包含着一系列相关的方面：研究的理论框架、收集数据的方法、加工数据的途径以及样本设计等等以后，再加上相关的理论学习，就可以做一些简单的研究工作了。我们在这里只简单的说明以上五点中的一些内容，目的是让学生们对于研究的方式方法有一个感性上的认识。⑴信度：测量的信度即可靠性，它是测量反映被测特征真实程度的指标，有人称之为测量的准确性，即：测量信度是指测量结果反映出个体某方面的真实的个体差异。高信度的测量很少受到随机因素或事件的干扰，能够准确无误的测量出所需的各种特征和过程。测量信度有相应的估算公式，一般来讲，测量误差越小，信度越高。影响信度的因素有：①测量项目的数目：在一定限度内，一个测验或一次测量中所采用的性质相同的项目越多，测量信度也越高。②测量的程序：测量程序对测量信度的影响很大，包括测量的指导语、程序安排、测试场地的环境、多组测量之间的间隔时间等等。③测量项目的质量：例如问卷中的选题设计应具有代表性。④测试人和受试者都会对信度有影响。⑵效度：指测量的有效性，即测量到的是不是所要测定的特征。例如：如果一项语言能力的测验测得的竟然是机械能力，那么这种测验就完全没有效度。效度的指标比较复杂，分成很多种类型，在这里就不一一讲述了。影响效度的因素有①测验的组成：选题与构思、测验的长度、项目的难度等等。②测量程序；③所用样本与受试者的特点等等。信度和效度的评定标准很多也比较复杂，学生在高中阶段将要做的研究工作一般都比较简单，只要让他们有这种意识就可以了，如果需要可以去查阅相关的书籍和资料就可以了。
⒊数据的处理：用问卷等方法所得到的结果，可以收集到一些或大量的数据，对数据的处理可以分为统计和分析，并得到研究结果的过程。　 ⑴统计（分析）：是研究方法的重要组成部分，在此基础上才能做进一步的分析和研究，在做统计分析时首先要了解数据的特征。当收集了数据后，需要用计算机做出一些数据图形，然后观察数据所表示出的特征，其中包括数据的集中趋势、离散程度、偏态度、峰态度等，并且判断数据呈现一种什么样的分布，如正态分布、二项分布、t分布、f分布、x2分布等等，用来判断数据的呈现规律。它们各有其特点和用途，但其中以正态分布最常用，最基本的，统计学的许多技术问题，只有在假定总体观察值为正态分布时才得以解决。⑵数据的进一步分析：例如：相关分析：自变量与因变量之间的关系。回归分析：猜想或寻找数据的规律，主要用途是预测将要发生的事件。除此之外根据研究内容的不同需要，还有很多种其它的分析方法，就不再说明了。
这些工作很少借助人力，有专门进行统计的软件，例如象spss、sas，如果需要可以到网上下载。由于数据的处理用到的都是统计学中的知识，如果需要可以学习统计学的相关知识，参阅相关的书籍，或登录一些网站取得这一部分的知识，在应用中学习就可以了。今后，大学中要学习有关的课程。讲这节课的目的并不是让学生通过一次课去掌握整个的研究方法，只是给学生一种观念，知道正确的研究方法是什么，如果今后要用做研究了，可以怎样去想，有什么样的理论可以依据，到哪里可以找到要用的东西。
作者：陶昌书调查问卷设计与初步数据处理
本人做互联网的，首先就从互联网方面着手引入问卷设计的话题。通常大的网络公司网站的改版，平台外观的变化之前都会进行一系列的准备工作，而这些工作都是由用户驱动的。在这之前你需要明白用户的原始需求是什么（是不是可能有新的需求）？然后确定合理的设计流程：需求调研---需求分析---产品设计---设计实现。需求调研方面，你需要了解你面对的核心用户是谁？他们的属性（年龄、收入之类）如何？有什么样的需求？满足这些需求能给我们带来什么？调研结果的实现有很多途径，下面主要说说问卷设计的基础知识：
问卷选题设计步骤
1.提出足够的测量选题，通常提供的选题是最终问卷选题数的2倍
2.预试以删除不佳的题目：通常可以通过专家评估（通常调研公司都是通过经验判定），内部试测等方式排除。例如内部试测中某一选题填答者答案一致性很高（标准差接近0），代表没有区别能力，则可考虑删除此题
3.选取内部一致性的题目
4.建立正式调查问卷：删除不良的选题后，就可进行最后的排版。通常问卷前会有一段文字来说明问卷标题、研究内容与目的、调查单位、感谢词、填卷说明等等
5.若不满意，回到1重复以上内容直到满意为止&
问卷设计精要12条
1.题目是否符合研究假设的需要
2.题目不宜过长，应以精简、易于阅读为原则
3.问卷设计的用字不能含糊要明确，用字要浅显易懂，不要超出答题者的理解能力
4.问题不能超出填答者的知识或能力
5.任何一个备选答案皆不能有多重意义或包含关系
6.一个问题不能有两个以上的观念或事物
7.问题尽量以封闭式而非开放式的方式来填答
8.问题不应涉及社会禁忌与隐私
9.题目应尽量保持客观中立的原则，将自己的主观意见加入问题中，而设计出引导性的语句，将会造成填卷的偏差
10.避免引诱回答或暗示回答的问题：例如，您赞不赞成抽烟？
11.通常将一般的、易于回答、熟悉的问题放在前面，以避免填答者一开始就拒答
12.使用反向题目（防止填答者的草率与恶意回答）
说了这么多关于问卷设计的基础知识，你们是不是有些许补充意见呢？言归正传，上面的问卷设计步骤讲到了有关试题的删除及问卷内部一致性的问题，一份调查问卷的好坏除了要难度适中且要有较高的鉴别度外，最重要的是要有信度和效度。
二、信度与效度分析
什么是信度和效度，简言之信度就是可靠性，效度就是正确性。信度通常是可测量的，而效度则很难测量（通常凭经验判定），目前市场调查与研究中，问卷调查可以说是最常采用的方式。信度和效度只有程度上的差别，而不是全有或全无的差别，因此调查问卷的信度与效度是相对的而非绝对的。&
信度是指一份量表所测得的分数的一致性与稳定性。通常，要得到测量的信度需对受测者在相同的环境下测量至少2次。同一群受测者在同一份量表多次填写的一致性很高则表示信度很高，反之则表示信度低。关于信度的数学定义，林震岩在其《多变量分析》一书中定义为：假定测量所得的测量分数为x，真实分数为T，误差分数为E，三者的关系为x=T+E,即误差分数越小信度越高，而信度则为测量分数x与真实分数T的相关系数的平方，即:
&&&&&&&&&&&&&&&&&&&&&&&&&
通常信度可分为再测信度，复本信度，分半信度和Cronbach
α信度（系数）。简单的讲再测信度是指在不同的时间做相同的测量，比如同一套心理调查问卷在期初和期末测量；复本信度指不同时间不同的测量，这里的不同指不用同一份量表而改用两个形式不同的等价量表；分半信度指在相同时间作不同的测量，这里的不同是指将量表中的项目被分成两半并计算测量结果的相关系数，主要用来测量内部一致性；Cronbach
α信度，是指量表所有可能的项目划分方法的得到的折半信度系数的平均值，也是最常用的信度测量方法。
通常Cronbach α系数的值在0和1之间。如果X系数不超过0.6，一般认为内部一致信度不足。Cronbach
α系数的一个重要特性是它们值会随着量表项目的增加而增加。因此，Cronbach
α系数可能由于量表中包含多余的测量项目而被人为地、不适当地提高。还有一种可以和Cronbach
α系数同时使用的系数。系数能够帮助评价，在计算Cronbach
α系数的过程中，平均数的计算是否掩盖了某些不相关的测量项目。不同的研究者对信度系数的界限值有不同的看法，有学者认为，在基础研究中Cronbach
α系数至少应达到0.8才能接受，在探索研究中Cronbach α系数至少应达到0.7才能接受，而在实务研究中，Cronbach
α系数只需达到0.6即可。
在同群里的朋友们讨论的时候，谈论最多的就是关于Cronbach α系数值的问题，有的书上说Cronbach
α值范围为0-1，但就有朋友把Cronbach α值算出来是负数，并且非常肯定的说Cronbach
α值的范围应该是（-oo,1]。其实，在用SPSS作信度分析内部一致性检验时，是要满足一定条件的，比如说问卷项目得分方向应该一致；其次SPSS中效度分析模型用的是真分数理论,模型是得分与真分数之间存在线性，其计算公式模型为：
& （其中Si是指单个项目得分标准差，Sh是指Sh是全部项目总得分的标准差，这里讨论的结果是注意与方差分析类似情况的区别）
效度也称正确性，表示一份量表能真正测量到该量表所要测量能力或功能的程度。通常效度≤
，主要分为内容效度、效标关联效度和建构效度。指测验题目对有关内容或行为范围取样的适当性；建构效度指测验分数能够说明理论上的某种结构或特质的程度；效标关联效度指测验分数与效度标准的一致程度。
信度值可以计算，效度值呢？目前为止效度值还很难测量，所以SPSS中只有relaibility程序，却没有任何一个效度计算的程序，而通常专家修订的一些量表也只是调整内容效度罢了。更多关于效度的内容参见：&
SPSS的信度分析摘要
SPSS的信度分析可研究测量量表的性质以及组成他们的项目。信度分析程序会计算一些常用信度量数，同时也会提供有关量表中个别题目间的信息及组内相关系数。（注意：信度分析的数据可以是二分的、次序的或是等距的，但必须以数值表示；此外，信度分析假设观测值应该是独立抽样的，题目间误差应该是不相关的，且每一对题目应该具有二元正态分布。）
选择Analyze→Scale→Reliability程序，会弹出Reliability Analysis对话框。如下图：
&&&&&&&&&&&&&&&
1、主要选择计算信度系数的方法或模型，SPSS提供的模型有：I、Alpha
计算Cronbac&&
α系数；Ⅱ、分半信度（Split-half）；III、Guttman,此模型计算真实信度的Guttman值下限，信度系数从lambds1到lambds6；IV、平行模型检验（Parallel）：此模型在所有复制过程中，会假设所有题目均有相等的变异及相等的误差变异；V、严密平行模型（strict
Parallel）
2、选择进行信度分析的变量
3、统计量（包含Descriptives for、Summaries、Inter-item、Avon
table四个主要统计变量框）
&&&&&&&&&&&&&&
应用语句：
RELIABILITY（信度分析主语句）
& /VARIABLES=VAR00001
VAR00002（选择进行信度分析的变量）
/FORMAT=NOLABELS（相关格式说明：是否列出项目标签，此处选择不列出项目标签）
/SCALE(ALPHA)=ALL/MODEL=ALPHA（信度分析方法或模型的选择，此处选用Alpha）
&&/STATISTICS=SCALE HOTELLING
CORR ANOVA FRIEDMAN
TUKEY（选择需导出的相关统计量，例如：SCALE表示描述统计对象采用量尺法，可以计算所有分析变量合计的平均数、方差、标准差和项目数；HOTELLING表示一种多变量的T检验，可用来检验各分析变量的平均数是否相等；ANOVA
FRIEDMAN则显示FRIEDMAN和KENDALL和谐系数，适采用等级形式的数据，在ANOVA摘要表中会以卡方检验置换一般的F检验）
& /SUMMARY=MEANS
COV（统计量选项中摘要部分内容的导出，此处选择了均值和协方差，例如：均值导出结果会显示分析项目中的平均数的最小与最大值，所有分析项目的平均数、项目平均数的全距和方差以及最大与最小项目平均数的比值等）
& /ICC=MODEL(MIXED) TYPE(CONSISTENCY) CIN=95
TESTVAL=0 （组内相关系数格式说明，此处选择的模型为：Two-Way mixed,类型为 consistency
，置信区间为95%，检验值为0）
信度分析结果制表与解释
由于这里没有实际的操作数据，只能理论上简单的说明。由于SPSS得信度分析产生了大量的表格，我们实际运用时就必须将自己所需要的数据整合起来，不同的信度分析结果制表不同，比如说我们最常用的Cronbach
α信度分析结果分析表通常可以写出如下形式：
未删除项目前的Item-Overall
的相关系数
未删除项目前的Total的相关系数
删除项目后Item-Total的相关系数
删除此项目后的α值
三、数据的预处理
数据预处理没有统一的标准，只能说是根据不同类型的分析数据和业务需求，在对数据特性做了充分的理解之后，再选择相关的数据预处理技术。处理的数据有很多种，比如噪声数据处理，缺失值的处理，孤立点数据的处理等等。这里主要讲讲根据调查问卷收集而来的数据预处理方式，通常调查问卷收集来的数据预处理包括缺失值的处理和异常数据的处理（逻辑判断、同质判断、概率判断等），关于缺失值数据的处理张文彤老师已经在他的《SPSS统计分析高级教程》一书中作了详细的介绍，有兴趣的可以去查阅，下面主要说说SPSS中异常数据处理中逻辑错误的处理.&
由于手头没有具体的实例，这里我拿WOW为例随便编造几个简单数据编造为例，来对WOW玩家进行调查，由于事先不能确定玩家情况，我们用2个问题对玩家身份进行判定，
1你是否玩WOW？& A
& 1.1目前中国大陆WOW人物角色最高等级为？（1选择是回答此问题）
下面我将建立数据将非数据中的假WOW玩家排除，
DATA LIST FREE /wow rank.
BEGIN DATA
VALUE LABELS wow 0 '否' 1 '是'
/rank& 1 '50'& 2
'60'& 3 '70'& 4 '80'.
DO IF wow = 1.
- DO IF rank = 3.
- COMPUTE valueCheck = 1.
- ELSE IF wow= 1.
- DO IF rank &4.
- COMPUTE valueCheck = 2.
- ELSE IF rank=1 or rank=2 or rank=4.
- COMPUTE valueCheck = 3.
- COMPUTE valueCheck=0.
VALUE LABELS valueCheck
0 '非WOW玩家'
1 'WOW玩家'
2 '录入错误'
3 '伪WOW玩家'.
FREQUENCIES VARIABLES = valueCheck.
&&&&&&&&&&&&
PS：SPSS交流群昨日完成了相约周五《每周论点》的第一次讨论，讨论结果及相关资料记录在
已投稿到：
以上网友发言只代表其个人观点，不代表新浪网的观点或立场。& 调查问卷数据处理方法有哪些
调查问卷数据处理方法有哪些
进行处理的方法有很多种方式方法，如果为了让最后的数据可以应用于您的工作中或者是分析报告中，就要根据您调查的种类进行相关工作的确认。如果是进行一般的网络问卷的话，可以在网上找到一些统计数据的软件进行下载应用就可以，在进行这项工作的时候，一定要注意在进行问卷的实施工作之前就要了解最后的统计方式，不要先进行问卷的实施工作再想办法统计，这样就可以影响最后的效果。
所以，制定调查的计划的时候，如果您采用网络问卷的形式，就需要在开始就找到专业的网站进行合作，把您的调研需求告诉给工作人员，让他们为您挑选进行问卷调查的方式方法，这样就可以让您得到比较可靠地调查问卷数据，也可以加快您进行调查分析工作的速度。如果您进行的是一般性的市场调研，没有找合作的公司进行问卷的开展，那么自己进行问卷的统计也是可以的。
自己进行调查问卷数据统计工作就一定要掌握一些专业的知识，否则您会不知道应该如何着手进行，如果是进行了问卷数量比较多的调查，在统计工作里面也会造成很多的麻烦，这个时候委托为专业的人员进行数据的处理工作也是可以的。为了能够让您的调查工作有一定的目的性，就需要在进行这些工作的过程中有一定的计划，让工作可以顺利的开展。
进行调查问卷数据统计处理工作最忌讳的就是盲目与着急，这样会大大的影响最后调查取得的效果，也会为您的工作带来非常多的不便，如果您在进行这项工作的时候没有太多的把握，希望您一定要与专业的网站公司进行联系，让您的问题得到妥善的解决。也可以帮助您的调查工作开展的更加的顺利。以上的内容都是对于调查问卷数据处理的方法有哪些这个问题的简单回答，如果您想要具体的了解这项工作就一定要根据专业的知识以及经验来进行了解与实施。
请输入关键字搜索您的赞赏，是对我创作的最大鼓励。|赞赏
收藏已收藏 | 509赞 | 127
分享到微信扫码分享到微信
投稿、稿件问题联系Q：
1543篇作品17.7m阅读总量
热门问题12345678910> 问题详情
对调查数据处理的步骤包括( )。A．问卷的确认和编辑B．数据的录入C．问卷的发放与回收D．数据的图
悬赏：0&答案豆
提问人：匿名网友
发布时间：
对调查数据处理的步骤包括( )。A．问卷的确认和编辑B．数据的录入C．问卷的发放与回收D．数据的图形化E．描述性统计此题为多项选择题。请帮忙给出正确答案和分析，谢谢！
论文写作技巧
您可能感兴趣的试题
)最伟大的发明。A．21世纪B．20世纪C．19世纪D．18世纪2我国电影的拍摄片比为(
)。A．35：1B．15：1C．20：1D．3．5：1
我有更好的答案
相关考试课程
请先输入下方的验证码查看最佳答案
图形验证：
验证码提交中……}

我就爱股票网