Spss考试基本要求及大纲分析.docx
Spss考试基本要求与大纲分析(仅供参考)基本要求:1、娴熟2、知其然亦知其所以然3、从中随机选取2-3或4个操作题4、操作50分+说明50分5、上机独立操作第2章数据文件的建立与整理1、以下操作在datesortCaSeSl根据某个之分。SortChsMbhHll状况g3Sii*R*qSI吩你矍左干什么工作|<M,基11电生地g时<Hftd*q84%nj体状况Ih01Sortby:7件留il-AscendP"7"普-AsccndDc8811lSortOYCrAscendingDescending育阳街.xvSPSSData(ditorJjaftftcnnQfVtAUtfttetJndcCS*插入行数据,增加个案。Sc*Fte.sC4tM.weWC««.CneOsces.CtoC4M.SortCa1«.T*wow.Rwtructw.Sl插入列数据,增加变盘.2、splitfile:DatafSlAnal/zcallc«ses.donotcreategroupGComparegroupsSggfzCuutbygroupsQfOtigsedon:S<x1theWebygfxp<9vriabletrDieItalreadysortedIeHtAbh今年龄1年龄I09状Hwn“学历E4。先工作NHflt长也取*三*itwR*hw体理在干什么工作IC*包内出生地Igl何酎if入*q8学室的身体状况IMnl“纪老伴的9体状况It&保冠5年内编,。经美H麦,山、Ad2>-M<对话框。3、selectcases:Data-SelectCases(选择个案)吩咐,打开SeIeCtCases对话框。执行后,会产生一个飞”的变量,凡被选中的满意条件的个案,该变量对应的值为1(其值标签为Selected),否则为0(值标签为NotSelected),并在个案序号列上将未选中的划上斜线“/”作为标记。未选中的个案将在接着进行的统计分析中短暂被关闭。根据设置的选择条JSl件,选中个案。门=WogD5Fk-5i11R”Ie川Catr-三<*Pfl<WMktt<CBnCeIlHCs|SlctCss性别xb敏年龄11含基本工资sr砂媪船Xl失业俣聆IbXlSelectCases:If展职工号(zgh性别xb粉年龄(111(宜本悟IsrlSelectAUcasesGIfconditionissatisfied点击ifconditionissatisfied选择性别xb,点击卜方的表达式,让它T.ok运行。系统将自动产生一个名为“filter_$”的变量,凡被选中的满意条件的个案,该变量对应的值为1(其值标签为SeleCted),否则为0(值标签为NotSeleCted),并在个案序号列上将未选中的划上斜线“i”作为标记。未选中的个案将在接着进行的统计分析中短暂被关闭。根据设置的选择条件,选中个案。4、weightcases:Data-*Weightcases(个案加权)吩咐,打开Weightcases对话框对话框中单选项Donotweightcases(不对个案加权)为系统默认选项;其次个单选项为Weightcasesby(对个案加权),选择此项时激活Frequencyvariable(频数)矩形框,从源变量列表中选择一个加权变量移入此框中,单击OK,该数据文件的权变量便定义好了。须要指出,旦为数据文件定义了权变量,则称这个文件为加权数据文件,其中权变量的信息将始终有效,除非改选用别的变量作为权变量:,或者关闭它。此外,假如权变量的值中有0、负数或缺失值,它便不能在分析中应用。NameTypeM¾hDeeimaIe1.abN5、调查表编码录入二二我们打开spss.然后切换二::VariablesView(变量视图)选点13二,1八一7A1.您的性别:A.男B.女点击VaIUe栏右侧的豆腐块按钮,出现VaIUelabel,对话框。在第一个框里输入1.下面的长一点的框里输入男。点击add。然后,输入2,女,add,最终。k。结果就是这样。生活费,Ba请问您的月生活费大约有多少?元一IissiBgValwsZJ×111C3。>issincvaluesCDiScreSnissinvUu«s(Rn<cplusOneoptionaldiscretenssUr*画H>hl15Digcreto第3章变量计算与转换1、变量计算COiBUte:选择菜单transform选择CoilPUte执行TranSrOrm(转换)-Compute吩咐,打开ComputeYariabIe(计算变量)对话框。表3.1运皙符及其意义算术运算符及意义,关系运声及意义芨辑运算符及意义加法"YEQ),等于“&(ANDA与J-P减法>(GT)'大于,I(ORA或,、融,<(1.1>小于(NoTA/除法>-(GE)'大于等于,乘嘉<=<1.E*小于等于()5括导,<NE)不等于“例如:体重指数(BMI)=体重(kg)/【身高(m)平方选择菜单transform选择compute。Targetvariable栏里面输入bmi,在后面的公式里:体重/(身高*身高)*10000Vrlt>le:TyPCa1.b<l.I,姓密学性别£居住地Xti能力乡鼻遇上怪群Pn每遇上学期初戒杯期中成里4,期耒成承4bmiW100OOJ<I>.(JBHIEUnCliO«3:Q-I<a>三-IIAJjJI»I»IJJ2J2JABSume×p1)ANYpestvalue.value4.AASIN(nume×pr)APTANnume×pr)CDFNO11M(zvslcCDF.BtRNOUlIl(qpj二JJjJjJj-UJ"I二JllJDeMeIOKIPasleIBesetICncelJHelp在ComputeVariable对话框中单击If按钮,打开IfCases条件对话框。2、变量重新赋值recode现在起先,打开执行TranSfOrm-*Recode,这里recode有两个选择:IntoSameVariables(重新赋值给同一个变量)吩咐;是用新赋值的变量覆盖原有的变量。不举荐运用这种方式.IntoDifferentVariables(重新赋值给不同变量)吩咐。产生一个新的变量,会在数据文件的最终,这个是不假盖原有变量的。可以爱护数据。举荐这种方式,因为运用这个过程,新产生的变量可以分析时用,不再须SSDataEditor要是,就删去。RecodeWoSaneVirUbies.QMandNewValues.nIntoWfercntVenabtes.CategorizeVaridHes.然后,点击oldandnewvalues»弹出如下对话框。我们的分组规则:18-30岁一青年组,30-50岁一中年组,50岁以上一老年组.对话框里是玳新赋值的标准,分别是Daffr>>tV<tbkl*.014<ndValv*OldValueValue:ISystem-missing1.System-oruscr-mitfsingGRange:31through50Range:1.ciwrutdruughRange:ItlrouyllilBtAllhervaluesNewValueCVuc:CSyutrmmi:;lng1.Copyoldvafuc(三)Old->New:l8Ihru305青年,Add£h8C0CRemove31thru5050UiruHigheel-)飞年QOutputVnrinblenarestringsyy<th:ContinueCancelHelp在Oldvalue旧值栏里,点击range填入18和30.在newVaIUe里填入1,点击add。SPSS就会显示把18-30的值,都统重新赋值为1(这里,1是代表青年组,这个我们会在稍后定义,当然你也可以填入随意数,只要在后面定义其值标答时,定义成青年同样操作,把中年和老年定义好。同时,假如有其他值的话,就作为系统缺失值。这里50岁以上的就要用卜面的栏。卜面就是定义,从某个值以上的数值。面其他值,就用allothervalues,定义成缺失值时,在newvalue里,点击SySteln-missing。RCCOdeintoBiffercBtV*ri¼les.Old*ailewYlvesNewVaIue6Value:3Copyoldvalue(三)SystemmissingAddChjmge1thru30->131thru50->250thruHighest->3E1.SE->SYSMISHcmoveFOutputvariablesarcstringsWidth:bConvertnumericstringstonumbers(,5,->5ContinueCancelHelpOld->New:OldValueValue:ISystemmissingSystem-oruser-missingrRange:IthroughRange:1.owestthrough6Rang:SI)throughhighestAllfithervalues这样就可以了,点击Continue,回到recode栏O点击ChangeO最终点击ok»第4章描述统计过程1、匆I数分析-Frequencies并说明执行AnaIyZefDeSCriPtiVeStatistics-Frequencies吩咐打开设置图4的类型及&表坐标”出格式逸择求出的统计单击StatiStiCS按钮,打开统计量选择对话框。此对话框中包括:XPercentileValuesQUanileS四分位数将数据分为设Cutpointsfore雷单需?数PercentiIe(三):|百分位数AddChangeRemoveCentralTendencyMean均(fiICOnUnUMCancelMedian中位数MOde众数Sum合计HelpValuesaregroupmidpointsrss:s三a11mDistributionSkewnessMFrequencies:Statistics厂VarianCe方差FMaXimUm最大值.上加Kunosis,皮RangC全距SEmen均值标准误单击Chart(图形)按钮,打开统计图对话框,对图形类型等进行设置。ChartType(图形类型)包括的4个单选项,其中:Prcqucncics:ChartsCancelIC.ntifut!ChartTypeNoM不出图形UBarCharU条形图Plecharts饼形图Histograms亶方BBFWithnormalcurveCImrlVnIiieR仁rrquendesCPrfcentitgefi单击FOnnat按钮,打开格式对话框示。s:Format按曼值升价用勇IGAscendingvalues技变量值降闾4列Descendingvalues按变量Itit生楚我/IKAscendingcounts按麦It值发生81”鼻塞mDescendingcounts6ComparevariablesOrganizeoutputbyvariables芭嬲l三三球数thancategoriesIContinue"CancelHelp结果分析:Statistics(统计量)汇总表。FrequenciesStatistics您的性别NValdMtssirg269OFreqUCnCies(频数)分布表,分别用两个变坡输出它们的值频数分布、累积分布等。然的性别FreqiencyPercentVairiPercentCurrubttvePercentVald男11843.943.943.9女15156.156.1100QTotal269100.0l.0frequency是指的频数,我们可以看出本次调查调查了118个男生,151个女生percent是仃分比,也就是男生女生的频数除以总的样本数。男生占43.9%.,女生占56.1%Validpercent,有效的仃分比,即有效回答的问卷占总体的仃分比。Cumulativepercent是累加的百分比.即是把有效百分比依次从上往下相加,假如我们的变量是一个定序的变量,这种统计指标还是很有用的(意思是说,假如不是定序的话,这个指标就可以不看了)。Barplot(条形图)。2、描述统计量DeSCriPtiVeS并说明(1)执行AnaIyze-DescriptiveStatistics-Descriptives(描述)吩咐,打开DeSCriPtiVeS对话框。从源变量清单中选择一个或多个分析变量移至Variable(三)栏中。Dcscriptivcs号numberttM(te×»年龄IagelVariable(s:1.U修ISavestandardizedvaluesasvariablesOK计算并保存所逸变量的标准化值,公式为z1=E1.-一二'S指定统计*与输出绪果显示的顺序3、数据的标准化(I)打开数据文件。儿童宇传华.sav的数据。(2)执行AnalyZeDescriptiveSlaIiSliCSFrequencies吩咐。(3)选择变量身高,在左卜.方有个displayfrequencytable,输出频PreQuenciesDisplayfrequencytablesS<alistic8.JCharls.format.ChartTypeNQfleBarcharts0echarts,Histogram:Q付IhnormalcurveFrequencies;ChartvX:击以下鼠标,不选它,频数表吗?我们点击确»*二、两个群体进行比较标准化比如,假设我考人民高校,英语73分。我的同学考北京高校,英语58分。那现在要比较我们两个人的英语水平,这个时候有的同学说,比分数不就可以了,假如比分数的话,那我的英语比我同学高,但是事实上,我的英语水平不与他。因为人民高校历年的英语都是很简洁的。而北大的英语胭可以说特别难。这样我们两个人之间要比较的话,就须要统一标准。比如下面的数据标准化英语.sav°人大英语I北大英语!73.0Oi58阖-72004673.5051.0080.5060面这个时候统一标准的方法,就是将两个数据都标准化。选择descriptive,选择人大英语和北大英语两个变量,勾选saveStandardrizedasvariable0DeacriptveaBesetCancelHelp三as1e结果就是在数据文件的最终两列,都会有标准化值产生。人大英语I北大英语|Z人大英|Z北大英|173.005800-450606690772.004600-7OO8-120183373.50W二'5100-.321861-.4264S48050EDOO14HU96922我的人大成果73分时应的标准化值z人大英是-0.450,我同学的北大英语成果58对应的标准化值Z北大英是0.659,这个时候就可以比较了,可以看出我同学的成果其实是比我高的。三.Descriptive(描述统计)的其他功能单击Options按钮,打开Options对话框。Discriptive里还为我们供应其他一些常用的统计量。比如均值,标准差,方差等。如下图。Descriptives:OptionsVMean均值I-Sum合计DiSPerSiOn高效趋势lStd.加浦送BMinimumVariance方差BMaximumRangt全距iS.E.mean;Distribution分布FKUrtOSi啾度SkeWneSS偏度DisplayOrdtr输出顺序Variablelist按数据集中变量的排列*序显示或计量CAlphabetic按变量名字母序展示侠计量Ascendingmeans按均值升序显示统计量rDeS(XndIngmeanS按均值降序显示统计量ICOntinUMCancelHelp四.各部分含义DescriptiveStatisticsNMhimumMaxrnumMeanStd.StatsticStatsticStatisticStatisticStd.ErrorStatstic以悠对朋友的定义,您总共有多少朋友VabdN(Ishvise)20220238029.231.3519.160总量最小值最大值均值均值标准误五.画出数据的正态分布曲线见上面曲线图第5章交互分析过程1、交互分析吩咐Cr。SStabS(交叉表)交互分析通过交叉表或者是列联表,总之英文叫做CroSSlab,来展示两个变量的关系。交叉表过程可以显示两个或多个变量的联合频数分布表,简称列联表或交叉表。如图。吸烟*MffiCrosstabulationCount肺癌Total国肺翘不患肺癌吸烟吸6040100不吸2080100Total80120200上表就是一个曲型的交叉表,横着的行,分别是吸烟与不吸烟,竖着的列,分别是患肺癌与不患肺癌。通过横竖交叉,把我们调查的200个人分成四个类别。分别是(吸烟,患肺癌:60吸烟,不患肺癌:40(不吸烟,患肺癌:20(不吸烟,不患肺癌:80步骤:(1)打开吸烟与肺癌sa%(2)选择data-weightcase.打开加权对话框,选择weightcaseby把权数选进去。Ok执行。(3)执行AnalyZeDescriptiveStatiStiCSferOSStabS(交叉表)吩咐,打开Crosstabs对话框。把两个变量分别选入row和collu11r,其×JCrosstabsBesetCancelHelpOK(4)运行结果如下。肺座Total史触癌不忠脚痛吸烟吸6040100不吸2080100Total80120200吸烟*肺癌CrosstabulationCount吸烟的人有60%患有肺癌,不吸烟的人有20%患有肺痛。吸烟的有40%的不患,不吸烟的有80%不患。(结果假如须要出现%号:重新调入cr。SStab过程。选择下方的CCll按钮。在PerCenIageS里选择row。运行)2、如何解读(判定)X值,df,sig值(假设检验的问题)(接上面)重新调入crosstab过程。点击Statstics按钮,选择Chi-SquareTestsValuedfAsymp.Sg.(2-sded)ExactS>g.(2-slded)ExactSg.(1-slded)PearsonChi-Square33.333b1.000ContinuityCorrection31.6881.000UkeliboodRatioAsherExactTest34.5221.000.000.0001.inear-by-1.inearAssociati33.1671.000NofValdCases200a.Computedonlyfora2×2tableb.0cels(.0%)haveexpectedcountlessthan5,Themiimjme×pectedcount40.00.上表里就是我们最终想要的统计数据.Pcarsonchi-square就是我们通常所说的卡方。用希腊字母就是X?。X。值是33.33,df是1(白由度等于样本容量减1),Sig是0.000。通常这说明,吸烟和肺痛是有关系的。吸烟会导致肺癌。两者的关系有统计意义,显著度小J:0.05.X:是由皮尔逊独创的,所以在SPSS输出里叫做pcarsonchi-squareX,是由两个正态分布的是由n个独立的标准正态分布的平方和相加而成的.自由度为n。自由度不同,X:分布的图形不同。可以说,假如自由度限大的话,X?分布会趋近于正态分布。那么卡方怎么判定,我们用显著度来判定,就是SPSS输出表格里的sig。Sig<0.05的话,我们可以认为两个变量是有关系的,相互影响的。显著度标准问题,我们一般用0.05来作标准,<005,就是说,原假设成立,那么这种状况发生的概率小于005,则可以拒绝原假设。第6章均值比较过程Analyze-*CooareMeans-*CcoprMeansgnerl1.inea*ModelOnSfplTTst.Correlate.Independent-SamplesITest.Remon>faired*SvtplesTTest.ClassiOn-YftyYA.Means,最简洁的均值比较T检验法IOnesample:单个样本的t检胎,这一过程是用来检瞳样本均数是否等于一个特定值.Independentsanle:独立样本t检验,用t检验来检验均值是否相等Pairedsample:配对样本t检验,看两个相像的样本是否均值相等用于医学居多OnewayANOVA:单因索方差分析,1、neans均值比较打开城市社会学数据。执行AnalyZefComPareMeanSfMeanS吩咐,打开Means对话框。(2)从变量清单中选择“您平均每个月花多少钱”作为因变量,移入DePCndCnt栏,一般因变量应当是连续型的数值变量。选择“性别”“家庭所在地”作为白变量。其他默认,Ok提交运行。移入IndePOndent1.iSt栏,这里分组变量也就是自变量.(3)单击Options按钮,打开统计量选项对话框。(4)默认就可以了,点击Ok运行。leansOKPasteBesetCancelHelpOptions.IQependent1.ist:I,你平均每个月花多d4的的的的的的?用.88费花花花吗你一43娘月月机一llasl£生生个个分手月Ir*m的级治业的的的姆每衽有个5nil年年政专伤好怒你秀你你上一<言小岁岁岁a学中<<<-Means:OptionsMedianGroupedMedianStd.ErrorofMeanSumMinimumMaximumDrceArnMeanNumberofCasesStandardDeviationStatistics:CellStatistics:(3)(Statistics:选择要输出的统计指标,二十余个统计:S,Mean、NumberofCases和StandardDeViatiOn为默认输出的统计员)结果你平均每个月花多少钱*性别你平均每个月花多少钱性别MeanNStd.Deviation男527.7453197.381女559.4858217.848Total544.32111207.996你平均每个月花多少钱*家血所在地你平均每个月花条少我家庭所在地MeanNStd.Devetion大城市677.789231.990中小城市623.4432219.230乡演536.6128192.296农村460.6042169.886Total544.32111207.9962、单样本t检验OneSanpleTTest如何解读Sig值(1) AnaIyZe-CompareMeanS-0De-SaDleTTest(单个样本T检验)吩附,打开One-SaInPleTTeSt对话框,.(2)单击OPtionS按钮,打开选项对话框。在此对话框里可以设置置信概率与缺失值的处理方式。剧除所有含缺失值的观测One-SampleTTest:Options剔除分析变量缺失值的观泅在ConfidenceInterval(置信区间)栏里输入1-99(%)中的一个数值,输出结果给出样本均值与指定的检验值此之差的置信水平该数值的置信区间。这里我们让它默认95%。(3)选项确定后,单击OK提交系统运行。One-SampleStatisticsNMeanStd.DeviationStd.ErrorMean打包机999.9781.2122.4041One-SampleTestTestVaIue三100tdfSig.(2-tailed)MeanDfference95%ConfidenceIntervaloftheDifference1.OWerUpper-.0558.957-.022.954.910第一栏里显示我们有9个样本。样本的平均值等于99.978,标准差为0.4041其次栏里显示T统让量值I=0.055;df(自由度)为8,自由度等于样本容量减1;双尾T检验的显著性概率Sig(2-tailed),Sig.-0.957>0.05,MeanDifference(均值差),即样本均值与检验值100之差为-0.022含义:1:T统计量:值df(自由度)为8双尾检验的显著性概率Sigmeandifference,均值差,这个很好算,就是9个打包机数据的均值版去100得来的。95%ConfidenceIntervaloftheDifference):样本均值与检验值偏差的95%置信区间为(-0.954,0.910),置信区间不包含0,则说明以95%的置信概率样木值与检验值偏差为零。接受原假设。Sig就是t的检验,遵循的还是假设检验的逻辑.假如sig>0.05那么就可以认为不能拒绝原假设。U=G3、独立样本T检验如何解读Sig值独立样本的T检验用于检验来自正态总体的两个彼此独立的样本之间的差异。即校验两个群体的均值是否相等。独立样本的T检段的步骤如下:打开城市社会学.sav,执行AnalyZe-CompareMeans-*Independent-SaDleTTest(独立样本T检验)吩咐,打开IndePendent-Sa叩IeTTes对话框.从源变量清单中选择个或几个数值型变量移入TeStVariabIeS框。这里选择你平均每个月花多少钱。OKPfc1eBeqetCincdHelpJ/t-1-f/WIG论wr%纥汽?一於h费费el花花吗Jnra活月月内机Ia生生生个个个土Mn板«庭一笈的的的也每的有.I年年£«多ffffff你你你你.选择分组变量移入GroupingVariables框里,这时框内显示“变量名?单击DifineGroups(定义分组)按钮,默认的是选择Usespecifiedvalues,表示用分组变量的值进行分组,并在GroUPl和GroUP2框中分别输入指定的分组变量的不同有效值,区分两个独立样本。打开财话框。分别输入1,2.(2)单击OPIiOnS按钮,打开选项对话框,设置置信概率与缺失值的处理方式。它与单个样本T检验的选项对话框完全相同,默认就可以九Independent-Sa三plesTTest:OptionsConfidenceInterval:|95%ContinueMissingValues,ExcludecasesanalysisbyanalysisExcludecasesistwiseCancelHelp单击OK,提交系统运行。输出结果如E组统计里值表GroupStatistics性别NMeanStd.DevetlonStd.ErrorMean你平均每个月花多少假男53527.74197.38127.112女58559.48217.84828.605这里显示,男生平均每个月花527.7元,女生平均每个月花559.5元,标潴差更大点,可以说女生在消费方面,圣别比男生大。独立样本T检验结果表.表中显示结果分为两部分:这里表格的前两列,由一个F和sig,这个是1.evene,sTestforEqualityOfVariances,为方差齐性检验,这个检验的是两组的方差是IndependentSamplesTest1.evene'sTestforEqMtyofVariancest-testforEquallyofMeansFSiq.tdfSig.(2-taifed)MeanMferenceStd.ErrorWferencC95%CorfdenceIntervaloftheMference1.enVerUpper消费Equalvariancesassumed1.948.166-.802109,42431.7539,589-110.21046.717EqualVariaricesnotassumed-.806108.994,422-31.7539.412-109.86046.367K/八I1.AI>NI-J。y-4JX入"J、Un»»o*,'八-X-fI月花的钱是一样多的。均值差为-31.75;均值差标准误为39.589;均值差的95%置信区间为(TIO.210,46.717)o4、配对样本T检验如何解读Sig值配对样本的T检验用于检验来自正态总体的两个彼此相关的样本均值之间的差异。打开或建立数据文件,执行Analyze-CO即areMeans-Paired-SampleTTest(配对样本T检验)吩咐,打开Paired-SamPIeTTest对话框。从源变量清单中选择一对或几对成对数值型变量,移入PairedVariables(配对变量)框,框内显示出“甲变量一乙变量”,表示这一对变量将作为比,攵的检验变量。当从变量清单中选择了一个变量时,栏下CurrentSelections(当前选择)状态栏里显示出选中的变量名,再选择另个变量,对话框中心的箭头按钮方可被激活,这时才允许将它们移入PairedVariableS框。(2)单击OPtionS选项按钮,打开选项对话框,在这里设置置信水平以与缺失值的处理方式。选项确定后,单击OK提交系统运行。结果分析:配对样本相关性检验表如表所示。ParedSamplesSt4ttF*M11NStdDevwbonStd.ErrorMwnPJr197f11122.101011.318133.57911治疗后112.101016.175775.11523 表6.7中的CorrelaliOn(相关系数),显示配对样本的线性相关性。相关系数为0.990,不线性关系的显著性概率Sie.=0.000<<0.05,说明两种轮胎的磨损量具有高度的线性相关关系。PlMre(ISjmpsCorrMdtiomNCorrcbbon沁IO.674.033 配刻样本显著性检验表如表6.8所示。表6.8的显示结果为: PairedDifferences(配对变量数值差)中,列出成对"样本数值差的统计量值,有数值差的平均值为26.4克、标准差为26.1457克、平均标准误为8.268克、95%置信区间为(6.6965,45.1035)» I统计量值t=3.193:白由度为9。 T检验的双尾显著性概率Sig.=0.OlKO.05,说明两种轮胎的耐磨性有显著的差异。ParFaMmprsIeMDrteencestSQ(2-tod)MMnStdSorMwn96¾ConMerceIntEaftheWfermce1.owPMl内而力打后W.011.953611.4918S5112