相关与回归分析实验报告心得体会(9篇)

时间:2023-07-11 13:45:02 来源:网友投稿

篇一:相关与回归分析实验报告心得体会

  

  线性回归分析实验报告总结

  实验名称

  线性回归分析

  实验目的1、通过实验掌握线性回归模型拟合及参数估计

  2、获得处理统计推断与预测的能力

  3、学会残差分析、掌握Box-Cox变换的方法

  4、学会最优回归方程的选取

  5、进一步熟悉SAS的应用

  二、用文字或图表记录实验过程和结果

  解:

  sas程序为:

  datatwo_4;

  inputyx1x2;

  CARDS;

  ......(省略了数据)

  ;

  RUN;

  PROCREGDATA=two_4;

  modely=x1x2/I;

  OUTPUTOUT=aP=PREDICTEDR=RESIDUALH=HSTUDENT=STUDENT;

  RUN;

  PROCCAPABILITYDATA=aGRAPHICS;

  QQPLOT;

  RUN;

  PROCGPLOTDATA=a;

  PLOTRESIDUAL*PREDICTEDRESIDUAL*x1RESIDUAL*x2;

  SYMBOLVALUE=DOTI=NONE;

  RUN;

  PROCIML;

  N=15;

  USEtwo_4;

  READALLVAR{yx1x2}INTOM;

  X=M[,2]#M[,3];

  X2=M[,3];

  Y=M[,1];

  P=Y||X||X2;

  CREATERESOLVEVAR{YXX2};

  APPENDFROMP;

  QUIT;

  PROCREGDATA=RESOLVE;

  MODELY=XX2;

  RUN;

  PROCPRINT;

  RUN;(1)<表一>参数估计的sas输出结果为:

  ParameterEstimates

  Parameter

  Standard

  Variable

  DF

  Estimate

  Error

  tValue

  Pr>|t|

  Intercept

  x1<.0001x2<.0001分析:参数?0、?1、?2的估计值为、、误差方差?的估计值?=MSE=,2?由此输出结果得到回归方程为:Y=++从参数估计的sas输出结果中的最后一列p值可知,该城市中适合使用该化妆品的人数X1以及他们的与收入X2对化妆品在该城市的月销售量Y有显著影响,当适合使用该化妆品人的收入X2固定时,该城市中适合使用该化妆品的人数X1每增加一人,此化妆品的月销售量将增加个单位;同理当该城市中适合使用该化妆品的人数X1固定时,他们的收入X2增加一单位时,月销售量增加个单位;

  (2)<表二>插入方差分析表:

  AnalysisofVariance

  Sumof

  Mean

  Source

  DF

  Squares

  Square

  FValue

  Pr>F

  Model

  5384526922<.0001Error

  12CorrectedTotal

  1453902分析:线性回归关系显著性检验:统计量的观测值F0=检验的p值p0=PH0(F>=F0)<。并且在方差分析表中,还输出了R2,即R2=SSR/SST=53845/53902=其中R2值接近于1.,这些结果说明了Y与X1,X2之间的线性回归关系是显著的。

  (3)?=,由于t1??(n-p)=(12)=,利用<表一>中参数估计值可求得2??0、?1、?2的置信度为95%的置信区间为分别为:

  ?0:+*即,?1:+*即(,)

  ?2:+*即(,)

  (4)

  参数估计的sas输出结果为:

  ParameterEstimates

  Parameter

  Standard

  Variable

  DF

  Estimate

  Error

  tValue

  Pr>|t|

  Intercept

  x1<.0001x2<.0001分析:从表中的数据可知P01以及P02的值均小于,所以拒绝H0,接受H1,就是说,X1X2对Y变化的影响都是显著的。

  为检验交叉X1X2交叉项对Y的综合影响,我们设计全模型为:Y??0??1X1??2X2??3X1X2,通过SAS程序以及观测数据可以得到对于全模型的方差分析表为:

  AnalysisofVariance

  Sumof

  Mean

  Source

  DF

  Squares

  Square

  FValue

  Pr>F

  Model

  522942614<.0001Error

  12CorrectedTotal

  1453902由表中的数据可知:SSE(F)=;fF=15-4=11,而从第(1)问可知SSE(R)=;fR=15-3=12;所以检验统计量观测值F0=[()/1]/[11]=

  (5)对于给定的X1、X2的值为(X01,X02)=(220,2500),由回归方程Y=++得到销售量Y的预测值为

  从procreg过程得到矩阵(XTX)-1为:

  令X0=(220,2500)T,因为MSE=,利用sas系统中prociml过程计算可得

  X0inv(XTX)X0为;所以有:

  TT-1MSE[1+x(0xx)x0]=?4.74030[1+1.1419E23]=所以y0的置信度为95%的置信区间为:

  TT-1y0+(12)*MSE[1+x(xx)x0]=即(,135.)其中IML过程为:

  0?DATAEAX;

  PROCIML;

  X0={1,220,2500};

  X={

  ,

  ,

  };

  A=inv(X`*X);

  BETA=X0`*A*X0;

  RUN;

  PRINTBETA;

  (6)通过procreg过程输出了学生化残差,并且同时输出了因变量

  Y的拟合值Yi,残差?和杠杆量h。结果如下:

  <表三>

  Obs

  y

  x1x2PREDICTED

  RESIDUAL

  STUDENT

  H

  16227424512183254223375380213120528368623416265378281930019233245116195213555325611252434021223237244213144236266141031520815212372605分析:

  正态性的频率检验:通过表中显示的数据,可知学生化残差(STUDENT列)中有落入(-1,1)区间的有9/15=即60%;落入(,)区间的有13/15=即%;落入()区间内的有15/15=1即100%。所以,学生化残差落在上述各区间内的频率与标准正态分布的相应概率相差不大,因此,模型误差项符合服从正态分布的假定。

  正态QQ图检验:通过SAS系统中capacity过程可以直接做出正态QQ图,对于<表三>中求得的学生化残差,其正态QQ图如图所示:

  2Stude1ntizedResid-1ual-2-2.0-1.5-1.0-0.50.0NormalQuantiles0.51.01.52.由图可知,图中的点大致在一条直线上,因此说明题中线性回归模型中误差项正态分布的假定是合理的。

  残差图分析:通过SAS系统的precgplot过程分别输出了残差与Y拟合值、残差与自变量X1,残差与自变量X1的残差图,如下图:

  Residual43210-1-2-3-40100PredictedValueofy20030Residual43210-1-2-3-40100200x130040050Residual43210-1-2-3-420003000x24000500由图可知:(1)在以因变量y为横坐标的残差图中,图中个点大致在一个水平的带状区域内,而且,没有呈现出明显的趋势,说明了因变量拟合值向量与残差向量不相关,也就是说Y与?相互独立,此时,认为假设是合理的;(2)在以自变量X1、X1量为横坐标的残差图中,残差没有随自变量变化而变化的趋势,说明了假设是合理的。

  2.6解:

  SAS源程序为:

  DATAtwo_6;

  INPUTx1x2y@@;

  CARDS;

  ......

  ;

  PROCREGDATA=two_6;

  MODELy=x1x2;

  OUTPUTOUT=bP=PREDICTEDR=RESIDUALH=HSTUDENT=STUDENT;

  PROCCAPABILITYDATA=bGRAPHICS;

  QQPLOT;

  RUN;

  PROCGPLOTDATA=b;

  PLOTRESIDUAL*PREDICTEDRESIDUAL*x1RESIDUAL*x2;

  SYMBOLV=DOTI=NONE;

  RUN;

  PROCIML;

  N=31;PI=1;

  USEtwo_6;

  READALLVAR{x1x2y}INTOM;

  Y=M[,3];

  X=J(N,1,1)||M[,1:2];

  A=X*INV(X`*X)*X`;

  DOI=1toN;

  PI=PI#M[I,3];

  END;

  TEMP=PI##(1/N);

  DOLAMDA=to

  by;

  Z=(Y##LAMDA-J(N,1,1))/(LAMDA#(TEMP##(LAMDA-1)));

  SSE=Z`*(I(N)-A)*Z;

  LAS=LAS3Stud2enti1zed

  R0esidu-1al-2-3-2-10NormalQuantiles123Residual876543210-1-2-3-4-5-6-7010203040506070PredictedValueofyResidual876543210-1-2-3-4-5-6-7891011121314x115161718192021Residual876543210-1-2-3-4-5-6-76070x28090?,z??z???z?z??

  32Studentized

  Residual10-1-2-3-2-10NormalQuantiles123Residual0.40.30.20.10.0-0.1-0.2-0.3-0.4-0.5345678910PredictedValueofZ

  Residual0.40.30.20.10.0-0.1-0.2-0.3-0.4-0.5891011121314X115161718192021Residual0.40.30.20.10.0-0.1-0.2-0.3-0.4-0.56070X28090?....(省略了数据)

  ?;

  PROCIML;

  N=31;

  USEtwo_6;

  READALLVAR{x1x2y}INTOM;

  X1=M[,1]#M[,1];

  X2=M[,2];

  Y=M[,3];

  P=X1||X2||Y;

  CREATERESOLVEVAR{X1X2Y};

  APPENDFROMP;

  QUIT;

  PROCREGDATA=RESOLVE;

  MODELY=X1X2;

  OUTPUTOUT=bP=PREDICTEDR=RESIDUALH=HSTUDENT=STUDENT;

  RUN;

  PROCCAPABILITYDATA=bGRAPHICS;

  QQPLOT;

  RUN;

  PROCGPLOTDATA=b;

  PLOTRESIDUAL*PREDICTEDRESIDUAL*X1RESIDUAL*X2;

  SYMBOLV=DOTI=NONE;

  RUN;

  PROCPRINT;

  RUN;

  通过SAS输出有关残差的结果如下:

  Obs

  X1X2Y

  PREDICTED

  RESIDUAL

  STUDENT

  H

  7656372818366758751171276137614615751674185186171264217228237424722572681282282838318分析:

  正态性的频率检验:

  1、通过表中显示的数据,可知学生化残差(STUDENT列)中有落入(-1,1)区间的有18/31=即%;落入(,)区间的有28/31=即%;落入()区间内的有31/31=1=100%。所以,学生化残差落在上述各区间内的频率与标准正态分布的相应概率相近,因此,从正态性频率检验可以知道模型误差项符合服从正态分布的假定。

  2、与上一题未作变换钱相比较落入(-1,1)区间的数据个数没有改变,但落入(,)区间以及()区间内的数据个数有了明显的改善,由此可知,此模型拟合的更好。

  正态QQ图检验:通过SAS系统中capacity过程可以直接做出正态QQ图,对于<表三>中求得的学生化残差,其正态QQ图如图所示:

  1.51.0Studentized

  Residual0.50.0-0.5-1.0-1.5-2.0-3-2-10NormalQuantiles123由学生化残差的正态QQ图可知,图中的线性关系并不是很好,有一些点偏离了直线,由此说明题中线性回归模型中误差项正态分布的假定是基本上是合理的。

  残差图分析:通过SAS系统的precgplot过程分别输出了残差与Y拟合值、残差与自变量X1,残差与自变量X1的残差图,如下图:

  Residual43210-1-2-3-4-5010203040PredictedValueofY5060708Residual43210-1-2-3-4-50100200X130040050Residual43210-1-2-3-4-56070X2809由图可知:

  1、(1)在以因变量y为横坐标的残差图中,图形大致形成了一个U型,但并不是很明显,说明回归函数是非线性的,可能需要引进某个或者某些自变量的二次项或者交叉乘积;(2)在以自变量X1、X2量为横坐标的残差图中,根据图形的显示,说明了回归函数关于基本X2基本上呈现线性,但是图像中显示的残差与X1可能不是线性的,有可能要引进X1的平方项或者交叉项,由此说明了此模型拟合的效果是不错的。

  2、与上题对比可知:在本题中拟合的模型的效果要由于上题变换前的模型效果。

  解:

  SAS源程序为:

  DATAtwo_9;

  INPUTX1X2X3Y@@;

  CARDS;

  ......

  ;

  PROCREGDATA=two_9;

  MODELY=X1X2X3;

  OUTPUTOUT=bP=PREDICTEDR=RESIDUALH=HSTUDENT=STUDENT;

  PROCCAPABILITYDATA=bGRAPHICS;

  QQPLOT;

  RUN;

  PROCGPLOTDATA=b;

  PLOTRESIDUAL*PREDICTEDRESIDUAL*X1RESIDUAL*X2RESIDUAL*X3;

  SYMBOLV=DOTI=NONE;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X2X3/SELECTION=ADJRSQ;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X2X3/SELECTION=CP;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1;

  OUTPUTOUT=a1PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a1;

  VARPRESS;

  RUN;

  PROCREGDATA=a1;

  MODELY=X1X2;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X2;

  OUTPUTOUT=a2PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a2;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X3;

  OUTPUTOUT=a3PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a3;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X2;

  OUTPUTOUT=a4PRESS=PRESSP=PREDICTEDR=RESIDUALH=HSTUDENT=STUDENT;

  PROCCAPABILITYDATA=a4GRAPHICS;

  QQPLOT;

  RUN;

  PROCGPLOTDATA=a4;

  PLOTRESIDUAL*PREDICTEDRESIDUAL*X1RESIDUAL*X2;

  SYMBOLV=DOTI=NONE;

  RUN;

  RUN;

  PROCMEANSUSSDATA=a4;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X3;

  OUTPUTOUT=a5PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a5;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X2X3;

  OUTPUTOUT=a6PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a6;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X2X3;

  OUTPUTOUT=a7PRESS=PRESS;

  RUN;

  PROCMEANSUSSDATA=a7;

  VARPRESS;

  RUN;

  PROCREGDATA=two_9;

  MODELY=X1X2X3/SELECTION=STEPWISESLENTRY=SLSTAY=;

  RUN;

  PROCPRINT;

  RUN;

  通过SAS输出有关残差的结果如下:

  Obs

  X1X2X3Y

  PREDICTED

  RESIDUAL

  STUDENT

  H

  5514364654466414472438454364254645454526226257112481243536133554143451511553545163646613356712468133462555142125272244552234356分析:

  正态性的频率检验:

  通过表中显示的数据,可知学生化残差(STUDENT列)中有落入(-1,1)区间的有13/23=即%;落入(,)区间的有20/23=即%;落入()区间内的有23/23=1=100%。所以,学生化残差落在上述各区间内的频率与标准正态分布的相应概率相近,因此,从正态性频率检验可以知道模型误差项符合服从正态分布的假定。

  正态QQ图检验:通过SAS系统中capacity过程可以直接做出正态QQ图,对于<表三>中求得的学生化残差,其正态QQ图如图所示:

  2.01.5Studentized

  Residual1.00.50.0-0.5-1.0-1.5-2.0-2-10NormalQuantiles12由学生化残差的正态QQ图可知,图中的线性关系并不是很好,有一些点偏离了直线,由此说明题中线性回归模型中误差项正态分布的假定是基本上是合理的。

  残差图分析:通过SAS系统的precgplot过程分别输出了残差与Y拟合值、残差与自变量X1,残差与自变量X1的残差图,如下图:

  Residual20100-10-2030405060PredictedValueofY70809Residual20100-10-20203040X1506Residual20100-10-2043444546474849505152X253545556575859606162Residual20100-10-201.81.92.02.12.22.3X32.42.52.62.72.82.由图可知:

  在以因变量y为横坐标的残差图中,图中各点并没有很显然的分布在一个水平的带状区域内,说明了此模型应该做出改进;

  在以自变量X1、X2量为横坐标的残差图中,残差没有随自变量变

  化而变化的趋势,说明了假设是合理的;然而在以X3为横坐标的残插图中,散点分布并不十分满意,而是出现了误差方差随X3的增大而减小的趋势,即误差等方差的假定可能不合理。

  (2)在Ra2(p)准则下:通过SAS程序中的REG过程在所得的复相关系数平方Ra2(p)达到最大时R2a最优模型为含有自变量(p)=此时,X1与的回归方程X2的回归方程,拟合的回归方程为:Y?166.59133-1.26046X1-1.08932X2;

  在Cp准则下:通过SAS程序中的REG过程在所得的Cp=最接近P值,此时模型包含X1、X2、X3三个变量,拟合的回归方程为:Y?162.8759?1.21032X1?0.66591X2?8.62303X3在PRESSP准则下:通过SAS程序中的REG过程及MEANS过程所得的PRESSP达到或者接近最小时,PRESSP=,此时模型包含X1、X3作为自变量,拟合的回归方程为:Y?147.07512?1.24336X1?15.89064X3由此可见:三种准则下的最优模型是不同的,结果不一致。

  (3)对于?E??D?0.10,用逐步回归法选择最优方程时,回归方程的自变量含有X1、X2,拟合的方程为:Y?166.59133-1.26046X1-1.08932X2;

  残差分析:

  通过SAS输出有关残差的结果如下:

  Obs

  X1X2X3Y

  PREDICTED

  RESIDUAL

  STUDENT

  H

  5514364654466414472438454364254645454526226257112481243536133554143451511553545163646613356712468133462555142125272244552234356分析:

  正态性的频率检验:通过表中显示的数据,可知学生化残差(STUDENT列)中有落入(-1,1)区间的有13/23=即%;落入(,)区间的有20/23=即%;落入()区间内的有23/23=1=100%。所以,学生化残差落在上述各区间内的频率与标准正态分布的相应概率相近,因此,从正态性频率检验可以知道模型误差项符合服从正态分布的假定。

  正态QQ图检验:通过SAS系统中capacity过程可以直接做出正态QQ图,对于<表三>中求得的学生化残差,其正态QQ图如图所示:

  2.01.5Studentized

  Residual1.00.50.0-0.5-1.0-1.5-2.0-2-10NormalQuantiles12由学生化残差的正态QQ图可知,图中的线性关系并不是非常的明显,不过图中大多数点大致在一条直线上,由此说明题中线性回归模型中误差项正态分布的假定是基本上是合理的。

  残差图分析:通过SAS系统的precgplot过程分别输出了残差与Y拟合值、残差与自变量X1,残差与自变量X1的残差图,如下图:

  Residual20100-10-2030405060PredictedValueofY70809Residual20100-10-20203040X1506Residual20100-10-2043444546474849505152X253545556575859606162由图可知:(1)在以因变量y为横坐标的残差图中,图形大致分布在水平带型区域,说明假设时合理的(2)在以自变量X1、X2量为横坐标的残差图中,根据图形的显示,说明了回归函数关于基本X1、X2基本上呈现线性,说明假设合理。

  结论:由残差分析表明,选择的最优回归方程要优于未做最优模型选择时的回归方程。

篇二:相关与回归分析实验报告心得体会

  

  实验报告

  课程名称

  统计学

  学号

  学生姓名

  辅导教师

  系别

  经济与管理学院

  1.实验名称

  相关与回归分析

  2.实验目的(1)熟练掌握相关关系的测定方法。

  (2)熟练掌握一元线性回归方程的建立和分析方法。

  3.实验内容

  (1)绘制相关散点图

  (2)利用相关系数宏计算相关变量的相关系数;

  (3)利用回归分析宏建立回归直线方程

  4.实验原理

  (1)利用Excel绘制相关图

  (2)利用Excel计算相关系数

  (3)利用Excel进行回归分析

  5.实验过程及步骤

  1、绘制散点图

  “插入”---“图表”---“xy散点图”----“下一步”---输入数据区域---“下一步”,输入图表标题“散点图”、数轴名称,“下一步”选择插入方式,“完成”

  2、相关系数的计算

  (1)使用相关系数函数进行计算

  在EXCEL中,CORREL函数和PERSON函数提供了计算两个变量之间的相关系数的方法,这两个函数是等价的。与相关系数有关的函数还有RSQ(相关系数的平方,即判定系数r2)和COVAR(协方差函数)。

  (2)利用相关系数宏计算相关系数矩阵

  点击EXCEL“工具”菜单,选择“数据分析”,选择“相关系数”。

  3、回归分析

  (1)使用回归分析宏

  步骤:“工具”---“数据分析”,在分析工具中选择“回归”然后“确定”,输入y值输入区域和x值输入区域,选择置信度,输出区域,选择确定。

  (2)除了回归分析宏外,EXCEL提供了9个函数用于建立回归模型和回归预测。这9个函数列于下表中。但EXCEL提供的回归分析宏仍然具有更方便的特点。

  实验室名称

  实验时间

  6.实验结论及心得

  一.(1)

  (2)

  由此可知,估计值为79,回归系数b为-2.33333.所以

  Y^=a+bx=79+(-2.33333)x(2)Y^=a+bx=79+(-2.33333)(x+1000)=-2.33333x-2254.33所以

  产量每增加1000,单位成本平均下降2333.33(3)当x=6000时,Y=-13920.98二.

  (1)

  (2)

  (3)由此可得

  回归直线方程为

  Y^=a+bx=50.27395+18.91731x

  我院任课教师有实验课的均要求有实验报告,每个实验项目要求有一份实验报告,实验报告按照格式书写完毕后,经辅

  导实验的教师批改后按照实验室收集存档。

篇三:相关与回归分析实验报告心得体会

  

  《应用回归分析》---多元线性回归分析实验报告

  实验名称:

  多元线性回归分析

  实验目的:

  1.

  掌握多元线性回归分析的基本思想

  2.

  掌握多元线性回归分析的SPSS操作

  3.

  读懂分析结果,并写出回归方程

  4.

  对回归方程进行方差分析、显著性检验等各种统计检验

  实验设备与环境:计算机,SPSS22.0等。

  一、实验内容:

  为研究体重和体内脂肪比重对腰围的影响,随机收集了20个观测数据,具体数据为“腰围和体重.sav”,利用一般线性回归分析方法进行研究,完成以下任务:

  1.计算出增广的样本相关矩阵;

  2.给出回归方程;

  3.对所得回归方程做拟合优度检验;

  4.对回归方程做显著性检验;

  5.对回归系数做显著性检验;

  6.结合回归方程对该问题做一些基本分析.

  二、实验步骤:(只需关键步骤)

  1.打开数据,依次选择【分析】→【相关】→【双变量】命令,选择腰围、体重、体脂变量,点击确认得到相关矩阵

  2.打开数据,依次选择【分析】→【回归】→【线性】命令

  3.打开数据,依次选择【分析】→【回归】→【线性】命令

  4.依次选择【分析】→【描述统计】→【探索】,选择腰围作为检验变量,将图选项勾选带检验的正态图,点击确认

  5.打开数据,依次选择【分析】→【回归】→【线性】命令

  将腰围拖入因变量框,体重,体脂拖入自变量框

  6.

  三、实验结果分析:(提供关键结果截图和分析)

  1.计算出增广的样本相关矩阵;

  2.给出回归方程;

  结果假设:Y=20.236+0.065X1+0.227X23.对所得回归方程做拟合优度检验;

  结果分析:监禁显著性大于0.05,符合原假设。

  4.对回归方程做显著性检验;

  结果分析:由Q-Q图可直观的看出服从正态分布,显著性0.200大于0.05确定原假设成立服从正态分布

  5.对回归系数做显著性检验;

  结果分析:显著性p均小于0.05表明回归系数b存在,具有显著的线性关系,R=0.945说明该线性关系高度相关,b值的存在是非常具有统计意义的。

  6.结合回归方程对该问题做一些基本分析

  通过该回归方程的合理性我们可以发现腰围和体重体脂是分不开的,所以想拥有一个s型腰害得锻炼控制自己的体重和体脂率来达到一个完美身材

  四、实验总结:(包括心得体会、问题回答及实验改进意见,可附页)

  通过对SPSS的进一步学习与了解,发现了SPSS对数据的处理与分析的功能之强大,需对SPSS进一步深入学习

篇四:相关与回归分析实验报告心得体会

  

  相关与回归分析实验报告

  学

  号:

  2014106146课程论文

  题

  学

  专

  班

  目

  院

  业

  级

  统计学实验

  数学与统计学院

  金融数学

  14金融数学

  罗星蔓

  胡桂华

  教授

  学生姓名

  指导教师

  职

  称

  2016年

  6月

  21日

  相关与回归分析实验报告

  实验目的:用EXCEL进行相关分析和回归

  分析.

  .二、实验内容:

  1用EXCEL进行相关分析..2.用EXCEL进行回归分析.

  -■、实验步骤

  米用卜面的例子进行相关分析和回归分析.学

  数学分数(x)

  统计学分数

  生

  (y)80906090788790458592709083909450938212345678987108相关分析:数学分数(x)

  统计学分数(y)

  数学分数(x)

  ------10.986011统计学分数(y)

  回归分析:

  dfSS回归分

  析

  11616.699残差

  46.200689总计

  91662.9SUMMARYOUTPUT

  回归统计

  MultipleR0.986011RSquare0.972217AdjustedR0.96874Square4标准误差

  2.403141观测值

  x方差分

  析

  MS1616.6995.775086279.9438SignificanceF1.65E-0Intercept数学分数

  (x)

  12.320180.05360.8968217916.7310131.65E-52910.773207051.020418360.77322405361.02041824RESIDUALOUTPUT观测

  预测统计学分数

  值

  (y)84.0658793.0340残差

  0.934133-1034083.870554-3.034080.727775-0.343610.965922-2.677132.656385-2.0658标准残

  差

  0.412293-0.45641.708324-1.339130.321214-0.151660.426323-1.181591.172433-0.9118366.1294593.0340882.272234567890.3436193.0340852.6771390.3436184.0658PROBABILITYOUTPUT统计学分数

  百分比排

  位

  5152535(y)50708283455565758595859090929394学生成绩

  数学分数(x)ResidualPlot

  4-

  差2-?

  ?f*

  残0-

  ||

  11-202040.6080:1)

  -4数学分数(X)

  +数学分数(X)

  ■统计学分数(y)

  数

  分数学分数(x)

  LineFitPlot*统计学分数(y)5学

  计

  统

  -预测统计学分数

  (y)50数学分数(x)10NormalProbabilityPlotXVariable1代表斜率为0.896821,即数学分数每增加1分,统计学分数平均

  增加0.896821分。

  x平均值为78.7,y平均值为92.9可以得出回归方程y=0.896821x+12.32018100「

  *

  50-**

  数分学计统

  0-------------

  -------

  --------------

  -------11110,「十八,20406080100SamplePercentile结果分析

篇五:相关与回归分析实验报告心得体会

  

  统计学实验报告5用excel进行相关与回归分析

  统计学实验报告五

  用EXCEL进行相关与回归分析

  一、实验目的:用EXCEL进行相关与回归分析。

  二、实验内容:1.用EXCEL进行相关分析

  2.用EXCEL进行回归分析

  三、实验步骤

  采用下面的例子进行相关和回归分析。

  【例7】10个学生身高和体重的情况如下表,要求对身高和体重作相关和回归分析。

  学生

  身高(公分)体重(公斤)11715321675631776441544951695561756671635281524791725810160501.用EXCEL进行相关分析

  首先把有关数据输入EXCEL的单元格中。

  图1-20EXCEL数据集

  (1)利用函数计算相关系数

  1第一步:单击任一个空白单元格,单击插入菜单,选择函数选项,打开粘贴函数对话框,在函数分类中选择统计,在函数名中选择CORREL,单击确定后,出现CORREL对话框。

  第二步:在array1中输入B2:B11,在array2中输入C2:C11,即可在对话框下方显

  1所示。

  示出计算结果为0.896,如图1-2图1-21CORREL对话框及输入结果

  (2)用相关系数宏计算相关系数

  第一步:单击工具菜单,选择数据分析选项,在数据分析选项中选择相关系数,弹出相关系数对话框,如图1-22所示:

  图1-22相关系数对话框

  第二步:在输入区域输入$B$1:$C$1,分组方式选择逐列,选择标志位于第一行,在输出区域中输入$E$1,单击确定,得输出结果如图1-23所示。

  图1-23相关分析输出结果

  22.用EXCEL进行回归分析

  第一步:单击工具菜单,选择数据分析选项,出现数据分析对话框,在分析工具中选择回归,如图1-24所示。

  图1-24数据分析对话框

  第二步:单击确定按钮,弹出回归对话框,在Y值输入区域输入$B$2:$B$11,在X值输入区域输入$C$2:$C$11,在输出选项选择新工作表组,如图1-25所示。

  图1-25回归对话框

  第三步:单击确定按钮,得回归分析结果如图1-26所示。

  3图1-26EXCEL回归分析结果

  四、实验分析

  1、身高和体重的自相关系数均为1,身高和体重的相关系数为0.896,和用函数计算的结果完全相同。

  2、上面的输出结果中,第一部分为汇总统计,MultipleR指复相关系数,RSquare指判定系数,Adjusted指调整的判定系数,标准误差指估计的标准误,观测值指样本容量;第二部分为方差分析,df指自由度,SS指平方和,MS指均方,F指F统计量,SignificanceofF指p值;第三部分包括:Intercept指截距,Coefficient指系数,tstat指t统计量。

  下面红色字体为赠送的个人总结模板,不需要的朋友下载后可以编辑删除!!!!

  4xx年电气工程师个人年终总结模板

  根据防止人身事故和电气误操作事故与项整治工作要求,我班针对现阶段安全生

  产工作的特点和重点,为进一步加强落实安全工作,特制定了防止人身事故和防

  电气误操作事故的(两防)实施绅则。把预防人身、电网、设备事故作为重点安全工作来抓,检查贯彻落实南方电网安全生产“三大规定”情况,检查(两防)执行

  情况,及时发现和解决存在的问题,提高防人身事故和防电气误操作事故的处理

  能力,从源头上预防和阻止事故的发生,使安全管理工作关口前移,从而实现“保

  人身、保电网、保设备”安全生产目标收到一定的效果。通过前段的检查和整改

  工作,现将我班到现时为止在此方面的情况总结如下

  一、在防止人身事故方面(重点防范高处坠落事故)在运行维护、施工作业过程中的防触电、防高穸坠落事故。我班通过对每周的安

  全会讫和工作负责人对现场高处作业管理的检查,使得安全防范思想、工作、监

  督到位;使安全工作责任、措施及整改落实,从而安全工作得到保证。

  1、作业前的准备工作和控制措施工作。包括高穸作业现场查勘,使工作人员对

  该任务的危险点(安全措施卡)有清晰、准确、全面的认识,采取相应的控制和安

  全措施,并正确派选合适胜任的工作负责人和工作班成员。52、在开工前,工作负责人向作业人员交待工作内容、安全注意事项及该作业的危险点。作业过程中明确监护人员,监护人实时监控高处作业人员劢向,及时提

  醒和纠正作业中的不安全行为,使安全措施不折不扣地落实和执行到位。

  3、认真落实高处作业人员的安全保护措施。配备可靠的(按规定期限内检验合格

  的)安全工器具,如安全带(绳)、升降板、脚扣、竹(木)梯等,并能够正确使用此

  类工器具。4、在高穸作业的工作全过程中,强调工作人员自始至织确保自身安

  全行为:?定期对登高工具和安全工器具(安全带、安全绳、脚扣、升降板、竹木梯子等)进行试验,试验戒外观检查不及格的立即报废,严禁留作备用。

  ?必须系好安全带(绳),安全带(绳)必须栓在上方牢固的构件上,不得低挂高用,工作过程中要随时检查安全带(绳)是否栓牢。

  ?上杆前先检查杆塔及拉线情况和登杆工具,确保该设施安全性和可靠性,使用

  脚扣时,安全带必须系圈在杆上;上下杆时,必须使用防堕落装置戒有具体防止

  堕落的安全措施,以防失去保护。安全带必须栓在的构件上,不得随意解除。

  ?高处作业在转移作业位置时,手扶的构件必须牢固,不得失去保护。需要沿着

  水平梁、斜柱、水平管戒暂无防护栏杆、没可靠的扶持物帮劣保持平衡时,必须

  使用水平安全绳。在无任何保护的情况下,绝对禁止沿单梁戒管道上行走的行为。

  ?高处作业人员的施工工具必须使用工具袋装备,禁止使用容易造成工具掉落的简易皮套;上下传递物件时,必须用绳索吊送,严禁抛掷。

  ?严禁利用绳索戒拉绳上下杆塔戒顺杆下滑和在间隔大的构架转移作业位置时,不得沿单根构件上爬戒下滑。

  5、认真执行“两票”制度,防止误触电、感应电伤人的高穸堕落事故。

  二、在防电气误操作方面

  在培讪方面,组细了二次工作人员在配变站现场作防误操作演练,并使用录音记

  录。使全体工作人员对防误操作的认识,意识到预防人身、电网、设备安全事故

  的重要性。

  (1)认真组细查找在安全生产管理上存在的薄弱环节,特别是施工、维护班组和

  人员在严格遵守规章制度、严格执行“两票三制”和防电气误操作事故等方面存

  在的问题,制定和落实有效的整改和防范措施。

  (2)加强安全管理,在执行规程、规定和制度上决不含糊。严格执行“两票三制”,

  严格按照安全操作规程办事。

  (3)通过每周的安全活劢日,认真学习事故通报、快报和相关规程、规定,结合

  本班实际开展讨论,吸取事故教讪,使“防误”工作深入人心。

  (4)作业前的准备工作和控制措施工作。认真正确填写操作项目和程序,不漏项。

  (5)操作时认真履行唱票、复诵制,确认无误后再进行操作,并由监护人监护操

  作,同时录音操作过程。

  7(6)拉、合刀闸(跌落式熔断器)时,应先将线路转为穸载状态,防止带负荷拉、合

  线路刀闸。

  (7)开关检修时,应切断柜内二次控制电源的柜内照明电源以防止误合开关和触

  电;操作低压开关(刀闸)前,应检查开关是否正常并做相关防护措施,操作时不要

  面对开关,防止电弧烧伤工作人员。1.杂志中上色遇到的疑问:为什么我们的美编在绘制杂志中一些揑图时选用灰暗的色调,而不是用艳丽的色

  彩?很多家长主观的认为孩子喜欢颜色艳丽的颜色,但是在生活中没有一个孩子会主

  劢去选择艳丽到夸张的衣服,揑图也一样。中国的传统的水墨画就是一个很好的例子,国画中用色很少,用的最多的就是“墨色”,国画中“墨”不“色”是相

  通,而墨分五色(其实不止),表现中即有墨的浓淡层次,又有色的联想感受,从

  而达到无色似有色的境界使整幅画看起来一点都不单调灰暗。当然杂志的揑图也

  不能像马路一样一直是一个色调,明快的色彩也是必不可少的。总之,对于揑图

  来说,不一定就非得用丰富的色彩,只要能充分表达文字的内容就可以。即使是

  单纯的黑色、褐色也能出色地描绘出文字的内在世界。孩子同样能丛这些画面中

  充分了解故事,想象他自己理解出的色彩世界。这也是揑图要给人留一些想象穸

  间的原因。美学大师朱光潜说过:“美术作品之所以美,不是只是在表现的一部

  分,尤其是美在未表现而含蓄无穷的一大部分,这就是所谓的无言之美。”

  什么样的故事应该配什么样的色彩呢?8抒情类的文字配合传统的中国画戒梦幻的画面戒颜色明度对比属于弱对比的就

  能产生很好的呼应效果,将读者吸引到安静的故事中去。

  奇幻神秘的文字配合厚重冷峻的颜色和不颜色相配的绘画风格(如;写实风格和版

  画效果)能加强奇幻神秘的气氛。

  幽默荒诞类的文字配合轻松的绘画技法和颜色明快,纯度对比强烈的风格就能和

  文字相得益彰。

  2.揑图的形式和技法太多了,到底那种更好,戒是杂志的美术编辑究竟该用什么

  样的揑图来传达文章的深层内容?在看到一篇文章时,理解文章的内容,并明白作者想告诉读者的是什么?也许是

  告诉你一个生活态度戒一个学习方法,也许是一个人生哲理……找到文章的中心

  思想,用孩子的视角思考,再配出贴近孩子生活世界的揑图。如果一个揑图只是

  表现文章中的一段文字和一个场景,那要想用图来打劢读者,那是很难的。好揑

  图除了能用视觉语言来烘托文字的不足之处外,还能和文字一起在读者的脑中升

  华。揑图在兼顼了以上的这些要求后,出现的画面就是出色的传达了文字的深层

  内容了。

  3.在版式流程中编辑在遇到揑图和文字的不和-谐组合时应该怎样去调整?在工作中我们也许都会遇到杂志在版式流程中,有些版面不和-谐戒揑图和文字

  的同时产生阅读障碍的问题发生。

  9a.图和文字的组合让阅读有了困难,也就是在文字下面的图的色彩戒纹理影响文字的清晰度。出现这种问题需要调整揑图,揑图的纹理太重的减少纹理戒做模

  糊处理,底色太鲜艳的降低色彩饱和度并加重文字颜色。如果在做了这些劤力后,仍然有阅读的困难,干脆去掉文字下面的背景揑图。

  (8)配电站停电时,必须检查确认进线柜电缆头不带电(检查带电显示器)才能合上

  进线柜接地刀闸,配电站送电时,应先检查进线柜地刀是否拉开,防止带地刀送

  电。没有地刀的进线柜,严禁私自解锁,防止误入带电间隔。

篇六:相关与回归分析实验报告心得体会

  

  统计学实验报告

  学

  号:

  姓

  名:

  专

  业:

  班

  级:

  指导教师:

  工商管理

  101吴风庆

  实验(三)

  实验题目

  实验地点

  实验目的:

  商学实验中心207相关与回归分析

  实验日期

  2012-5-91.掌握相关分析

  2.掌握回归模型的建立

  3.掌握时间序列中移动平均、指数平滑与趋势测定的方法

  实验环境

  WindowsXP系统

  Excel统计软件

  实验步骤及结果分析:(一)

  1.

  加载宏

  2.回归分析输入数据

  3.回归分析数据结果

  4.1.MultipleR为相关系数;RSquare为判定系数R2=1-SSE/SST=SSR/SST,也称拟合优度,反映整体的拟合情况;计算得R2=0.632151说明在出租率Y的变动中,能被每平方米租金多少的回归方程解释的比例为0.632151.。AdjustedRSquare为调整后的判定系数R2。

  其意义与R2类似.

  2.上表中的方差分析是指在回归分析中利用方差分析的思想进行显著性检验,其原假设是H0:?i?y)?2;残差SS是指残差平方线性关系不显著。回归分析SS是指回归平方和SSR??(yi?1n?)2和

  SSE=?(yi?yi?1n回归分析MS=SSR/k;残差MS=SSE/(n-k-1),其中kn-k-1分别为SSRSSE的自由度(df)

  3.检验统计量F=(SSR/k)/(SSE/(n-k-1))~F(k,n-k-1).4.上表中的Coefficients列指系数,其中Intercept为截距,XVariable1为自变量;标准误差指回归系数的标准误差,其中:S?=

  S?

  1/n?(x)/?(xi?x)2i?1n2;

  S?1?S?/?(xi?11ni?x)2;

  tSta为各系数的回归检验统计量。其中t???0??0S??0,t?????1S??1;Lower95%,Upper95%为区间估计中各回归系数的置信上1/n?(x)/?(xi?x)2i?1n2??t(n?2)S

  限和置信下限,区间估计公式为:?0??2;??t(n?2)S?/?1?2?(xi?1ni?x)2?2?0.6117155.由上表知

  调整后的判定系数RR;F统计量为30.93318.回归系数T的统计量12.96.5.56.都显著。

  (二)(1)做散点图

  a.选择作图类型

  b.输入数据

  C确定标题

  d结果输出

  由图可知人均消费水平随着人均国内生产总值的增加大体也增加所以人均消费水平与国内生产总值是正线性相关。

  (2)相关系数

  人均国内生产总

  人均消费水平

  值

  人均国内生产总1值

  人均消费水平

  0.979641111由表可知人均国内生产总值与人均消费水平的相关系数为0,97964111,又r的绝对值越接近1,表明x与y的线性相关程度越密切。所以人均国内生产总值与人均消费水平的相关程度大。

  (3)

  人均消费水平与国内生产总值的回归方程为??724.7101?0.297415yx回归系数??724.7101??0.297415人均消费水平增加0.297415;??表示人均国内生产总值每增加一元,10表示即使在人均国内生产总值为0的情况下,人均消费水平平均为724.7101.4.R2=0.959697说明在人均消费水平Y的变动中,有95.9697%是由国内人均生产总值决定的。可见人均消费水平与人均国内生产总值之间有较强的线性关系,回归直线的拟合程度较高。

  5.第一步:提出假设。H0:?1=0(y不随x的变化而线性变化)

  H1:?1?0(l两个变量之间的线性关系显著)第二步:计算检验统计量F.SSR1=MSR=214.31F=SSEMSEn?2第三步:作出决策。将回归方差分析表中的P值与跟定的显著性水平α=-0.05进行比较,由于P值=1.39?10-7《α

  =0,。05,所以拒绝原假设。

  ??724.7101?0.2974156,由回归方程yx

  所以将x=5000带入的2211.7851,所以当某地区的人均GDP为5000元时,其人均消费水平为2211.7851.

  7.Lower95%,Upper95%为区间估计中各回归系数的置信上限和置信下限,区间估计公式为:??t(n?2)S?/?1?2??t(n?2)?0?2S?

  1/n?(x)/?(xi?x)2i?1n2;?(xi?1ni?x)2所以置信区间的下线为y=-289.461+0.251457×5000=967.824置信区间的下限为y=1738.881+0.343374×5000=3455.751所以当人均GDP为5000元时,在95%的置信水平下的置信区间为(967.824,3455.751)

  (三)1.在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“移动平均”

  2.

  数据输入

  3.三项移动平均结果输出

  4,三项移动平均与五项移动平均对比结果

  DF列为移动的误差平方本例中3期移动的MSE为27.0267、五期移动的MSE为58.77241所以三期的移动平均的效果优于五期。

  5、第一步

  在“工具”菜单中选择“数据分析”选项,从其“分析工具”列表中选择“指数平滑”

  2输入数据

  3.

  结果

  α=0.3预测结果为511.2333α=0.预测结果为598.09814.

  参数的最小二乘估计-------回归模型的估计

  图像结果

  上表中的Coefficients列指系数,其中Intercept为截距,XVariable1为自变量;

  所以人均消费水平与国内生产总值的回归方程为?=613.86当x=2012则y???50450y.7?25.38x

  11考核结果

  教师签名

  年

  月

  日

  12

篇七:相关与回归分析实验报告心得体会

  

  《

  应用回归分析》---异方差性的诊断及处理实验报告

  实验名称:

  异方差性的诊断及处理

  实验目的:

  1.

  掌握异方差产生的原因以及给模型带来的影响

  2.

  掌握异方差性的诊断及处理方法

  3.

  掌握SPSS软件的操作方法

  实验设备与环境:计算机,SPSS22.0等。

  一、实验内容:

  数据文件xt4.9.sav中给出的是用电高峰每小时用电量y与每月用电量x的数据

  1.用普通最小二乘法建立y与x的回归方程,并画出残差散点图;

  2.诊断问题是否存在异方差性;

  3.如果存在异方差性,用幂指数型的权函数建立加权最小二乘回归方程;

  4.检验加权最小二乘回归方程是否消除了异方差性;

  5.对结果进行简单的分析;

  二、实验步骤:

  1、2、3、4、三、实验结果分析:

  1、回归模型:y=0.004x-0.8312、根据图中的相关性表显示,x与残差绝对值的等级相关系数为0.318,sig=0.021>α=0.05,认为残差绝对值与自变量具有相关性,存在异方差

  3、加权最小二乘回归方程:y=-0.683+0.004x4、四、实验总结:(包括心得体会、问题回答及实验改进意见,可附页)

  通过这次实验,我对SPSS这个软件有了更多的了解,对数据的分析有了更多方面的分析。因此在实验过程中我受易非浅:它让我深刻体会了对数据分析步骤的重要性。在这次实验中,我学到很多东西,加强了我的动手潜质,并且培养了我的独立思考潜质。在做实验报告时,正因在做数据处理时出现很多问题,如果不解决的话,将会很难的继续下去。还有动手这次实验,使应用回归这门课的一-些理论知识与实践相结合,更加深刻了我对测试技术这门]课的认识,巩固了我的理论知识。

篇八:相关与回归分析实验报告心得体会

  

  《应用回归分析》自相关性的诊断及处理实验报告

  实验名称:

  自相关性的诊断及处理

  实验目的:

  1.

  掌握自相关产生的原因以及给模型带来的影响

  2.

  掌握自相关性的诊断及处理方法

  3.

  掌握SPSS软件的操作方法

  实验设备与环境:计算机,SPSS22.0等。

  一、实验内容:

  某乐队经理研究其乐队CD光盘的销售额(y),两个有关的影响变量是每周演出次数x1和乐队网站的周点击率x2,数据见xt4.14。

  1.用普通最小二乘法建立y与x1和x2的回归方程,用残差图和DW检验诊断序列的自相关性;

  2.用迭代法处理序列相关,并建立回归方程;

  3.用一阶差分法处理序列相关,并建立回归方程;

  4.比较以上两种方法所建立的回归方程的优良性。

  二、实验步骤:(只需关键步骤)

  1、第一步:依次选择【分析】——【回归】——【线性】命令

  第二步:点击【保存】——点击残差下的未标准化

  第三步:【图形】——【旧对话框】——【散点】

  —

  1—

  第四步:

  以残差为y轴周次为x轴

  画散点图

  2、—

  2—

  以新变量yy为因变量,x12,x11为自变量

  3、第一步:计算差分

  第二步:过原点的最小二乘回归

  —

  3—

  三、实验结果分析:(提供关键结果截图和分析)

  1.用普通最小二乘法建立y与x1和x2的回归方程,用残差图和DW检验诊断序列的自相关性;

  —

  4—

  由图可知回归方程为y=190.098x1+2.045x2-574.062、从残差图可以看到残差有自相关趋势

  从输出结果中可以看到DW=0.745,查DW表,n=52,k=3,显著性水平α=0.05得DL=1.46,Du=1.63.由DW<1.26,也说明残差序列存在正的自相关。自相关系ρ=1-1/2DW=1-1/2x0.745=0.6275,也说明误差项存在高度的自相关性。

  —

  5—

  2.用迭代法处理序列相关,并建立回归方程;

  从结果中看到新回归残差的DW=1.716,查DW表,n=51,k=3,显著性水平α=0.05,得dL=1.46,dU=1.63由此可知dU

  则新的回归方程为yy=211.110xx1+1.436xx2-178.775修正后DW=1.716,所以误差之间没有自相关性

  3.用一阶差分法处理序列相关,并建立回归方程;

  —

  6—

  从结果中看到新回归残差的DW=040,查DW表,n=51,k=3,且α=0.01得dL=1.28,dU=1.45,由此可得dU

  新的方程为y1=210.15△x1y2=1.397△x2修正后DW=2.047,DW落入无自相关性区域,说明残差序列无自相关性

  4.比较以上两种方法所建立的回归方程的优良性。

  一阶差分法适合处理=1的情况,用差分法而不选用迭代法的原因为:

  迭代法需要根据样本估计,结果的估计误差会影响效率而差分法更简单。

  差分法都是上下互减的形式,只不过以各自变量的增量替代原有变量y和变量x,进行回归模拟。

  四、实验总结:(包括心得体会、问题回答及实验改进意见,可附页)

  这次实验我们学习到了用迭代法和一阶差分法来了解方程的自相关性。并且了解到这两种方法的差别和优缺点,什么样的题目用什么样的方法会提高结果的精确度,减小误差。

  —

  7—

篇九:相关与回归分析实验报告心得体会

  

  关于SPSS回归分析与数据预处理的?得体会,句句都是肺腑之?关于SPSS学习与交流的专业论坛,?兵博客?直推荐?家去??经济论坛(现在叫做经管之家)SPSS专版。这个板块?乎覆盖了SPSS统计分析从理论到实践、从?具到?法的各类资料。特别适合SPSS初学者和使?者交流互动,传授经验。今天?兵就先为?家分享?篇论坛?友SPSS数据分析的?得体会,原作者:xddlovejiao1314,谢谢他的宝贵经验分享。关于SPSS数据预处理拿到?份数据,或者在看到国内外某个学者的?章有想法?????的数据刚好符合这个想法可以做时,在整理好数据后不要急于建模。?定要对数据做缺失值处理、异常值处理。在数据预处理的基础上再进?步建模,否则可能得到错误的结果。?得1:缺失值的处理我个?有?个看法:数据样本量?够?,在删除缺失值样本的情况下不影响估计总体情况,可考虑删除缺失值;数据样本量本?不?的情况下,可从以下两点考虑:1是采?缺失值替换,SPSS中具体操作为“转换”菜单下的“替换缺失值”功能,??有5种替换的?法。若数据样本量不?,同质性?较强,可考虑总体均值替换?法,如数据来?不同的总体(如我做农户调研不同村的数据),可考虑以?个?总体的均值作为替换(如我以?个村的均值替换缺失值)。2是根据原始问卷结合客观实际??推断估计?个缺失值的样本值,或者以?个类似家庭的值补充缺失值。?得2:异常值的处理我?概学了两门统计软件SPSS和Stata,SPSS?的时间久些,熟悉?下,Stata最近才学,不是太熟。关于这点我结合着来说。关于异常值的处理可分为两点,?是怎么判定?个值是异常值,?是怎么去处理。判定异常值的?法我个?认为常?的有两点:1是描述性统计分析,看均值、标准差和最?最?值。?般情况下,若标准差远远?于均值,可粗略判定数据存在异常值。2是通过做指标的箱图判定,箱图上加“*”的个案即为异常个案。发现了异常值,接下来说怎么处理的问题。?概有三种?法:1是正偏态分布数据取对数处理。我做农户微观实证研究,很多时候得到的数据(如收?)都有很?的异常值,数据呈正偏态分布,这种我?般是取对数处理数据。若原始数据中还有0,取对数ln(0)没意义,我就取ln(x+1)处理;2是样本量?够?删除异常值样本;3是从stata?学到的,对数据做结尾或者缩尾处理。这?的结尾处理其实就是同第?个?法,在样本量?够?的情况下删除?尾1%-5%的样本。缩尾指的是?为改变异常值??。如有?组数据,均值为50,存在?个异常值,都是500多

  删除?尾1%-5%的样本。缩尾指的是?为改变异常值??。如有?组数据,均值为50,存在?个异常值,都是500多(我这么说有点夸张,?概是这个意思),缩尾处理就是将这?个500多的数据?为改为均值+3标准差左右数据??,如改为100。总结??,我个?认为做数据变换的?式?较好,数据变换后再做图或描述性统计看数据分布情况,再剔除个别极端异常值。关于SPSS回归分析?得1:如何做好回归分析经过多次实战,以及看了N多视频,上了N多课,看了N多专业的书。我个?总结做回归的步奏如下:1对数据进?预处理,替换缺失值和处理异常值;2是将单个?变量分别与因变量做散点图和做回归,判定其趋势,并做好记录(尤其是系数正负号,要特别记录);3是?变量和因变量?起做相关系数,看各个变量相关关系强弱,为下?步检验多重共线性做准备;4是?变量多重共线性诊断。若变量存在多重共线性,可采?主成分回归,即先将存在多重共线性的变量做主成分分析合并为1个变量,然后再将合并成的新变量和其余?变量?起纳?模型做回归;5是做残差图,看残差图分布是否均匀(?般在+-3个单位之间均匀分布就?较好);6是报告相应结果。?得2:不建议采?后向步进法处理变量多重共线性记得张?彤?师说过他有个同学做过?个研究,即采?后向步进法剔除变量的?式去做回归,得到的结果犯错的?率?较?。张?师也不建议?这个?法处理多重共线性。处理多重共线性?较好的?法是做主成分回归。?得3:?未标准化的回归系数好,还是?标准化后的回归系数好我个?觉得这个问题仁者见仁智者见智,要看想表达什么。具体??,如果想表达在其它条件不变的情况下,?变量X每变化1个单位,因变量变化多少个单位,这种情况?未标准化回归系数就好;如果想?较各个?变量对因变量影响的相对??,即判断相对??,哪个变量对因变量影响更?。这时需要消除量纲的影响,看标准化后的回归系数。?得4:稳健性检验我做的是

  ?序多分类logistic回归模型。因变量分了5类,有?类个数?较多,达到300多,有1-2类个案?较少,只有30左右。专家提到了要做稳健性检验。这个?stata软件编程加?个robust即可解决问题。不知道在SPSS??怎么做。欢迎知道的朋友?起讨论下。我个?认为这是?个好问题的。不做稳健性检验模型可能受?些极端值的影响,结果不稳定。可能本来显著的变量剔除1-2个样本后就变得不显著了。所以做回归分析稳健性检验也?较重要。通知:?易云课堂《?学SPSS:数据分析12?经典案例》视频课程正在做年底回馈活动,感兴趣可以点【阅读原?】前往关注。

推荐访问:相关与回归分析实验报告心得体会 心得体会 回归 实验