可以。做回归模型后最好做一下稳健性检验,特别是在做论文的时候,稳健性检验可以让回归变量的选取更严谨(拉姆齐检验)、让回归方程结构更稳定(邹氏检验),通过稳健性检验让论文更有说服力。如果稳健性检验不通过,说明不够严谨,可以不放,重新做稳健性检验评估。
看看数据是否出现了错误,可以先认真的核查一遍,看看自己的计算过程是否正确,如果没有错误,那就更换下实验的数据的,把数据修改一下。
上数据或者分析的散点图,先看看数据啥样子的,你这么干说我们也不明白咋优化啊!
1. 线性模型不适合,你换成非线性的,SPSS自带的非线性模型有11种吧,你试试。2. 可能存在异常值,影响了回归分析的精度,你应该首先剔除这些异常值。
利用Excel的数据分析进行回归,可以得到一系列的统计参量。下面以连续10年积雪深度和灌溉面积序列(图1)为例给予详细的说明。图1 连续10年的最大积雪深度与灌溉面积(1971-1980) 回归结果摘要(Summary Output)如下(图2):图2 利用数据分析工具得到的回归结果第一部分:回归统计表 这一部分给出了相关系数、测定系数、校正测定系数、标准误差和样本数目如下(表1):表1 回归统计表逐行说明如下: Multiple对应的数据是相关系数(correlation coefficient),即R=。 R Square对应的数值为测定系数(determination coefficient),或称拟合优度(goodness of fit),它是相关系数的平方,即有R2=。 Adjusted对应的是校正测定系数(adjusted determination coefficient),计算公式为 式中n为样本数(实验总次数,本例n=10),m为变量数(参数样本总数,本例即最大积雪深度和灌溉面积,m=2),R2为测定系数。对于本例,n=10,m=1,R2=,代入上式得 标准误差(standard error)对应的即所谓标准误差,计算公式为 这里SSe为剩余平方和,可以从下面的方差分析表中读出,即有SSe=,代入上式可得 最后一行的观测值对应的是样本数目,即有n=10。第二部分,方差分析表 方差分析部分包括自由度、误差平方和、均方差、F值、P值等(表2)。表2 方差分析表(ANOVA)F临界值可用excel求解,方法如下:F临界值求法:FINV(a,因子自由度,误差项自由度)a为1-置信水平,即犯错几率,一般取因子自由度即回归分析df,误差项自由度即残差df。逐列、分行说明如下: 第一列df对应的是自由度(degree of freedom),第一行是回归自由度dfr,等于变量数目,即dfr=m;第二行为残差自由度dfe,等于样本数目减去变量数目再减1,即有dfe=n-m-1;第三行为总自由度dft,等于样本数目减1,即有dft=n-1。对于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,dft=n-1=9。 第二列SS对应的是误差平方和,或称变差。第一行为回归平方和或称回归变差SSr,即有它表征的是因变量的预测值对其平均值的总偏差。 第二行为剩余平方和(也称残差平方和)或称剩余变差SSe,即有 它表征的是因变量对其预测值的总偏差,这个数值越大,意味着拟合的效果越差。上述的y的标准误差即由SSe给出。 第三行为总平方和或称总变差SSt,即有 它表示的是因变量对其平均值的总偏差。容易验证,即有 而测定系数就是回归平方和在总平方和中所占的比重,即有 显然这个数值越大,拟合的效果也就越好。 第四列MS对应的是均方差,它是误差平方和除以相应的自由度得到的商。第一行为回归均方差MSr,即有 第二行为剩余均方差MSe,即有 显然这个数值越小,拟合的效果也就越好。 第四列对应的是F值,用于线性关系的判定。对于一元线性回归,F值的计算公式为式中R2=,dfe=10-1-1=8,因此 第五列Significance F对应的是在显著性水平下的Fα临界值,其实等于P值,即弃真概率。所谓“弃真概率”即模型为假的概率,显然1-P便是模型为真的概率。可见,P值越小越好。对于本例,P=<,故置信度达到以上。第三部分,回归参数表 回归参数表包括回归模型的截距、斜率及其有关的检验参数(表3)。表3 回归参数表第一列Coefficients对应的模型的回归系数,包括截距a=和斜率b=,由此可以建立回归模型或 第二列为回归系数的标准误差(用或表示),误差值越小,表明参数的精确度越高。这个参数较少使用,只是在一些特别的场合出现。例如L. Benguigui等人在When and where is a city fractal?一文中将斜率对应的标准误差值作为分形演化的标准,建议采用作为分维判定的统计指标(参见EPB2000)。 不常使用标准误差的原因在于:其统计信息已经包含在后述的t检验中。 第三列t Stat对应的是统计量t值,用于对模型参数的检验,需要查表才能决定。t值是回归系数与其标准误差的比值,即有根据表3中的数据容易算出:对于一元线性回归,t值可用相关系数或测定系数计算,公式如下将R=、n=10、m=1代入上式得到 对于一元线性回归,F值与t值都与相关系数R等价,因此,相关系数检验就已包含了这部分信息。但是,对于多元线性回归,t检验就不可缺省了。 第四列P value对应的是参数的P值(双侧)。当P<时,可以认为模型在α=的水平上显著,或者置信度达到95%;当P<时,可以认为模型在α=的水平上显著,或者置信度达到99%;当P<时,可以认为模型在α=的水平上显著,或者置信度达到。对于本例,P=<,故可认为在α=的水平上显著,或者置信度达到。P值检验与t值检验是等价的,但P值不用查表,显然要方便得多。 最后几列给出的回归系数以95%为置信区间的上限和下限。可以看出,在α=的显著水平上,截距的变化上限和下限为和,即有斜率的变化极限则为和,即有第四部分,残差输出结果 这一部分为选择输出内容,如果在“回归”分析选项框中没有选中有关内容,则输出结果不会给出这部分结果。 残差输出中包括观测值序号(第一列,用i表示),因变量的预测值(第二列,用表示),残差(residuals,第三列,用ei表示)以及标准残差(表4)。表4 残差输出结果预测值是用回归模型计算的结果,式中xi即原始数据的中的自变量。从图1可见,x1=,代入上式,得其余依此类推。残差ei的计算公式为 从图1可见,y1=,代入上式,得到其余依此类推。 标准残差即残差的数据标准化结果,借助均值命令average和标准差命令stdev容易验证,残差的算术平均值为0,标准差为。利用求平均值命令standardize(残差的单元格范围,均值,标准差)立即算出表4中的结果。当然,也可以利用数据标准化公式逐一计算。将残差平方再求和,便得到残差平方和即剩余平方和,即有 利用Excel的求平方和命令sumsq容易验证上述结果。 以最大积雪深度xi为自变量,以残差ei为因变量,作散点图,可得残差图(图3)。残差点列的分布越是没有趋势(没有规则,即越是随机),回归的结果就越是可靠。用最大积雪深度xi为自变量,用灌溉面积yi及其预测值为因变量,作散点图,可得线性拟合图(图4)。图3 残差图图4 线性拟合图第五部分,概率输出结果 在选项输出中,还有一个概率输出(Probability Output)表(表5)。第一列是按等差数列设计的百分比排位,第二列则是原始数据因变量的自下而上排序(即从小到大)——选中图1中的第三列(C列)数据,用鼠标点击自下而上排序按钮,立即得到表5中的第二列数值。当然,也可以沿着主菜单的“数据(D)→排序(S)”路径,打开数据排序选项框,进行数据排序。用表5中的数据作散点图,可以得到Excel所谓的正态概率图(图5)。表5 概率输出表图5 正态概率图【几点说明】 第一,多元线性回归与一元线性回归结果相似,只是变量数目m≠1,F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。 第二,利用SPSS给出的结果与Excel也大同小异。当然,SPSS可以给出更多的统计量,如DW值。在表示方法上,SPSS也有一些不同,例如P Value(P值)用 Sig.(显著性)表征,因为二者等价。只要能够读懂Excel的回归摘要,就可以读懂SPSS回归输出结果的大部分内容。
哥哥,您这是逮着数据就往里面塞啊!而且你怎么没有给出因变量?我猜测是销售量?还是点击量?暂且不论你自变量的选择不正确,你的R Square值太小,最起码应该达到以上。模型拟合度相当不好,请删减自变量,再行回归!
要用 原始数据计算我替别人做这类的数据分析蛮多的
spss输出的结果格式跟论文要求的是不一样的,而且也没法在spss中调整都是把它复制出来,然后在word中调整表格格式的...至于在word中怎么调整表格边框 就很简单了,直接双击表格在弹出来的表格属性里面进行选择的,总之该表格格式是一件非常麻烦的事情
Variable Coefficient Std. Error t-Statistic Prob. 变量 系数 标准差 T统计量 P值 一般在5%显著水平下,选择 ABS(T统计量)>2的P。
多元线性回归可表示为Y=a+b1*X +b2*X2+ e,其中a表示截距,b表示直线的斜率,e是误差项。多元线性回归可以根据给定的预测变量(s)来预测目标变量的值。
eView系列人机界面产品系列包括:
MT6000:高性能,开方式的嵌入式人机界面。
MT5020:高端应用系列。
MT4000/MT4000E:普通应用系列。
MT500、MD200和MD300系列:低成本系列(2012年1月1日MT500正式停止对外销售) 。
2010年,由于公司品牌整合升级及海外推广的需要,触摸屏品牌eview全面更换为kinco,详情可关注步科官网了解。
哥哥,您这是逮着数据就往里面塞啊!而且你怎么没有给出因变量?我猜测是销售量?还是点击量?暂且不论你自变量的选择不正确,你的R Square值太小,最起码应该达到以上。模型拟合度相当不好,请删减自变量,再行回归!
你妹妹 ,那么难。
不会。论文改回归结果不会被发现的,是小批改不会发现的。论文发表是需要审核的,有一项就是论文内容与实际不符的审核容易不通过。
不会。论文改回归结果不会被发现的,是小批改不会发现的。论文发表是需要审核的,有一项就是论文内容与实际不符的审核容易不通过。
回归结果与预期之间存在相反的结果的话可以采用多种方式进行处理,比如说扩大样本量再次进行实证,也可以是换指标,换掉衡量指标体系和计算方法,这样的话都可以进行有效的处理,但是最好不要直接把正负值或者回归系数进行修改,因为这样会造成学术不端。互联网是具有记忆的,今天为了毕业偷的懒,谁知道会不会在以后论文被找出来抽检,万一到时候学校怀疑最后的结果提出要重新运行或者解释,影响会更大。我之前做实证分析的时候也是要么回归系数太小,要么回归的指标过少,要么是最后的结果与假设之间相反,总之会存在多种问题,但是实证就是如此,希望你能把每一步始终数据和结果都保留,改变数据和指标进行再次实证,这样的话就能保证实证结果不断完善和科学。作者:一只特立独行的猪链接:来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。