计量经济学作业二的作业-关于OSL和Autocorrelation

当前位置: >>
计量经济学实验指导书
计量经济学基础实验实验一 实验二 实验三 实验四 实验五 实验六 实验七 实验八 实验九 实验十Eviews 软件的基本操作.............................................1 一元回归模型 ....................................................10 多元和非线性回归模型 ............................................20 多重共线性 ......................................................29 异方差性 ........................................................38 自相关性 ........................................................49 滞后变量模型 ....................................................63 虚拟解释变量模型 ................................................75 模型设定误差诊断与检验 ..........................................82 联立方程模型 ....................................................90实验十一 平稳时间序列分析 .............................................106 实验十二 非平稳时间序列分析(一) .....................................118 实验一 Eviews 软件的基本操作【实验目的】 通过本实验,全面了解 Eviews 软件,熟悉 Eviews 软件建立工作文件、文件窗口操作、对象 操作、数据处理与操作等的基本操作,掌握单序列和多序列的描述统计分析和统计检验等操作 方法,学习使用 Eviews 软件的帮助系统,为后续计量分析做好必需的软件操作准备。 【实验内容】 一、Eviews 软件的安装 二、建立工作文件和对象 三、数据的输入、编辑 四、序列生成、序列组和序列窗口 五、图形分析与描述统计分析 【实验步骤】 一、安装 Eviews 软件 1.双击 Eviews6 安装盘中的 setup.exe,弹出安装界面,如图 2-2-1 所示。 2.指定安装 Eviews 软件的目标目录(默认为 C:\Program files\EVIEWS6) ,多次点击 Next 键,在 Serial Number 项中输入序列号(如图 2-1-2 所示); 3.安装完毕之后,桌面上会有 Eviews6 的快捷图标,了解更多信息可以点击“开始/程 序/Eviews 6”中的文件。图 2-1-1 Eviews 安装界面1 图 2-1-2 Eviews 安装界面 二、建立工作文件和对象 1.建立工作文件。启动 Eviews 后,单击主菜单中的 File/New/Workfile,在弹出的窗 口中选择数据性质和起始、终止期,创建一个工作文档。文件的保存后缀为“WF1” 。具体操 作参考图 1-1-2 和图 1-1-3 及相关内容。 2.建立对象。在 Eviews 中,相关数据都保存的对象中,对象还包括视图(View)和处 理。具体操作参考第 1 部分 1.1.4 中的 Step3~Step5。图 2-1-3 菜单操作创建序列文件 三、数据的输入、编辑与序列生成。选择主菜单 Objects/New Objects,选择所需建立 的对象类型,如序列(Series) 、方程(equation)等。对象的冻结操作比较实用(如果希 望保留某个图形,使它不随工作进程而改变,可以点击对象窗口工具栏中的 Freeze 键,该 功能可以把当前图形冻结下来) (图 1-1-8) ,对象的命名要注意可读性。具体操作可参考图2 1-1-4 及相关内容。 1.建立工作文件。 2.输入 Y、X 的数据。(消费和收入数据见电子附件 2-1-1.wf1) 两种建立新序列的操作。 菜单操作为: 选择主菜单 Objects/New Objects 后, 选择 Series 对象类型,在弹出的窗口中给序列命名,点击 OK;命令操作为:在命令窗口直接输入 Series X 即可建立 X 序列,如图 2-1-3 和图 2-1-4 所示。图 2-1-4 命令窗口创建序列文件图 2-1-5打开 SAS、SPSS 等格式数据文件的操作三种数据输入方式: (1)键盘输入。 (2)复制粘贴输入。通过主菜单的 Edit/copy 和 Edit/Paste 功能复制粘贴数据;要注意粘贴数据的时间区间要和表单中的时间区间一致。 (3)文件输入。可以通过其他程序建立的数据文件直接输入数据。可以通过单击 file/Open/foreign data as workfile 直接打开 SAS、 SPSS 等格式的数据文件 (见图 2-1-5) ; 也可以单击主菜单中的 File/Import/Read Text-Lotus-Excel,在输入窗口中的 Windows 子 目录中找到相应的 Excel(.xls)文件,输入与 Excel 文件的列顺序相同的序列名(见图 2-1-6)。尤其要注意时间区间和该窗口中设置好 Excle(.xls)文件的数据开始单元。至于 文本文件的输入转换,与 Excel(.xls)操作类似。3 数据起始位置图 2-1-6Excel 文件数据输入选择窗口3.公式的运用。在命令窗口用命令生成 log(Y) 、log(X)、X^2、1/X、时间变量 T 等序 列(@year) ,见图 2-1-7。图 2-1-7公式的编辑4.选择若干序列, 用右键以群 (组) 方式打开, 在数组中可以增加、 删除和更名序列 (菜 单 Group Member)见图 2-1-8。图 2-1-8构成数组菜单5.在工作文件窗口中删除、更名序列,可通过鼠标右键选择相应命令操作完成。 6.标量的使用(scalar 命令) 。标量与序列或组不同,它没有显示窗口,只能通过命令 方式来建立。例如,在命令窗口输入:Scalar hj=2。等号右边也可以是表达式或一个特殊 的函数。如果要显示标量对象的值,可以使用 Show 按钮,这时系统会在 Eviews 窗口底部状4 态栏显示标量对象的值。如,Show hj。另外,也可通过双击工作文件窗口的标量对象的名 字来显示标量对象的值,如图 2-1-9 所示。图 2-1-9标量的使用命令7.对序列取数(序列名(i) ) 。如在命令窗口键入 scalar a=X(2),则取出序列 X 的第 2 个数据,如图 2-1-10 所示。图 2-1-10 序列取数命令操作 8.群(组)生成的几种操作方式:DATA 命令(见图 2-1-11) ;菜单操作(见图 2-1-12); 追加成员(见图 2-1-13) 。 9.设定样本范围。在计量分析中,设定样本范围是很重要的。Eviews 主菜单中 Quick/Sample 功能和工作文件窗口中的功能键 Procs 中的 Sample 功能可以用来完成样本范 围的设定。如在设定对话框上侧窗口输入:1 8;下侧窗口输入:X>3000,这意味着样本 在前 8 个观测范围内,收入大于 3000 的观测,如图 2-1-14 所示。5 图 2-1-11 DATA 命令操作图 2-1-12 菜单操作点击此键图 2-1-13 追加成员操作图 2-1-14 设定样本范围对话框 四、图形分析与描述统计分析 1. 菜单方式作图。要作出一个序列的图形,首先要在工作文件窗口中双击该序列的名6 称,在打开的序列窗口中,单击 View 功能键,选择 Graph 中的 Line 就可以显示以时间为横 轴的折线图,选择 Bar 可以显示标有序列观测值条形图,如图 2-1-15 和图 2-1-16 所示。图 2-1-15Line 图图 2-1-16直方图要画两个或更多序列的图形, 从工作文件中选择要画图的多个序列, 或打开一个数据组 窗口,接着单击 View 键,选择 Graph/Line 就可以得到画在一张图中的各序列的折线图。如 果要画两个变量的相关图,则选择主菜单 Quick/Graph/XY line 即可。图 2-1-17X 和 Y 的序列图图 2-1-18 X 和 Y 的相关散点图7 2.命令方式作图。利用 PLOT 命令绘制趋势图。如 Plot x y,绘制出两个序列的趋势图 (见图 2-1-17) ;利用 SCAT 命令绘制 X、Y 的相关图(见图 2-1-18) ; 3.在序列和数组窗口观察序列的描述统计量 选择 View 下的 Descriptive Stats 菜单项。该菜单项下的第二项是 Individual Samples,选择它将会生成序列的直方图和描述统计量。这些统计量包括均值(Mean) 、中位 数(Median) 、最大和最小值(Maximum and Minimum) 、标准差(Standard Deviation) 、偏 度 (Skewness) 、 峰度 (Kurtosis) 、 Jarque-Bera 统计量及概率 (Probability) , 如图 2-1-19 所示。图 2-1-19 需要注意的是,标准差的公式简单描述统计量窗口s∧=1 N ?1∑(Xi =1ni? X )2 。图 2-1-20 统计检验表单图 2-1-21统计检验对话框8 4.Eviews 进行描述统计检验 选择序列窗口 View 按钮下的 Tests of Equality 菜单项。这里主要是序列均值、中位 数和方差的简单假设检验。在序列窗口选择 View/Tests of Equality,就会出现序列简单 检验对话框。此选项提供了对均值(Mean) 、方差(Variance)和中位数(Median)3 个统 计量是否等于某个给定值的检验,如图 2-1-20 和图 2-1-21 所示。【练习与作业】 1.数据文件的存贮、调用与转换 (1)存贮并调用工作文件; (2)存贮若干个变量,并在另一个工作文件中使用这些存 贮的变量(复制) ; (3)将工作文件分别另存为文本文件和 Excel 文件; (4)在工作文件中 分别调用文本文件和 Excel 文件; (5)在对象窗口中点击 Name 按钮,将对象命名贮于工作 文件 2.命令操作方式练习 (1)Scalar 标题命令的使用; (2)Eviews 函数的使用,序列函数及其它对象函数; (3) 使用帮助系统查阅函数及对象视图及属性的使用。 3. 1998 年我国 30 个省的城镇居民人均可支配收入与人均消费性支出数据 (单位: 元) 。inc 表示的是可支配收入, consume 表示的是消费性支出。(数据见电子附件 lx1-3.wf1)(1) 分别用菜单和命令方式建立并保存工作文件为 Ex01.wf1; (2) 将数据导出为 Excel 格式文件,文件名为 Ex01.xls; (3)对数据进行描述统计分析,求两个变量的均值、方差 等统计量; (4)作出两个变量的分布图。 4.为了了解现阶段护士们对于工作的满意程度, 国家医护协会对全国的医院护士进行了 一项调查,下表是一个由 50 名护士组成的样本对工作、工资和升职机会的满意程度的评分 (分值越大表明满意程度越高) 。 WK 表示工作, WG 表示工资, OPP 表示升职机会,(数 据见电子附件 lx1-4.wf1)。 要求: (1)利用各种描述统计指标概括样本数据; (2)判断哪一方面是护士们最为满意的,哪一方面是护士们最不满意的,说明原因, 并对如何改进进行讨论; (3)根据变异指标,判断护士们对工作的哪一方面的满意程度的差异程度最大; (4)指出还可以利用哪些指标来分析护士们对工作满意程度的情况。9 实验二一元回归模型【实验目的】 通过本实验,熟练掌握简单(一元)线性回归模型的文档建立和数据录入,熟悉 Eviews 对象操作和函数应用,熟悉 Eviews 进行回归分析的操作步骤,熟练掌握一元线性回归模型 的建模、检验和预测等方法。学会用 Eviews 软件的回归分析功能分析和解决实际问题。 【实验内容】 一、建立我国城镇居民平均消费支出模型(2-2-1.wf1) 二、建立我国财政收入模型(2-2-2.wf1) 【实验步骤】 一、建立我国城镇居民平均消费支出模型(2-2-1.WF1) 问题概述: 研究全国 31 个省市 2002 年城市居民家庭平均每人消费支出 (Y) 与收入 (X) 的数量关系(单位:亿元) 。 1. 建立工作文件和序列。选择 Eviews 主菜单 File/New/Workfile,进而在文件创建对 话框中做如图 2-2-1 的设置,确定后再选择 Object/New object 建立两个序列(图 2-2-2) 。图 2-2-1 创建工作文件图 2-2-2 建立序列10 2.通过序列视图(view)考察数据的特征:趋势图、散点图、描述统计量和相关系数。 通过序列窗口中的 View 功能键下 Graph/Line,Graph/Scatter,Descriptive statistics, correlations 菜单来完成;操作方式如图 2-2-3 所示。图 2-2-3 群窗口中的 View 功能键的下拉菜单 3.线性回归模型的估计(命令方式和菜单方式) (1)命令方式:LS Y C X,如图 2-2-4 所示。图 2-2-4 命令方式估计模型 (2)菜单方式 ①点击 Quick\Estimate Equation,如图 2-2-5 所示。图 2-2-5 建立方程对象估计模型11 ②在弹出的方程设定框内输入模型:Y C X 或 Y=C(1)+C(2)*X,可参考图 1-1-9。 确定后可得到模型参数估计的结果,如图 2-2-6 所示。 4.方程对象窗口及功能 图 2-2-6 表明,F 统计量为 421.90,方程具有显著性;而截距项的显著性检验不能通过 (伴随概率 0.334&0.05) ,从经济意义上考虑自发性消费是应该有的一部分,可以保留截距 项;X 系数的显著不为零,说明城市人均可支配收入对消费支出有显著影响;可决系数为 0.9357 也表明模型总体拟合较好。 在方程(Equation)窗口中(图 2-2-6) ,View(视图) 、Estimate(估计) 、Forecast (预测) 、Stats(统计量)和 Resids(残差)是常用的按钮,点击相应按钮可以执行相应 的功能。图 2-2-6 模型估计结果 5.残差项正态分布检验 回归的残差项服从正态分布是建立模型的基本要求。在工作文件目录中双击 resid 序 列,在打开的窗口中点击 View/Descriptive Statistics/Histogram and Stats,如图 2-2-7 所示,可以得到柱状分布图、Jarque-Bera 统计量和它的伴随概率等统计量,如图 2-2-8 所 示。图中 Jarque-Bera 统计量的伴随概率(Probability)大于 0.05,则认为残差服从正态 分布。 也可从偏度(Skewness)和峰度(Kurtosis)考察残差序列分布的特点,由偏度值 0.7439 可知,其概率分布为左偏(值为 0 是为对称分布) ;由峰度值 3.8902 可知,其比标12 准正态分布的峰要高(值为 0 是标准正态分布) 。 另外,还可以在 Resid 序列窗口点击 View/Graph 或在方程窗口点击 Resid 按钮得到残 差序列的线图,考察其变化规律,可以参考图 1-1-12 的相关操作。图 2-2-7 残差序列的随机项正态分布检验的对话框图 2-2-8 残差序列的柱状图及相关统计量图 2-2-9 建立工作文件13 二、建立我国财政收入模型(2-2-2.wf1) 问题概述:研究中国
年的财政收入(Y)和国内生产总值(X)的数量关系。 (单位:亿元) 1.建立工作文件 在命令窗口键入 CREATE,弹出创建文件对话框,做如图 2-2-9 的设置。 2.输入数据 在命令窗口键入:DATA Y X,即可打开群窗口,输入相关数据,如图 2-2-10 所示。图 2-2-10 命令方式建立群 3.图形分析 (1)在命令窗口键入 PLOT (2)在命令窗口键入 SCAT Y X,得到趋势图,也可参考图 2-1-17 的相关操作。 X Y,得到两个序列的相关图,如图 2-2-11。图 2-2-11 财政收入(Y)与国内生产总值(X)的相关图 4.估计线性回归模型 (1)命令方式 LS (2)菜单方式14Y CX,与图 2-2-4 操作相同。 ①点击 Quick\EstimateEquation,与图 2-2-5 操作相同。②在弹出的方程设定框内输入:Y C X 或 Y=C(1)+C(2)*X,可参考图 1-1-9。 5.根据判定系数、残差图等进行综合分析图 2-2-12 我国财政收入模型回归结果图 2-2-13 残差、实际值和拟合值的线图 由回归结果图 2-2-13 可知, R 2 = 0.9915 ,说明模型拟合很好。变量 x 的伴随概率为 0.0000,说明 x 对 y 有显著的影响。 由图 2-2-13(在图 2-2-12 中点击 Resids 按钮可得)可知,模型拟合效果不错,残差 呈现出随机波动的特点。 6.Eviews 函数的使用15 (1)常用函数(以@符号为起始符) ①序列描述统计函数:均值[@MEAN()];相关系数[@COR()];协方差[@COV()]等。 ②分布函数:标准正态分布[@CNORM()];t 分布[@TDIST(x,v)]等。 ③分位数函数:t 分位数[@QTDIST(p,v)];f 分位数[@QFDIST(p,v1,v2)]等。 ④回归统计函数(重点) :回归参数标准差[@STDERRS(i)];回归系数[@COEFS(i)];回 归标准差[@SE];回归可决系数[@R2];残差平方和[@SSR]等。 (2)用函数完成参数估计和预测区间的计算(在 Eviews 命令窗口内) series difx=x-@mean(x) ‘建立 x 与其均值的离差序列 series dify=y-@mean(y) series difx2=difx*difx ‘计算离差平方 series difxdify=difx*dify图 2-2-14 序列的生成 在 Eviews 命令窗口中,输入以上命令,得到如图 2-2-14 所显示的序列。图 2-2-15 参数的计算 scalar b2=@sum(difxdify)/@sum(difx2) ‘计算回归系数16 scalar b1=@mean(y)-b2*@mean(x) ‘计算回归截距项? = 根据公式 β 2示。∑ ( X ? X )(Y ? Y ) 和 β? = Y ? β ? X ,计算出 β ? 和β ? 。如图 2-2-15 所 1 2 1 2 ( X ? X ) ∑i i 2 iseries forecasty=b1+b2*x series e=y-forecasty series e2=e*e scalar sigma2=@sum(e2)/18 ‘求得方程方差 scalar varb2=sigma2/(@var(x)*20) ‘求得回归系数方差 scalar Tb2=b2/@sqrt(varb2) ‘求得 T 统计量 scalar tlinjie=@qtdist(0.975,18) ‘求出 95%置信水平下的 T 临界值 scalar y*78017.8 ‘已知 1998 年 GDP 为 78017.8,预测 1998 年财政收入 scalar fdown=y1998-tlinjie*@sqrt(sigma2)*@sqrt(1+1/20+(78017.8-@mean(x))^2/(@var(x)*20)) ‘计算 1998 年预测值的置 信区间下 限17 图 2-2-16 置信区间的计算 求出 1998 年的预测值置信区间下限。如图 2-2-16 所示。根据公式:1 (X f ? X ) ? ?t σ ? 1+ + Y , 可以得出 1998 年的预测值置信区间下限为 。 f α 2 n ∑ xi2(3)使用回归统计函数获取回归过程的中间结果 在命令窗口键入 Scalar a=@SSR(将回归残差平方和的值赋给标量 a) ;或者 Scalar a=@Stderrs(2)(将第二个参数估计量的标准差赋给标量 a) ,使用回归统计函数有利于更快 捷地计算其他相关的统计量。【练习与作业】 1.开放作业(需上机前做好准备) 。利用网络搜索有关计量经济学的网站、实证论文, 就感兴趣的某一问题及相关的实证论文, 了解在实际经济背景下如何利用计量经济学软件建 立计量经济学模型的全过程。要求如下: (1)将查阅的资料录入生成工作文件; (2)用三种不同的操作方式完成回归分析,保 存回归结果; (3)对建立的模型进行经济理论检验、统计检验并对残差进行图形分析; (4) 写出回归分析报告,与论文的分析结果进行对比。 2.发生车祸次数与司机年龄有关吗? 作为交通安全研究的一部分,美国交通部采集了每 1000 个驾驶执照发生死亡事故的车 祸次数(number)和有驾驶执照的司机中 21 岁以下者所占比例(proportion)的数据,样本由 42 个城市组成(数据见电子附件 LX2-2.wf1)。 要求:(1)对这些数据做出数值的和图示的概述; (2)利用回归分析研究发生死亡事故 的车祸次数和有驾驶执照的司机中 21 岁以下者所占比例之间的关系,结合分析结果展开同 学间的讨论。 (3)从你的分析中,你能得出什么结论或提出什么建议。 3.利用 1988 年 9 个工业国的名义利率(Y)与通货膨胀率(X)的数据(数据见电子附件 LX2-3.wf1), 资料来源:原始数据来自国际货币基金组织出版的《国际金融统计》 。分析下 列问题: (1)以利率为纵轴、通货膨胀率为横轴做图; (2)用 OSL 进行回归分析,写出求解步 骤; (3)如果实际利率不变,则名义利率与通货膨胀率的关系如何? 4.研究深圳市
年地方预算内财政收入(Y)与国内生产总值(X)的关系(数 据见电子附件 LX2-4.wf1) ,资料来源:《深圳统计年鉴 2002》 ,中国统计出版社。要求:18 (1)建立深圳地方预算内财政收入对 GDP 的回归模型; (2)估计所建立模型的参数, 解释斜率系数的经济意义; (3)对回归结果进行检验,用命令方式计算参数估计量的置信区 间和预测的置信区间; (4)若是 2005 年年的国内生产总值为 3600 亿元,用命令方式确定 2005 年财政收入的预测值和预测区间。19 实验三多元和非线性回归模型【实验目的】 本章是在第二章基础上的推广, 仍然是学习计量经济学的重要基础。 要求掌握多元线性 回归模型的矩阵估计方法,理解模型的参数估计以及模型的统计检验与简单线性回归的区 别;熟悉模型的非线性特征,掌握非线性模型的两类估计方法。在本实验结束后,学生能够 根据所学知识, 独立地选择实际经济问题, 确定研究对象, 按照计量经济分析的工作程序 (即 建立理论模型,收集统计数据,参数的估计和检验) ,最终写出研究分析报告。 【实验内容】 一、建立西部电力消费多元回归模型(2-3-1.wf1) 二、建立中国税收收入多元回归模型(2-3-2.wf1) 三、建立中国的生产函数(模型)(2-3-3.wf1) 【实验步骤】 一、建立西部电力消费多元回归模型(2-3-1.wf1) 问题概述: 研究西部各省份 2002 年电力消费量 (Y, 亿千瓦? 小时) 与国内生产总值 ( X2 , 亿元) 、水电燃料价格指数( X 3 ,%)的数量关系。 1.用矩阵命令构造 X 和 Y 矩阵(见图 2-3-1) ;图 2-3-1 命令窗口中使用矩阵命令 matrix matrixy=@convert(y) ‘将 Y 序列转换为矩阵类型 series x1=1 ‘建立一个值为 1 的序列20 group groupx x1 x2 x3 ‘建立一个名称为 groupx 的数组,包括三个序列 matrix matrixx=@convert(groupx) ‘将 groupx 数组转换为矩阵 2.用矩阵运算函数完成对模型参数的估计(见图 2-3-2) ; matrix xx=@transpose(matrixx)*matrixx ‘求出参数估计公式的前半部分 matrix xy=@transpose(matrixx)*matrixy ‘求出参数估计公式的后半部分 matrix b=@inverse(xx)*xy ‘得到参数矩阵图 2-3-2 矩阵运算函数 双击工作文件窗口中的矩阵 b,即可得到估计出的三个参数(图 2-3-3) ,估计出的模型 为: Yi =
+ 0.094 X 2i ? 17.151X 3i + ui图 2-3-3 矩阵命令计算出的参数向量 b 3.用矩阵运算完成方程方差估计和可决系数的计算(见图 2-3-4) 。) 残差平方和的矩阵计算公式:RSS = Y ' Y ? β ' X 'Y , 多重可决系数参考公式 (1-2-38) 。matrix RSS=@transpose(matrixy)*matrixy-@transpose(b)*@transpose(matrixx)*matrixy ‘计 算残差平方和21 scalar sigma2=rss(1)/8 ‘计算方程方差 matrix ESS= @transpose(b)*@transpose(matrixx)*matrixy-11*@mean(y)^2 matrix TSS= @transpose(matrixy)*matrixy-11*@mean(y)^2 scalar r2=ESS(1)/TSS(1)图 2-3-4 回归方程方差和多重可决系数的计算 由图 2-3-4 计算结果可知,回归方程的多重可决系数为 0.9469,拟合效果较好。另外, 还可以利用矩阵命令计算参数估计量的标准差和 t 统计量,进行显著性检验。图 2-3-5 模型的参数回归22 二、建立中国税收收入多元回归模型(2-3-2.wf1) 问题概述:研究我国税收收入增长的主要原因,建立税收收入(Y,亿元)和国内生产 总值( X 2 ,亿元) 、财政支出( X 3 ,亿元) 、商品零售价格指数( X 3 ,%)的回归模型。 1.建立方程对象完成多元回归模型的参数估计 可以参考图 2-2-5 的相关操作,在方程窗口输入 Y X2 X3 X4 C,确定后即可得到 回归分析结果(见图 2-3-5) 。 2.作出残差图和查看模型表达式 在方程对象窗口中,点击 View,选择 Actual,Fitted,Residual/Residual Graph,便 出现残差图(见图 2-3-6) ; 点击 View/Representations,得到估计方程的表达式,如图 2-3-7 所示; 再点击 View/Estimation Output,返回显示回归结果。图 2-3-6 残差图估 计的方 程 表达式式图 2-3-7 估计方程的表达式23 3.对回归方程进行经济意义检验、拟合优度检验、F 检验和 t 检验,并判断各检验的区 别与联系 (1)经济意义检验 模型估计结果说明,在假定其它变量不变的情况下,当年 GDP 每增长 1 亿元,税收收入 就会增长 0.02207 亿元;在假定其它变量不变的情况下,当年财政支出每增长 1 亿元,税收 收入会增长 0.7021 亿元;在假定其它变量不变的情况下,当年零售商品物价指数上涨一个 百分点,税收收入就会增长 23.9854 亿元。这与理论分析和经验判断相一致。 (2)统计检验 拟合优度: 由图 2-3-5 中数据可以得到:R 2 = 0.9974 , 修正的可决系数为 R = 0.9971 , 这说明模型对样本的拟合很好。 F 检验:针对 H 0 : β 2 = β 3 = β 4 = 0 ,给定显著性水平 α = 0.05 ,在 F 分布表中查出自 由度为 k-1=3 和 n-k=21 的临界值 Fa (3, 21) = 3.075 。由图 2-3-5 中得到 F =
,由于 大于临界值,应拒绝原假设,说明回归方程显著,即“国内生产总值” 、 “财政支出” 、 “商品 零售物价指数”等变量联合起来确实对“税收收入”有显著影响。 t 检验:给定显著性水平,查 t 分布表得自由度为 n-k=21 临界值 t a / 2 (n ? k ) = 2.08 。 由图 2-3-5 中数据可得, 与参数对应的 t 统计量分别为-2.7459、 3.9566、 21.1247、 2.7449, 其绝对值均大于临界值,这说明分别都应当拒绝原假设,也就是说,当在其它解释变量不变 的情况下,解释变量“国内生产总值” 、 “财政支出” 、 “商品零售物价指数”分别对被解释变 量“税收收入”Y 都有显著的影响。 4.对模型进行回归系数的区间估计并计算预测值的置信区间2?∧ ? ∧ ∧ ∧ ? 参数估计的置信区间: P β ? tα / 2 σ c jj ≤ β j ≤ β + tα / 2 σ c jj ? = 1 ? α ? ? ? ? ? ?个别值预测区间: Y f ? tα / 2 δ∧ ∧X f ( X ' X ) ?1 X 'f ≤ Y f ≤ Y f + tα / 2 δ∧∧X f ( X ' X ) ?1 X 'f参考实验二的命令方式计算过程。 三、建立中国生产函数(模型) (2-3-3.wf1) 问题概述:研究我国
年国内生产总值(GDP,亿元) 、劳动投入(L,万人) 、 资本投入(K,亿元)的数量关系。 1.建立我国柯布-道格拉斯生产函数GDP = A * Lα * K β2.用线性化方法和迭代估计法完成模型的参数估计24 方式 1:转化成线性模型进行估计 命令窗口键入命令:LS log(GDP) C log(L) log(K) ‘取对数有助于克服异方差和自相关等问题(后续学习内容),可得分析结果(见图 2-3-8)。图 2-3-8 转化为线性模型的估计结果 方式 2:迭代估计非线性模型 在表达式窗口输入 GDP=c(1)*L^c(2)*K^c(3) (见图 2-3-9)。图 2-3-9 表达式窗口 迭代过程中可以作如下控制: (1)在工作文件窗口中双击序列 C,输入参数的初始值; (2)在方程描述框中点击 Options,输入精度控制值(见图 2-3-10),结果如下:25 ①参数初值:0,0,0;迭代精度:10 (见图 2-3-11); ②参数初值:0,0,0;迭代精度 10 (见图 2-3-12); ③参数初值:0,0,0;迭代精度:10 ,迭代次数 1000(见图 2-3-13); ④参数初值:0,0,0;迭代精度:10 ,迭代次数 100(见图 2-3-14)。-5 -5 -5-3图 2-3-10 迭代窗口图 2-3-11 迭代精度为 10 ?3 和次数为 500 的回归结果图 2-3-12 迭代精度为 10 ?5 和次数为 500 的回归结果26 图 2-3-13 迭代精度为 10 ?5 和次数为 1000 的回归结果图 2-3-14 迭代精度为 10 ?5 和次数为 100 的回归结果 从 4 个回归结果中看出, C(2)的系数全都不显著, 并且由图 2-3-8 结果中得出可决系数R 2 = 0.9946 , 都比迭代法的可决系数大, 由此可见, 采用线性化方法估计模型更为合适 (在不考虑模型可能存在的自相关的情况下) 。 3.根据劳动和资本投入弹性值判断规模报酬情况。 由图 2-3-8 可知,α = 0.71 和 β = 0.75 , α + β = 1.46 & 1 ,所以可以初步判断该函数是 规模报酬递增。 四、Eviews 中的矩阵运算函数简介 1.矩阵的定义:Matrix;对称矩阵的定义:sym;向量定义:vector 2.序列、群向矩阵的转换:Matrix y=@convert(x) 3.矩阵的转置:@transpose() 4.矩阵逆的运算:@inverse()【练习与作业】 1.美国 30 所知名学校的 MBA 学生 1994 年基本年薪(ASP)、GPA 分数(从 1~4 共四个 等级)、GMAT 分数以及每年学费(ATT)的数据。(数据见电子附件 lx3-1.wf1) (1)建立一个多元回归模型,解释 MBA 毕业生的平均初职工资,并且求出回归结果;27 (2)如果模型中包括了 GPA 和 GMAT 分数这两个解释变量,先验地,你可能会遇到什么 问题,为什么? (3)如果学费这一变量的系数为正、并且在统计上是显著的,是否表示进入最昂贵的 商业学校是值得的。学费这个变量可用什么来代替? 2.考察家庭月收入与购买耐用消费品的关系,用 Y 表示虚拟变量,取 1 时表示已购买, 0 表示没有购买,可用逻辑增长曲线建立计量模型。(数据见电子附件 lx3-2.wf1) 3.
年 7 个 OECD 国家(美国、加拿大、德国、意大利、英国、日本、法国) 总的最终能源需求指数( y ) 、实际的 GDP( x1 ) 、实际的能源价格( x 2 )的数据,所有指数 均以及 970 年为基准() ,试建立模型对能源需求和两个影响因素间的关系进行分 析。 (数据见电子附件 lx3-3.wf1) ①运用柯布-道格拉斯生产函数建立能源需求与收入、价格之间的对数需求函数:ln y t = b0 + b1 ln x1t + b2 ln x 2t + u t②所估计的回归系数是否显著?用 p 值回答这个问题。 ③解释回归系数的意义。 ④根据上面的数据建立线性回归模型:y t = b0 + b1 x1t + b2 x 2t + u t⑤比较以上两个模型的可决系数。 ⑥如果以上两个模型的结论不同,你将选择哪一个回归模型?为什么?28 实验四多重共线性【实验目的】 通过本实验, 要求学生在理解计量经济模型中出现多重共线性的不良后果基础上, 掌握 诊断多重共线性和修正多重共线性的若干方法; 与实验三紧密联系起来, 利用若干变量建立 多元回归模型过程中,要求学生能够独立分析和解决存在的多重共线性问题。 【实验内容】 一、我国财政收入影响因素分析(2-4-1.wf1) 二、我国旅游市场发展影响因素分析(2-4-2.wf1) 三、经典案例:工业增加值与三大产业固定资产投资的联系(2-4-3.wf1) 【实验步骤】 一、我国财政收入影响因素分析(2-4-1.wf1) 问题概述:建立中国
年的财政收入(CS,亿元)对农业增加值(NZ,亿元)、 工业增加值(GZ,亿元)、建筑业增加值(JZZ,亿元) 总人口(TPOP,万人)、 最终消费(CUM, 亿元)和受灾面积(SZM,万公顷)的数量模型。 1.建立回归模型,估计模型的参数图 2-4-1 估计回归模型的结果 在 Equation Estimation 窗口输入 CS C NZ GZ JZZ RPOP CUM SZM,得到回归估计果,29 如图 2-4-1 所示。 2.关注可决系数、F 检验和 t 检验 如图 2-4-1 可知:可决系数 0.995,由此可知模型拟合很好;F 统计量为 632.10,并且 F 检验的伴随概率很小,方程具有显著性。而某些 t 检验伴随概率大于 5%或更大,说明很有 可能存在多重共线性。 3.理论与现实相结合的经济意义分析 经济意义检验时,经济变量间的变化是否与现实情况不符,如果有这种情况出现,应考 虑模型可能存在多重共线性。 如农业增加值和建筑业增加值的回归系数竟然是负的, 这就是 说,农业和建筑业的发展反而会使财政收入减少,这显然与理论分析和实际经验不符。 4.多重共线性的一般判断经验R 2 值很大,方程的 F 统计量值很大,而且它的伴随概率很小,并且变量 t 检验的伴随概率大于 0.05 或者更大。 二、我国旅游市场发展影响因素分析(2-4-2.wf1) 问题概述:分析中国
年全国旅游收入(Y,亿元),国内旅游人数(X2,万 人/次),城镇居民人均旅游支出(X3,元),农村居民人均旅游支出(X4,元),公路里 程(X5,万 km),铁路里程(X6,万 km)的数量关系。图 2-4-2 多元回归模型的回归结果 1.多元线性回归模型的参数估计30 模型形如 Yt = β 0 + β 1 X 2 t + β 2 X 3t + β 3 X 4 t + β 4 X 5t + β 5 X 6 t + ? ,用 Eviews 估计结 果如图 2-4-2 所示。 2.从可决系数、F 检验和 t 检验综合判断共线性 如图 2-4-2 可知: 可决系数 R 2 = 0.9954 , 由此可知模型拟合很好; F 统计量为 173.3525, 并且 F 检验的伴随概率很小。而两个回归系数的 t 检验伴随概率大于 5%,很有可能存在多 重共线性。 3.用相关系数法、方差膨胀因子法和条件数法进行共线性诊断 (1)相关系数检验 在命令窗口键入 COR X2 X3 X4 X5 X6,结果如图 2-4-3 所示。由相关系数矩阵可以看 出,部分解释变量相互之间相关系数较高,存在多重共线性。图 2-4-3 各解释变量之间的相关系数 (2)方差膨胀因子检验法 ①建立辅助回归方程图 2-4-4辅助回归的估计在命令窗口依次键入以下命令,如图 2-4-4 所示,分别得出 x2、x3、x4、x5 和 x6 的辅 助回归方程。31 LS LS LS …X2 X3 X4C C CX3 X2 X2X4 X4 X3X5 X5 X5X6 X6 X6其中 LS X2 C X3 X4 X5 X6 的回归结果如图 2-4-5 所示。图 2-4-5 x2 的辅助回归结果 而 LS X3 C X4 X5 X6,LS X4 C X2 X3 X5 X6,LS X5 C X2 X3 X4 X6,LS X6 C X2 X3 X4 X5 的回归估计与 X2 的辅助回归估计类似,依此类推即可。图 2-4-6 x2 的方差膨胀因子 ②求得方差膨胀因子32 以第 1 个解释变量 x2 为例,如图 2-4-6 的左下角可以看到 x2 的方差膨胀因子VIFx 2 =17.8722。其他变量对应的方差膨胀因子可以依次类推。一般认为,方差膨胀因子大于 10,模型中就存在严重的多重共线性,因此可以认为,该模型中存在严重的多重共线性。 (4)用病态指数法检验多重共线性的存在(提示:使用@eigenvalues 函数)图 2-4-7病态指数病态指数的知识参考 1.3.3。图 2-4-7 中的第四个命令行产生一个对称矩阵,第五行求 得特征根向量, 第六行计算出病态指数。 由图 2-4-7 可知: 病态指数 CI=5≥100, 模型存在严重的多重共线性。 4.用逐步回归法消除多重共线性 先分别做 Y 对 X2 X3 X4 X5 X6 的回归,以 R 最大者为基础,如表 2-4-1 所示。 表 2-4-1 一元回归结果 X2 X3 X4 X5 8.8 5.5 0.0 0.2 0.8 0.4 75.2 27.0 0.0 0.22 2T 统计量 T 值的概率 R2 F 统计量 F 值的概率X6 8.0 0.7 0.0000由表可以看出,x3 方程的 R = 0.9558 最大,以 x3 为基础,依次加入其它变量,进行33 逐步回归,如表 2-4-2 所示。 表 2-4-2 加入新变量的回归结果(一) X2 X4 X5 X6 T 统计量 2.8 2.1 T 值的概率 0.4 0.0 R2 0.0 0.2 表 2-4-2 表明,在 x3 的基础上,新加入变量 x5 方程的 R 2 = 0.9780 最大,并且 T 值的 概率相对优于其他变量,选择 x5。再次加入其他变量逐步回归的结果如表 2-4-3 所示。 表 2-4-3 加入新变量的回归结果(二) T 统计量 T 值的概率 R2 X2 0.9 0..0 0..5 0.9802表 2-4-3 表明,在 x3、x5 的基础上,新加入变量 x4 方程的 R 2 = 0.9914 最大,并且 T 值的概率相对优于其他变量,选择 x4。再次加入其他变量逐步回归的结果如表 2-4-4 所示。 表 2-4-4 加入新变量的回归结果(三) 系数 T 统计量 T 值的概率 R2 X2 0.3 0.9 X6 -480.9 0.2图 2-4-8 最后的回归结果34 表 2-4-4 表明,在 x3、x5、x4 的基础上,加入变量 x2 的 R 2 = 0.9919 ,并且 R 几乎没2有多大的改进,而且 T 检验不显著;加入变量 x6 方程的 T 检验不显著,而且参数为负值不 合理。这说明 x2、x6 引起多重共线性。此时,最后方程的回归结果如下,如图 2-4-8 所示。 由图 2-4-8 可知参数估计模型估计结果为:? = ? + 4.2159 X + 3.2220 X + 13.6291X Y t 3 4 5t=(-8.2461) (3.9450) (3.0677) (4.6930)R 2 = 0.9914R 2 = 0.9872 F=231.7935 DW=1.9526这说明,在其他因素不变的情况下,当城镇居民人均旅游支出 X 3 和农村居民人均旅游 支出 X 4 分别增长 1 元, 公里路程 X 5 每增加 1 万 km 时, 国内旅游收入将分别增长 4.22 亿元、 3.22 亿元和 13.63 亿元。 三、经典案例:工业增加值与三大产业固定资产投资的联系(2-4-3.wf1) 背景资料: 工业增加值与三大产业固定资产投资存在着紧密的联系。 工业增加值包含重 工业增加值和轻工业增加值。重工业增加值以当月重工业增加值点工业增加值的比重来衡 量,三大产业固定资产投资以各产业固定资产投资占当月全部固定资产投资的比重来衡量 (数据见 2-4-3.wf1) 问题概述:假设 Y 表示当月重工业增加值占同月工业增加值的比重(%),X1 表示第一 产业固定资产投资占当月全部固定资产投资的比重(%),X2 表示第二产业固定资产投资占 当月全部固定资产投资的比重(%),X3 表示第三产业固定资产投资占当月全部固定资产投 资的比重(%), ? 为随机扰动项。试建立模型: 模型 1: Yt = β 0 + β 1 X 1t + β 2 X 2 t + ? 模型 2: Yt = β 0 + β 1 X 1t + β 2 X 2 t + β 3 X 3t + ? 从不同的角度分析,可能会有不同的结论! 1. 模型 1: Yt = β 0 + β1 X 1t + β 2 X 2t + ? 的回归结果见图 2-4-9 所示。 2. 模型 2: Yt = β 0 + β1 X 1t + β 2 X 2t + β 3 X 3t + ? 的回归结果见图 2-4-10 所示。 从共线性的角度分析来看这两个模型的分析结果 (图 2-4-9 和图 2-4-10) , 其中模型 1: 变量 x1 和 x2 的伴随概率很小,F 统计量为 91.0001。模型 2:变量 x1 和 x2 的伴随概率小 于相对于模型 1 有所增大;F 统计量为 52.7526,相对于模型 1 有所减小。经比较可得:模35 型 2 可能存在共线性。 模型 1 的可决系数 R 2 = 0.8545 ;模型 2 的可决系数 R 2 = 0.9241 。如果仅从模型拟合效 果来看,或者从模型的预测功效来看,模型 2 优于模型 1。虽然模型 2 中存在一定程度的共 线性,但如果更强调模型的预测应用效果,那么,关注拟合效果(可决系数)比这种共线性 更有意义。图 2-4-9 模型 1 的回归结果图 2-4-10 模型 2 的回归结果【练习与作业】36 1.已知美国
年间的年数据,(数据见电子附件 LX4-1.wf1),其中,y 为售出 新客车的数量(千辆);x1 为新车,消费者价格指数,;x2 为所有物品所有居民 的消费者价格指数,;x3 为个人可支配收入(PDI,10 亿美元);x4 为利率;x5 为城市就业劳动力(千人)。 考虑下面的客车需求函数: Lny=b0+b1lnx1+b2lnx2+b3lnx3+b4lnx4+b5lnx5+u (1)用 OLS 法估计样本回归方程。 (2)如果模型存在多重共线性,试估计各辅助回归方程,并找出哪些变量是高度共线 性的。 (3)如果存在严重的共线性,你会剔除哪一个变量,为什么? (4)在剔除一个或多个解释变量后,最终的客车需求函数是什么?这个模型在哪些方 面好于包括所有解释变量的原始模型? (5)你认为还有哪些变量可以更好地解释美国的汽车需求? 2.某公司经理试图建立识别对管理有利的个人能力模型,他选取了 15 名新近提拨的职 员, 作一系列测试, 确定他们的交易能力 (x1) 、 与其他人联系的能力 (x2) 及决策能力 (x3) 。 每名职员的工作情况(y) (数据见电子附件 LX4-2.wf1)依次对上述三个变量作回归,解决下 列问题: (1)建立三元线性回归模型,并进行回归分析。 (2)模型是否显著。 (3)计算方差膨胀因子,并判断是否存在多重共线性。37 实验五异方差性【实验目的】 异方差是计量经济建模过程中常见的问题。通过本实验要求:在理解异方差性概念和异 方差对 OLS 影响的基础上,掌握进行异方差检验和处理的方法。熟练掌握和运用 Eviews 软 件的 White、Glejser 和 Arch 等异方差检验方法和异方差的处理办法――加权最小二乘法。 【实验内容】 一、四川各地区医疗机构数和人口数的关系分析(2-5-1.wf1) 二、新疆城镇居民人均消费和收入的关系分析(2-5-2.wf1) 三、经典案例:模型的突变点检验和稳定性(2-5-3.wf1) 【实验步骤】 一、四川各地区医疗机构数和人口数的关系分析(2-5-1.wf1) 问题概述:分析四川省 2000 年各地区医疗机构数(Y,个)和人口数量(X,万人)的 数量关系 1.建立字符型的序列 alpha 序列的建立:主菜单 Object/New Object,在弹出窗口中选择 alpha series,如 图 2-5-1 所示。进而输入各地区汉字名称。图 2-5-1 2.用图形诊断异方差建立 alpha 序列对话框38 (1)图形的观察和分析 观察 Y、X 相关图:命令窗口键入 SCAT X Y;观察 Y、X 的线性相关图:主菜单 Quick/graph/XY Line。图形有明显的转折点,如图 2-5-2 和图 2-5-3 所示。图 2-5-2 Y 和 X 的线性相关图图 2-5-3 Y 和 X line 图图 2-5-4 残差分析图39 (2)残差分析 命令窗口键入 LS Y C X,再在方程窗口上点击 Rseidual 按钮,判断残差是否存在明显的波动和转折,如图 2-5-4 所示。残差图波动较大,呈现两头大,中间小,异方差存在 的可能性较大。 3.Goldfeld-Quant 检验法诊断异方差 SORT SMPL LS Y X ‘样本排序 1 C 14 Y C 8 X ‘计算第一组残差平方和,检验结果见图 2-5-5 21 X ‘计算第二组残差平方和,检验结果见图 2-5-6SMPL LS图 2-5-5 第一组回归结果图 2-5-6 第二组回归结果40 计算 F 统计量,判断异方差性。基于图 2-5-5 和图 2-5-6 中残差平方和的数据,即 Sum squared resid 的值。由图 2-5-5 得到的残差平方和为 的残差平方和为∑e2 1i=
,由图 2-5-6 得到∑e2 2i=
,根据 Goldfeld-Quanadt 检验,F 统计量为∑e F= ∑e2 2i 2 1i= = 5.076 上式中分子、分母的自由度均为 6,查 F 分布表得临界值为 F0.05 (6,6) = 4.28 ,因为F = 5.076 & F0.05 (6,6) = 4.28 ,所以拒绝无异方差的原假设,表明模型确实存在异方差。二、新疆城镇居民人均消费和收入的关系分析(2-5-2.wf1) 问题概述:分析新疆
年城镇居民家庭人均消费 Y 和收入 X 的数量关系。 (一)White、Glejser 检验和异方差的处理 1.White 检验 命令窗口键入 LS Y C X,得到方程估计结果。在方程窗口上点击:View\ResidualTests\ Heteroskedastcity Tests,弹出 Heteroskedastcity Tests 对话框,选中 White, 点击 OK,见图 2-5-7。再由概率值判断异方差性,见图 2-5-8。图 2-5-7 White 检验对话框图 2-5-8 White 检验结果 从图 2-5-8 可看出, nR 2 的伴随概率小于 0.05,应拒绝不存在异方差的原假设,表明 模型显著存在异方差。 2.Glejser 检验41 图 2-5-9绝对残差与 X 的回归分析结果选择解释变量的不同函数形式与残差绝对值进行回归, 若能发现某种函数形式对残差绝 对值有显著影响,则认为模型存在异方差。在命令窗口执行以下三条命令: LS GENR LS Y C XE1=ABS(resid)‘将回归残差的绝对值赋给新序列 E1 E1 C X回归结果如图 2-5-9 所示, X 的伴随概率为 0.1157, 表明 X 对残差绝对值的影响不显著。图 2-5-10 Estimate 按扭对话框 再在方程窗口中点击 Estimate 按扭,然后在方程描述框中依次输入下列方程(见图 2-5-10): E1 C X^2 (检验结果见图 2-5-11)42 E1 E1C CX^(-2) 1/X(检验结果见图 2-5-12) (检验结果见图 2-5-13)图 2-5-11 E1 C X^2 的回归结果图 2-5-12E1 C X^(-2) 的回归结果图 2-5-13E1 C X^(-1)的回归结果根据 F 值和 t 值确定最显著的异方差类型模型。 从四个回归的结果看,第一和第二个不显著,后两个显著,比较后两个回归结果,选择 的 Glejse 方程为: ABS ( RESID) = 265.94 ? 41744.2*X ?1 ,原模型存在显著的异方差。 3.进行加权最小二乘法处理43 (1)计算权数变量 在命令窗口键入以下命令,取四种权数进行加权最小二乘回归。 GENR GENR GENR GENR W1=1/X W2=1/X^2 W3=1/E1 W4=1/E2 根据 Gleiser 检验结果 根据 Gleiser 检验结果 取权数变量为 1/| ei | 取权数变量为 1/ ei 2(2)WLS 估计 在 Equation Estimation 窗口中定义模型 Y C X,然后选择 Options 选项卡,在 Weighted Ls 前复选框上打勾, 依次输入 W1、 W2、 W3、 W4, 可得四个回归结果, 这里以 1/ ei 2为例,加权最小二乘回归结果见图 2-5-14。 可决系数由 0.9838 提高到 0.9998,模型的拟 合优度由于加权最小二乘而得到了进一步提高。图 2-5-14 权数 W2=1/e^2 的回归结果 4.再次诊断异方差 可直接对 WLS 处理后的残差项进行异方差检验, 例如选择 White 检验法, 经过加权后的 模型能有效克服异方差问题,检验结果见图 2-5-15。44 图 2-5-15 White 检验结果 由图 2-5-15 可知, nR 2 的伴随概率为 0.6331,远大于 0.05,应该接受原假设,模型不 存在异方差,经过加权后,模型消除了异方差。 (二)arch 检验 Equation Estimation 窗口中定义模型为 Y C X,在回归结果的方程窗口上选择 View\Residual Test\Arch LM test(见图 2-5-16),在对话框进行滞后期的选择,分别选 1、2、3,对结果进行对比,判断是否存在明显的异方差。检验结果见图 2-5-17,图 2-5-18 和图 2-5-19。图 2-5-16 Arch 对话框图 2-5-17 滞后期=1 的回归结果图 2-5-18 滞后期=2 的回归结果图 2-5-19 滞后期=3 的回归结果45 从图 2-5-17,图 2-5-18 和图 2-5-19 检验结果看出,模型不存在异方差。最终可以结 论为:该模型不存在自回归条件下的异方差,但存在其他形式的异方差。 三、经典案例:模型的突变点检验和稳定性(2-5-3.wf1) 问题概述:中国农用汽车拥有量和城镇居民家庭人均可支配收入关系稳定吗?根据
年中国家用汽车拥有量( Y ,万辆)与城镇居民家庭人均可支配收入( X ,元) 建立计量经济模型进行分析。 1.图形分析 从散点图看(见图 2-5-20),1996 年有一个明显的转折,当城镇居民家庭人均可支配 收入突破 4838.9 元后,城镇居民家庭购买家用汽车的能力大大提高,那么,1996 年是不是 一个突变点?即将资料分为两段,分别回归,两个模型是否存在显著的差异。可以用 Goldfeld-Quant 检验法进行验证,如果存在异方差,说明可能存在这个转折点(突变点) , 模型所表达的关系是不稳定的。因而,可以进一步验证 1996 年为突变点。图 2-5-20 散点图2.异方差检验 操作步骤与实验内容一相似,定义两个样本,即
和 。从两个回2 归结果中得到 ∑ e12t = 30.268 和 ∑ e2 t =
, F = 191.74 & F0.05 (6,6) = 4.28 ,可以确定模型存在严重的异方差问题,应该进一步做突变点的验证。 3.突变点检验46 。 图 2-5-21 菜单窗口图 2-5-22 Chow Tests 对话框图 2-5-23 检验结果 将样本范围重新设定为
年, 在简单线性回归后的方程对象窗口中, 单击 View 功能键,选 Stability tests/Chow Breakpoint Test 功能(图 2-2-21),结合以上的图形 分析,在 Chow Tests 的第一个文本框键入 1996,第二个文本框键入 c 和 x(图 2-5-22),47 确定后即可得邹检验结果,如图 2-5-23 所示,三个统计量的伴随概率都远远小于 0.05,可 以认为 1996 年是一个明显的突变点。将 1996 年后的时间段作为预测期,选 Stability tests/Chow Forcast Test 功能,也可以判断回归参数是否发生的显著变化(是否稳定)。 可见异方差的问题与模型稳定性问题往往是相伴的。 另外, 还可以引入虚拟变量对模型 结构稳定问题进行研究,相关内容参考实验八。【练习与作业】 1.假定在家计调查中得出一个关于家庭收入( X )和每年生活必需品综合支出( Y ) 的横截面样本,数据如下表: 表 2-5-1 Xi Yi 1 0.8 1.2 0.8 1.4 0.9 1.6 1.2 1.8 1.4 2.0 1.2 2.2 1.7 2.4 1.5 2.7 2.1 3.0 2.4 3.3 2.2 3.5 2.1 3.8 2.3 4.0 3.2根据表中数据: (1)用普通最小二乘法估计线性模型 Yt = β 0 + β1 X t + ? t (2)用适当的检验法进行异方差检验。 (3)用加权最小二乘法对模型加以改进。 2.1995 年北京市规模最大的 20 家百货零售商店的商品销售收入( x )和销售利润( y ) 的统计资料(单位:千万元)(数据见电子附件 lx5-2.wf1)。 (1)根据 y,x 的相关图分析异方差性 (2)利用怀特检验、ARCH 检验和戈里瑟检验进行异方差检验 (3)利用 WLS 法估计利润函数 3.试分析美国 1988 年工业部门 R&D 支出费用 Y 和销售额 S 、 销售利润 P 的统计资料 (单 位:百万美元)的数量关系(数据见电子附件 lx5-3.wf1)。 试分析下列问题: (1)分别利用线性模型和双对数模型建立研发费用模型,比较模型的统计检验结果和 异方差的变化情况。 (2)检验模型的异方差性。 (3)对于双对数模型,分别取权数变量为 W1=1/P、W2=1/RESID^2,利用 WLS 重新估 计模型,分析模型中异方差性的校正情况。48 实验六【实验目的】自相关性通过本实验要求:在理解自相关的基本概念、自相关导致的严重后果的基础上,掌握诊 断自相关存在的方法和修正自相关的方法。能够熟练使用 Eviews 对实际经济问题独立进行 自相关的诊断与处理。经过第四、五、六章的学习,学生可自己选择一个实际经济问题,建 立模型,并判断和解决可能存在的上述问题。 【实验内容】 一、我国城乡居民储蓄余额与 GDP 指数的关系分析(2-6-1.wf1) 二、我国 GDP 与进口总额的关系(2-6-2.wf1) 三、经典案例:新疆消费需求的影响因素分析(2-6-3.wf1) 【实验步骤】 一、我国城乡居民储蓄余额与 GDP 指数的关系分析(2-6-1.wf1) 问题概述:分析我国
年城乡居民储蓄存款年底余额(Y,亿元)与 GDP 指数 ()的数量关系。 1.学生可将数据补齐至 2007 年 数据从 1978 至 1998 年,要求学生查阅中国统计年鉴,补充相应数据至 2007 年,同时, 了解学校图书馆的统计年鉴状况。 2.模型的设定(尝试多种函数) (1)线形模型。命令方式执行 LS Y C X,如图 2-6-1 所示。图 2-6-1 线形模型的回归结果49 (2)双对数模型。命令方式执行 LS log(Y) C log(X),如图 2-6-2 所示。图 2-6-2 双对数模型的回归结果 (3)对数模型。命令方式执行 LS Y C log(X),如图 2-6-3 所示。图 2-6-3 对数模型的回归结果 (4)指数模型。命令方式执行 LS log(Y) C X,如图 2-6-4 所示。图 2-6-4 指数模型的回归结果50 (5)二次多项式模型。命令方式执行 LS Y C X X^2,如图 2-6-5 所示。图 2-6-5 二次多项式模型的回归结果 根据判定系数、 残差图等分析结果, 双对数模型和二次多项式模型的统计检验结果较好。 他们的判定系数分别为 R 2 = 0.9803 和 R 2 = 0.9902 ,t 值的伴随概率显著。由于原始变量 y、 x 数据呈现指数变化,宜选择双对数模型,继续进行以下分析。 3.自相关性的诊断 (1)残差图分析。双对数回归模型残差项 e t 呈现有规律的波动(图 2-6-6),预示着可 能存在自相关。图 2-6-6残差图分析(2)DW 检验。观察回归结果中的 DW 统计量(图 2-6-2) 。查 DW 分布表, DW=0.1290& d L = 1.352 ,可判定双对数模型存在正自相关。51 (3) 偏相关系数检验。 在图 2-6-2 所在的方程对象窗口单击 View 键功能, 选择 Residual tests/correlogram-Q-statistics,在弹出的对话框中输入滞后期 12。结果如图 2-6-7 所 示,残差序列是非平稳序列,根据 PACF(偏自相关)图判断可能存在自相关问题。图 2-6-7 偏相关系数检验 (4)BG 检验(LM 检验)(进一步检验高阶自相关)图 2-6-8 LM 检验 方程对象窗口单击 View 键功能,选择 Residual tests/serial correlation LM test, 在弹出的对话框中输入要验证的自相关阶数,例如选择 2(可做多次更高阶数的选择),确 定后根据 F 统计量和 nR 2 的伴随概率,判断是否存在高阶自相关。如图 2-6-7 所示,F 值的 伴随概率小于 0.05,可以认为存在高阶自相关。 4.自相关的处理52 (1)广义差分法 做一阶自相关的处理,命令方式执行如下命令,结果如图 2-6-9 所示。 series lny=log(y) series lnx=log(x) series dlny=lny-0.9355*lny(-1) ‘产生差分序列,0.9355 如何计算? series dlnx=lnx-0.9355*lnx(-1) dlny(1)=@sqrt(1-0.9355^2)*lny(1) ‘定义差分序列的初始值 dlnx(1)=@sqrt(1-0.9355^2)*lnx(1) ls dlny c dlnx图 2-6-9 广义差分的回归结果 图 2-6-9 显示广义差分回归结果中的 DW=0.8814& d L = 1.352 , 仍存在正自相关, 为什么? (因为可能存在高阶自相关。双对数模型的 DW 值不适用于高阶自相关的检验,原模型存在 一阶自相关的结果有可能是错误的)。 (2)C-O 迭代法53 ①命令方式执行 LS lnyc lnx ar(1) ar(2),即设定模型存在 2 阶自相关,结果如图 2-6-10 所示,我们可知 LNX 的 t 值伴随概率大于 0.05,这与常理不符,可以考虑建立 更高阶自相关的回归模型。图 2-6-10 二阶自相关的回归结果 ②命令方式执行 LS lny c lnx ar(1) ar(2) ar(3),即设定模型存在 3 阶自相关,结果如图 2-6-11 所示,各个系数都显著不为零,而且模型拟合效果也很好,说明模型存在 三阶自相关。图 2-6-11 三阶自相关的回归结果54 由以上分析可知, 我国城乡居民储蓄余额与 GDP 指数的关系模型存在三阶自相关, 最终 模型可确定为:ln Yt = ?8.5914 + 3.0858ln X t + ut ut = 1.6795ut ?1 ? 1.1351ut ? 2 + 0.6037ut ?3 + ε t在回归结果中, AR(1)、AR(2)、AR(3)的系数就是三个自相关系数。 5.两种方法处理效果对比 在这个模型中,由于存在高阶自相关,从拟合优度、显著性检验等多个方面来看,C-O 迭代法的效果比广义差分法(一阶)更好。 二、我国 GDP 与进口总额的关系(2-6-2.wf1) 问题概述:分析
年中国实际进口额(Y,亿元)和实际 GDP(X,亿元)的数 量关系。 1.自相关诊断(残差图分析和 DW 检验) (1)残差相关图分析 命令方式执行 ls Y c X,可得回归结果和残差序列。继续命令方式执行 SCAT RESID RESID(-1) ,得相关散点图(图 2-6-13) 。由图可知,残差序列(RESID)与其滞后一期的 序列(RESID(-1) )存在一定程度的正相关(同方向变动) ,因此,残差序列存在某种程度 的正自相关问题。图 2-6-13 残差的相关图 (2)DW 检验 Y 与 X 的简单线性回归结果如图 2-6-12 所示。N=19,在 0.05 的显著性水平下,查 DW 统计表可知,DW=0.5239& d L = 1.18 ,模型存在正自相关。也可对原序列求自然对数后,再 进行简单回归,DW=0.4501(图 2-6-14) 。55 图 2-6-12 我国
年 GDP 与进口总额的回归结果 2.一阶自相关系数的确定(DW 法和杜宾两步法) (1) DW 法。 根据公式 ρ =1?DW ? = 0.7749 。 计算一阶自相关系数, 如图 2-6-14 可知:ρ 2? 图 2-6-14 由 DW 值计算 ρ(2)杜宾两步法。以命令方式执行 ls lny c lny(-1) lnx lnx(-1),结果中的 lny(-1)? = 0.8721 。 的参数估计值就是一阶自相关系数。如图 2-6-15 可知: ρ56 ? 的计算 图 2-6-15 一阶自相关系数 ρ3.自相关的处理 (1)广义差分法 在广义差分过程中,对缺失的初始值进行补充,公式如下:y? 1= 1? ρ2y , x1 =?11? ρ2x ,此种变换叫做普瑞斯-文思(Prais-Winsten)变换。1图 2-5-16 广义差分的结果 由图 2-5-16 可知,广义差分后,DW=0.5242& d L = 1.18 。自相关处理效果不理想,模型 可能存在高阶自相关。BG 检验(LM 检验)可以验证确实存在高阶自相关。57 (2)C-O 迭代法 ①一阶自相关的处理 命令方式执行 LS lny c lnx ar(1),结果如图 2-6-17 所示。图 2-6-17 AR(1)回归的的结果 ②二阶自相关的处理 命令方式执行 LS lny c lnx ar(1) ar(2),结果如图 2-6-18 所示。图 2-6-18 AR(2)回归的的结果 对比图 2-6-17 和图 2-6-18 可知:二阶自相关模型的拟合优度更好,BG 检验(LM 检验) 效果也更好,因此,应该选择二阶自相关模型(模型方程形式参考实验内容一)。58 三、经典案例:新疆消费需求的影响因素分析 背景资料: 消费问题在近两年成为一个焦点问题, 刺激消费成为拉动经济增长的有效手 段。由于经济发展的外部环境和内部环境变化,将刺激消费、扩大内需确定为经济增长的基 本立足点和长期发展策略, 具有重要的现实意义。 影响人均居民消费的主要影响因素可能有 以下几个方面:前期人均居民消费(x1)、人均国内生产总值(x2)、全省商品零售价格指 数(x3)、中国人民银行一年期储蓄存款利率(x4)。(数据见电子附件 2-6-3.wf1)。 要求:通过计量分析,确定影响新疆消费需求的主要因素,针对实验四、五和六涉及内 容的进行较综合的实验。 1.共线性分析 (1)多重共线性的检验图 2-6-19 多元回归结果 由图 2-6-19 我们可以看出,可决系数 R 2 = 0.9929 ,模型拟合效果很好;F 统计量为 383.6059,并且 F 检验的伴随概率很小;而变量 x3 和 x4 的 t 检验伴随概率大于 5%,很有 可能存在多重共线性。 (2)逐步回归法消除多重共线性(反向逐步回归) 前面的实验中选择了正向逐步回归,这里选择反向逐步回归法做实验。先分别做 Y 对 X1 X2 X3 X4 的回归。如表 2-6-1 所示。59 表 2-6-1 Y 对每个解释变量的回归T 统计量 T 值的概率 C -1.3 X1 2.0 X2 3.1 X3 2.6 X4 0.0先逐次剔除不显著的变量,由表 2-6-1 可知,可以将截距项和 X4 予以剔除,回归结果 如表 2-6-2 所示,模型 1 为:Yt = 0.4892 X 1t + 0.1175 X 2 t + 1.4520 X 3t (4.2777) (4.6401) (4.9362)R 2 = 0.9920 ,DW=1.8558。表 2-6-2 剔除变量的回归结果(一)X1 T 统计量 T 值的概率 4.9 X2 4.5 X3 4.3也可尝试将截距项和 X3 予以剔除,回归结果如表 2-6-3 所示,模型 2 为:Yt = 0.8000 X 1t + 0.0761X 2 t + 22.0058 X 4t (9.2563) (3.0198) (3.7609)R 2 = 0.9890 ,DW=1.6874。表 2-6-3 剔除变量的回归结果(二)T 统计量 T 值的概率 X1 9.0 X2 3.9 X4 3.4经表 2-6-2 和表 2-6-3 比较,反向逐步回归可以停止,模型 1 的拟合优度比模型 2 高, 模型 1 的 DW=1.8558& dU = 1.728 ,模型不存在一阶自相关,而模型 2 无法判定是否存在自 相关,因为 d L = 0.857 &DW=1.68747& dU = 1.728 。所以,可以选择模型 1 作为回归模型,结 果如图 2-6-21 所示。 3.异方差分析图 2-6-20 White 检验 对上述模型回归结果的残差进行异方差 White 检验。从图 2-6-20 可以看出, F 和 nR 2 统计量的伴随概率均远大于 0.05,模型不存在异方差。 4.自相关性分析 由图 2-6-21 可知 dU = 1.728 &DW=1.8558& 4 ? dU = 2.272 ,确定模型不存在一阶自相关。60 根据图 2-6-22 的偏自相关图和 LM 检验,均接受无自相关的假定。因此,模型不存在自相关 问题。图 2-6-21 Y 对 X1 X2 X3 的回归结果图 2-6-22 自相关检验图 综合以上分析,最后模型估计的结果为:Yt = 0.4892 X 1t + 0.1175 X 2 t + 1.4520 X 3t (4.2777) (4.6401) (4.9362)R 2 = 0.9920 ,DW=1.8558。方程总体显著,解释变量对被解释变量的影响显著,拟合优度较高。可决系数R 2 = 0.9920 ,说明这三个变量的变动能解释人均消费水平 99.20%的变动,模型解释能力较强。由于我国实行固定利率制度,利率不是通过市场调节的,所以人均居民消费与一年期储 蓄存款利率无密切关系。同样,商品零售价格也没有发挥其市场作用,与人均居民消费呈现 正相关。可见,包括保持经济增长(人均国内生产总值(x2))和消费贯性的形成(前期人 均消费)在内的方法是在制定拉动消费对策中应该重点考虑的。61 【练习与作业】 1.在用广义差分法消除一阶自相关过程中, 由于差分会将丢失一个观察值。 为避免观察 值的丢失,我们可对第一组观察值作如下变换: y1? =1 ? ρ y12, x1? = 1 ? ρ 2 x1 ,此种变换叫做普瑞斯-文思特(Prais-Winsten)变换。利用美国
年进口支出(y)与个人可支 配收入(x)的数据,掌握在广义差分法消除一阶自相关过程中补充缺失值的方法, 数据见 电子附件 LX6-1.wf1(单位:10 亿美元,1982 年为基期)。请回答以下问题: (1)利用表中数据估计模型 yt = β 0 + β1 xt + ut ;(2)是否存在自相关?如果存在,请 用 DW 的估计值估计自相关系数ρ;(3)用广义差分法重新估计模型:yt ? ρ yt ?1 = β 0 (1 ? ρ ) + β1 ( xt ? ρ xt ?1 ) + ε t ;(4)应用杜宾两步法估计ρ的方法,解决第(3)问。 2.已知某上市公司的子公司的年销售额 Yt 与其总公司年销售额 X t 的观测数据(数据见 电子附件 LX6-2.wf1),请回答以下问题: (1)用最小二乘法估计 Yt 关于 X t 的回归方程; (2)用 D.W.检验分析随机项的一阶自相关 性;(3)用 Durbin 两步法估计回归模型的参数;(4)用广义差分法估计回归模型的参数。 3.已知美国股票价格指数(y)和 GNP(x)数据(数据见电子附件 LX6-3.wf1),请回答 以下问题: (1)利用 OLS 估计模型; (2)根据 DW 统计量确定在数据中是否存在一阶自相关; (3) 如果存在一阶自相关,用 DW 值来估计自相关系数;(4)利用估计的自相关系数值,用 OLS 法进行广义差分估计;(5)利用一阶差分法进行参数估计。比较(4)和(5)的回归结果, 你能得出什么结论?在变换后的模型中还存在自相关吗?62 实验七滞后变量模型【实验目的】 本章是一般线性回归模型的扩展部分--动态计量经济建模。 通过本实验要求: 在了解分 布滞后模型与自回归模型的区别与联系基础上,掌握利用 Eviews 软件进行分布滞后模型的 参数估计方法;在区别库伊克模型、自适应期望模型和局部调整模型三种模型的基础上,尝 试进行自回归模型的参数估计,并掌握处理随机解释变量问题的工具变量法。 【实验内容】 一、库存函数及其模型分析(2-7-1.wf1) 二、货币供应量与物价指数模型分析(2-7-2.wfl) 三、我国消费与 GDP 关系的模型分析(2-7-3.wf1) 【实验步骤】 一、库存函数及其模型分析(2-7-1.wf1) 问题概述:分析
年美国制造业库存量(Y,亿美元)和销售额(X,亿美元) 的数量关系(滞后销售对库存量有影响)。 1.经验加权法 用递减滞后结构、∧型滞后结构和不变滞后结构分别进行加权,在 Eviews 中命令方式 执行如下三条命令,产生三个新的线性组合变量: Genr z1=X+(1/2)*X(-1)+(1/4)*X(-2)+(1/8)*X(-3) ‘递减滞后加权 Genr z2=(1/4)*X+(1/2)*X(-1)+(2/3)*X(-2)+(1/4)*X(-3) Genr z3=(1/4)*X+(1/4)*X(-1)+(1/4)*X(-2)+(1/4)*X(-3) 再用 Y 与产生的三个新变量分别回归,选取最佳的模型即可。 2.阿尔蒙法 (1)分析滞后期长度: ①互相关分析 命令方式执行 CROSS Y X; 或在 Y 和 X 的数组对象窗口中, 单击 View 功能键, 选择 cross correlation(2),进而再选择滞后长度,就可以做互相关分析了(见图 2-7-1)。(注意与 自相关分析图的区别) ②确定滞后期长度 ‘∧型滞后加权 ‘不变滞后加权63 根据临界值(虚线)判断(图 2-7-1),滞后 3 期后,互相关系数进入了临界域,可以 确定滞后期长度为 3。图 2-7-1 X 和 Y 的互相关图 (2)命令方式进行阿尔蒙计算 ①Almon 变换 多项式的次数 m 一般取值小于滞后长度 k,这里取 m=2。如图 2-7-2 所示,在命令窗口 中利用阿尔蒙多项式 β i = α 0 + α1i + α 2 i 2 进行计算。 GENR GENR GENR Z0=X+X(-1)+X(-2)+X(-3) Z1=X(-1)+2*X(-2)+3*X(-3) Z2=X(-1)+4*X(-2)+9*X(-3)图 2-7-2 命令方式实现 Almon 变换 ②估计模型 命令方式执行 LS Y C Z0 Z1 Z2,结果如图 2-7-3 所示。64 图 2-7-3 变换后的模型回归结果 ③计算原模型中的系数估计值 图 2-7-5 中 Z 0、Z1、Z 2 对应的系数分别为 α 0 、 α1、 α2。 将它们代入 α1 、 α 2 的估计值 α 0 、 分布滞后系数的阿尔蒙多项式中,可计算出 β 0 、 β1、 β2 β3、 β 4 的估计值。最终模型为:∧ ∧ ∧ ∧ ∧ ∧ ∧ ∧Yt = ?71.3814 + 0.6614 X t + 1.1305 X t ?1 + 0.7363 X t ?2 ? 0.5211X t ?3(2)利用 PDL 命令估计模型 多项式分布滞后命令 PDL(x,k,m,d),x 是待分析的解释变量 k 为滞后期长度,m 为多 项式次数,d 是对分布滞后特征进行控制的参数。 由于确定了滞后长度 k=3, 多项式次数 m=2, 滞后特征参数缺省, 在命令窗口执行 LS Y C PDL (X, 3, 2) 即可得到阿尔蒙法的回归结果, 如图 2-7-4 所示。 结果上半部分中的 PDL01、PDL02 和 PDL03 的系数相当于命令方式计算 Z 0、Z1、Z 2 的系数, 都为阿尔蒙多项式生成的变 量的参数估计值。需要特别说明的是,在使用 PDL 估计分布滞后模型时,Eviews 所采用的 滞后系数多项式变换不是形如 β i = α 0 + α1i + α 2 i 2 的阿尔蒙多项式,而是阿尔蒙多项式的派 生形式: β i = α 0 + α1 (i ? 1) + α 2 (i ? 1) 2 ,因此 PDL01、PDL02 和 PDL03 的系数与命令方式计算Z 0、Z1、Z 2 的系数有所不同,但这并不影响估计系数的最终结果,即最终模型是完全相同的。图 2-7-42 中,模型的可决系数 R 2 =0.9968 和 F 统计量的伴随概率为远小于 0.05,表明 模型有较好的拟合效果,方程具有显著性。65 图 2-7-4 滞后模型的回归结果 结果的下半部分是还原成原始变量及其滞后量的参数估计值,最终模型可表示为:Yt = ?71.3814 + 0.6614 X t + 1.1305 X t ?1 + 0.7363 X t ? 2 ? 0.5211X t ? 3 (-3.58) (4.00) (6.28) (4.49) (-2.22)(3)滞后长度的调整和判断 尝试将 PDL 项依次取成:PDL(X, 3, 2)、PDL(X, 4, 2)、PDL(X, 5, 2),当回归 结果中调整的判定系数下降,或 SC、AIC 的值增大时,则表明滞后期长度已经不能再增加。 二、货币供应量与物价指数模型分析(2-7-2.wfl) 问题概述:分析
年全国广义货币 M 2 的月增长量( M 2 Z , 1011 元)和居民消 费价格同比指数的数量关系。 1.对金融问题普遍存在滞后现象的认识 金融领域是数据发生量最大、 数据发生频率最高的领域, 金融变量间关系的探究因为数 据的可得性和相对真实性广受计量分析者亲睐。 然而金融变量的关系因为政策效应的滞后和 行为人的预期往往是一种滞后关系, 包括变量间的滞后和变量自身的滞后影响。 这种滞后性66 是建立滞后变量模型的重要依据。因此货币供应量和物价指数关系模型也存在滞后影响关 系。 2.滞后长度的试算和确定 将货币供应量与物价指数的滞后量进行反复试算,长度选择为 6、12、18,判断的标准 是 SC、 AIC 越小越好, 因为它们都是残差的函数。 注意观察滞后长度变化对回归效果的影响, 最后确定滞后长度大致为 1 年, 回归系数的估计值都很小, 这或许是 Koyok 模型存在的现实 基础,检验结果见图 2-7-5。图 2-7-5 滞后期为 6 的回归分析结果 从回归结果来看,M2Z 各滞后期的系数逐步增加,表明当期货币供应量的变化对物价水 平的影响要经过一段时间才能逐步显现。但各滞后期的系数的 t 统计量值不显著,同时随着 滞后期的延长,参数估计量的统计量有逐渐显著的趋势,例如,伴随概率从 0.9376 逐步变 化为为 0.0859,因此还不能据此判断滞后期究竟有多长。为此,我们做滞后 12 个月的分布 滞后模型的估计,检验结果如图 2-7-6。 图 2-7-7 显示,从 M2Z 到 M2Z(-11),回归系数都不显著异于零,而 M2Z(-12)的回归 系数 t 统计量值为 3.016798,在 5%显著性水平下拒绝系数为零的原假设。这一结果表明, 当期货币供应量变化对物价水平的影响在经过 12 个月(即一年)后明显地显现出来。为了 考察货币供应量变化对物价水平影响的持续期, 我们做滞后 18 个月的分布滞后模型的估计, 检验结果如图 2-7-7 所示。67 图 2-7-6 滞后期=12 的回归分析 图 2-7-7 表明,从滞后 12 个月开始 t 统计量值显著,一直到滞后 16 个月为止,从滞后 第 17 个月开始 t 值变得不显著;再从回归系数来看,从滞后 11 个月开始,货币供应量变化 对物价水平的影响明显增加,再滞后 14 个月时达到最大,然后逐步下降。 通过上述一系列分析,我们可以做出这样的判断:在我国,货币供应量变化对物价水平 的影响具有明显的滞后性,滞后期大约为一年,而且滞后影响具有持续性,持续的长度大约 为半年,其影响力度先递增然后递减,滞后结构为∧型。 计量分析中, 我们要注意模型分析与实际问题要紧密结合起来。 动态计量经济建模在很 大程度上注重数据的变化规律,本实验着重讨论货币供应量对物价影响的滞后性,所以,从 上述回归结果可以看出,回归方程的 R 2 不高,DW 值也偏低,表明除了货币供应量外,还有 其他因素影响物价变化;同时,过多的滞后变量也可能引起多重共线性问题。如果我们分析 的重点是货币供应量变化对物价影响的滞后性, 上述结果已能说明问题。 如果要提高模型的 预测精度,则可以考虑对模型进行改进,例如,可以考虑引入更多的变量,或改变模型的函 数形式等等。根据前面的分析可知,当滞后期数比较大时,分布滞后模型可以用自回归模型68 来代替,模型的表达式更加简洁。图 2-7-7 滞后期=18 的回归分析69 图 2-7-8 自回归模型的回归结果 3.自回归模型的尝试 Koyok 模型的适用范围是比较讲究的,不是任何情况下都可适用。一般情况下,当资产 价格遵循几何布朗运动时, 其时间序列数据可以运用 Koyok 模型来分析。 根据前面学过的理 论知识可知,分布滞后模型可以用自回归模型来代替,因此我们估计如下自回归模型:TBZSt = α + β 0 * M 2 Z + β1 * TBZSt ?1 + ut回归结果如图 2-7-8 所示。 从回归结果来看,M2Z 的 t 统计量值不显著,表明当期货币供应量的变化对当期物价水 平的影响在统计意义上不明显,可以予以剔除。图 2-7-9 自回归模型的进一步优化 图 2-7-9 的模型优化为 TBZS = 5.3488 + 0.9467TBZSt ?1 + ut ,可以继续用德宾 h 统计量 检验该自回归模型是否存在自相关(自回归模型不适合用 DW 检验),模型已不存在自相关。 三、我国消费与 GDP 关系的模型分析(2-7-3.wf1) 表 2-7-1序号 1 2 3 4 5 6 7 8 GDP 2.1 84
56.5 45.9国内生产总值、消费与投资数据IV 6 95 15 序号 9 10 11 12 13 14 15 GDP 00.6 10.5 94.3 79853.3 CS 82.1 35 79.4 46405.9 IV
77 57.6 3039670 问题概述: 表 2-7-1 是国内生产总值(GDP)、 消费(CS)与投资(IV)数据。 试分析消费 (CS, 亿元)与国内生产总值(GDP,亿元)的数量关系。图 2-7-10 模型回归结果 在 Eviews 中进行简单线性回归(图 2-7-10),模型表达式为:CSt = 852.3928 + 0.568763* GDPt + ut1.随机变量的检验(2-7-1)用 Hausman 检验判断模型是否存在随机解释变量问题, 假设投资变量与随机误差项不相 关(只是为了说明问题,不去计较实际是否相关)。 在命令窗口中输入以下三条命令: Equation hausman.LS GDP C IV Genr HJ=resid ‘建立模型 GDPt = α 0 + α1 IV + HJ t‘将模型的残差项赋给序列 HJ ‘建立模型 CSt = β 0 + β1GDPt + β 2 HJ t + utEquation eqtest.LS CS C GDP HJ操作如图 2-7-11。由模型 GDPt = α 0 + α1 IV + HJ t 可知残差(HJ)是与 GDP 相关的;如 果 HJ 在模型 GDPt = β 0 + β1 IVt + β 2 HJ t + ut 中的参数是显著的,即序列 HJ 显著存在,则在 该模型中,GDP 与 HJ 之间存在相关性;序列 HJ 应该是模型(2-7-1)残差的一部分,因而 在模型 (2-7-1) 中存在 GDP 与残差项相关, 即存在随机解释变量问题。 检验结果如图 2-7-12 所示,残差 HJ 的参数是显著的,可以判定 GDP 与随机误差项之间的确存在相关性。模型中 存在随机解释变量问题,可能会对 OLS 估计产生不良的影响,需要进行相应的处理,一般选 择工具变量法进行处理。71 图 2-7-11 命令窗口图 2-7-12 Hausman 检验用到的回归结果 2.工具变量的选择 依据工具变量的选择原则,可以选用 IV 作为 GDP 的工具变量。 3.随机解释变量问题的处理--工具变量法 在 Equation Estimation 窗口中选择 TSLS(二阶段最小二乘法)估计法(该方法将会 在后续实验十一中详细阐述),将工具变量 IV 填入到 Instrument List 框内,如图 2-7-13 所示,点击 OK 便得到计算结果,GDP 的参数估计值就是工具变量法的估计量,处理结果见 图 2-7-14。72 图 2-7-13 TSLS 方程定义对话框图 2-7-14 回归结果【练习与作业】 1.某地区
年基本建设新增固定资产 Y (亿元)和全省工业总产值 X (亿元) 按当年价格计算的历史资料。(数据见电子附件 lx7-1.wf1) (1) 设定模型 Yt* = α + β X t + ?t 作部分调整假定,估计参数,并作解释。 (2) 设定模型 Yt = α + β X t + ?t 作自适应假定,估计参数,并作解释。*73 (3) 比较上述两种模型的设定,哪一个模型拟合较好? 2.美国
年间个人消费支出( CC )与个人可支配收入( I )的数据(单位: 10 亿美元,1982 年为基期)(数据见电子附件 lx7-2.wf1) 考虑以下模型:C t = a1 + a2 I t + ut C t = b1 + b2 I t + b3 C t ?1 + u t请回答以下问题:①估计以上两模型;②估计边际消费倾向(MPC) 3.接上题,如果考虑如下模型: ln C t = a1 + a 2 ln I t + u t ln C t = b1 + b2 ln I t + b3 ln C t ?1 + ut 请回答以下问题: ①估计以上两模型; ②估计个人消费支出对个人可支配收入的弹性系 数。74 实验八【实验目的】虚拟解释变量模型在计量经济学建模中会经常遇到解释变量是离散型变量而非连续型变量, 就需要建立虚 拟解释变量模型。通过本实验要求:在理解虚拟解释变量设置规则、引入方式和相关理论知 识的基础上,掌握在 Eviews 软件中建立虚拟变量数据序列的方法,掌握与建立虚拟解释变 量模型相关的 Eviews 操作;能够运用虚拟解释变量模型分析和解决实际经济问题。 【实验内容】 一、建立我国国民总收入与居民储蓄存款模型(2-8-1.wf1) 二、建立美国人个可支配收入与储蓄模型(2-8-2.wf1) 三、建立我国城镇居民消费支出与可支配收入模型(2-8-3.wf1) 【实验步骤】 一、建立我国国民总收入与居民储蓄存款模型(2-8-1.wf1) 问题概述:改革开放以来,随着经济的发展,中国城乡居民的收入快速增长,同时城乡 居民的储蓄存款也迅速增长。 经济学界的一种观点认为, 20 世纪 90 年代以后由于经济体制、 住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。分析改革开 放以来()中国居民的储蓄存款(以城乡居民人民币储蓄存款年底余额(Y,亿 元)代表)与收入(以国民总收入(GNI,亿元)代表)的关系是否已发生明显改变。 1.时序图分析 命令方式执行 Plot Y GNI,从时序图(图 2-8-1)看出两序列相同的变化趋势,但看不 出储蓄行为明显的改变趋势,需作进一步的分析。图 2-8-1 时序图75 2.储蓄增量的图分析 取储蓄的增量(YY),并作时序图,对明显的阶段特征进行分析。与 YY 变化相似,YY 与 GNI 的散点相关图(图 2-8-2)。结果表明,1996 年和 2000 年有两个明显的转折点。图 2-8-2 YY 与 GNI 的散点图 3.构造虚拟变量 依据引入虚拟变量的原则,两个转折点(三种状态)需引入两个虚拟变量。如果引入三 个虚拟变量,则落入“虚拟变量陷阱”。?1 D1 = ? ?01996年以后 1996年及以前?1 D2 = ? ?02000年以后 2000年及以前方式 1:手动方式输入虚拟变量数据 在命令窗口执行 DATA D1 D2,再用手动方式输入 D1 和 D2 两个序列的值。方式 2:使用 SMPL 和赋值语句直接定义数据 在命令窗口执行 DATA D1 smpl
d2=1 操作步骤如图 2-8-3 所示。76D2,然后对不同时间段的虚拟变量进行赋值。‘定义样本区间从 1978 至 1996 年 ‘1978 至 1996 年间的第一个虚拟变量取 0 值 图 2-8-3 SMPL 和赋值语句定义数据 4.估计虚拟变量模型,进行分段线性回归 如图 2-8-4 命令方式执行 LS YY C 回归结果如图 2-8-5 所示。 GNI (GNI-66850.5)*D1 (GNI-88254.0)*D2,图 2-8-4 命令输入图 2-8-5 回归结果 依据图 2-8-5,回归方程为:YYt = -830.4045 + 0.1445GNI t - 0.2914 ( GNI t -66850.50 ) D1t + 0.5602 ( GNIt -88254.00 ) D2t(-4.8234) (25.1700) (-10.7192)R 2 = 0.9895 R 2 = 0.9880(13.9581)F = 659.5450 DW = 1.677777 再由 t 统计量及伴随概率可知, 虚拟变量在模型中具有显著性, 引入两个虚拟变量是正 确的,即 1996 和 2000 年,中国居民储蓄行为确实发生了质了变化。居民人民币储蓄存款年 增加额的回归模型分段表示为:? YYt = -830.4045 + 0.1445GNI t +ε1t ? YYt = ? YYt = - 0.1469GNI t +ε 2t ? ? YYt =-
+ 0.4133GNI t +ε 3t二、建立美国个人可支配收入与储蓄模型(2-8-2.wf1)t ≤ &t ≤ 2000 t & 2000问题概述:研究
年间美国个人可支配收入(income,亿美元)与个人储蓄 (saving,亿美元)的关系。在 1982 年,美国遭受到和平时期最严重的经济衰退,当年的 城市失业率高达 9.7%,是自 1948 年以来失业率最高的一年。这种事件会使收入和储蓄之间 的关系发生重大变化,现分析这种情况是否会发生。 思考:实际上是对模型稳定性的检验(检验 1982 是否为明显的转折点),可参考实验 五的经典案例,除了用 CHOW 检验,也可用虚拟变量模型进行判断。 1.构造虚拟变量?1 D1 = ? ?01982年及以后 ,参考本实验内容一输入虚拟变量数据。 1982年以前2.建立虚拟变量模型 经试算,截距项不显著,在命令窗口输入 LS saving d1 income income*d1,结果如图 2-8-6 所示。发现 d1 和 income income*d1 的系数都是显著的,因此 1982 年的事件对美 国个人可支配收入与个人储蓄的关系有显著的影响,简单回归模型不具有稳定性。图 2-8-6 虚拟解释变量模型回归结果78 由图 2-8-6 可知,虚拟变量模型为:savingt = 154.054 + 0.0810incomet ? 0.0661income * D1 + ut (6.0559) ( 17.45) ( ? 8.26)也可以做分段线性回归,在命令窗口输入 LS saving income (income-2374.3)*d1,执 行后也会发现(income-2374.3)*d1 的系数显著不为零(图 2-8-7),可以得到同样的结论, 1982 年的事件对美国个人可支配收入与个人储蓄的关系有显著的影响,原模型不具有稳定 性。图 2-8-7 估计所得模型与 2-8-6 所得模型是一致的。图 2-8-7 分段回归结果 三、建立我国城镇居民消费支出与可支配收入模型(2-8-3.wf1) 表 2-8-1 我国城镇居民人均消费支出和可支配收入统计资料消费 Y 7.6 3.24 0.88 3.95 1998 年 收入 X 6.75 7.26 0.59 62.1 D1 0 0 0 0 0 0 0 0 消费 Y 3.1 4.46 7.09 2.42 1999 年 收入 X 7.8 3.78 4.96 83.79 D1 1 1 1 1 1 1 1 1困难户 最低收入户 低收入户 中等偏下户 中等收入户 中等偏上户 高收入户 最高收入户问题描述:表 2-8-1 是我国城镇居民
年全年人均消费支出和可支配收入的 统计资料(单位:元/年)。分析能否将两年的数据组成混合数据(16 个观测)估计我国城 镇居民消费函数。 思路:用虚拟变量模型判断消费函数在两个年份是否存在差异。 1.建立非日期型的工作文件,引入虚拟变量79 在 工作文件 创 建对 话框 选择 Unstructured/Undated 工作文件 类 型 。 引 入 虚拟变量?1 D1 = ? ?01999年 ,虚拟变量数据如表 2-8-1 所示。 1998年2.合并两年的数据,建立虚拟变量模型,进行回归系数检验 在命令窗口输入 LS y c x d1 x*d1,执行后,从图 2-8-8 回归结果看,d1 和 x*d1 两 个回归系数均不显著,故认为
年我国城镇居民消费函数没有显著差异。因此可 以将两年的样本数据合并成一个样本,对城镇居民的消费函数进行估计。图 2-8-8 回归结果 由以上分析可知,不需要引入虚拟变量,命令方式执行 LS y c x,可得回归模型:Yi = 955.6621 + 0.6195 X i (17.09) (69.52) R 2 = 0.9971 DW=1.5063思考:可以将表 2-8-1 看作一个面板数据,可否利用 Eviews 面板数据分析功能进行模 型分析(参考实验十二相关内容)?【练习与作业】 1.表 2-8-2 给出了
年服装季度销售额的原始数据(单位:百万元)。 表 2-8-2
年服装季度销售额的原始数据 年份 95 1996 现考虑如下模型: 1 季度 02 5458 2 季度 12 6359 3 季度 72 6501 4 季度 87 860780 ? = b + b D 2t + b D3t + b D 4t + u S 1 2 3 4 t 其中, D2t =1:第二季度; D3t =1:第三季度; D4t =1:第四季度;S 为销售额。 请回答以下问题: (1)引入虚拟变量,估计此模型; (2)解释 b1, b2, b3, b4; (2)如何消除数据的季节性? 2.依据
年美国制造业利润(y)和销售额(x)的季度数据 (数据见 LX8-2.wf1) 。 假定利润不仅与销售额有关,而且和季度因素有关。要求: ① 如果认为季度影响使利润平均值发生变异,应当如何引入虚拟变量? ② 如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量? ③ 如果认为上述两种情况都存在,又应当如何引入虚拟变量? ④对上述三种情况分别估计利润模型,进行对比分析。 3.可以用方差分析方法分析工人不同班次对劳动效率(e)的影响,其样本数据为: 表 2-8-3 工人不同班次的劳动效率 早班 34 37 35 33 33 35 36 中班 49 47 51 48 50 51 51 晚班 39 40 42 39 41 42 40试采用虚拟解释变量回归的方法对上述数据进行方差分析。81 实验九模型设定误差诊断与检验【实验目的】 模型设定是既具科学性又有艺术性的问题, 是建立计量经济模型的重要环节。 通过本实 验,要求理解模型设定误差检验的基本原理,掌握计量经济模型错误函数形式、遗漏和误选 等问题的检验方法,熟练使用 Eviews 中有关模型设定检验的功能。结合前面所做实验中的 案例,尝试制定检验模型设定是否存在偏误的分析方案,体会模型设定检验的重要性。 【实验内容】 一、影响中国进出口量的主要因素分析_错误函数形式检验(2-10-1.wf1) 二、中国国债发行总量影响因素分析_遗漏和误选变量检验(2-10-2.wf1) 三、规模报酬问题分析_任意约束条件检验(2-10-3.wf1) 【实验步骤】 一、影响中国进出口量的主要因素分析_错误函数形式检验(2-10-1.wf1) 前面实验中, 问题研究中都设定变量和函数形式是正确地描述被解释变量与解释变量之 间的真实关系,但是在实际的建模实践中,对模型的设定不一定能够完全满足这样的要求, 从而会使模型出现设定误差。图 2-10-1 模型(2-10-1)回归结果 问题概述:分析我国进口量的主要因素,设定模型 IM t = β0 + β1GDPt + ut(2 ? 10 ? 1) ,其中: IM 是进口总额, GDP 是国内生产总值。有人认为,货物与服务的进口量还会受到 一国货物与服务的进口价格、 汇率等其他影响因素, 不能仅用 GDP 来解释商品进口的变化。82 因此,设定的回归模型应该为: IM t = β1 + β 2 ( f GDP) + β3 g (Exchange) + ut (2 ? 10 ? 2) ,其 中,GDP 是国内生产总值, f (GDP ) 为 GDP 的线性函数, Exchange 为美元兑换人民币的 汇率, g ( Exchange) 为 Exchange 的线性函数。 试分析模型(2-10-1)是否有变量设定误差,进行变量设定误差检验。 1.DW 检验的初步判断 依模型(2-10-1)进行回归,回归结果如图 2-10-1 所示。图 2-10-1 显示的 DW 检验值 为 0.6398,经判断存在正自相关,初步说明存在模型设定误差。 2.拉姆齐(RESET)检验 拉姆齐(J. B. Ramsey)的回归设定误差检验法(RESET 法, Regression Specification) ) Error Test) 。RESET 检验法的思路是在要检验的回归方程中加进 Y 2 , Y 3 等项作为解释变量,然后看结果是否有显著改善。如有,则可判断原方程存在误设定问题。图 2-10-2 模型(2-10-1)拉姆齐检验结果 按照模型 (2-10-1) 进行回归, 在方程回归结果窗口中, 单击 View 功能键, 选择 Stability ) Tests/ Ramsey RESET test,在弹出的对话框中填入拟合项(如填 1,表示将 Y 2 加入,填 2, ) ) 表示将 Y 2 、 Y3 加入) ,确定后可以得到检验结果如图 2-10-2 所示。83 根据图 2-10-2 中 F 统计量和对数似然值的伴随概率来看,拒绝无误设定的假设。新加 入的 FITTED^2 项改善了方程的拟合状况, 进一步说明了原方程存在误设定。 需要说明的是, 拉姆齐 RESET 检验仅能检验误设定的存在,而不能告诉我们到底是哪一类的误设定。因此, 可以通过观察和试算的方法确定回归的函数形式。 3.选择合适的函数形式图 2-10-3 模型(2-10-3)回归结果图 2-10-4 模型(2-10-3)拉姆齐检验结果 经过多次试算,当模型设定为:IM t = β 0 + β1GDP t ?1 + β 2 GDPt 2 + β 3 Exchanget 2 + β 4 Echanget 3 + ut84(2-10-3) 该模型的显著性和拟合效果都很好,回归结果如图 2-10-3 所示。 同时, 对模型 (2-10-3) 进行拉姆齐的 RESET 检验, 结果如图 2-10-4 所示。 由图 2-10-4 中的 F 统计量和对数似然值的伴随概率可知,模型不存在误设定问题。 二、中国国债发行总量影响因素分析_遗漏和误选变量检验(2-10-2.wf1) 问题概述:有中国国债发行总量( DEBTt ,亿元)模型如下:EDBTt = β 0 + β 1GDPt + β 2 DEFt + β 3 REPAYt + u t(2 ? 10 ? 4)其中 GDP 表示年国内生产总值(百亿元) , DEF 表示年财政赤字额(亿元) , REPAY 表示年还本付息额(亿元) ,试对模型(2-10-4)进行诊断和检验。 1.回归分析 依据模型(2-10-4)回归分析结果如图 2-10-5 所示。图 2-10-5 模型(2-10-4)的回归结果 2.误选变量检验 要考察变量 GDP 是否是误选变量,可用似然比(LR)统计量检验变量 GDPt 对应的回归 系数 β 1 等于零是否成立,若检验结果是否定的,则认为 GDP 不是误选变量。在图 2-10-5 所 在的窗口中点击 Views 键,选 Coefficient te}

我要回帖

更多关于 计量经济学第二次作业 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信