(i)在计算机习题C7.5所估计的模型中, 应用方程(9.3)中的RESET。此方程中有函数形式误设的证据吗
?
(ii)计算一个异方差-稳健形式的RESET。你在第(i)部分的结论改变了吗?
?
(ii)计算一个异方差-稳健形式的RESET。你在第(i)部分的结论改变了吗?
利用DISCRIM.RAW中的数据回答本题。(也可参见第3章计算机习题c 3.8.)
(i)利用OLS估计模型
以常用形式报告结果。在5%的显著性水平上,相对一个双侧对立假设,β统计显著异于零吗?在1%的显著性水平上呢?
(ii)log(income)和prppov的相关系数是多少?每个变量都是统计显著的吗?报告双侧P值。
(iii)在第(i)部分的回归中增加变量log(hseval)。解释其系数并报告H0:βlog(hseval)=0的双侧p值。
(iv) 在第(ii) 部分的回归中, log(income) 和prppov的个别统计显著性有何变化?这些变量联合显著吗?(计算一个p值。)你如何解释你的答案?
(v)给定前面的回归结果,在确定一个邮区的种族构成是否影响当地快餐价格时,你会报告哪一个结果才最为可靠?
利用401KSUBS.RAW中size=1的一个子集; 这就将分析仅限于单身者。(见计算机习题第4章第8题。)
(i)样本中最年轻的人多少岁?这个年龄的有多少人?
(ii)在模型中,β2的字面解释是什么?它本身有什么意义吗?
(iii)估计第(ii)部分中的模型,并以标准形式报告结果。你关心age的系数为负吗?请解释。
(iv)由于样本中最年轻者为25岁,若认为给定收入水平下,25岁时净总金融资产的平均量最低,这有意义吗?记得age对nettfa的偏效应为β2+2β3age,所以在25岁时的偏效应为β2+2β2(25)=β2+50β3称之为θ2。求并得到检验H0:θ2=0的双侧P值。你应该得到θ2很小且在统计上也不显著的结论。
在第4章习题11中, 利用CEOS AL 2.RAW中的数据估计模型
所得到的R2为R2=0.353(n=177) 。若添加ceo ten2和cem ten2后, R2=0.375。此模型中是否有函数形式误设的证据?
本题利用LOANAPP.RAW中的数据。
(i)估计计算机习题C7.8第(iii) 部分中的方程, 计算其异方差-稳健的标准误。将的95%的置信区间与非稳健的置信区间相比较。
(ii)由第(i)部分的回归计算拟合值。其中有没有哪个估计值小于0?有没有哪个估计值大于1?而这些情况对加权最小二乘估计的应用意味着什么?
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
间和工作时间之间的取舍,并考察影响睡眠的其他因素:
其中,sleep和totwrk都以分钟/周为单位,而educ和age则以年为单位。(也可参见计算机习题C2.3。)
(i)如果成年人为工作而放弃睡眠,β1的符号是什么?
(ii)你认为β2和β3的符号应该是什么?
(iii)利用SLEEP75.RAW中的数据, 估计出来的方程是
如果有人一周多工作5个小时,预计sleep会减少多少分钟?这是一个很大的舍弃吗?
(iv)讨论educ的估计系数的符号和大小。
(v)你能说totwrk,educ和age解释了sleep的大部分变异吗?还有什么其他因素可能影响花在睡眠上的时间?它们与totwrk可能相关吗?
)序列相关。
(ii)如果你发现有序列相关的证据,用科克伦-奥卡特方法重新估计这个方程,并将所得结果与以前的结果进行比较。
(i)解释vote A 88的系数并讨论其统计显著性。
(ii)添加vote A 88对其他系数具有很大影响吗?
列。
(i)用OLS估计模型并检验误差中的AR(1)序列相关。假定回归元是严格外生的。误差中有正或负的序列相关吗?
(ii)用迭代的普莱斯一温斯顿检验方法估计(i)中的模型。gmwage的系数与用OLS方法相比有什么区别?
(iii)在第(ii)部分的方程中增加gmwage的1~12阶滞后项并用迭代的普莱斯-温斯顿方法估计该模型,检验这12个滞后项是否为联合显著的。
(iv)我们回到在第(i)部分估计出的静态模型,用6阶滞后项计算尼威-韦斯特标准误。用尼威一韦斯特方法计算的标准误和普通的OLS标准误相比有什么区别?
(v)在静态模型中增加gwage的1~12阶滞后项,并用6阶滞后项的尼威-韦斯特检验方法检查12阶滞后项的联合显著性。你的结论和第(ii)部分相比有区别吗?
讨论对的解释及其统计显著性。
利用CHARITY.RAW中的数据回答如下问题
(i)用普通最小二乘法估计如下模型:
按照通常的方式报告估计方程,包括样本容量和R²。其R²与不使用giftlast和propresp的简单回归所得到的R²相比如何?
(ii)解释mailsyear的系数,它比对应的简单回归系数更大还是更小?
(iii)解释propresp的系数,千万要注意propresp的度量单位。
(iv)现在,在这个方程中增加变量avggif。这将对mailsyear的估计效应造成什么样的影响?
(v)在第(iv)部分的方程中,giftlast的系数有何变化?你认为这是怎么回事?