在例4.4中,我们针对一个大学样本,估计了一个联系校园犯罪与学生注册人数的模型。由于很多学校在
在例7.12中,我们估计了一个线性概率模型以说明一个年轻人在1986年是否被拘捕:
(i)用OLS估计此模型, 并验证其全部估计值都严格地介于0和1之间。最大和最小的估计值各是多少?
(ii)像8.5节所讨论的那样,用加权最小二乘法估计这个方程。
(iii)用WLS估计值决定avgsen和tottie在5%的显著性水平上是否联合显著。
年和1995年的入学申请数据。
(i)你会怎样把度量体育成绩的变量放入方程中?有什么样的时期安排问题?
(ii)你想在方程中控制哪些其他因素?
(iii)试写出一个方程,用以估计体育成绩对申请人数百分数变化的影响。你如何估计这个方程呢?为什么选用这一方法?
使用PHILLIPS.RAW中的数据。
(i)教材例11.5中,我们估计了如下形式的附加预期的菲利普斯曲线:
其中。用OLS估计该方程时,我们假定供给冲击et与unemt不相关。如果这是错误的,关于βt的OLS估计量可做什么解释?
(ii)假定et在给定所有过去信息的条件下是不可预期的:
解释为什么这使得unemt-1成为unemt的一个好的Ⅳ候选者。
(iii)将unemt对unemt-1做回归。unemt与unemt-1是否显著相关?
(iv)用Ⅳ估计附加预期的菲利普斯曲线。以通常形式报告结果,并将之与教材例11.5中的OLS估计值进行比较。
A.估计未来所需样本的容量
B.计算相关系数与判定系数
C.以给定的因变量的值估计自变量的值
D.以给定的自变量的值估计因变量的值
本题利用401KSUBS.RAW中的数据。
(i) 计算样本中nettfa的平均值、标准差、最小值和最大值。
(ii) 检验假设平均nettfa不会因为401(k) 资格状况而有所不同, 使用双侧对立假设。估计差异的美元数量是多少?
(iii)根据计算机习题C7.9的第(ii)部分,e401k在一个简单回归模型中显然不是外生的,起码它随着收入和年龄而变化。以收入、年龄和e40lk作为解释变量估计nettfa的一个多元线性回归模型。收入和年龄应该以二次函数形式出现。现在,估计401(k)资格的美元效应是多少?
(iv) 在第(iii) 部分估计的模型中, 增加交互项e401k·(age-41) 和e401k·(age-41)2 。注意样本中的平均年龄约为41岁,所以在新模型中,e401k的系数是401(k)资格在平均年龄处的估计效应。哪个交互项显著?
(v)比较第(iii)和(iv)部分的估计值,401(k)资格在41岁处的估计效应差别大吗?请解释。
(vi) 现在, 从模型中去掉交互项, 但定义5个家庭规模虚拟变量:fsize l, j size2,f size 3, f size 4和f size 5。对有5个或5个以上成员的家庭, fsize 5等于1。在第(iii) 部分估计的模型中, 增加家庭规模虚拟变量, 记得选择一个基组。这些家庭虚拟变量在1%的显著性水平上显著吗?
(vii) 现在, 针对模型
在容许截距不同的情况下, 做5个家庭规模类别的邹至庄检验。约束残差平方和SSR, 从第(vi) 部分得到,因为那里回归假定了相同斜率。无约束残差平方和SSRUR=SSR1+SSR2 +…+SSR5 , 其中SSRf是从仅用家庭规模f估计的方程中得到的残差平方和。你应该明白,无约束模型中有30个参数(5个截距和25个斜率),而约束模型中有10个参数(5个截距和5个斜率)。因此,带检验的约束个数是q=20,而且无约束模型的df为9275-30=9245。
考虑例4.3中的估计方程,这个方程可以被用来研究缺课对大学平均成绩的影响:
(i)利用标准正态近似,求出在置信水平为95%时的置信区间。
(ii)相对于双侧对立假设,你能在5%的显著性水平上拒绝假设H0:=0.4吗?
(iii)相对于双侧对立假设,你能在5%的显著性水平上拒绝假设H0:=1吗?
有计划上大学的中学高年级学生。
(Ⅰ) 假设你有权进行一项控制实验。请说明为了估计hours对sal的引致效应, 你将如何构建实验。
(Ⅱ) 考虑一个更加实际的情形, 即由学生选择在备考课程上花多少时间, 而你只能随机地从总体中抽出sat和hours的样本。将总体模型写作如下形式:
其中,与通常带截距的模型一样, 我们可以假设E(u)=0。列举出至少两个u中包含的因素。这些因素与hours可能呈正相关还是负相关?
(III)在(Ⅱ)的方程中,如果备考课程有效,那么β1的符号应该是什么?
(Ⅳ)在(Ⅱ)的方程中,β0该如何解释?
A.置信区间为(115.8,124.2)
B.样本均值的标准误差为2.143
C.置信区间的估计误差为4.2
D.置信区间的半长为8.4