工具变量有一个不显著行不行

本文已影响2.47W人 

不行。

工具变量有一个不显著行不行1

工具变量有一个不显著不行。

通常一个变量不显著,并不能表明该变量对结果变量没有影响。不显著只意味着数据没有提供存在影响的证据,但这并不意味着这种效应不存在。

工具变量有一个不显著行不行
  

工具变量也称为仪器变量或辅助变量,是经济学、计量经济学、流行病学和相关学科中无法实现可控实验的'时候,用于估计模型因果关系的方法。在回归模型中,当解释变量与误差项存在相关性(内生性问题),使用工具变量法能够得到一致的估计量。

工具变量有一个不显著行不行2

工具变量有一个不显著行。好的工具变量一定是先在逻辑上行得通,然后通过检验。而且题主说的检验不知道是什么检验,单个工具变量需要关注外生性、相关性两个条件,多个工具变量还需要关注过度识别等问题。

因此,题主遇到的“加入工具变量后不显著”的问题,可能有两个原因:

不加入工具变量时,其他因素对被解释变量的影响被错误的认为是核心解释变量的显著作用,这种情况下需要逻辑上先判断哪些因素会影响核心解释变量,是否能控制都尽量控制住了,如果没有,就有必要使用其他方法进行因果识别,例如工具变量法、倾向匹配法,如果是面板数据也要考虑更换方法

工具变量有一个不显著行不行 第2张
  

加入工具变量变得不显著,有两种情况,1)当工具变量选取的合适的时候,核心解释变量对被解释变量的因果关系被正确识别,可能这个关系就是不显著的,工具边框堵上了未观测因素的“后门”;2)当工具变量选取的.不合适时,加入错误的工具边框可能会扭曲因果关系,参考前文说的xu yiqing老师的文章。

当然,不能排除数据本身的问题,例如数据的强异质性,例如数据的极端值影响,上述分析的前提是在数据清洗到位、可以反映真实情况的基础上的。

工具变量有一个不显著行不行3

计量经济学中,线性回归模型的本意是给定x值,然后预测(或估计)y的条件均值。在给定的x值下,y值可能忽高忽低(即y是随机变量),其变化程度也可大可小(即y有方差),但其条件均值是可以通过回归方法来估计的。

至于y的条件方差,在只有一个固定的x值下是无法估计的(在重复测量样本下也许可以做到,因为这时有多个固定相同的x值),所以只好简单地假设对于任何给定的x,y的条件方差都是一样的(即同方差假设),此时才可以通过多个样本点来估计一个相同的方差,然后进行各种t检验、f检验。

通俗一点说,回归的思想就是先抓住x,然后观察y将如何变化。比如说居民收入r与消费c,先抓住1000元收入水平的消费群体

然后看他们将如何消费,c|1000是条件随机变量(当然,实际数据中1000元水平的观测可能只有一个);

然后再抓住1500元收入水平的群体,再看他们将如何消费,依次类推。一般来说,随着收入增长,消费的条件均值将同步增长,此时回归关系成立。

但是,令我们苦恼的是,实际中很有可能是“无法抓住x”的,因为x在变,y也在变,然后y的'变化又影响到了x,所以我们观测到的结果,很有可能是x与y相互影响的结果;

工具变量有一个不显著行不行 第3张
  

通俗一点说,就是x已经与y纠缠到了一起,你哪里还能辨清哪是x,哪是y?比如说收入与消费,可以说赚得多,花得也多,但钱花完了,又得想办法去多赚点,这时收入与消费是相互影响的,你是无法"按住x"的。

因为等你"按住x"了,去观察y,y的变动回过头来又造成了x的变化,你转身一看,坏了,x已经不是原来那个x了,它已经变了!这个相互影响的过程,你是观测不到的,你观测到的只是结果。

所以在你观测到实际数据的时候,x已经不是本来的x,x中混杂了y的信息。既然x已经不是本来意义上的x,你又如何去估计它对Y的真实影响?这就是我们通常所说的联立性偏误(simultaneity bias),即x与y是同时变动的。

这种情况下,x与回归模型的误差项表现为相关,违背了经典OLS(ordinary least square,普通最小二乘法)的假设。此时,你应该可以知道,你很难估计x对y的真实影响,即在经典回归假设下,估计出的回归系数是有偏的。这是造成内生性 Endogeneity 的情况之一。

还有可能是x在变,其他影响y的因素也在变(因为除了x影响y外,也有其他因素在影响y),但这些因素你没有纳入模型的解释变量中,此时x与回归模型的误差项也表现为相关(因为遗漏因素的影响归入了误差项)。此时,你如何能辨清y的变化,有多少是x造成的,又有多少是“其他因素”造成的?于是估计再次陷入僵局。

这种情况的产生,需要两个条件:一是x变化,其他因素也同时变化(x与其他因素相关),二是其他因素要能影响y(即其他因素要与y相关),这是造成内生性的情况之二。

相关内容

热门精选