今天有幸见到了我一直喜欢并尊敬的charles manski教授,听他讲了一个半小时他的新论文<idendification of treatment response with social interactions>, 很受启发。觉得应该写一篇小博客来介绍他的工作。现在每个人都在讨论structural model 和 reduced form,有幸在这个讨论的高潮连着学到heckman和manski 两位顶尖学者的评论和工作,受益良多。
让我用他2003年书中第七章的一个故事开头吧。
有两个高中,“好高中”的学生成绩好,“差高中”的学生成绩差,那么是什么造成这种差异呢?有三种可能的解释。
第一、好高中的学生比差高中的学生聪明,或者好高中的学生家里条件都比较好,从小受的教育就好,当这些好学生聚在一起,成绩自然就比差学生扎堆的学校成绩好。
第二、两个学校的学生质量都一样,但好学校的老师啊教学设备啊都好,所以学生成绩好。
第三、两个学校的学生整体质量差不多,硬件设备也差不多,但是“学风”不同。好学校的学生都和学习好的同学“比超赶帮”, 而差学校的学生都喜欢和成绩不好的同学浪迹街头,所以整体成绩就差。
这三种原因的含义很明显不同,如果是第二种原因,那提升差学校的教育就很容易,换老师和硬件就行了;如果是第三种原因,那就可以帮助一部分差学校的学生,让他们成绩提升,然后带动“学习气氛”;但如果是第一种原因,那外部的改革就很难有效果了。
问题在于,当你只观测到好学校的成绩比差学校的高时,你怎么知道哪一个才是真正的原因呢?也许三个因素都有,同时起作用,如何能分离开呢?
正确的答案当然是你没办法分离开,聚在一起的孩子肯定是要互相作用的,在这种情况下应该怎么进行研究呢?
第一种最简单,是estimation层面的,就是目前关于cluster error一脉的研究。比如说,我做一个随机实验,改进很多差学校的硬件,然后观测到这些接收到好硬件的学校成绩改善了,我就说原来的硬件不行是成绩不好的原因之一。但是每个学校内学生的成绩是互相关联的,比如“学风”不同,所以在估计时要考虑这种关联,这是cluser error的含义。这个主要是estimation层面的技术,和identification无关。
第二种是structural model的方式:你如果认为学生之间的互动会影响估计结果,那么我就打破沙锅问到底 ---学生之间到底是怎么互动的呢?然后直接把这种互动方式模型化,估计一个社会互动的模型来解决问题。
在这种模型里,要同时考虑上面提到的三种原因,试图把三种原因分离开,理论上当然可以做到,但要想用现有的数据真正分离,需要非常强的假设,这些假设在现实中几乎不可能满足。manski在03年的书中用了一个线性模型的例子做示范,来突出要分开三种效应所要满足的条件,非常有趣,非常精彩。
第三种是manski的方式:先不考虑estimation的技术,也不管structural model中各种假设出来的互动方式,就问一件事:我知道社会互动存在,可以是任意的互动方式,这时候我究竟可能identify什么东西?
这是他这20年一直倡导的“partial identification”的理念。当然,如果互动方式真的是任意的变幻莫测的,那肯定什么也做不了;但也不用像structural model一样非得假设具体的互动模式,或者像随即试验者一样模糊不清,反正一路cluster过去就是了 (顺便说一嘴,一旦考虑cluster了,那你的麻烦就大了。我折腾了一个月,也没搞清楚目前哪种方法比较靠谱)。如果只对互动方式做一些比较让人信服的,很弱的假设,我们仍然有可能partially identify treatment effects.
比如,我不知道一个村里的人平时怎么互动的,谁和谁经常在一起,但我假设如果给这村子越多的人打预防针,那没打的人得传染病的概率就越小,这种“正反馈”的互动假设就很弱,但很可信。在这样的假设下,我们还是可以把打预防针的效果推论到一个可信的区间里。
当然,对熟悉manski教授工作的人而言,上面都是早已熟知的知识,但这篇新论文的贡献在于他发展了一套数学语言来正式描述这种社会互动,把个人层面的简单的treatment status推广到了互相关联的treatment vectors in reference groups, 我觉得这个工作为未来的研究搭建了一个很好的平台,是很基础的贡献。
另外这篇论文对发展经济学中大行其道的随机实验浪潮也是个很好的提醒,在一些不是很夸张的条件下,随机实验者们便可能一无所获,他们估计出的结果可能根本不是他们本来想识别的东西。
(最近两期的journal of economic perspectives都很精彩,我认为最新这期发展经济学的专稿比上一期的混战更有内容,而上一期的混战中,einav和levin那篇报告empirical io进展的文章最好,如果我在两年前读到这篇文章,我很有可能就搞io去了)
======
最后是一点个人感言。
manski是应该得诺贝尔奖的,但我觉得他可能等不到那一天了。虽然现在partial identification的讨论多了起来,但离真正成规模的应用,还很远。我个人认为这是基础性的突破,是最可信的经验研究,比目前非得搞出一个什么具体数来的方法好多了。但是现实世界的应用里,没什么人关心“区间”,就要那个具体数。这么些年,连“置信区间”这种“点估计”都没有人在相互引用结果时提及,“区间识别”的理念,超越时代有点儿远了。
今天manski也多次提及目前的争议,并引用了他去年故去的好友,也是我非常尊敬的计量经济学家,arthur goldberger的一些洞见。如果你读过goldberger的经典计量教科书,你就可以预期那些真的是“洞见”,直白,没有一点装。我晚上通读了那篇goldberger教授的访谈(http://korora.econ.yale.edu/et/interview/goldberger.pdf),像读他的教科书一样,几次大笑起来。
他说:“有篇顶尖学报发表了一篇宏观经济学论文,我去数这个论文中所有的图和数字,好家伙,那总数比他的数据样本都大。”
他又说:“我讨厌那些学报发表论文时,汇报的数字都精确到小数点之后六位数,看着好像很科学很精确,其实物理学家也不过到小数点之后两位数。我又看了一下那些估计值是小数点之后六位数的论文所用的数据,那些数据本身也才到小数点之后两位。”
也借此悼念arthure goldberger教授,和另一位常让我笑出来的zvi griliches教授,还有前些日子刚过世的arnold zellner教授。很可惜,他们本都应该得诺贝尔奖的。