
从统计推断到因果推断
任何一门理论要成为科学,都离不开构造可验证或可证伪的假设,需要实证研究,而如何识别出让人信服的因果关系,历来是实证研究的难点。随着随机化实验和潜在结果框架的引入,整个实证经济学出现了“可信性革命”,尽管有些计量经济学家不一定完全认同这一说法,但是“以实验设计为基础的计量经济学”确实提供了很多“基本有用的经验知识”,从而使经济学实证研究正在经历一场研究范式的转变――从统计推断向因果推断转变。这种转变,体现到计量经济学上,就是从控制变量到控制实验设计,因为变量控制非常难以克服遗漏变量带来的内生性、样本选择偏差等问题;这种转变体现在近二十多年来的各类学术或政策报告中,“实验学派”计量经济学方法影响越来越大,研究范式的“技术进步”也不断在其他学科中“技术扩散”,出现了所谓的“政策评估计量经济学”,并被广泛应用于社会科学众多领域,包括经济学、社会学、政治学、教育学等。这些研究方法逐渐被政府所接受,例如2002年美国国会通过教育科学改革法案规定,任何由联邦政府资助的教育学研究必须采用严格的试验或准试验研究方法。 本届三位诺奖得主在众多发展中国家的扶贫政策项目评估上贡献显著,2003年在MIT共同创建了AbdulLatifJameel贫困行动实验室(J-PAL),目前该实验室在非洲、拉丁美洲、南亚、东南亚以及北美和欧洲都设有办事处,开展了大量有关教育、卫生、小额贷款、政府治理等政策效果评估,他们的研究表明,这些相对微观细小的问题通常可以通过在受影响最大的人群中进行精心设计的实验来最好地回答,逐步建立起基于科学实验基础上的政策效果评估,为我们观察世界提供了很多富有启发的洞见,为政府完善政策提供坚实的实证研究支撑。例如在肯尼亚发现蛔虫药能避免孩子们相互传染疾病,并提高集体出勤率,免费的驱虫治疗惠及世界上6000万孩子,还有大量针对改善教育成果或儿童健康的最有效干预措施的研究,这些研究方法为发展经济学注入新的活力,一个小小的政策助推就能打破很多现实困境。需要指出的是,众多随机受控试验都需要大量的人力、资金、技术投入,要实现试验的目标并非易事,需要当地政府、科研院所的通力合作。
新实证范式的分析思路
如果能像医学那样进行随机试验,识别因果关系就不是一个难题,现实中大量社会科学研究往往难以直接进行随机试验,得不到真实实验数据,那就需要需按照经过良好控制的对照组,或说是准试验(quasi-experiment),然后再对产出指标进行比较分析。 各类实验方法的基本思路是,在政策评估过程中寻找合适的反事实(counterfactual)框架的控制组。政策实施对象的全体组成“实验组”或“处理组”(受到政策干预的组),非政策实施对象的全体是“控制组”或者“对照组”(未受到政策干预的组)。构建反事实框架的关键:构造一个与政策实施对象(实验组)统计意义上类似的对照组,进而通过实验组和对照组之间的对比来估算政策实施产生的真实影响,即估计出相对准确的政策效应(或“处理效应”,treatment effect)。政策效应评估就是估算各类政策或者项目对某些团体(或者政府)所关心的产出指标所产生的因果(结果)影响进行的研究。
举一个通俗的例子,假定我们要评估的是大学教育对收入的贡献度,我们可以造一个时空穿梭机器,首先让某人在现实中读大学,然后记录他工作时的收入1,接着我们用时空穿梭机将他再送回去,这次不让他上大学,记录他另一个平行世界中的收入2,收入2与收入1的差额则是此人上大学的教育回报。在政策评估的方法论中,这个例子中的不上大学就是上大学的反事实情景,也就是说,一旦其接受政策干预(即“上大学”),则表现是收入1,如果没有接受政策干预,结果就是收入2。上述例子在任何学科领域都是无法实现的,因为历史都是单线程往前发展的。在现实世界中,一个人要么受到政策的干预,要么没有受到干预;很难做到让一个上过大学的人再让他辍学并考察其收入变化,或是让高中辍学的人实现上大学并考察其收入变化。
为了得到政策效应评估,首先要解决两大基本问题:一是寻找与参与者相同或相类似的反事实样本,这一过程也称为配比(matching)。如何找到一组可信的反事实样本,是政策效应评估要解决的第一个基本问题。也就是要构造出一个相对完美的平行世界来获得一个政策实施后的反事实对照组。二是个体是否参与某一项目或接受干预往往不是随机的,而是自我选择(Self-selection)的结果,因此,造成了选择性偏差(SelectionBias)或内生性问题,需要进行纠正。如何消除参与项目的自选择偏差,是政策效应评估要解决的第二个基本问题。如果数据是随机的实验数据,就可以克服选择性偏差问题,那么,政策效应计算只需要简单比较参与组和未参与组的平均产出的差即可,因为数据的随机性确保了未参与组可信地作为参与组的反事实,但是这种随机受控试验的成本较高,而且需要非常缜密的实验设计。大量的学术研究往往基于各类历史事件、制度变迁或地理特征等设计各类准试验研究,为我们认识客观世界提供了极为丰富的知识。
对中国发展的启示
作为全球扶贫最主要的贡献者,中国改革开放以来快速的经济增长,为解决贫困问题提供了丰富的物质基础,当前正在推进的精准扶贫事业将会为人类减贫事业书写下浓重一笔。和中国巨大的减贫成就相比,这些减贫政策的评估和实践似乎并不那么重要,但是其扎实的分析方法对于我们完善现有的政策评估体系具有重要的借鉴作用。 中国丰富的改革实践往往是一个从试点到推广的过程,充满了各种社会试验色彩,尽管比较宏大,但是也无碍我们运用更加微观的视角来分析验证政策的效果,帮我们识别出哪些政策是雪中送炭,哪些是锦上添花,使我们可以更加准确地把握政策的真实效果和传导机制,进而优化政策设计,避免试点样本选择偏差带来的政策幻觉。如果我们可以掌握并运用好这些现代分析手段,有助于设计更加精准的政策,例如对不同地区、不同群体的人群或企业通过随机实验方式给予更多可量化的政策,我们的政策效果会更加明显。众所周知,大量的公共政策背后都有财政资金的拨付,如何评判财政资金使用的效果?尤其在当前财政收支矛盾凸显的背景下,如何把钱用在刀刃上,让财政资金发挥最大的综合效益,都需要我们认真思考,这些诺奖得主的研究无疑为我们开启了新的视窗。