2.1 科学方法
在第1章中,我们解释了优化和均衡的概念,即经济学的前两个原理。现在我们来解释经济学家如何将这两个原理付诸实践,以及你如何也能做到这一点。
经济学是一门科学。和其他科学家一样,经济学家用科学原理解释数据。例如,天文学家感兴趣的可能是几个世纪以来所观测到的火星在夜空中位置变化的数据。用于解释该数据的科学原理,则是行星在引力作用下围绕着另一个质量大得多的天体(比如太阳系中的太阳)的曲线运行轨迹。你一旦有了关于火星轨道的精确模型,就既可以解释火星位置的历史观测结果,也可以准确预测火星的未来位置。如果你想让自动驾驶交通工具在火星着陆,并有一天在火星上建立人类定居点,就需要准确预测火星的未来位置。天文学家可以准确地告诉我们火星在未来数百万年的位置。
经济学家也在试图解释过去并预测未来。人们所做的选择就是我们所使用的数据。经济学家用优化和均衡这两个核心科学原理来解释这类数据。收集数据并利用这些数据来理解世界被称为实证,这是经济学的第三个关键原理。
实证,即用数据来分析世界,是所有科学分析的核心。科学方法是一个持续的过程,经济学家和其他社会科学家及自然科学家旨在通过这一过程达到如下目的:
(1)建立关于世界运转方式的模型;
(2)通过数据检验来评估这些模型。
天文学家利用火星在天空中位置的历史数据来预测它未来的位置,从而促进太空旅行和其他形式的科学探究。经济学家则利用人的历史选择数据来预测其未来选择,从而使家庭、企业和政府能够预测和规划未来。
通过运用数据检验模型,经济学家得以将好的模型和坏的模型区分开来。所谓好的模型,是指其能做出和数据大致相符的预测。当一个模型与数据严重不符时,经济学家会尝试修正这个模型或者完全重建模型。开发模型,然后检验模型,通过对这两个步骤的循环往复,经济学家就能够找到可以更好地解释过去甚至可以预测未来的模型。
比如,我们想知道上大学将如何提高学生随后在劳动力市场上的收入。再比如,我们想知道提高来福车司机的工资会如何影响这家共享出行公司的市场份额和盈利能力。我们还想知道提高汽油税会如何影响汽油的购买并最终如何影响温室气体的排放。你将看到实证分析会使我们能够回答如上这些问题以及与家庭、企业、政府和社会更普遍相关的无数其他问题。
考虑到世界的复杂性,我们并不指望科学方法能够产生一个完美的模型——我们永远都不能精确地预测未来。但不管怎么说,经济学家确实希望能找出有助于理解我们已有观测数据并能够部分预测未来的模型。在本节中,我们将解释什么是模型,以及如何使用数据来检验模型。
模型和数据
在古希腊哲学家有重大发现之前,每个人都认为地球是平的。现在我们知道,地球更像一个沙滩球而不是飞盘。然而时至今日,我们仍然在大量使用平面模型。在利用谷歌地图进行导航时,你使用的就是一张平面地图。
平面地图和地球仪都是关于地球表面的模型。模型是对现实的简化描述。经济学家有时会把模型称为理论。这些术语在使用时通常可互换。
因为模型是经过简化的,所以它们并不是对现实的完美重现。显而易见,平面地图并不是完全精确的地球表面模型,即并没有反映出地球表面的曲率。如果你从纽约飞往东京,这个曲率就会对你有影响。但是如果你只是在纽约市内通行,就无须担心地球是一个球形的问题。
科学家和通勤者都会使用最适合的模型分析手头的问题。即使一个模型或地图所基于的是明显错误的假设,比如地球是平的,它依然可以帮助我们做出优质的预测,为未来制订合理的计划。相比于成为这个世界的完美复制品,一个模型更重要的是简单和有用。
图2.1 纽约地铁线路图
注:这是纽约市地铁系统的一个模型。它被高度简化了——例如,它把纽约市视为一个完美的平面,而且扭曲了城市的形状。但对通勤者和游客来说,它仍然非常有用。
科学模型被用于进行可以用实证证据检验的预测。所谓实证证据,是指通过观察和测算得到的事实。我们也把实证证据称为数据。如第1章所述,经济学家常常形容自己是实证主义者,或者说自己践行的是实证主义,因为我们使用实证证据。实证主义者使用数据来回答关于世界的问题并且验证模型。例如,我们可以通过实际乘坐地铁和验证地图的准确性来检验纽约市地铁线路图模型。
在进行实证分析时,经济学家将一个模型所做出的预测称为假说。每当这些假说与现有数据相矛盾时,经济学家就会从头再来,尝试提出一个更好的模型,产生新的假说。
在新冠疫情危机期间,伦敦帝国理工学院的科学家开发的一个流行病学模型对公共卫生政策产生了重大影响。利用从经验证据中获得的一些疫情特征(比如被感染者的预估死亡率为0.9%),这些科学家创建了一个病毒传播模型。根据该模型的预测,如果不采取措施抑制疫情,英国将有51万人死亡,美国将有220万人死亡。[1]该模型还预测,保持社交距离等公共卫生政策能大幅降低死亡人数。因此,采用这些政策将减缓病毒的传播,并防止医疗系统因患者过多而陷入瘫痪。
该模型的关键预测和科学家们的主要假说是社交距离将大大减少新冠病毒的传播。作为一种预测工具,帝国理工学院的模型发挥了重要作用,促使政府采取了更加严格的保持社交距离干预措施,如居家避疫政策等,而这也确实显著减缓了病毒的传播,也减少了死亡人数。[2]
一个经济模型
让我们举一个经济模型的例子。我们将从研究一个非常简单的模型入手。但即使是比这个例子复杂得多的经济模型,也同样是对现实的简化描述。
所有的模型都始于假设。思考如下关于教育回报的假设:每多接受1年的教育,你未来的工资就会增加10%。让我们基于这个假设生成一个将人的受教育程度和工资联系起来的模型。
工资增加10%,相当于在原有工资基础上乘以(1+0.10),即工资为原有工资的1.10倍。因此,有关教育回报的这一假设意味着,一个人多接受1年教育所赚得的收入是他在未接受这1年教育的情况下所赚得收入的1.10倍。例如,如果一个人接受了13年的教育,他的工资是每小时15美元,那么我们预测,在接受了第14年的教育后,他每小时的工资会增加到1.10×15美元,也就是16.5美元。
经济学家还会利用假设推导出其他结论。例如,有关教育回报的假设意味着,多接受两年教育将使一个人的工资增加两次10%——每多接受1年教育,工资水平就会在原有水平上增加10%,而这会使工资总共增加21%:
1.10×1.10=1.21
同样,多接受4年教育会使一个人的工资水平4次增加10%,这意味着工资水平总共约增加46%:
1.10×1.10×1.10×1.10=(1.10)4≈1.46
这意味着,与高中毕业后就不再上学相比,一个人大学毕业后的收入将增加46%。换言之,该模型提出的一个预测或假说是大学毕业生将比高中毕业生多赚46%。
原则上,我们可以将这个分析应用于任意年限的教育。因此,我们建立了一个将人们的受教育程度和他们的收入联系起来的一般模型。我们推导出的模型被称为教育回报模型。它描述了人们接受更多教育的经济收益,也就是教育投资的回报。绝大多数经济模型远比这个模型复杂。在一些经济模型中,我们需要做大量的数学分析才能推导出关于这些假设的结果。但不管怎么说,这个简单的模型是我们展开讨论的一个很好的起点。它表明了所有模型都具备的两个重要特性。
首先,经济学家知道模型只是一种近似,因此他们明白模型不可能完全正确。从字面上看,根据这一模型,任何一个人多接受1年教育,其将来的工资都将会正好增加10%,但是这个精确的预测肯定是错误的。例如,与大学的倒数第二年相比,大学最后一年会给你带来更多的收入增长。因为在最后一年你会获得正式的文凭,而这份文凭是你简历中的重中之重。同样地,你在大学中主修的专业也会对你毕业后的收入产生重要影响。例如,那些主修经济学的人往往比大多数主修其他专业的人收入更高。我们上面的简单模型就忽略了很多这样的细微之处。正如一幅平面地铁线路图只是对一个城市特征的近似模拟,教育回报模型也只是对受教育年限与工资之间关系的近似估计。该模型忽略了很多特殊的因素,只是简化地预测了受教育程度和工资之间的关系。
其次,模型所做出的预测可以用数据来检验。在这个例子中,检验预测的数据就是人们的受教育年限和收入水平。我们现在准备用一些数据来评估上述教育回报模型的预测结果。
循证经济学
一个拥有大学学历的劳动者比一个拥有高中学历的劳动者多挣多少钱?
● 要检验该模型,我们需要先有数据。我们可以从“当前人口调查”中获得所需数据,这是一项来自美国政府的数据。这项调查匿名搜集了普通人口的收入、受教育程度和很多其他特征信息,任何人都可以使用这些数据。这种面向大众开放的数据被称为“公用数据”。
● 图2.2总结了我们检验该模型所需的平均年收入数据。该图显示,在美国,年龄介于25~34岁、拥有高中文凭(且不再接受教育)的全职劳动者,2018年的年收入中位数为35 620美元。该图还显示,年龄在25~34岁、拥有大学学历(且不再接受教育)的全职劳动者,2018年的年收入中位数为55 660美元。
● 如果我们把这两组中位数相除,即最高学历为大学者的收入除以最高学历为高中者的收入,得出的比率为1.56,这也表示他们的收入差距为56%。
● 根据上文中的教育回报模型,每多接受1年教育会使工资增长10%,那么多接受4年教育应该使工资增长至原来的1.10[3],即1.46倍。我们可以看到,该模型与数据并不十分吻合,但差距也不大。受教育年限从12年提高到16年,收入增长了56%,高于模型预测的46%。
图2.2 根据教育程度区分的美国全职劳动者年收入中位数(2018年数据)
注:那些最高学历为高中的人,年收入中位数是35 620美元,而那些最高学历为大学的人,年收入中位数是55 660美元。
资料来源:“当前人口调查”统计的2018年收入。
均值和中位数
你可能想知道如何使用“当前人口调查”中的数据计算出上述工资水平。我们使用了中位数这一概念。所谓中位数,就是一组数字的“中间”值。具体来说,中位数的计算方法是将数字从小到大排序,然后在列表的中间找到该值。
我们可以用一个简单的例子说明中位数的计算方式。比如,现有权先生、利特尔顿女士、洛克先生、雷耶女士和谢泼德女士共5人,他们每个人的时薪都不相同。
权:26美元/小时
利特尔顿:24美元/小时
洛克:8美元/小时
雷耶:35美元/小时
谢泼德:57美元/小时
我们说过,中位数的计算方法是将数字从最小到最大排序,然后在列表的中间找到该值。对上面的时薪数据进行排序,我们得到了这个排列顺序:8美元,24美元,26美元,35美元,57美元。我们可以看到,中间的数值,即中位数,是26美元。(当列表中数字的个数为偶数时,中位数就是两个中间数值的平均值。所以8美元、24美元、26美元和35美元这4个数字的中位数是24美元和26美元的平均值:25美元。)
科学家们有时也会研究均值或平均数。均值(或平均数)是用所有数值的总和除以数值的个数所得出的结果。在统计学家和其他科学家这里,均值和平均数这两个术语可以互换。
针对上面的例子,如果我们将这5个人的工资加在一起,再除以5,就可以计算出他们的工资均值是每小时30美元。
总结一下,中位数是一组有序数字的中间数值,均值则是一组数字的平均值。当一组数字有一个或者多个极端数值时,其中位数和均值会相差很大。例如,假设谢泼德的工资特别高——她也许是一位公司律师,平均每小时工资为257美元(而不是原来的每小时57美元)。那么,这些人的工资均值将上升为每小时70美元,但是工资中位数并没有改变,仍然是每小时26美元。因此,均值会受到离群值(所谓离群值,是指与列表中其他数字差异较大的极端数值)的影响,而中位数不受离群值影响。
我们使用这份只有5个人的小样本分析解释了中位数和均值的概念。但是在经济学中,数据分析要想令人信服,则有赖于对大规模样本的使用。例如,一篇典型的经济学研究论文所使用的通常都是成千上万人规模的数据。当我们在图2.2中指出更高的受教育程度和更高收入水平相关联时,所依赖的并非只是少数的观察值(每条数据都被称为一个“观察值”)。相反,我们使用了从美国人口中随机选择并经人口普查局调查的1.5万名全职劳动者的数据。使用大量的观察值能加强实证论证的说服力,因为大量的观察样本更有可能体现我们所抽取样本的那个基础群体。
为了向大家展示如何提出令人信服的实证论证,本书使用了大量来自庞大群体的真实数据。基于大量观察值的可信实证论证是科学方法的重要组成部分。
实例论证
教育并不决定命运。有些受过很多教育的人挣钱很少,也有些受过很少教育的人挣钱很多。这个世界上很多知名企业的创始人都没有大学毕业:比尔·盖茨从哈佛辍学创办微软,拉里·埃里森在创建甲骨文之前从两所不同的大学辍学,马克·扎克伯格则从哈佛辍学创办了脸书。[4]
考虑到这些例子,人们可能很容易得出这样的结论:从大学辍学是一条通向成功的伟大道路。然而,用几则逸事或者一些小样本就试图断定统计意义上的关系是错误的。
如果你随机挑选两个30岁的人来研究,那么一个只有高中学历的人比一个拥有大学学历的人收入更高的概率为1/3。这个事实指出了一点:尽管获得大学学历通常有助于你提高收入,但决定你收入的绝不仅仅是教育。
当你只看一小部分数据时,会很容易得出错误的结论。下次再有报纸专栏作家试图用这些实例来左右你的观点时,请记住这个提醒。如果这个专栏作家用从成千上万人的实际经历中得出的数据来支持自己的说法,那么他的工作确实做得很到位,他的结论可能值得相信。但如果他仅仅以几则逸事来证明自己的观点,那么你要对其结论保持怀疑态度。如果你怀疑这些事例都是经过精心挑选的,只为证明专栏作家自己的观点,那么就更要持质疑态度了。这样的论证不可当真。
这条规则有一个例外。当你在反驳一个笼统的陈述时,举例论证就是一种适当的方法。例如,如果有人断言每个NBA(美国男子职业篮球联赛)的球员都必须身材高大,那么仅仅一个反例就足以证明这种说法是错误的。例如,你可以举蒂尼·博格斯的例子,他的身高只有5英尺3英寸(约1.6米),体重133磅(约60.3千克),却在NBA打了15个赛季的控球后卫。
[1] Ferguson, Neil et al. “Impact of Non Pharmaceutical Interventions (NPIs) to Reduce COVID-19 Mortality and Healthcare Demand.”Imperial College London, March 16, 2020.
[2] Landler, Mark, and Steven Castle. “Behind the Virus Report That Jarred the U.S. and the U.K. to Action.” The New York Times, March 17, 2020. https://www.nytimes.com./2020/03/17/world/europe/coronavirus-imperial-college-johnson.html.
[3] Source: U.S. Census Bureau, Current Population Survey, 2019 Annual Social and Economic Supplement.
[4] “World’s Billionaire List: The Richest in 2020,”Forbes, March 18, 2020. https://www.forbes.com/billionaires/#636fcc4e251c.