欢迎光临第一论文网,权威的论文发表,我们将竭诚为您服务!
您的位置: 第一论文网 -> 统计学论文 -> 文章内容

计量经济学局限性研究

作者:admin 更新时间:2018年08月02日 09:30:55

  一、引言


  当前正在持续并不断延伸的经济危机,引发了学术界对于标准经济学建模方法在此次危机预测与应对中作用的探讨,其矛头直指计量经济学,认为计量经济学在经济现实表述与预测方面作用甚微,一些极端观点甚至要求放弃计量经济学模型方法,因之引发当前学术界关于计量经济学“失败与否”的学术之争。争论的实质可归结为一个问题:计量经济学是否是精确、无局限的绝对科学?


  对于计量科学的精确性、绝对性的探讨由来已久,当前学术界的争论只是对这一问题的深化。早在1939年,Keynes就指出计量经济学模型方法存在三个层面的问题:一是理论的先验正确性问题[1],二是线性假设以及滞后期与趋势决定的主观随意性问题,(1)三是计量经济学的结构不变性问题。认为这三个问题造成了计量经济学经济分析的局限。相对于凯恩斯,Lawson的观点相对来说比较极端,Lawson对当前计量经济学建模的研究方法进行了严厉的批判[2],认为当前的计量经济学模型,尤其是VAR系列模型在研究现实经济机制方面作用甚微,模型未获得关于经验现实的真正洞察,其预测结果不具备经验充分性。


  而Juselius则更倾向于为现代计量经济学模型、尤其是VAR系列模型进行辩护[3],认为计量经济学本身不存在任何问题,只是在面对当前危机时应做一些转变[4]。并指出正确设定的、具有经验充分性的协整向量自回归(Co-integrationVectorAutoRegrssion,CVAR)模型可以实现这一转变[5]。作为计量经济学的拥护者,Hendry同样对计量经济学进行了辩护,指出虽然计量经济学方法确实可能会产生谬误回归,但这种谬误可通过检验进行回避与拒绝[6];Hendry提出根据数据生成过程(DGP,DataGenerationProcess)进行建模的理念,指出计量经济学应根据DGP过程进行经验建模,进而保证计量经济学应用研究的科学性与精确性。


  国内学界对计量经济学基本持肯定态度,李子奈认为,从计量经济学模型方法的建立、估计与检验过程来说,其方法具有坚实的统计、逻辑基础,符合科学研究的发现过程[7]。计量经济学研究方法实质上就是回归分析,是证实与证伪、归纳与演绎、检验与发现、相对与绝对相结合的过程。并探讨了计量经济学模型政策评价、结构分析、预测与检验功能上的局限。(1)洪永淼认为计量经济学模型面临三个主要问题:非重要因素的影响问题、观测数据问题以及样本外预测问题[8]。但计量经济学理论本身已经发展得相对成熟与全面,只是由于经济系统的时变性、不可逆性以及经济数据的缺陷导致了计量经济学的分析、预测没有物理学那样精确,这也是计量经济学与自然科学最大的区别。


  那么计量经济学究竟是怎样的科学?它是否具有其自身难以避免的不足与局限?要对这一问题进行解答,就要从其模型方法的概率和统计学科基础进行探讨,从其表述语言、方法论及功用层面进行基础研究,以提高其应用研究的科学性,使计量经济学应用研究沿着正确的方向发展,这也正是本文的研究目的。


  二、计量经济学的语言分析:模型语言经济学表述的非充分性


  经济学语言学转向引发人们对语言在经济分析中作用的广泛关注,进而产生一个问题,计量经济学的主要语言是什么?计量经济学语言具有什么特征?其在经济分析中又处于什么地位?要解决这些问题,就要从什么是计量经济学的语言以及计量经济学语言的方法论地位来着手。


  要探讨计量经济学的语言,离不开对计量经济学的界定及其基本分析结构的探讨。计量经济学是通过模型来表述经济现实的,基于统计、概率方法的模型构建是计量经济学经济表述的主要手段与方式,也是计量经济学进行经济研究与分析,以及作用于应用实践的基础途径。从学科的自我表述与实践应用两个层面来说,一方面,以概率和统计为基础的计量经济学模型是计量经济学这一学科的主要表达方式,也就是计量经济学的“语言”;另一方面,从计量经济学的基本分析结构来说,模型是计量经济学分析的基本结构,是计量经济学描述、解释经济现实的主要手段,也是计量经济学进行学科表述与对外自我表达的主要途径,可称为计量经济学的“模型语言”。以概率和统计为基础的计量经济学模型,既是方法又是语言,在计量经济学经济分析中处于核心地位。作为经验实证的计量经济学,其研究方法从方法论上来说是经验实证的模型方法,其语言也必然离不开经验实证的方法论基础地位,是经验实证的模型语言。


  那么,计量经济学经验实证的模型语言在经济学研究中处于何种位置?其经济学的表述充分性如何?是否能够替代自然语言?要回答这些问题,首先就要明确经济学学科本质与计量经济学经验实证模型语言的方法论地位。作为社会科学的“皇冠”,其特殊的学科性质决定其不等同于物理学这样的自然科学,同时人类社会也不等同于实验室。经济现实的复杂多变性,人性与人类心理的不可预测性,使得经济发展过程成为一个异常复杂的有机体,这些必然复杂化经济学的表述及其语言,单一的基于以概率和统计的模型语言难以完成这一任务。此外,从经济科学理论表述层面来看,经济理论并不必然由数学或统计学来证明。经济学的语言是多元而非一元的,数学、统计语言是经济学分析语言中不可替代一种,是“多元”中的“一元”,但并不必然比其他语言更重要。当然,这也解释了计量经济学以概率和统计为基础的模型语言在经济分析语言中的地位。


  计量经济学经验实证的模型语言是计量经济学科学化经济研究的一个重要体现,但同时也难以避免其自身与生俱来的方法论局限:


  首先,经验实证的模型语言面临经济研究中价值判断理念的计量化问题。计量经济学模型语言对经济现实的表述是建立在表示现实经济活动结果数据的概率分布假定基础之上的,模型语言对经济现实中不可度量的社会关系、政策和心理等价值理念的处理是通过主观假定赋值或虚拟变量来完成的。从一定程度上来说,计量经济学模型语言对价值判断的这种表述稍显随意、主观,是不精确的;此外,很多价值判断理念难以通过统计语言或概率分布来表述。因此,计量经济学模型语言存在着价值判断理念计量化的问题。经济研究是以人及其构成社会的经济活动与关系为核心的,而这种社会经济关系的表述不仅是“量”的统计,还包括“质”的描述。计量经济学模型语言对经济现实的解释与描述是通过变量与现实经济因素的映射来完成的,因此,模型对经济现实的解释是建立在模型方程涵盖待解释经济变量这一前提之上的。那么就产生了一个问题,模型是否可以包含所有经济因素,也就是经济因素都可以通过适当量化的形式纳入模型语言的表述范围吗?答案是否定的。很多宏观计量经济学模型中的政策、环境因素以及微观计量模型中的心理因素,都很难一一映射为计量模型中等价的变量形式。虽然虚拟变量是一种选择方式,但现代计量经济学中的虚拟变量通常是简单的“二进制”(0,1),这种“是与否”的极端表述方式很难精确描述经济现实的渐变过程与渐变效应。


  此外,即便勉强将价值判断理念通过主观赋值的变量进行计量化,还存在现实经济因素与观测数据统计方式的非“一一映射”问题。很多模型表达的变量或符号在现实经济中有多个对应统计方式,而每种方式的选取都代表着不同的样本数据,有时甚至会影响到模型的估计结果。如探讨外商直接投资与中国经济增长的关系时,涉及到国家开放程度这一政策理念及其模型对应变量的选取。究竟用什么代表开放程度,现实中选取模型样本数据时就涉及一个选择的问题,有的研究者将年进出口贸易总额的GDP占比作为一国开放程度的度量标准,有的将对外政策的颁布作为开放程度的度量。这种变量的选取通常以模型的估计结果是否更优作为条件,可以说这种选取模式是稍显主观随意的,并不具备严格的科学性。


  其次,计量经济学模型语言难以完全取代经济学表述中的自然语言,一元的模型语言难以对经济学进行全面、充分表述。第一,能够表述经济世界的是语言性的词语而不是人为创造的符号、模型,计量经济学的模型语言并不比自然语言更接近经济现实,同时,经验实证的模型语言所描述的逻辑建构具有其本身的局限,不能完全取代经济学自然语言的使用。虽然计量经济学模型语言中的数学公式与统计推断过程本身也是一种话语,但这种“话语”本身也有语言问题,爱因斯坦指出,“就数学定律指涉现实而言,它们并不确定;就其确定性而言,他们并不指涉现实”。数学哲学的观点展示出数学、统计的模型语言,作为一种经济学研究语言,其所构建的“经济世界”并不比自然语言的更准确,也不比自然语言的更接近现实世界。第二,人们生活的世界是词语的世界而非函数的世界,对语言最重要的沟通与交流功能来说,经验实证的计量经济学模型语言作为交际语言并不具备足够的充分性。虽然其在统计推断与函数符号表达上具有严谨性与便利性,并因此一定程度上体现了其科学性,但对于语言最为重要的交际功能,计量经济学模型语言并未表现出任何超越其他语言范式的优势,尤其是在与公众交流时[9]。用函数与符号表达的数学语言是自然科学的通用语言,“对自然科学家而言,它就像过去拉丁语对学者一样,而对许多经济学家来说它不幸是希腊语”[10],因之其模型方程与符号的表达范式可能更容易使人们感觉它只想通过深奥的数学让人肃然起敬,而不是更有助于交流。


  还有一个不得不说的问题,不论计量经济学模型语言多么严谨、精确,也不可能做到对完整社会关系进行精确表述,这取决于计量经济学模型设定的非精确性与局部性,因为任何模型都不可能把整个社会复杂多面的关系全部纳入模型体系,无论从技术层面来说还是从方法论层面来说,这是不现实也是不可能实现的。


  三、计量经济学的数理基础:非精确数量关系的度量


  由于计量经济学以概率和统计作为其学科的数理基础,其结论是基于样本数据(总体样本的一部分)的推断做出的,而非真实的针对总体样本进行的精确运算,因而其结论并非是确定的、精确的。而计量经济学中以概率为基础的随机检验的不对称性与非精确性、概率约化(ProbabilisticReduction,PR)方法下统计推断的非确定性,都导致了计量经济学度量精确数量关系上的局限。


  1.以概率为基础的随机检验的不对称性与非精确性


  由于观测值很少是现实经济中经济变量的真实值,因此随机模型的存在具有较为重要的作用。(1)但随机模型本身由于其概率基础的非精确性以及两类前提假定的不对称性,使其模型检验的逻辑基础受到质疑;同时其概率基础的随机性,也严重削弱了随机模型的可靠性与精确性。


  首先,以概率为基础的随机检验的不对称性。计量经济学的证伪或检验需要逻辑依据,随机检验在逻辑上具有非对称性,这种非对称性源于对标准逻辑的构建,即对于给定的一系列假定,我们能逻辑性地得出一系列结论:(1)如果所有的前提都为真(在某种意义上),那么所有的结论也都为真(同样的意义上),这是必然的。(2)如果任何一个结论是错误的(同样意义上的),那么给定系列的前提假设中至少一个是错误的———但我们不能确定哪一个是错误的(多于一个的时候),也不知道有多少个是错误的,因为可能所有的都是错误的。(3)如果存在任何一个错误的前提,我们不能排除结论中可能有正确的结论,这是必然的。(4)如果结论中有一个是正确的,给定系列假设中的任何一个都有可能是错的。这里我们可以说,如果正确运用逻辑,那么前提的正确性可以传递到结论上(假设到预测),而结论的正确性却不一定能传递到前提上,这里存在一个明显的不对称性。同样,对结论的证伪可以至少传递到前提上(一个),但对前提的证伪却不能传递到结论(除非结论与前提一样)。计量经济学的随机检验是建立在通过对结论(根据经济理论、数据建立的模型)的证伪进而证伪前提(经济理论假说)的逻辑基础上的,而逻辑不对称性则削弱了这一检验的逻辑基础。


  其次,以概率为基础的随机检验的相对性与非精确性。这里用简单的线性模型来探讨随机模型检验的相对性与非精确性问题。假设线性的两个变量,C=a+bY的每个观测值允许有10%的误差,通过式(1)和式(2)两个观测值,可以通过方程确定a和b的值,即进而通过确定系数的方程与Y3来确定C3的值,得出C3的计算值和观测之间的误差为17%,超出通常10%的标准。


  实际上C与Y的观测值可能与其真实值有10%的偏差,而对于第三个观测值C3,其计算值和观测值之间可能有大到17%的误差,而它们之间的关系不能就此确定是非线性的。同时,未对线性假设进行确定并不必然表示对非线性假设的肯定,基于单一观测值的检验并不构成对假设的反驳,而0误差也不代表对线性关系的肯定。15%的误差可能不足以确定模型就是线性的,但也不足以说明模型是非线性的,因此我们称之为对线性假设的非肯定。要区别开对线性假设的非肯定并不代表对非线性假设的肯定。任何判定的标准都应基于对观测误差本质的了解以及对理论本身的了解。通过判断P值来判定,这要求首先观测值符合高斯正态分布步钟形曲线,如果我们假设观测均值是真实的,数据的分布是正态的,那么正态分布的观测值曲线可以用来计算P值,如5%,作为接受的标准。这样的一个缺点就是,很可能错误地接受了不适合的方程或模型。如果观测值的概率分布不是正态的,或如果每次观测到的值不是独立的,那么P值检验就难以进行。若实际的误差分布与假定有差异,则此方法带来的问题足以影响到计量经济学的精确性。


  这里还需要指出的是,随机的是模型,而不是现实经济世界。任何随机模型的检验都是对这种假设的一致性的检验,即对理论本身的检验。只有人们认为模型绝对为真,任何违反一致性的变化完全都是由真实世界难以解释的变化引起的时候,人们可以选择相信现实世界是随机的,但这点显然是不成立的。而随机性把理论的真实性变得无可非议,认为理论是不可能出错的,这一先验观点严重损害计量经济学的经验基础。计量经济学随机模型这种把理论和模型假设看成是真实的,世界是随机的这种看法是不诚实的,也是随机模型局限性的一个体现。


  2.概率约化方法下统计推断的非确定性


  计量经济学概率约化方法(ProbabilisticReduction,PR)的出发点是,经验模型是实质性信息与统计信息的混合体,其主要目标是应用数据来了解观测对象。这两类信息最初被包含进两个不同的模型———理论模型和统计模型,前者是由理论变量构建的,其中一些变量可能是不可观测的;后者则是专门根据数据Z:=(Z1,Z2,…,Zt)潜在的可观测随机变量设定的,问题是找到将两者联系起来的方式,同时不违背实质性信息与统计信息任何一方的完整性。


  根据概率约化方法,Z是随机过程{Zt,t∈T}的一个实现,根据Kolmogorov定理,随机过程的概率结构在某些温和规律性条件下,就联合分布D(Z1,Z2,…,ZT;Φ)来说,可被充分描述。统计模型被看做为假定概率结构{Zt,t∈T}的参数化,并可作为这一联合分布的一个约化形式。为了说明相同的D(Z1,Z2,…,ZT;Φ)能产生不同(但相关联的)统计模型,可先考虑情况{Zt,t∈T}假定为一个马可夫的阶数p(M(p)),和稳定的(S)过程,在此基础上,人们可推断:


  其中,Zpt-1:(Zt-1,Zt-2,…,Zt-p),即联合分布(Z1,Z2,…,ZT;Φ)约化为条件分布D(Zt︱Zpt-1;φ)的一个产物。假定,{Zt,t∈T}是一个正态的(N),D(Zt︱Zpt-1;φ)产生VAR(p)模型:


  也就是说,VAR(p)模型提供了(N,M(p),S)过程{Zt,t∈T}的特例。但考虑到事实:D(Zt︱Zpt-1;φt)=D(yt︱xt,Zpt-1;φt)·D(xt︱Zpt-1;φt),很容易发现自回归分布滞后模型AD(p,q):


  基于D(yt︱xt,Zpt-1;"t)构成了相同随机过程{Zt,t∈T}的另一个参数化。怎样在两者之间进行选择呢?选择完全依赖与特定参数化能否嵌入结构模型。当然,这是以存在一个联结理论与统计模型的结构模型为前提的。这一概率约化(PR)方法指出了VAR(p)方法做为统计模型的合理性,但同时也揭示了两者的核心弱点:它们并不能作为时间序列数据建模的“灵丹妙药”。当任何概率假定(N,M(p),S)不适宜时,都可能会产生模型的错误设定。


  概率方法提供了基于相关观测过程的概率假定的完全设定。完全的统计模型假定系列本身就揭示了其背后的分布规律,比如D(Zt︱Zpt-1;φ)是与联合分布(Z1,Z2,…,ZT;Φ)通过推断方程(4)相关起来的。同时,这一推断也将模型设定与有可能产生数据D(Z1,Z2,…,ZT;Φ)的其他模型(P)相区别,因为所有P的潜在模型都可看做为从相同联合分布、不同统计推断假定得出的,这些不同的统计推断假定大体上可分为三个类别:(D)分布,(M)依赖,(H)异质性[11]。


  但这里存在一个问题,概率约化方法是基于弱概率结构的,而统计模型的设定是基于变量随机过程{Zt,t∈T}的概率结构,要求概率假定应尽可能的具体完整,也就是强概率结构。原理是这样的,假定范围越窄推断越精确———认为假定的结构对研究的数据是有效的———因此统计充分性具有非常重要的作用。假定的概率结构越弱(不具体),推断就越不精确、不深刻。此外,弱概率假定并不必然能使推断更可靠,但它们不可避免地使推断更不确切[12]。


  3.建立统计充分性的难度


  费雪-内曼(Fisher–Neyman,F-N)概率方法认为:(1)每个统计推断都是基于某个假定前提的,以统计模型的形式参数化潜在的随机过程{Zt,t∈T},该过程可生成数据Z:=(Z1,Z2,…,ZT),并认为这一随机过程是“理所当然”的。(2)统计充分性是建立“统计规律”可靠性的必要条件。具有较高R2值的估计回归模型并不能构成“统计规律性”,除非统计模型的概率假定1—5(见表1,其中ΒT=(β0T,β1T),ⅹT:=(1,ⅹ1T))都用潜在的错误设定检验(检验其正态性、线性、异方差性与自相关性),也就是建立统计充分性。事实是,如果1—5中的任一假设对数据Z:=(Х,У)无效,那么基于结构模型统计推断就是不可靠的。统计充分的经验规律性很少见,因为假定4—5在现实中很难满足。因而,即使“非充分性”以良好拟合为统计标准,严格统计充分的经验规律性事实上也是很少见的。一旦统计充分性建立起来,统计推断的可靠性确保了实质性信息(结构模型的形式)评价的可靠性。统计上非充分的前提会导致非规律性,“理论上的有意义性”也不能使其变成任何规律性。


  表1多变量线性回归模型(MLR)假定条件下载原表


  表1多变量线性回归模型(MLR)假定条件


  注:其中,β1:=Cov(Х1t)-1Cov(Х1t,Уt),β0=Ε(Уt)-B1TΕ(Х1t)


  建立统计充分性的难度显示,对数据盲目的集合不大可能产生任何规律性;即便偶尔产生了,对一致性度量与外部有效性的探索也将会消除这种伪规律性。现实应用研究中的计量模型,其统计充分性或多或少都存在一定程度上的不充分问题,原因并不取决于建模者,而是经验数据本身就难以完全符合强概率假定。现实中的数据很少能满足统计上要求的时间平稳性或不同数据生成过程的同质性,因此要建立完全的具有统计充分性的模型是几乎不可能的。这也是计量经济学数理基础本身所固有的一个局限。


  四、计量经济学的建模过程:不平衡方法论基础的局限性


  计量经济学基于经验数据模型符合科学研究的发现过程,是其优势所在,但同时,其建模过程的方法论基础并不平衡,表现为认识论基础上归纳内容重于演绎内容,逻辑学基础上对检验的重视超过发现,一般哲学基础上对“特殊”与“一般”的处理未达到平衡,而这些建模过程中的方法论基础不平衡导致了计量经济学模型方法的局限性。


  1.计量经济学建模过程中认识论基础的不平衡:归纳重于演绎


  计量经济学的一个首要目标就是为经济学提供经验内容,可见经验归纳在计量经济学中独特的重要性;而计量经济学科的产生与发展,也无不体现了归纳法或经验检验在经济研究中的兴起与盛行[13]。虽然计量经济学不只包含归纳,从其建立模型过程看,除去其中经验检验部分则是明显的经验归纳,最初的模型设定与检验后的模型政策评价、预测等功用的实现均属于演绎内容。但不得不承认的是,计量经济学作为“为经济学提供经验基础”的学科,其模型方法不可避免地侧重经验归纳,而现实经济研究应用中,这种对经验归纳的侧重也在一定程度上导致了计量经济学研究方法的局限。


  首先,对归纳赋予过多权重可能会导致模型方法的归纳内容缺乏正确前提,进而产生不可靠甚至错误模型结果。缺少足够演绎内容的模型设定,很可能是基于错误的经济理论或数理逻辑,模型设定不充分。那么这种情况下模型的检验结果就会很危险,会有较强的误导性,因为它可能直接导致完全错误甚至荒谬的结论,进而削弱计量经济学模型分析的意义,得出错误甚至荒谬的结论。模型设定是计量经济学研究的基础与前提,只有设定正确的模型才能通过正确的检验步骤得出正确的结论。


  其次,对归纳给予过多权重可能会导致统计意义与经济意义的不平衡,使计量经济学的研究倾向于追求统计分析上的完美性,进而趋向于形式主义,降低研究的质量,甚至产生方向性错误。应平衡计量经济学建模过程中归纳与演绎内容的权重,过于重视经验归纳内容,忽视演绎部分,很可能会导致对统计显著性的片面追求而忽略模型的经济意义,进而沦为缺乏经济意义的形式主义,产生“伪回归”谬误。而现实经济研究中也确实存在这种统计上显著、检验环节完美而经济意义上贫乏的研究结果。其中较为普遍的是根据研究目的进行模型设定,随意性较强,甚至有时不符合经济理论或经济惯例,与经验现实相冲突。有时为了突出待研究的关键变量,可能较为随意地增减其他变量以获得关键变量较高的统计显著性。这种模型设定是单纯地对经验归纳的偏重而忽略演绎内容在模型设定中的意义,致使研究缺乏经济理论基础,导致可能误导性的甚至是错误的结论。


  总之,必须认识到,计量经济学应用研究中应将抽象演绎与经验归纳相结合。演绎内容决定了计量经济学的模型设定,为归纳内容设定了前提,决定了经验归纳的方向,它就像建筑物的地基一样限制并主导着其基础上建立起来的建筑———模型的经验归纳部分。不能片面地强调归纳或演绎的重要性,而应平衡两种方法在计量模型方法中的应用。


  2.计量经济学建模过程中逻辑学基础的不平衡:检验重于发现


  计量经济学的学科性质并非是狭义的回归分析。广义的计量经济学具有多重科学、哲学和方法论基础,它形式上是统计学、经济理论与数学三者的结合,其目的是为经济研究提供经验基础。在计量经济学模型设定与估计两个环节,由于是以理论与数据相结合的关系论导向进行模型设定,而且严格遵循从一般模型到特殊模型的建模范式,很可能发现与原有的先验理论不同的,并通过严格系列检验的新经济关系,或是证伪已经存在的旧有经济关系,这是一个检验与发现综合运用的过程,它不仅是单纯的检验,还是对新事物探寻的过程。正如丁伯根对计量经济学模型方法的辩护,“它从一定程度来说是检验与发现的结合”,但这里要注意一个问题,计量经济学中的理论发现并不是真正意义上的“发现”,而是估计、检验过程中对先验设定理论假说的完善,或者是对更为适合样本数据、对样本数据拟合更好的模型形式的探寻。


  同时,也必须承认,计量经济学对检验的重视要远重于发现。Hendry曾指出,计量经济学的三大黄金定律就是“检验、检验再检验”。理论检验功能也是计量经济学模型的传统功能,可见检验在计量经济学模型方法中的核心地位。对检验过于重视的同时也难以避免地忽略其另一面———发现,这也造成了计量经济学模型方法一定程度的局限。


  首先,对检验赋予过多的权重,而忽略发现的重要性,很可能使计量模型分析沦为“统计的炼金术”或“经济学的鬼把戏”。计量经济学建模过程中对检验的重视程度远超发现,这一逻辑学基础的不平衡很可能导致建模者对检验技术的先进性与复杂性的片面重视,即过于偏重统计显著性而忽略对模型经济充分性的考察;同时,建模过程中最为重要的、可能导致理论发现的“异常现象”,很可能在对检验的片面追求中被忽略掉。对于与先验观念相冲突的、导致统计充分性降低的、不符合检验标准的“异常现象”的出现,建模者很可能以其不符合检验标准为根据,在未考虑其可能的经济充分性的前提下,为突出某些变量的显著性而对变量进行随意删减,结果可能将模型从正确设定的方向引向歧途,错过最为重要的“理论发现”。模型的设定脱离了经验现实,进而使统计分析变成形式化的“统计的炼金术”。还有一种更危险的情况,就是根据根本就没有科学性的理论假说,而只是盲目地根据研究目的对变量回归关系进行检验。这种缺乏理论指导的计量分析早在20世纪40年代计量经济学著名的方法论争论———“没有理论的度量”中就已指出其谬误性。无论检验步骤、方法如何完善,没有正确的前提很可能造成“伪回归”而得出错误的结论,使计量经济学应用研究成为“经济学的鬼把戏”。


  其次,即便是计量经济学中占主导地位的检验,也不是毫无瑕疵的,计量经济学检验的逻辑不对称性严重损害了计量经济学检验的权威性与说服力。前文已经探讨过计量经济学以概率为基础的随机检验的非对称性,前提的正确性可以明确地传递到每一个结论,而对任一结论的证伪却只能模糊地传递到前提,即难以确定是哪一个或哪些前提是错误的。这种逻辑上的不对称性决定了逻辑在检验中的作用:(1)只通过检验从理论中推理出来的结论(可能很多都是正确的)不能检验理论本身。(2)不可能通过前提的真实性间接性地证实所有结论,当其中一个前提恰好是公认的陈述时(至少有一个,这样才能进行解释和预测),由于我们不能知道相对于经验事实来说什么时候这个公认的陈述是对的。(3)证明前提都是错误的并不能证明特定结论的正确性。由于结论正误和前提正误的不对称性是检验经济理论的最大障碍,对结论的证伪并不能证明理论本身有问题,如果在建模过程中添加了附加假设。由此可见,对随机模型本身的检验并不能检验理论假说的真伪。计量经济学中的检验,从一定程度上来说是无力的。


  最后,计量经济学的检验是概率意义上的,是随机的、相对意义上的,难以获得绝对的、精确的结论,认识到这一点同样十分重要。计量模型的回归结果只是在给定的某一显著性水平上,给出是否可以接受待检验的假说;其接受与否是以显著性水平为评判标准的,如经常使用的10%,5%和1%显著性水平。但这里需要注意的是,这一显著性水平是人为选取的,并非是计量经济学科学体系天然生成的。而且,即便通过显著性检验,也不能完全确保检验的假说是完全正确的,因为这里还有一个10%,5%或1%“弃真”(错误地拒绝了原假设)的可能性,通过检验也是存在错误可能性的。也就是说,通过检验只是证明错误的概率偏低而已,而不能绝对地排除错误的可能性。因此,计量经济学以概率为基础的检验,其相对性和非确定性是与生俱来的,这也是计量经济学的局限性之一。


  3.建模过程哲学基础的不平衡:“特殊”重于“一般”


  不同于一般哲学中的一般与特殊,本文的一般与特殊指“一般模型”与“特殊模型”,两者的关系在计量分析的两个层面得到体现:一是始于“一般模型”的建模范式和始于“特殊模型”的建模范式,二是约化过程中“一般”与“特殊”模型的相互转化方面。


  “一般模型”源于Hendry的“包含模型”[14],始于一般模型指从包含所有可能影响变量的一般模型开始的建模范式,在不丢失任何信息的前提下,通过约化过程将复杂的一般模型约化为便于统计分析的、简单的特殊模型。而始于“特殊模型”的建模范式则相反,从包含核心因素的特殊模型开始,通过检验揭示不足之处,再通过增加可能影响因素来完善模型的建模范式。由于模型是对经济现实的表述,理论上应只有一种正确的最终模型设定,但现实中由于经济变量之间的复杂关系与模型推导过程中对统计充分性的片面追求,很可能使二者的最终模型设定相距较远。(1)


  计量经济学中的“特殊模型”与“一般模型”的转化,在时间序列数据建模过程中尤为突出。由于现代时间序列数据通常采用数据导向的建模方法,为保证其经济理论基础充分性对约化过程进行理论或结构约束,从其本质上来说就是将“一般模型”实施约束进而转化为“特殊模型”。再通过包容性检验来验证这一“特殊模型”的包容性,若无法通过包容性检验,则重新建立一个新的“一般模型”,再逐步约化生成新的“特殊模型”。伦敦经济学院(LondonSchoolofEconomics,LSE)方法就是“一般”与“特殊”交替进行的过程。


  然而现实中由于始于“特殊模型”的建模范式更有利于迎合研究目的,更容易通过统计方法上的“努力”突显出某个或某些待研究变量的统计显著性,而成为建模实践应用中一种通用的范式。现实约化过程中,常难以做到两者的转化,而采用单纯的删减变量方式,这都为计量经济学的经济分析带来局限。


  首先,现实中无法满足“一切条件不变”假定,进而造成始于“特殊模型”建模范式的经济基础的非充分性。由于现实经济错综复杂,各经济因素处于一个不断变化的、相互作用的动态过程中。若模型中包括的变量并非所有影响因素,而只是部分影响因素,并试图从这一局部来探寻整体,那么首先就要求模型包括的部分影响因素相互作用时,其他未被包括进来的因素满足“一切条件不变”假定,即经济现实满足其他变量不变的假定,但现实中其他影响因素一直是在起作用的,难以满足这一前提假定,这必然造成基于这一假定的模型估计的问题。如始于“特殊模型”建模范式下,对同一问题的研究常出现多种模型设定形式并得出多种不同结论,其主要原因就是始于“特殊模型”的建模范式的局部性与片面性。


  其次,始于特殊建模范式混淆了协整方程与均衡方程。均衡方程描述经济体中所有经济变量之间长期的稳定关系,是一个整体概念,其所涉及的时间序列变量(如果样本数据是时间序列数据的话)是经济体中所有影响因素的,是完全的而不是仅仅给定的;协整方程表达的虽然也是长期均衡关系,但其描述的仅是协整方程中包含的变量关系,是局部概念,是不完整的,因而方程中的协整系数也不是变量之间关系的真实反映,因为它是不完全的回归系数。协整方程与均衡方程的关系实质上也是某种“一般”与“特殊”的问题,基于协整方程的模型也可以称之为“特殊模型”,而基于均衡方程的模型也可称之为“一般模型”,若非经过均衡方程约化得出的(根据建模目的随意设定的)协整方程,其与均衡方程是有较大偏差的,将这样的协整方程误认为均衡方程,并将其回归系数描述为潜在的真实经济关系,则是对经济现实的扭曲。


  计量经济学模型方法应处理好“一般”与“特殊”的关系,对两者的不当认识与处理,会导致模型分析结论的不可靠性。这里需要注意的是完全实用主义的“特殊”,即不对现实经济做全面的观测,仅根据研究目的设立“特殊模型”,一旦通过检验就到此为止;或仅仅不能通过检验时才逐个增加解释变量,只增加到通过检验为止。这样得到的模型并不具有统计与经济上的双重意义,也使计量经济学的经济分析与科学方法相背离,并渐行渐远。


  五、计量经济学的模型功用:计量经济学局限性的外在体现


  当前经济危机导致的对计量经济学的重新审视,其中最具争议的就是计量经济学的模型功用。本质上来说,计量经济学模型功用的局限是计量经济学局限性的外在表现。作为一门可靠而非精确的科学,计量经济学的科学性是相对的而非绝对的,这决定了计量经济学模型也非万能的,其在理论检验、变量预测和经济结构关系表述上都有不同程度的局限性。


  1.计量经济学模型理论检验功用的局限


  计量经济学通过对理论进行建模并通过检验模型来检验理论,模型设定是检验理论的关键。因为不论建立随机模型还是非随机模型,模型都要比待检验的理论本身更为具体。为了经验检验的足够确切(现实),总是需要对模型添加进去进一步的假设,以使其适用于特定的经济事件和数学方程[15]。如回归方程应该是线性的还是二次型,观测值中可能包含的随机误差成分,方程中可允许的误差是多少,结论的经济意义。而要解决这些问题就要为模型设定假设条件。


  计量经济学的模型是由两部分构成:理论本身和为设定解释理论的方程而附加的假设[16]:(1)构成理论本身的一系列的行为假设,C=F(Y)。(2)关于上述理论表述关系的简化的行为假设:C=a+bY,其中a为正,b介于0和1之间。模型是两个系列假设的统一,经济研究是假定这两部分假设都是为真的,并通过对现实数据的应用来推导出第二个假设方程的系数。那么这里就存在两个问题:


  第一,反驳一个根据理论建立的模型是否就能反驳该理论?答案是否定的。这是因为在计量经济学模型建立的过程中,建模者人为地添加了很多约束假设,这些假设与理论内涵(implication)共同构成了模型的内涵。对基于理论建立的模型的反驳,相当于对理论以及附加假设的并集进行反驳,并不能直接得出对理论的反驳,也不能证实理论为错。除非能够保证建模过程中附加的假设是绝对正确的,才能保证:反驳模型=反驳理论,但现实中有时甚至难以保证附加假设的正确性,致使这一条件很难得到满足。因此,试图通过反驳一个根据理论建立的模型来反驳理论是徒劳的。(1)


  第二,检验根据一系列理论建立起来的模型是否就能检验理论?答案也是否定的,这里存在一个逻辑上的不一致性。模型是两个或两个以上理论假设的统一,这意味着逻辑上的不对称性,即一旦理论的预测被证伪,我们不知道究竟是理论本身的基本假设出现问题,即第一部分,还是附加假设出现问题,即第二部分。这挑战了建立模型就是为了检验理论的观点。如果想通过模型的经验检验证明理论是错误的,那么就要证明该理论的所有可能模型都是错误的,这和波普所说的需要“证实所有的天鹅都是白色的”[17]很类似,在逻辑上是不可能的。由于对理论建模有无数种方式,排除误差的可能性,只有每个理论建立的模型预测都导致至少一个错误结论的时候,才能证明理论本身至少一个基本假设是错误的。但由于每个特定模型都有特定的附加假设,只有通过证明所有这些附加假设都是正确的,排除第二部分是错误的可能性,才能得出第一部分,也就是理论的基本假设是错误的,但这在现实中是难以做到的。从这个角度来说,通过对理论建立模型,进而对模型经验检验来对理论进行证伪是很困难的。


  2.计量经济学模型变量预测功用的局限


  计量经济学模型方法缘起自宏观经济的短期预测,在计量经济学的发展历程中,也不乏成功预测的例子。预测成为计量经济学模型的一个主要功用,也是判定模型的一个重要标准。但随着经济现实的复杂化,计量经济学预测的精确性受到严重质疑,显示出其模型预测功用一定程度上的局限。


  首先,从其学科方法论基础上来看,计量经济学学科并非如劳森所说的寻找覆盖法则(事物之间恒定联系的规律性)的科学。计量经济学也难以达到卡特赖特所期望的构建封闭系统进而测度精确覆盖性法则的层次。而成功预测的前提与基础就是对“覆盖性的法则”的探寻,即对潜在的社会—经济结构、选择结构以及因果机制的精确法则机制的探索。计量经济学只是对经济现实中潜在的、不明显的规律的可能表达,而且即便是“不明显的规律”,也是基于样本的。预测是对于样本外的、尚未发生的经济活动进行的,这种基于样本内知识进行的样本外预测,本身就具有不确定性;同时伴随着经济现实的复杂、多变以及很多不可知因素,预测的非精确性难以避免。


  其次,从学科性质上来看,计量经济学模型方法也不是探寻因果机制的精确科学方法。计量经济学是数学、统计学与经济学的结合,其对因果机制的探寻在其模型方法中是以概率或分布函数体现出来的。概率分布假定是统计分析的前提与基础,然而现实经济数据很难严格服从正态分布,因而基于正态分布假定估计出的结构关系并不是全然精确的。同时计量经济学可控实验的缺失,更加剧这种不可靠性。建立在不可靠因果机制基础上的变量关系,难免会在一定程度上影响其预测结论的准确性。


  最后,从现实经验数据的非稳定性与数据生成过程的非同质性上来看,一方面,经验数据难以满足统计分析的前提假定要求,进而损害其统计充分性;另一方面,结构参数的不稳定性又进一步加剧了预测的不精确性。正是基于这一点,任何经济数学模型,包括计量经济学中用于短期预测的VAR类模型,(1)对于这类预测问题,都是无能为力的。这也充分说明了计量经济学模型在预测上的局限性。那么计量经济学中用于预测的VAR类(2)模型能否进行精确的宏观经济预测?从2008年金融危机对于学术界的突发性来看,答案可能是否定的。VAR类模型是数据导向性较强、经济理论导向性相对较弱的建模范式,从其模型设定层面来看,该类模型较为适用于自由经济体系。但经济现实中由于各经济体政府干预程度不同,致使模型的“外生约束”因国家、政体和时期的不同而具有较大的差异性,导致VAR类模型的适用程度各异。同时,VAR类模型的线性假定前提也一定程度上损害了其预测的精确性,因为随着时间序列时期的增加,线性假定所决定的VAR类模型走向与经济现实发展趋势的偏差会逐渐增大。这都局限了VAR类模型的预测功用。


  3.计量经济学模型经济结构表述功用的局限


  传统计量经济学观是以逻辑实证主义为其方法论基础的,认为经济理论是先验的真实,而计量经济学模型的作用就是为先验理论决定的模型结构参数估值,(3)这也是计量经济学结构表述功用的体现。现代计量经济学的结构表述则侧重于计量经济学的结构观,并以此为基础来看待计量经济学模型的作用与局限,本文这里主要探讨的是后者。


  计量经济学的结构观是结构经验主义在计量经济学中的体现,源起自Fraassen的结构方法,结构经验主义认为科学描述的是结构而非其领域的内容。计量经济学语境下,结构是“对经济机制进行直接特征描述的不变特征集”[18],而这种不变特征是由参数表述的。经验模型中,结构观用于表述经济“框架”下的一种恒久性观点。要求在样本信息集扩大、时期延展、政策体系变更以及新信息源增加的情况下,结构参数都保持稳定不变。因此,结构的理念是就稳定性与不变性来理解的,在这一结构观下,计量经济学的经济结构表述局限就较为明显。


  首先,经验观测数据难以满足结构模型所界定的结构参数的时间稳定性(样本时期延长)、体系稳定性(经济体系变更)以及样本稳定性(样本信息集扩充)。对于时间稳定性与体系稳定性问题,界内的探讨已经较为成熟,早在1939年凯恩斯就提出了计量经济学模型结构参数的非稳定性问题,这也正是“卢卡斯批判”所揭示的思想。对于样本稳定性问题,这里要说明的是,若要在样本信息集变更的情况下保证参数的稳定性,则对观测数据具有较高的要求,即样本数据要满足数据生成过程的同质性,因为统计分析是基于“平均”理念的。由于现实经验数据很难保证观测数据生成过程的同质,因此,对于结构参数保持不变的三个前提条件,现实应用研究中都难以得到满足。


  其次,计量经济学的经验模型难以保证与现实世界的一致性,因而很难对经济结构进行准确的表述。计量经济学建模过程中,从理论模型(可能机制)到可估计的经验模型的转化过程也是非正式的。计量经济学经验模型假定数据必须是由某些基本的概率分布所产生的,这样才能对数据生成过程进行进一步的分析,在模型中用数据来对现实进行表述。上文已指出,现实中的经验数据很难完全满足模型所假定的概率分布条件,这样就难以避免其所带来的经验模型统计分析充分性上的局限,进而造成计量经济学模型方法估计结果与经济现实的差距。


  最后,计量经济学模型难以对DGP过程进行结构性的表述。约化理论与一般到特殊的方法同样面临着真实数据生成过程的不可知性问题。更进一步,约化理论本身也很难解释清楚经验模型如何在具体层面影射可观测到部分的数据生成过程,而转化、边缘化和因式分解后得到经验模型的过程也忽略掉了一些变量,难以表述完整、可观测部分的数据生成过程,发生了进一步的数据损失。另一方面,从认识论上来说,DGP过程本身就是不可知的,其复杂性与不可知性使计量经济学经验模型对真实、完整的数据生成过程的表述成为不可能,而仅能对DGP中可观测、可度量部分进行局部表述,也就是局部DGP(LDGP)。可见,计量经济学的结构表述难以达到精确、完全的层次,其经验模型对经济结构的表述所能达到的最高层次就是类似,这也是计量经济学模型难以避免的内在局限性。


  六、结论与未来研究空间展望


  计量经济学是一门相对的科学,其概率统计学科基础以及其表述语言、模型方法论基础决定了其优势所在也是其局限所在:(1)计量经济学经验实证模型语言经济学表述的非充分性,体现在其对价值判断理念计量化及其对自然语言取代问题方面。(2)计量经济学度量精确数量关系的局限性,体现在计量经济学基于概率的随机检验的不对称性与非确定性,概率约化方法中推断的非确定性以及建立统计充分性的难度层面。(3)模型过程方法论基础不平衡的局限,体现为其对归纳与演绎、检验与发现、“特殊”与“一般”三个关系处理的不平衡。(4)计量经济学模型理论检验、变量预测和结构关系描述功能上的局限,其实质是计量经济学的非精确性、科学的相对性的外在表现。


  本文对计量经济学局限性的思考是计量经济学学科性质基础研究的一部分,关于计量经济学的基础研究涉及到其理论基础、学科基础和方法论基础等,未来在以下几个方面还应进一步延展与纵深:


  第一,现代计量经济学理论与研究方法层面。纵观计量经济学的发展历程,每次理论与方法的范式革命都源起于其对当时经济危机处理的无力,如20世纪70年代的石油危机引发的计量经济学反思。鉴于当前的经济危机仍在进行中,学术界关于现代计量经济学的争论仍在继续,也就意味着未来一个阶段计量经济学理论与研究方法可能处于范式变革阶段,如何获得计量经济学理论与应用研究的实质性进步是个重要课题。


  第二,计量经济学方法论基础研究层面。计量经济学以科学化经济研究为目标,其每一阶段的发展都体现了科学哲学界定的科学标准,现代科学哲学的多样化发展、科学标准的多元化表现,也必然会为计量经济学的发展走向提供多维空间。


  第三,关于计量经济学自身研究方法体系方面。计量经济学目前的研究方法体系庞杂,以教科书研究范式为主其他各种方法体系为辅,各有优势与弊端。如何综合当前计量经济学方法体系中的各个派系,发展出一个科学、系统,能最大程度发挥计量经济学科学性的研究范式是未来的研究目标。


  第四,关于计量经济学概率统计基础的研究。计量经济学研究方法体系以概率统计为其数理基础,如何正确、合宜地应用统计与概率方法,最大限度提高计量经济学应用研究的科学性与精确性,是计量经济学与数学两个领域应共同探讨的问题。


  第五,关于现代计量经济学的经济学基础方面的研究。由于现代经济学统一理论体系缺位,很难为现代计量经济学提供一个一致的、系统的经济学基础。当前计量经济学的建模范式虽几经转换却仍处于探寻阶段,加之计量经济学本身的非精确性与局限性,必然导致当前计量经济学应用研究中存在一些问题。如何为计量经济学建立一致的、系统的经济学理论框架,不仅仅是计量经济学理论界要解决的问题,也是经济学理论界要解决的问题。