欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

stata:数据包络分析(DEA)简明教程

最编程 2024-04-19 21:07:47
...

数据包络分析(DEA)是是由美国著名运筹学家 A.Charnes(查恩斯)、W.W.Cooper(库铂)、E.Rhodes(罗兹)于 1978 年首先提出,在相对效率评价概念基础上发展起来的一种非参数检验方法。此文章主要介绍如何在stata中进行DEA分析以及进行boostrap检验,用到的命令为tenonradialteradialbc等。需要说明的是,尽管此命令的运算速度与矩阵的最大处理量要优于dea命令,但是其仍有一些限制。

DEA模型简介

技术效率的概念

在数据包络分析中,技术效率是指一个生产单元(DMU)的生产水平达到该行业技术水平的程度。技术效率可以从投入和产出两个角度来衡量,在投入既定的情况下,技术效率由产出最大化的程度来衡量。在产出既定的情况下,技术效率由投入最小化的程度来衡量。当然,在计算TFP的过程中,一般都是投入既定的。
下面举一个一种投入一种产出时的例子,来帮助我们理解技术效率的概念。

单位 x x x(投入) y y y(产出) y / x y/x y/x y / x y/x y/x(标准化)
A 2 1 0.5 0.625
B 3 2 0.667 0.533
C 4 3 0.75 0.938
D 5 4 0.8 1.00
E 5 2 0.4 0.5

在此表中, y / x y/x y/x反应各个生产单元技术效率的高低, y / x y/x y/x(标准化)是将各单元的 y / x y/x y/x除以其中的最大值。这样就是为了更好的比较这一数值。
当涉及多个产出时,就会对各个投入与产出赋予一定的权重,然后分别加权,计算产出投入比。如:
v = v 1 x 1 + v 2 x 2 + . . . + v n x n v = v_1x_1+v_2x_2+...+v_nx_n v=v1x1+v2x2+...+vnxn
u = u 1 y 1 + u 2 y 2 + . . . + u n y n u=u_1y_1+u_2y_2+...+u_ny_n u=u1y1+u2y2+...+unyn
则产出投入比为 u / v u/v u/v
数据包络分析就是在讨论如何通过数据本身来获得权重,从而计算各个DMU的技术效率。

径向距离模型

此命令径向效率的度量方法采用的是Debreu–Farrell(Debreu 1951; Farrell 1957)方法。假设有 k k k D M U DMU DMU。对于 D M U K DMU_K DMUK,有 N N N种投入,记为 x k = ( x k 1 , . . . , x k N ) ∈ R N x_k =(x_{k1},...,x_{kN}) \in R^N xk=xk1,...,xkN)RN,有 M M M种产出,记为 y k = ( x k 1 , . . . , x k M ) ∈ R M y_k =(x_{k1},...,x_{kM}) \in R^M yk=xk1,...,xkM)RM。然后我们假设在技术条件 T T T下产出 y y y由投入 x x x产出,数学表达为:
T = { ( x , y ) : y   a r e   p r o d u c i b l e   b y   x } T = \{(x,y):y\ are\ producible\ by\ x\} T={(x,y):y are producible by x}
那么在科技 T T T下,生产可能集表示为:
P ( x ) = { y : ( x , y ) ∈ T } P(x) = \{y:(x,y) \in T\} P(x)={y:(x,y)T}
投入的需求集表示为:
P ( y ) = { x : ( x , y ) ∈ T } P(y) = \{x:(x,y) \in T\} P(y)={x:(x,y)T}
以生产可能集为例,技术效率就表示为,某个给定数据点与生产可能集边界的距离。若以DEA模型来测量此种技术效率从,则对于 k k k D M U DMU DMU,每个 D M U DMU DMU N N N种投入, M M M种产出的数据集来说。Debreu–Farrell(Debreu 1951; Farrell 1957)的以产出为导向的估计方法,可以通过下述线性规的方程式来表示,对于每一个数据点 k ( k = 1 , 2 , 3... K ) k(k= 1,2,3...K) k(k=1,2,3...K)
F k o ( y k , x k , y , x ∣ C R S ) = m a x θ s . t . ∑ k = 1 K z k y k m ≥ y k m θ m , m = 1 , . . . , M ∑ k = 1 K z k x k n ≤ x k n θ n , n = 1 , . . . , N z k ≥ 0 F_k^o(y_k,x_k,y,x|CRS)=max\theta \\ s.t. \sum_{k=1}^Kz_ky_{km} \geq y_{km}\theta_m,m=1,...,M \\ \sum_{k=1}^Kz_kx_{kn} \leq x_{kn}\theta_n,n=1,...,N \\ z_k \geq 0 Fko(yk,xk,y,xCRS)=maxθs.t.k=1Kzkykmykmθm,m=1,...,Mk=1Kzkxknxknθn,n=1,...,Nzk0
其中 y y y是一个 K × M K\times M K×M的产出矩阵, x x x是一个 K × N K\times N K×N的投入矩阵。估计 P ( x ) P(x) P(x)是最小