stata：数据包络分析（DEA）简明教程

最编程 2024-04-19 21:07:47

...

数据包络分析（DEA）是是由美国著名运筹学家 A.Charnes（查恩斯）、W.W.Cooper（库铂）、E.Rhodes（罗兹）于 1978 年首先提出，在相对效率评价概念基础上发展起来的一种非参数检验方法。此文章主要介绍如何在stata中进行DEA分析以及进行boostrap检验，用到的命令为tenonradial，teradialbc等。需要说明的是，尽管此命令的运算速度与矩阵的最大处理量要优于dea命令，但是其仍有一些限制。

DEA模型简介

技术效率的概念

在数据包络分析中，技术效率是指一个生产单元（DMU）的生产水平达到该行业技术水平的程度。技术效率可以从投入和产出两个角度来衡量，在投入既定的情况下，技术效率由产出最大化的程度来衡量。在产出既定的情况下，技术效率由投入最小化的程度来衡量。当然，在计算TFP的过程中，一般都是投入既定的。
下面举一个一种投入一种产出时的例子，来帮助我们理解技术效率的概念。

单位	$x$ （投入）	$y$ （产出）	$y / x$	$y / x$ (标准化)
A	2	1	0.5	0.625
B	3	2	0.667	0.533
C	4	3	0.75	0.938
D	5	4	0.8	1.00
E	5	2	0.4	0.5

在此表中， $y / x$ 反应各个生产单元技术效率的高低， $y / x$ (标准化)是将各单元的 $y / x$ 除以其中的最大值。这样就是为了更好的比较这一数值。
当涉及多个产出时，就会对各个投入与产出赋予一定的权重，然后分别加权，计算产出投入比。如：
$v = v_1x_1+v_2x_2+...+v_nx_n$
$u=u_1y_1+u_2y_2+...+u_ny_n$
则产出投入比为 $u / v$
数据包络分析就是在讨论如何通过数据本身来获得权重，从而计算各个DMU的技术效率。

径向距离模型

此命令径向效率的度量方法采用的是Debreu–Farrell(Debreu 1951; Farrell 1957)方法。假设有 $k$ 个 $D M U$ 。对于 $DMU_K$ ，有 $N$ 种投入，记为 $x_k =（x_{k1},...,x_{kN}) \in R^N$ ,有 $M$ 种产出，记为 $y_k =（x_{k1},...,x_{kM}) \in R^M$ 。然后我们假设在技术条件 $T$ 下产出 $y$ 由投入 $x$ 产出，数学表达为：
$T = \{(x,y):y\ are\ producible\ by\ x\}$
那么在科技 $T$ 下，生产可能集表示为：
$\{y:(x,y) \in T\}$
投入的需求集表示为：
$\{x:(x,y) \in T\}$
以生产可能集为例，技术效率就表示为，某个给定数据点与生产可能集边界的距离。若以DEA模型来测量此种技术效率从，则对于 $k$ 个 $D M U$ ，每个 $D M U$ 有 $N$ 种投入， $M$ 种产出的数据集来说。Debreu–Farrell(Debreu 1951; Farrell 1957)的以产出为导向的估计方法，可以通过下述线性规的方程式来表示，对于每一个数据点 $k (k = 1, 2, 3 . . . K)$
$F_k^o(y_k,x_k,y,x|CRS)=max\theta \\ s.t. \sum_{k=1}^Kz_ky_{km} \geq y_{km}\theta_m,m=1,...,M \\ \sum_{k=1}^Kz_kx_{kn} \leq x_{kn}\theta_n,n=1,...,N \\ z_k \geq 0$
其中 $y$ 是一个 $K\times M$ 的产出矩阵， $x$ 是一个 $K\times N$ 的投入矩阵。估计 $P (x)$ 是最小

上一篇：准备数学建模 23 - 数据包络分析

下一篇：常用数据分析方法

stata：数据包络分析（DEA）简明教程

DEA模型简介

技术效率的概念

径向距离模型

数据包络分析（DEA）

数据包络分析（DEA）详解（基于第八届宁夏省级比赛）

数学建模常用模型 10：数据包络（DEA）分析（投入产出法）

数据包络分析（DEA）

数学建模中的常用模型 (X)：数据包络（DEA）分析法

数据包络分析（DEA）说明

数学建模 - 评估模型 - 数据包络分析 DEA "效率分析

用 R 语言实现随机前沿分析 SFA、数据包络分析 DEA、*弃置水文学 FDH 和 BOOTSTRAP 方法

数据包络分析 DEA

数据包络分析教程