指数分布族

最编程 2024-04-14 08:39:41

...

从标题上看，是“指数分布族(exponential family)”，不是“指数分布(exponential distribution)”，这是两个不同的概念，不要弄混了。指数分布族在上世纪30年代中期被提出，在概率论和统计学中，它是一些有着特殊形式的概率分布的集合，包括许多常用的分布，如正态分布、指数分布、伯努利分布、泊松分布、gamma分布、beta分布等等。指数分布族为很多重要而常用的概率分布提供了统一框架，这种一般性有助于表达的方便和从更大的宏观尺度上理解这些分布。

下面我们用一个重要分布的例子来说明下指数分布族。假设有一个正态分布，均值为0，服从 X−N(0,σ2) ，则其概率密度函数PDF为：

f (x | σ) = 1 σ 2 π - - \sqrt e - x 2 2 σ 2

这个概率密度函数由一个参数 σ 来定义。我们可以把该式子作如下变形：

f (x | σ) = 1 2 π - - \sqrt e - l o g σ e - x 2 2 σ 2 = 1 2 π - - \sqrt e - x 2 2 σ 2 - l o g σ = 1 2 π - - \sqrt e - 1 2 σ 2 x 2 - l o g σ

令： h(x)=12π√ ， η(σ)=−12σ2 ， T(x)=x2 ， A(σ)=logσ ；则上式可以用如下的形式表达：

f (x | σ) = h (x) e x p (η (σ) T (x) - A (σ))

我们把参数一般化为 θ ，则上式为：

f (x | θ) = h (x) e x p (η (θ) T (x) - A (θ))

这就是指数分布族的概率密度函数PDF或概率质量函数PMF的通用表达式框架。

分布函数框架中的 h(x) , η(θ) , T(x) 和 A(θ) 并不是任意定义的，每一部分都有其特殊的意义。
θ 是自然参数(natural parameter)，通常是一个实数；
h(x) 是底层观测值（underlying measure）；
T(x) 是充分统计量（sufficient statistic）；
A(θ) 被称为对数规则化（log normalizer）。
为什么被称为对数规则化，和对数有什么关系？我们把上式作以下变形：

f (x | θ) = 上一篇： 指数分布族（指数族）和广义线性模型 GLM 下一篇： 指数分布的期望和方差的推导

指数分布族

龙族

硼族元素

概率论中的常见分布摘要和 python scipy 库的使用：两点分布、二项分布、几何分布、泊松分布、均匀分布、指数分布和正态分布

泊松分布和指数分布

统计学 03：泊松分布和指数分布

概率论基础 - 14 - 指数分布

机器学习小组知识 16：指数分布（指数分布）

人类理解伯努利分布、二项式分布、泊松分布和指数分布之间有什么关系？

统计学基础 - 常见概率分布（二项分布、泊松分布、指数分布、正态分布）

指数族分布简介 / 求指数族分布的 E(a(Y)) 和 D(a(Y))