欢迎您访问 最编程 本站为您分享编程语言代码,编程技术文章!
您现在的位置是: 首页

指数分布族

最编程 2024-04-14 08:39:41
...

从标题上看,是“指数分布族(exponential family)”,不是“指数分布(exponential distribution)”,这是两个不同的概念,不要弄混了。指数分布族在上世纪30年代中期被提出,在概率论和统计学中,它是一些有着特殊形式的概率分布的集合,包括许多常用的分布,如正态分布、指数分布、伯努利分布、泊松分布、gamma分布、beta分布等等。指数分布族为很多重要而常用的概率分布提供了统一框架,这种一般性有助于表达的方便和从更大的宏观尺度上理解这些分布。

下面我们用一个重要分布的例子来说明下指数分布族。假设有一个正态分布,均值为0,服从 XN(0,σ2) ,则其概率密度函数PDF为:

f(x|σ)=1σ2πex22σ2

这个概率密度函数由一个参数 σ 来定义。我们可以把该式子作如下变形:

f(x|σ)=12πelogσex22σ2=12πex22σ2logσ=12πe12σ2x2logσ

令: h(x)=12π η(σ)=12σ2 T(x)=x2 A(σ)=logσ ;则上式可以用如下的形式表达:

f(x|σ)=h(x)exp(η(σ)T(x)A(σ))

我们把参数一般化为 θ ,则上式为:

f(x|θ)=h(x)exp(η(θ)T(x)A(θ))

这就是指数分布族的概率密度函数PDF或概率质量函数PMF的通用表达式框架。

分布函数框架中的 h(x) , η(θ) , T(x) A(θ) 并不是任意定义的,每一部分都有其特殊的意义。
θ 自然参数(natural parameter),通常是一个实数;
h(x) 底层观测值(underlying measure)
T(x) 充分统计量(sufficient statistic)
A(θ) 被称为对数规则化(log normalizer)
为什么被称为对数规则化,和对数有什么关系?我们把上式作以下变形: