概率论基础 - 14 - 指数分布

本文最后更新于:2021年12月11日 上午

本文记录指数分布。

简介

在概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。 这是伽马分布的一个特殊情况。 它是几何分布的连续模拟,它具有无记忆的关键性质。 除了用于分析泊松过程外,还可以在其他各种环境中找到。

定义

  • 指数分布自变量$x$,其概率密度函数为:
$$ f(x)=\left\{\begin{array}{ll}\lambda e^{-\lambda x} & x>0 \\ 0 & x \leq 0\end{array}\right. $$
  • 其中$λ > 0$是分布的一个参数,常被称为率参数(rate parameter),即每单位时间内发生某事件的次数。指数分布的区间是$[0,∞)$。 如果一个随机变量X呈指数分布,则可以写作:$X \sim E(λ)$或$Exp(\lambda)$。
  • 累积概率密度函数:

$$
P{X \leq x}=F(x)=1-e^{-\frac{x}{\theta}}, x>0
$$

期望

$$ \begin{aligned} f(x) &=\lambda e^{-\lambda x} \\ E(x) &=\int_{-\infty}^{+\infty} x f(x) d(x) \\ &=\int_{0}^{+\infty} x \lambda e^{-\lambda x} d x \\ &=-\int_{0}^{+\infty} x d e^{-\lambda x} \\ &=-\left(\left.x \cdot e^{-\lambda x}\right|_{0} ^{+\infty}-\int_{0}^{+\infty} e^{-\lambda x} d x\right) \\ &= f-\frac{1}{x} \int_{0}^{+\infty} d e^{-\lambda x}\\&=\frac{1}{\lambda}\end{aligned} $$

方差

$$ \begin{aligned} E\left(x^{2}\right) &=\int_{-\infty}^{+\infty} x^{2} f(x) d x \\ &=\int_{0}^{+\infty} \lambda x^{2} e^{-\lambda x} d x \\ &=-\int_{0}^{+\infty} x^{2} d e^{-\lambda x} \\ &=-\left(\left.x^{2} e^{-\lambda x}\right|_{0} ^{+\infty}-\int_{0}^{+\infty} 2 x e^{-\lambda x} d x\right) \\ &=\frac{2}{\lambda} \cdot \int_{0}^{+\infty} \lambda x e^{-\lambda x} d x \\ &=\frac{2}{\lambda} \cdot E(x) \\ &=\frac{1}{\lambda}\end{aligned} $$ $$ \begin{aligned} Var(x) &=E(x)^{2}-(E(x))^{2} \\ &=\frac{2}{\lambda^{2}}-\frac{1}{\lambda^{2}} \\ &=\frac{1}{\lambda^{2}} \end{aligned} $$

指数分布的来源

指数分布表示事件发生两次的间隔的概率分布,我们利用泊松分布的一些结论来推导

  • 事件单位时间发生的期望次数为$\lambda$,两次事件发生的时间间隔随机变量用$Y$表示
  • 那么两次事件发生的时间间隔大于$t$的概率等于时间$t$内没有发生事件的概率,而后者的概率可以用泊松分布刻画:

$$
P(Y>t)=P(X=0, t)=\frac{(\lambda t)^{0}}{0 !} e^{-\lambda t}=e^{-\lambda t}, \quad t \geq 0
$$

  • 进而有:

$$
P(Y \leq t)=1-P(Y>t)=1-e^{-\lambda t}
$$

  • $ Y $ 的累积分布函数:
$$ F(y)=P(Y \leq y)=\left\{\begin{array}{ll} 1-e^{-\lambda y}, & y \geq 0 \\ 0, & y<0 \end{array}\right. $$
  • 求导得到概率密度函数:
$$ p(y)=\left\{\begin{array}{ll} \lambda e^{-\lambda y}, & y \geq 0 \\ 0, & y<0 \end{array}\right. $$
  • 至此得到了指数分布概率密度函数

无记忆性

  • 指数函数的一个重要特征是无记忆性(Memoryless Property, 又称遗失记忆性)

  • 这表示如果一个随机变量呈指数分布,当 $ s, t \geq 0 $ 时有:

$$
P(T>s+t \mid T>t)=P(T>s)
$$

举例:如果T是某一元件的寿命,已知元件使用了t小时,它总共使用至少 $ s+t $ 小时的条件概率,与从开始使用时算起它使用至少s小时的概率相等。

参考资料