跳转至

Chap 3 二维随机变量

阅读信息

759 字  4 分钟  本页总访问量 加载中...

二维随机变量

E 是随机试验,样本空间为 S={e}。设 X=X(e), Y=Y(e) 为 S 上的随机变量,则 (X,Y) 称为二维随机变量。

二维随机变量分为离散型二维随机变量和连续型二维随机变量

离散型的分布

联合分布

用二维表表示离散型二维随机变量的联合分布,其中第 i 行第 j 列表示 \(P\{X=x_i,Y=y_i\}\)

\[ \begin{array}{c|ccc} & y_1=0 & y_2=1 & y_3=2 \\ \hline x_1=0 & 0.1 & 0.2 & 0.1 \\ x_2=1 & 0.2 & 0.3 & 0.1 \\ \end{array} \]

边际分布

边际分布即二维变量中其中一维固定的概率,相当于全概率公式。

固定 X 变量,即联合分布中一行的概率相加;固定 Y 变量,即联合分布中一列的概率相加。

\[P\{X=x_i\}=P\{X=x_i,\bigcup_{j=1}^{\infty}(Y=y_i)\}=\sum_{j=1}^{\infty}p_{ij}\triangleq p_{i\cdot}\]

二维表表示时,在最下面和最右边各加一行、一列,表示边际分布。

条件分布

条件分布即 X 和 Y 满足一定条件下,X 或 Y 取某个值的概率。

将 X 和 Y 的条件转化为 X 和 Y 分别的取值,在联合分布中查找相加。

联合分布函数

记二维分布函数为 \(F(x,y)\)

\[F(x,y)=P\{(X\le x)\cap (Y\le y)\}\triangleq P\{X\le x,Y\le y\}\]

类似二维前缀和,可用分布函数计算 X 和 Y 在某个区间的概率:

\[P\{x_1\le X\le x_2,y_1\le Y \le y_2\}=F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\]

边际分布函数:

\[F_X(x)=P\{X\le x,Y\le +\infty\}\triangleq F(x,+\infty)\]
\[F_Y(y)=P\{X\le +\infty,Y\le y\}\triangleq F(+\infty,y)\]

条件分布函数:

\[F_{X|Y}(x|y)=P(X\le x|Y=y)\]
\[F_{Y|X}(y|x)=P(Y\le y|X=x)\]

因为分母中含 \(P\{Y=y\}\),只能对离散型的 Y 才能直接计算。
对于连续型变量 Y,分母定义为长度为 \(\varepsilon\) 的邻域的概率。

连续型的联合密度函数

若存在二元非负函数 \(f(x,y)\) ,使得对任意实数 \(x,y\)\(F(x,y)=\int_{-\infty}^x\int_{-\infty}^y f(u,v)\mathrm{d}u\mathrm{d}v\),则称 \(f(x,y)\) 为二维连续型随机变量的的联合概率密度函数。

联合密度函数的性质:

  • \(f(x, y) \geq 0\);
  • \(\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, y) \mathrm{d}x \mathrm{d}y = F(+\infty, +\infty) = 1\);
  • \(f(x, y)\) 的连续点处有
\[ \frac{\partial^2 F(x, y)}{\partial x \partial y} = f(x, y); \]
  • \((X, Y)\) 落入 \(xOy\) 平面任一区域 \(D\) 的概率为
\[ P\{(X, Y) \in D\} = \iint_D f(x, y) \mathrm{d}x \mathrm{d}y. \]

边际概率密度函数:

可理解成平行于坐标轴的箭头,看穿过非零区域的部分。

\[f_X(x)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}y\]
\[f_Y(y)=\int_{-\infty}^{+\infty}f(x,y)\mathrm{d}x\]

条件概率密度函数:

\[f_{Y|X}(y|x)=\frac{f(x,y)}{f_X(x)},\quad -\infty<y<+\infty\]

几种连续型的概率分布

二元均匀分布

设二维随机变量 \((X,Y)\) 在二维有界区域 \(D\) 上取值,且具有联合密度函数如下,则称 \((X,Y)\) 服从 \(D\) 上均匀分布。(其中 \(S\) 表示面积。)

\[ f(x,y)=\begin{cases} \frac{1}{S(D)}, &(x,y)\in D \\ 0, &\text{other} \end{cases} \]

\(D_1\)\(D\) 的一个子集,则概率为:

\[P\{(X,Y)\in D_1\}=\iint_{D_1}f(x,y)\mathrm{d}x\mathrm{d}y=\frac{S(D_1)}{S(D)}\]

\((X,Y)\) 是二维均匀分布,\(X\)\(Y\) 的边际密度函数不一定均为均匀分布。(可能沿 x 或 y 方向的长度不同。)

给定均匀分布的区间,求联合分布函数:\(F(x_0,y_0)\) 表示的是以当前点 \((x_0, y_0)\) 为右上角、向左下方无限延伸的矩形覆盖的联合密度函数的面积分。用直线 \(x=x_0\)\(y=y_0\) 确定矩形和均匀分布区间的交点,按交点在不同位置分类讨论。

示例 求联合分布函数

\(D\) 是 x=0, y=0, y=x+1 围成的区域,在 \(D\) 上均匀分布,求 \(F(x,y)\)

按如下分类:

\[ \begin{cases} x\le-1, y\le 0; \\ -1\le x \le 0,0<y<x+1; \\ -1\le x<0, 0<y<1; \\ x>0, 0<y<1; \\ x>0, y>1 \end{cases} \]

二元正态分布

设二维随机变量 \((X,Y)\) 具有联合密度函数如下,则称 \((X,Y)\) 服从 \(D\) 上二维正态分布,记为 \((X,Y)\sim N(\mu_1, \mu_2; \sigma_1^2, \sigma_2^2; \rho)\)

\[ f(x, y) = \frac{1}{2\pi \sigma_1 \sigma_2 \sqrt{1 - \rho^2}} \exp\left\{ -\frac{1}{2(1 - \rho^2)} \left[ \frac{(x - \mu_1)^2}{\sigma_1^2} -2\rho \frac{(x - \mu_1)(y - \mu_2)}{\sigma_1 \sigma_2} +\frac{(y - \mu_2)^2}{\sigma_2^2} \right] \right\} \]

二元正态分布的边际分布函数、条件分布函数也是正态分布(正态分布的封闭性)。

连续型的独立性

若满足以下条件,称 \(X\)\(Y\) 相互独立:

\[ \begin{align*}\forall (x,y),\quad &P\{X\le x, Y\le y\}=P\{X\le x\}\cdot P\{Y\le y\},\,\\[0.5em] &\text{i.e.}\,F(x,y)=F_X(x)F_Y(y)\end{align*} \]

或用密度函数表示(“几乎处处成立”表示除面积为零的区域外处处成立):

\[f(x,y)=f_X(x)\cdot f_Y(y)\quad \text{(holds a.e.)}\]

\((X,Y)\) 为二维正态变量, \(X\)\(Y\) 相互独立的充要条件为 \(\rho=0\)

二维连续型随机变量 \(X, Y\) 相互独立的充要条件是 \(X, Y\) 的联合密度函数 \(f(x, y)\) 几乎处处可写成 \(x\) 的函数 \(m(x)\)\(y\) 的函数 \(n(y)\) 的乘积,即 \(f(x, y) = m(x) \cdot n(y)\)

多元随机变量函数的分布

Z=X+Y

离散型:

\[P\{Z=z_k\}=\sum_{i=1}^{+\infty}P\{X=x_i, Y=z_k-x_i\}\]

连续型:

\[F_Z(z)=\iint_{x+y\le z}f(x, y)\mathrm{d}x\mathrm{d}y=\int_{-\infty}^{+\infty}\mathrm{d}x\int_{-\infty}^{z-x}f(x, y)\mathrm{d}y\]

作积分变量变换 \(u = x, \, v = x + y\) 可得\(F_Z(z) = \int_{-\infty}^{z} \mathrm{d}v \int_{-\infty}^{+\infty} f(u, v - u) \mathrm{d}u,\),从而:

\[ f_Z(z) = \int_{-\infty}^{+\infty} f(x, z - x) \mathrm{d}x=\int_{-\infty}^{+\infty} f(z-y, y) \mathrm{d}y \]

esp. 当 \(X, Y\) 相互独立时,可以写成:

\[f_Z(z)=\int_{-\infty}^{+\infty} f_X(x)\cdot f_Y(z-x)\mathrm{d}x=\int_{-\infty}^{+\infty} f_X(z-y)\cdot f_Y(y)\mathrm{d}y\]

特殊分布的性质:

  1. \(n\) 个相互独立的服从泊松分布的随机变量的和仍服从泊松分布,其参数为 \(n\) 个分布的参数之和。
  2. \(n\) 个相互独立的正态变量之和仍为正态变量,即若 \(X_1, X_2,\cdots ,X_n\) 相互独立,且 \(X_i\sim N(\mu_i, \sigma_i^2)\),则 \(\sum_{i=1}^n X_i\sim N(\sum_{i=1}^n \mu_i, \sum_{i=1}^n\sigma_i^2)\)

M=max(X,Y)

由 max 的定义可得:

\[\begin{align*}F_M(t)&=P\{\max\{X,Y\}\le t\}=P\{X\le t, Y\le t\} \\ &=F(t,t)\end{align*}\]

esp. 当 \(X, Y\) 相互独立时,可以写成 \(F_M(t)=F_X(t)F_Y(t)\)

\(M=\max(X_1,\cdots ,X_n)\),则:

\[F_M(t)=\prod_{i=1}^nF_i(t)\]

N=min(X,Y)

由 min 的定义可得:

\[\begin{align*}F_N(t)&=P\{\min\{X,Y\}\le t\}=P\{(X\le t)\,\text{or}\, (Y\le t)\}\\&=F_X(t)+F_Y(t)-F(t,t)\end{align*}\]

\[\begin{align*}F_N(t)&=P\{\min\{X,Y\}\le t\}=1-P\{\min\{X,Y\}>t\}\\&=1-[1-F_X(t)][1-F_Y(t)]\end{align*}\]

\(N=\min(X_1,\cdots ,X_n)\),则:

\[F_N(t)=1-\prod_{i=1}^n[1-F_i(t)]\]