除了高等数学、线性代数和补充的部分,剩下的也就是概率统计了。三门课是大学数学要掌握的,也是以后学习其他东西的基础,更是考研数学1的内容。
  概率统计相比前两门,知识点比较杂,公式也比较多,主要是能看懂题意,再联系起公式定理才能很好的解决问题,所以需要好好的总结一番。

一、随机事件与概率

1. 事件的关系与运算

  ①包含 若事件A发生必然导致事件B发生,则称$B$事件包含$A$事件,记为$A \subset B$
  ②相等 若$A \subset B$ 且$B \subset A$,则称$A$与$B$相等,记为$A = B$
  ③和(并) 事件$A, \, B$中至少有一个发生的事件称为$A$与$B$的和(并),记作$A \cup B$
  ④积(交) 事件$A$与$B$同时发生的事件称为$A$与$B$的积(交),记为$A \cap B$(或$AB$)
  ⑤ 事件$A$发生但$B$不发生的事件称为$A$与$B$的差,记作$A-B$
  ⑥互不相容(互斥) 若事件$A$与$B$不能同时发生,则称$A$与$B$互不相容(或互斥),记作$A \cap B = \varnothing$
  ⑦事件的独立性 若事件$A, \, B$满足$P(AB) = P(A)P(B)$,则称事件$A, \, B$独立。
  若事件$A, \, B, \, C$同时满足
  $P(AB) = P(A)P(B)$,
  $P(BC)=P(B)P(C)$,
  $P(AC) = P(A)P(C)$,
  $P(ABC) = P(A)P(B)P(C)$,
则称事件$A, \, B, \, C$相互独立
  ⑧对立(互逆) 若事件$A$与$B$不能同时发生,且必有一个发生,即$A$与$B$满足$AB = \varnothing$且$A \cup B = \Omega$,则称$A$与$B$互为对立事件(或互逆事件),记为$A = \overline{B}$或$B = \overline{A}$
  ⑨完全(完备)事件组 若有限个或可列个事件$A_1, \, A_2, \, \cdots, \, A_n, \, \cdots$满足$A_i A_j = \varnothing(i \neq j)$,且$\bigcup_{i=1}^{\infty}A_i = \Omega$,则$A_1, \, A_2, \, \cdots, \, A_n, \, \cdots$称构成一个完全事件组(或完备事件组).

2. 事件的运算性质

  ①交换律 $A \cup B = B \cup A, \, AB = BA$.
  ②结合律 $$(AB)C = A(BC) = ABC, \, (A \cup B) \cup C = A \cup (B \cup C) = A \cup B \cup C. $$   ③分配律 $$\begin{align} A(B \cup C) = AB \cup AC, \, A \cup (BC) = (A \cup B)(A \cup C) \\ A(B-C) = AB - AC , \, A (\bigcup_{i=1}^{n} A_i) = \bigcup_{i=1}^{n} AA_i . \end{align}$$   ④对偶律(De Morgan律)$$\overline{A \cup B} = \overline{A} \cap \overline{B}, \, \overline{AB} = \overline{A} \cup \overline{B}, \\ \overline{\bigcup_i A_i} = \bigcap_i \overline{A_i}, \, \overline{\bigcap_i A_i} = \bigcup_i \overline{A_i}, \, (i \geqslant 1).$$   ⑤吸收律 $A \cap (A \cup B) = A, \, A \cup (A \cap B) = A.$
  ⑥双重否定律  $\overline{\overline{A}} = A.$
  ⑦排中律 $A \cup \overline{A} = \Omega, \, A\overline{A} = \varnothing $.
  ⑧差积转换律 $A - B = A \overline{B}$.

3. 概率的定义及性质

(1) 概率的定义

  设试验$E$的样本空间为$\Omega$,对$E$的任意一个事件$A$,规定一个实数$P(A)$与之对应,若集合函数$P( \cdot )$满足下列条件:
  ①非负性:对任意事件$A$,有$P(A) \geqslant 0$;
  ②规范性:$P(\Omega) = 1$;
  ③可列可加性:对任意两两互不相容的事件列$A_1, \ , A_2, \, \cdots, \, A_n , \, \cdots ,$有$$P( \bigcup_{i=1}^{\infty} ) = \sum_{i=1}^{\infty} P(A_i)$$,则称$P(A)$为事件$A$的概率.

(2) 概率的基本性质

  ①$P(\varnothing ) = 0, \, P(\Omega) = 1$.   ②若$A_1, \, A_2, \, \cdots, \, A_n$两两互斥,则有$$P(\bigcap_{i=1}^n A_i) = \sum_{i=1}^n P(A_i).$$   ③$P(\overline{A}) = 1 - P(A)$.
  ④$P(A \cup B) = P(A) + P(B) - P(AB)$   $$⑤P(A \cup B \cup C) = P(A) + P(B) + P(C) - P(AB) - P(AC) - P(BC) + P(ABC)$$.   ⑥$P(A-B) = P(A) - P(AB)$.
  当 $B \subset A$时,有$P(A-B) = P(A) - P(B)$,从而$P(B) \leqslant P(A)$

4. 概率公式

(1) 条件概率

  $P(B | A) = \frac{P(AB)}{P(A)}$对于固定的事件$A$,条件概率$P(B | A)$具有(无条件)概率的一切性质.

(2) 乘法公式

  设两个事件$A, \, B$,若$P(A) > 0$,则有$P(AB) = P(B)P(A | B)$
  一般地,若$P(A_1 A_2 \cdots A_{n-1}) > 0$,则$$P(A_1 A_2 \cdots A_n) = P(A_1)P(A_2 | A_1)P(A_3 | A_2 A_1) \cdots P(A_n | A_1 A_2 \cdots A_{n-1}).$$

(3) 全概率公式

  设$A_1, \, A_2, \, \cdots, \, A_n$为一个完全事件组,且$P(A_i) > 0, i=1, \, 2, \, \cdots, \, n$,则对任意概率不为零的事件$B$,有$P(B) = \sum_{i=1}^{n} P(B | A_i) P(A_i)$.

(4) 贝叶斯(Bayes)公式

  设$A_1, \, A_2, \, \cdots, \, A_n$为一完全事件组,且$P(A_i) > 0, i=1, \, 2, \, \cdots , \, n, P(B) > 0$,则有$$P(A_j | B) = \frac{P(A_j)P(B|A_j)}{\sum_{i=1}^nP(A_i)P(B|A_i)}, j=1, \, 2, \, \cdots, \, n.$$


二、一维随机变量及其概率分布

1. 分布函数

  定义 设$X$为随机变量,则称定义在全体实数上的函数$$F(x) = P( X \leqslant x) , \, -\infty < x < +\infty, $$为$X$的分布函数,显然任何随机变量都有分布函数。
  性质 ①$0 \leqslant F(x) \leqslant 1$;
  ②单调不减,即对于任何$x_1 < x_2$,有$F(x_1) \leqslant F(x_2)$;
  ③右连续,对任何实数$x$,有$F(x+0) = F(x)$;
  ④$F(- \infty) = 0, \, F(+ \infty) = 1.$

2. 离散型随机变量

  定义 若随机变量$X$的所有可能取值只有有限个或可列个,则称为离散型随机变量.
  分布律 设$X$的所有可能取值为$x_1, \, x_2, \, \cdots , \, x_n, \, \cdots$,则称$P(X = x_i) = p_i, \, i=1, \, 2, \, \cdots$为$X$的分布律.
  显然,分布律满足:
  ①$p_i \geqslant 0, \, i=1, \, 2, \, \cdots$;
  ②$\sum_i p_i = 1$;
  ③离散型分布函数为$F(x) = P(X \leqslant x) = \sum_{x_i \leqslant x} P(X = x_i), \, -\infty < x < +\infty$.

3. 连续型随机变量

  定义 若随机变量$X$的分布函数$F(x)$可以表示成非负可积函数$f(x)$的下列积分形式:$$F(x) = \int_{-\infty}^x f(t)dt , \, -\infty < x < +\infty,$$则称$X$为连续型随机变量,$F(x)$为连续型分布,$f(x)$为$X$的概率密度函数,有时简称为密度。
  概率密度函数的性质
  ①$f(x) \geqslant 0$;
  ②$\int_{-\infty}^{+\infty} f(x)dx = 1$

4. 常见的重要分布

  ①0—1分布$B(1, \, p)$ 分布律为

$X$ 0 1
$P$ $1-p$ $p$

  ②二项分布$B(n, \, p)$ 分布律为$P(X = k) = C_n^k p^k(1-p)^{n-k}, k= 0, \, 1, \, 2, \, \cdots, \, n, \, 0 < p < 1$
  ③泊松(Poisson)分布$P(\lambda)$ 分布律为$P(x = k) = \frac{\lambda^k}{k!}e^{- \lambda}, \, k = 0, \, 1, \, 2, \, \cdots, \lambda > 0$
  ④超几何分布$H(N, \, M, \, n)$ 分布律为$$P(X = k) = \frac{C_M^k C_{N-M}^{n-k}}{C_N^n}, \, k=l, \, l+1, \, \cdots, \, min \left \{n , \, M \right \}$$其中$l = max \left \{ 0, \, n-(N-M) \right \}$.
  ⑤几何分布$G(p)$ 分布律为$P(X = k) = (1-p)^{k-1}p, \, k=1, \, 2, \, \cdots , \, 0 < p < 1$.
  ⑥均匀分布$U(a, \, b)$ 密度函数为$$f(x) = \begin{cases} \frac{1}{b-a}& a < x < b \\ 0 & \text{ 其他 } \end{cases}$$分布函数为$$F(x) = \begin{cases} 0 & x < a \\ \frac{x-a}{b-a} & a \leqslant x < b\\ 1 & x \geqslant b \end{cases}$$   ⑦指数分布$E(\lambda)$ 密度函数为$$f(x) = \begin{cases} \lambda e^{-\lambda x} & x > 0 \\ 0 & \text{其他} \end{cases}$$其中$\lambda > 0$,分布函数为$$F(x) = \begin{cases} 1 - e^{-\lambda x} & x > 0 \\ 0 & \text{其他} \end{cases}$$   ⑧正态分布$N(\mu , \, \sigma^2)$ 密度函数为$$f(x) = \frac{1}{\sqrt{2 \pi} \sigma} e^{-\frac{(x- \mu)^2}{2 \sigma^2}}, \, -\infty < x < +\infty,$$其中$\sigma > 0, \, -\infty < x < +\infty$,分布函数为$$\Phi (x) = \int_{-\infty}^x \frac{1}{\sqrt{2 \pi}} e ^{-\frac{(t- \mu)^2}{2 \sigma^2}}dt, \, -\infty < x < +\infty.$$标准正态分布$N(0, \, 1)$的密度函数为$$\varphi (x) = \frac{1}{\sqrt{2 \pi}} e ^ {- \frac{x^2}{2}} , \, -\infty < x < +\infty.$$

5. 随机变量函数的分布

  g(x)为连续函数或分段函数,则$Y = g(X)$的概率分布分三种情形:
  X为离散型 设$X$的分布律为$P(X = x_i) = p_i, \, i=1, \, 2, \, \cdots$,则$Y = g(X)$的分布律为$$P(Y = y_i) = P(g(X) = y_i) = \sum_{g(x_i) = y_i} P(X = x_i)$$   X为连续型 设$X$的密度函数为$f_X(x)$,则$Y$的密度函数(若存在)可按下列两种方法求得:
  ①公式法 若$y=g(x)$严格单调,其反函数$x=h(y)$有一阶连续导数,则$Y = g(X)$也是连续型随机变量,且密度函数为$$f_Y(y) = \begin{cases} f_X([h(y)])|h^{'}(y)| & \alpha < y < \beta \\ 0 & \text{ 其他 } \end{cases}$$其中$(\alpha ,\, \beta)$为$y=g(x)$的值域.
  ②分布函数法 首先按照分布函数的定义求得$Y$的分布函数,再通过求导得到密度函数,即$$F_Y(y) = P(Y \leqslant y) = P(g(X) \leqslant y) = \int_{g(x) \leqslant y}f_X(x)dx$$ $$f_Y(y) = F_Y^{'}(y)$$   X为一般的随机变量 设$X$的分布函数为$F_X(x)$,则$y$的分布函数可按照分布函数的定义求得$$F_Y(y) = P(Y \leqslant y) = P(g(X) \leqslant y).$$


三、二维随机变量及其概率分布

1. 二维随机变量的联合分布函数

(1). 定义

  二维随机变量$(X, \, Y)$,其联合分布函数为$$F(x, \, y) = P( X \leqslant x, \, Y \leqslant y) \, , \, (x, \, y) \in R^2 , $$其中$P(X \leqslant x, \, Y \leqslant y)$表示积事件$(X \leqslant x) \cap ( Y \leqslant y)$发生的概率

(2). 联合分布函数的性质

  ①$0 \leqslant F(x, \, y) \leqslant 1$.
  ②$F(x, \, y)$分别关于$x$和$y$单调不减.
  ③$F(x, \, y)$分别关于$x$和$y$右连续.
  ④$F(x, \, -\infty) = F(-\infty, \, y) = 0, \, F(+\infty, +\infty) = 1.$
  ⑤对于任意实数$x_1 < x_2, \, y_1 < y_2$,有$$F(x_2, \, y_2) - F(x_2, \, y_1) - F(x_1, \, y_2) + F(x_1, \, y_1) \geqslant 0.$$

2. 二维离散型随机变量

(1). 定义

  若二维随机变量$(X, \, Y)$的每一个分量$X$和$Y$都是离散型的,则称$(X, \, Y)$为二维离散型随机变量.

(2). 联合概率分布

  设$(X, \, Y)$的一切可能取值为$(x_i, \, y_i)$,则称$p_{ij} = P(X = x_i, \, Y = y_i), i, \, j = 1, \, 2, \, \cdots$为$(X, \, Y)$的联合分布律,或称联合概率分布.

(3). 联合分布律的性质

  ①$p_{ij} \geqslant 0$,
  ②$\sum_i \sum_j p_{ij} = 1$.

(4). 边缘分布

  $(X, \, Y)$的分量$X$和$Y$的分布律为边缘分布律。它与联合分布律的关系为$$p_{i \cdot} = P(X = x_i) = \sum_j P(X = x_i, \, Y = y_j) = \sum_j p_{ij},$$ $$p_{\cdot j} = P(Y = y_j) = \sum_i P(X = x_i , \, Y=y_j) = \sum_i p_{ij}.$$

(5). 条件分布

  对于固定的$j$,若$p_j > 0$,则称$$p_{i | j } = P(X = x_i | Y = y_j ) = \frac{p_{ij}}{p_{\cdot j}}, \, i=1, \, 2, \, \cdots$$为$X$关于$Y=y_i$的条件分布,类似地,若$p_i > 0$,则称$$p_{j|i} = P(Y = y_j | X = x_i) = \frac{p_{ij}}{p_{i \cdot}}, j = 1, \, 2, \, \cdots$$为$Y$关于$X = x_i$的条件分布.

3. 二维连续型随机变量

(1). 定义

  设$(X, \, Y)$的联合分布函数为$F(x, \, y)$,如果存在非负可积函数$f(x, \, y)$,使得对任意实数$x, \, y$,有$F(x, \, y) = \int_{-\infty}^{x} \int_{-\infty}^{y}f(u, \, v)dudv$,则称$(X, \, Y)$为二维连续型随机变量,$f(x, \, y)$为联合密度函数,常记为$(X, \, Y) \sim f(x, \, y).$

(2). 联合密度函数的性质

  ①$f(x, \, y) \geqslant 0$,
  ②$\int_{-\infty}^{+\infty} \int_{-\infty}^{+\infty} f(x, \, y)dxdy = 1$.
  反之,任意满足上述两条性质的二元函数$f(x, \, y)$必定可作为某二维随机变量的联合密度函数。

(3). 二维连续型随机变量的性质

  ①$F(x, \, y)$为二元函数.
  ②对于任意平面曲线$L$,有$P \left \{ (X, \, Y) \in L \right \} = 0$.
  ③对于平面区域$D$,有$P \left \{ (X, \, Y) \in D \right \} = \iint_D f(x, \, y)dxdy$.
  ④对于$f(x, \, y)$的连续点$(x, \, y)$,有$\frac{\partial^2 F(x, \, y)}{\partial x \partial y} = f(x, \, y)$.

(4). 边缘分布

  设$(X, \, Y) \sim f(x, \, y)$,则$X, \, Y$的分布函数可分别表示为$$F_X(x) = \int_{-\infty}^x (\int_{-\infty}^{+\infty} f(x, \, y)dy) dx, $$ $$F_Y(y) = \int_{-\infty}^y (\int_{-\infty}^{+\infty} f(x, \, y)dx) dy$$它们分别称为$(X, \, Y)$关于$X, \, Y$的边缘分布函数,而$$f_X(x) = \int_{-\infty}^{+\infty}f(x, \, y)dy, \, f_Y(y) = \int_{-\infty}^{+\infty}f(x, \, y)dx$$分别称为$(X, \, Y)$关于$X, \, Y$的边缘密度函数.

4. 随机变量的独立性

(1). 定义

  若对任意实数$x, \, y$有$P \left \{ X \leqslant x, \, Y \leqslant y \right \} = P \left \{ X \leqslant x \right \} P \left \{ Y \leqslant y \right \}$,则称随机变量$X$和$Y$相互独立.

(2). 独立性的判定条件

  ①离散型
  对于二维离散型随机变量$(X, \, Y)$,$X$与$Y$相互独立的充要条件为$p_{ij} = p_{i \cdot} \times p_{\cdot j}, \, i, \, j = 1, \, 2, \, \cdots$.
  ②连续型
  对于二维连续型随机变量$(X, \, Y)$,$X$与$Y$相互独立的充要条件为:对任意实数$x, \, y, \, f(x, \, y) = f_X(x)f_Y(y)$.

5. 随机变量函数的分布

(1). 一般情形

  已知二维随机变量$(X, \, Y)$的概率分布,而随机变量$Z$为$X$与$Y$的函数,即$Z = g(X, \, Y)$,则$Z$的分布函数为$$F_Z(z) = P(Z \leqslant z ) = P(g(X, \, Y) \leqslant z) , \, -\infty < z < +\infty. $$

(2). 离散型情形

  已知$P(X = x_i, \, Y = y_j) = p_{ij}, \, Z = g(X, \, Y)$,则$Z$的分布律为$$\begin{align} P(Z = z_k) &= P(g(X, \, Y) = z_k) \\ &= \sum_{g(x_i, \, y_j) = z_k}P(X= x_i , \, Y=y_j). \end{align}$$

(3). 连续型情形

  已知$(X, \, Y) \sim f(x, \, y), \, Z = g(X, \, Y)$,则$Z$的分布函数为$$\begin{align}F_Z(z) &= P(Z \leqslant z) = P(g(X, \, Y) \leqslant z ) \\ &= \iint_{g(x, \, y) \leqslant z } f(x, \, y)dxdy \end{align}$$  若$Z$仍为连续型随机变量,则$Z$的密度函数为$f_Z(z) = F_Z^{'}(z).$

(4). $X$与$Y$的和、商与极值的分布

  ①和的分布
  设$(X, \, Y) \sim f(x, \, y)$,则$Z = X+Y$的密度函数为$$f_Z(z) = \int_{-\infty}^{+\infty}f(x, \, z-x)dx = \int_{-\infty}^{+\infty}f(z-y, \, y)dy.$$当$X$与$Y$独立式,有卷积公式$$f_Z(z) = \int_{-\infty}^{+\infty}f_X(x)f_Y(z-x)dx = \int_{-\infty}^{+\infty}f_X(z-y)f_Y(y)dy$$.
  ②商的分布
  设$(X, \, Y) \sim f(x, \, y)$,则$Z = \frac{X}{Y}$的密度函数为$$f_Z(z) = \int_{-\infty}^{+\infty} |y| f(yz, y)dy.$$当$X$与$Y$独立时,有$$f_Z(z) = \int_{-\infty}^{+\infty} | y| f_X(yz)f_Y(y)dy$$   ③极值的分布
  设$X$与$Y$独立,其分布函数分别为$F_X(x) ,\, F_Y(y)$,则$Z_1 = max \left \{ X, \, Y \right \}, \, Z_2 = min \left \{ X, \, Y \right \}$的分布函数分别为:$$\begin{align} F_{Z_1} (z) &= P(Z_1 \leqslant z) = P(max \left \{ X, \, Y \right \} \leqslant z ) \\ &= P(X \leqslant z, \, Y \leqslant z ) = F_X (z)F_Y (z), \end{align}$$ $$\begin{align} F_{Z_2} (z) &= P(Z_2 \leqslant z ) = P(min \left \{ X ,\, Y \right \} \leqslant z) \\ &= 1- P(min \left \{ X, \, Y \right \} > z ) \\ &= 1 - P(X > z , \, Y > z) \\ &= 1- [1-F_X (z)][1-F_Y (z)]. \end{align}$$

6. 两个常见的二维分布

(1). 二维均匀分布

  若$(X, \, Y)$的联合密度函数为$$f(x,y) = \begin{cases} \frac{1}{S(D)}, & (x,y) \in D, \\ 0, & \text{ 其他 }, \end{cases}$$其中$D$为平面有界区域,$S(D)$为$D$的面积,则称$(X, \, Y)$服从二维均匀分布.

(2). 二维正态分布

  若$(X, \, Y)$的联合密度函数为 $$ f(x, \, y) = \frac{1}{2 \pi \sigma_1 \sigma_2 \sqrt{1- \rho^2}} \times exp \left \{ -\frac{1}{ 2 (1 - \rho )^2} \cdot [ \frac{(x- \mu_1)^2}{\sigma_1^2} - \frac{2 \rho (x- \mu_1)(y - \mu_2) }{\sigma_1 \sigma_2} + \frac{(y- \mu_2)^2}{\sigma_2^2} ] \right \} $$ 其中$-\infty < \mu_1, \, \mu_2 < +\infty, \, \sigma_1 > 0, \, \sigma_2 > 0, | \rho | < 1$,则称$(X, \, Y)$服从二维正态分布,常记为$(X, Y) \sim N(\mu_1, \, \mu_2, \, \sigma_1^2, \, \sigma_2^2, \rho).$
  注:(1)若$(X, \, Y) \sim N(\mu_1, \, \mu_2, \, \sigma_1^2, \, \sigma_2^2, \, \rho )$,则$X \sim N(\mu_1, \sigma_1^2), \, Y \sim N(\mu_2, \, \sigma_2^2)$. 反之,若$X$与$Y$都是正态变量,且相互独立,则$(X, \, Y)$是二维正态变量.
  (2)若$(X, \, Y) \sim N(\mu_1, \, \mu_2, \, \sigma_1^2, \, \sigma_2^2, \, \rho )$,则$X$与$Y$相互独立的充要条件是$\rho = 0$.
  (3)二维随机变量$(X, \, Y)$服从二维正态分布的充要条件是$X, \, Y$的任意非零线性组合服从一维正态分布.
  (4)若$(X, \, Y)$服从二维正态分布,设$Z_1, \, Z_2$是$X, \, Y$的线性函数,则$(Z_1, \, Z_2)$也服从二维正态分布.



  1. 1.概率统计针对考研的情况,主要是数学一和数学三,数学二可忽略本部分内容

本文标题:概率统计知识总结 (一)

文章作者:JarryChen

发布时间:2019年12月09日 - 12:56

最后更新: 2019年12月29日 16:54

原始链接: https://jarrychen.xyz/archives/356b4c47.html

× 请我喝奶茶~
打赏二维码