随机事件及概率

  • 条件概率——全概率公式+贝叶斯公式
  • 古典概型

一维随机变量(离散型+连续型)

  • 离散型随机变量分布律/连续型随机变量概率密度
    • 概率密度f(x)f(x)
      • 分布函数<——> 概率密度的互推
      • 重难点(步骤):求连续型变量XX的函数Y(X)Y(X)的分布函数和概率密度

二维随机变量(离散型+连布续型)

  • 离散型随机变量联合分/边缘分布/条件分布(分布律)
  • 连续型随机变量联合分布/边缘分布/条件分布(概率密度)
    • 最难点:两个连续型随机变量的函数的分布 Z=X+YZ=X+YZ=XYZ=XYZ=XYZ=\frac{X}{Y}Z=max{X,Y}...Z=\max\{X,Y\}...
    • 独立性

随机变量的数字特征

  • 数学期望E(X)E(X)
    • 离散型/连续型E(X)E(X)公式
    • 随机变量的函数的数学期望
      • 离散/连续
      • 一个随机变量/两个随机变量的函数
      • 期望的性质
  • 方差D(X)D(X)
    • D(X)E(X)D(X)与E(X)的关系式
    • 标准化变量X=XμσX^* =\frac{X-\mu}\sigma{}
    • 四个性质
    • 切比雪夫(Chebyshev)\textit{(Chebyshev)}不等式 P{Xμε}σ2ε2P\{|X-\mu| \geq \varepsilon\}\leq\frac{\sigma^2}{\varepsilon^2}P{Xμε}1σ2ε2P\{|X-\mu| \leq \varepsilon\}\geq1-\frac{\sigma^2}{\varepsilon^2}
  • 协方差Cov(X,Y)\text{Cov}(X, Y)、相关系数ρXY\rho_{XY}
    • 协方差
      • 定义式:Cov(X,Y)=E{[XE(X)]2[YE(Y)]2}\text{Cov}(X,Y)=E\{[X-E(X)]^2[Y-E(Y)]^2\}
      • 计算式:Cov(X,Y)=E(XY)E(X)E(Y)\text{Cov}(X,Y) = E(XY)-E(X)E(Y)
    • 相关系数
      • 定义:ρXY=Cov(X,Y)D(X)D(Y)\rho_{XY}=\frac{\text{Cov}(X,Y)}{\sqrt{D(X)}\sqrt{D(Y)}}
      • 含义:XYX、Y相关程度 (仅就线性关系来说)
    • 中心矩
    • 原点矩

大数定律和中心极限定理

  • 辛钦大数定律 --> 伯努利大数定律
  • 独立同分布的中心极限定理
  • 李雅普诺夫(Lyapunov)\textit{(Lyapunov)}定理
  • 棣莫弗-拉普拉斯(De Moivre-Laplace)\textit{(De Moivre-Laplace)}定理

样本及抽样分布

  • 统计学三大分布
    • X2\mathcal{X}^2分布 X2X2(n)\mathcal{X}^2 \sim \mathcal{X}^2(n)
      • XX服从总体N(0,1)N(0,1) --> 统计量X2=X12+X22++Xn2\mathcal{X}^2=X_1^2+X_2^2+ \cdots +X_n^2
      • 可加性:X12+X22X2(n1+n2)\mathcal{X_1}^2+\mathcal{X_2}^2 \sim \mathcal{X}^2(n_1+n_2)
      • E(X2)=n,D(X2)=2nE(\mathcal{X}^2)=n,D(\mathcal{X}^2)=2n
    • t\text{t}分布 tt(n)t \sim t(n)
      • XN(0,1),YX2(n)X \sim N(0,1), Y \sim \mathcal{X}^2(n) --> 随机变量t=XY/nt=\frac{X}{\sqrt{Y/n}}
    • FF分布 FF(n1,n2)F \sim F(n_1,n_2)
      • UX2(n1),VX2(n2)U \sim X^2(n_1),V \sim X^2(n_2) --> F=U/n1V/n2F=\frac{U/n_1}{V/n_2}

参数估计

  • 点估计(估计量、估计值)
    • 矩估计nn充分大时,样本矩等于总体矩
      • 总体一阶矩E(X)=E(X)= 样本均值Xˉ\bar{X} --> 得到参数θ\theta的矩估计量θ^\hat{\theta}
    • 最大似然估计:使得样本x1,x2,,xnx_1,x_2,\cdots,x_n发生的概率最大的θ\theta值最恰当
      • 求似然函数L(θ)=L(x1,x2,,xn;θ)=i=1np(xi;θ)L(\theta)=L(x_1,x_2,\cdots,x_n;\theta)=\prod \limits_{i=1}^n p(x_i;\theta)
      • 取对数lnL(θ)lnL(\theta)
      • 求驻点得到θ^\hat{\theta}
  • 估计量的评选标准
    • 无偏性E(θ^)=θE(\hat\theta)=\theta
    • 有效性:比较D(θ^)D(\hat\theta)
    • 相和性

常见分布

  • 二项分布 XB(n,p)X \sim \text{B}(n, p)
    • E=npE=npD=np(1p)D=np(1-p)
  • 均匀分布 XU(a,b)X \sim \text{U}(a, b)
  • 正态分布 XN(μ,σ2)X \sim \text{N}(\mu, \sigma^2)
  • 泊松分布 Xπ(λ)X \sim \pi(\lambda)
    • E(X)=D(X)=λE(X)=D(X)=\lambda
  • 指数分布Xe(θ)X \sim \text{e}(\theta)
    • E(X)=θD(X)=θ2E(X)=θ ,D(X)=θ^2
  • 几何分布XGe(p)X \sim \text{Ge}(p)
    • E(X)=1pE(X)=\frac{1}{p}, D(X)=1pp2D(X)=\frac{1-p}{p^2}

常见分布的期望方差
三大分布