返回列表 发布新帖

[辅助阅读] 数学第一章:认识数学符号⑥-统计与概率符号

91 0
digger 发表于 2026-1-8 18:56:43 | 查看全部 阅读模式 来自:中国–新疆–阿克苏地区 移动

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

×

702be4ad742567a7957caa340b9b2604.webp

一、 基础概念符号

核心用于描述概率的基本要素(样本空间、事件、概率运算),是概率理论的基础。

符号 数学意义 实用举例 读音(中文+英文常用念法)
\Omega(Omega) 样本空间(随机试验所有可能结果的集合) 掷骰子试验:\Omega=\{1,2,3,4,5,6\};抛硬币:\Omega=\{\text{正面},\text{反面}\} 中文:样本空间Ω(ōu mì gǎ)英文:sample space / Omega
A, B, C 随机事件(样本空间的子集,可判断发生与否) 掷骰子“出现偶数”:A=\{2,4,6\};“出现质数”:B=\{2,3,5\} 中文:事件A、事件B英文:event A, event B
\emptyset 不可能事件(不含任何结果的事件,概率为0) 掷骰子“出现7”:\emptysetP(\emptyset)=0 中文:不可能事件(空集)英文:impossible event / empty set
\Omega(全集) 必然事件(包含所有结果的事件,概率为1) 掷骰子“出现1-6中的数”:\OmegaP(\Omega)=1 中文:必然事件英文:certain event / universal set
A\cup B 事件A与B的并(A或B至少一个发生) A=\{2,4,6\}, B=\{2,3,5\},则A\cup B=\{2,3,4,5,6\} 中文:A并B英文:union of A and B
A\cap B(或AB 事件A与B的交(A和B同时发生) 如上,A\cap B=\{2\}(既偶数又质数) 中文:A交B英文:intersection of A and B
\overline{A}(或A^c 事件A的对立事件(A不发生) A=\{2,4,6\},则\overline{A}=\{1,3,5\}(出现奇数) 中文:A的对立事件英文:complement of A
A\setminus B(或A-B 事件A与B的差(A发生且B不发生) 如上,A\setminus B=\{4,6\}(偶数但非质数) 中文:A减B英文:difference of A and B
P(A) 事件A的概率(A发生的可能性大小,$0\leq P(A)\leq1$) 掷骰子P(A)=P(\text{偶数})=\frac{3}{6}=\frac{1}{2} 中文:事件A的概率英文:probability of event A
P(A|B) 条件概率(B发生的前提下A发生的概率) $P(A B)=\frac{P(AB)}{P(B)}P(\text{偶数}

二、 随机变量与分布符号

描述随机变量的类型、分布规律及核心参数,是概率应用的核心工具。

符号 数学意义 实用举例 读音(中文+英文常用念法)
X, Y, Z 随机变量(表示随机试验结果的变量,分离散/连续型) 离散型:X=“掷骰子点数”;连续型:Y=“随机抽取的身高(cm)” 中文:随机变量X、随机变量Y英文:random variable X, random variable Y
X\sim F 随机变量X服从分布F(F为分布类型) X\sim N(\mu,\sigma^2)(服从正态分布);X\sim B(n,p)(服从二项分布) 中文:X服从F分布英文:X is distributed as F
F(x) 分布函数(F(x)=P(X\leq x),描述随机变量取值规律) 离散型X(掷骰子):F(3)=P(X\leq3)=\frac{3}{6}=\frac{1}{2};连续型Y\sim N(0,1)F(0)=0.5 中文:分布函数F(x)英文:distribution function / cumulative distribution function (CDF)
p(x) 离散型随机变量的概率质量函数(p(x)=P(X=x) X\sim B(2,0.5)(2次抛硬币成功次数):p(0)=0.25, p(1)=0.5, p(2)=0.25 中文:概率质量函数p(x)英文:probability mass function (PMF)
f(x) 连续型随机变量的概率密度函数($P(a英文:probability density function (PDF)
B(n,p) 二项分布(n次伯努利试验,成功概率p,记X\sim B(n,p) 10次抛硬币(正面为成功):X\sim B(10,0.5)P(X=5)=\binom{10}{5}(0.5)^{10} 中文:二项分布(n,p)英文:binomial distribution (n,p)
P(\lambda)(或Poisson(\lambda) 泊松分布(描述稀有事件发生次数,参数\lambda 某路口日均交通事故数X\sim P(2)P(X=1)=\frac{2^1e^{-2}}{1!}\approx0.2707 中文:泊松分布(λ)英文:Poisson distribution (lambda)
N(\mu,\sigma^2) 正态分布(高斯分布,参数\mu为均值,\sigma^2为方差) 成年人身高Y\sim N(170, 6^2);标准正态分布N(0,1) 中文:正态分布(μ,σ²)英文:normal distribution (mu, sigma squared)
U(a,b) 均匀分布(X在区间[a,b]上取值均匀,概率密度恒定) 随机抽取[0,1]内的数:X\sim U(0,1)f(x)=\frac{1}{b-a}a\leq x\leq b 中文:均匀分布(a,b)英文:uniform distribution (a,b)
Exp(\lambda) 指数分布(描述寿命、间隔时间,参数\lambda为率参数) 电子元件寿命T\sim Exp(0.01)P(T>100)=e^{-0.01\times100}=e^{-1}\approx0.3679 中文:指数分布(λ)英文:exponential distribution (lambda)
\chi^2(k) 卡方分布(k个独立标准正态变量的平方和,自由度k) 拟合优度检验:X^2\sim\chi^2(5)(自由度5) 中文:卡方分布(k)英文:chi-squared distribution (k)
t(k) t分布(正态变量与卡方变量的比值,自由度k) 小样本均值检验:T\sim t(9)(自由度9) 中文:t分布(k)英文:t-distribution (k)
F(k_1,k_2) F分布(两个卡方变量的比值,自由度k_1,k_2 方差齐性检验:F\sim F(5,8)(分子自由度5,分母自由度8) 中文:F分布(k₁,k₂)英文:F-distribution (k1, k2)

三、 数字特征符号

刻画随机变量的核心性质(平均水平、离散程度、关联程度),是统计描述的关键。

符号 数学意义 实用举例 读音(中文+英文常用念法)
E(X)(或\mu_X 数学期望(均值,随机变量的平均取值) X\sim B(n,p),则E(X)=npX(掷骰子):E(X)=\frac{1+2+3+4+5+6}{6}=3.5 中文:X的数学期望英文:expected value of X / mean
Var(X)(或\sigma_X^2 方差(刻画随机变量取值的离散程度,Var(X)=E[(X-E(X))^2] X\sim B(n,p),则Var(X)=np(1-p)X(掷骰子):Var(X)=\frac{35}{12}\approx2.9167 中文:X的方差英文:variance of X
\sigma(X)(或\sigma_X 标准差(方差的算术平方根,与随机变量同量纲) X\sim N(\mu,\sigma^2),则\sigma(X)=\sigma;掷骰子\sigma(X)=\sqrt{\frac{35}{12}}\approx1.7078 中文:X的标准差英文:standard deviation of X
Cov(X,Y) 协方差(刻画X与Y的线性关联程度,Cov(X,Y)=E[(X-E(X))(Y-E(Y))] 独立变量Cov(X,Y)=0X与$2XCov(X,2X)=2Var(X)$ 中文:X与Y的协方差英文:covariance between X and Y
\rho(X,Y)(或r_{XY} 相关系数(标准化协方差,\rho=\frac{Cov(X,Y)}{\sigma(X)\sigma(Y)}\rho\in[-1,1] \rho=1(完全正相关);\rho=-1(完全负相关);\rho=0(无线性相关) 中文:X与Y的相关系数ρ(ròu)英文:correlation coefficient between X and Y
E[g(X)] 随机变量函数g(X)的期望 g(X)=X^2X(掷骰子):E[X^2]=\frac{1^2+2^2+\dots+6^2}{6}=\frac{91}{6}\approx15.1667 中文:g(X)的数学期望英文:expected value of g(X)
M_X(t) 矩母函数(生成矩的工具,M_X(t)=E[e^{tX}] X\sim N(\mu,\sigma^2),则M_X(t)=e^{\mu t+\frac{1}{2}\sigma^2 t^2} 中文:X的矩母函数英文:moment generating function of X
k阶原点矩 第k阶原点矩(E[X^k],k=1时为期望) 一阶原点矩E[X];二阶原点矩E[X^2] 中文:k阶原点矩英文:k-th moment about the origin
k阶中心矩 第k阶中心矩(E[(X-E(X))^k],k=2时为方差) 二阶中心矩Var(X);三阶中心矩刻画分布偏度 中文:k阶中心矩英文:k-th central moment

四、 抽样与估计符号

用于统计推断(从样本推断总体),核心是样本、估计量与置信区间。

符号 数学意义 实用举例 读音(中文+英文常用念法)
X_1,X_2,\dots,X_n 简单随机样本(n个独立同分布的随机变量,来自总体) 从全校学生中抽100人测身高:X_1,X_2,\dots,X_{100}(独立同分布) 中文:样本X₁到Xₙ英文:simple random sample X1 to Xn
\overline{X}(或\hat{\mu} 样本均值(总体均值\mu的无偏估计,\overline{X}=\frac{1}{n}\sum_{i=1}^n X_i 样本X_1=170,X_2=175,X_3=180\overline{X}=\frac{170+175+180}{3}=175 中文:样本均值X拔英文:sample mean / X-bar
S^2(或\hat{\sigma}^2 样本方差(总体方差\sigma^2的无偏估计,S^2=\frac{1}{n-1}\sum_{i=1}^n (X_i-\overline{X})^2 如上样本:S^2=\frac{(170-175)^2+(175-175)^2+(180-175)^2}{3-1}=25 中文:样本方差S平方英文:sample variance
S(或\hat{\sigma} 样本标准差(样本方差的算术平方根) 如上样本:S=\sqrt{25}=5 中文:样本标准差S英文:sample standard deviation
\hat{\theta}(theta hat) 参数\theta的估计量(用于估计总体参数的样本函数) 总体均值\mu的估计量\hat{\mu}=\overline{X};总体概率p的估计量\hat{p}=\frac{X}{n}(X为成功次数) 中文:theta的估计量英文:estimator of theta / theta hat
\hat{\theta}_n 基于样本量n的估计量 样本量n=100时,\hat{p}_n=\frac{X}{100} 中文:样本量n下theta的估计量英文:estimator of theta based on sample size n
[L,U] 参数\theta的置信区间(包含\theta的大概率区间,置信水平(1-\alpha) 总体均值\mu的95%置信区间:[\overline{X}-1.96\frac{S}{\sqrt{n}},\overline{X}+1.96\frac{S}{\sqrt{n}}] 中文:theta的置信区间英文:confidence interval for theta
(1-\alpha) 置信水平(置信区间包含总体参数的概率) 95%置信水平(\alpha=0.05 );99%置信水平(\alpha=0.01 中文:置信水平1减α英文:confidence level 1 minus alpha

五、 假设检验符号

用于判断“总体参数是否符合预期”,核心是假设、检验统计量与决策指标。

符号 数学意义 实用举例 读音(中文+英文常用念法)
H_0(null hypothesis) 原假设(待检验的默认假设,通常为“无差异”“无效应”) 检验总体均值是否为\mu_0H_0:\mu=\mu_0;检验两总体方差相等:H_0:\sigma_1^2=\sigma_2^2 中文:原假设H零英文:null hypothesis H-naught
H_1(或H_a 备择假设(与原假设对立的假设,通常为“有差异”“有效应”) 对应上例:H_1:\mu\neq\mu_0(双侧检验);H_1:\mu>\mu_0(单侧检验) 中文:备择假设H一英文:alternative hypothesis H-one / H-a
T(或Z, \chi^2, F 检验统计量(基于样本计算的统计量,用于判断是否拒绝H_0 正态总体小样本均值检验:T=\frac{\overline{X}-\mu_0}{S/\sqrt{n}}\sim t(n-1);大样本检验:Z=\frac{\overline{X}-\mu_0}{\sigma/\sqrt{n}} 中文:检验统计量T英文:test statistic T
\alpha(alpha) 显著性水平(拒绝H_0的临界概率,控制第一类错误概率) 常用\alpha=0.05(5%);\alpha=0.01(1%) 中文:显著性水平α(ā lā fǎ)英文:significance level alpha
P-值(P-value) 观测到的样本结果支持H_1的证据强度(P\leq\alpha则拒绝H_0 检验中P=0.03<0.05,拒绝H_0P=0.06>0.05,不拒绝H_0 中文:P值英文:P-value
W(或C 拒绝域(检验统计量的取值范围,落入则拒绝H_0 t检验(\alpha=0.05,自由度9):双侧拒绝域$ T
\beta(beta) 第二类错误概率(H_0为假时未拒绝H_0的概率) 功效$1-\beta=0.9$(90%的概率检测到真实差异) 中文:第二类错误概率β(bēi tǎ)英文:type II error probability beta
(1-\beta) 检验功效(H_0为假时拒绝H_0的概率,功效越高越好) 样本量越大,功效(1-\beta)越高 中文:检验功效英文:power of the test

六、 常用统计量与其他符号

涵盖多元统计、试验设计等领域的常用符号,满足进阶应用需求。

符号 数学意义 实用举例 读音(中文+英文常用念法)
X_{(1)}\leq X_{(2)}\leq\dots\leq X_{(n)} 顺序统计量(将样本按从小到大排序后的结果) 样本$3,1,4:顺序统计量X_{(1)}=1,X_{(2)}=3,X_{(3)}=4$ 中文:顺序统计量英文:order statistics
Med(X)(或\tilde{X} 样本中位数(中间位置的数值,抗极端值) 样本$1,3,4Med(X)=3;样本$1,3,4,5Med(X)=\frac{3+4}{2}=3.5 中文:样本中位数英文:sample median
F_n(x) 经验分布函数(基于样本的分布函数,F_n(x)=\frac{1}{n}\sum_{i=1}^n I(X_i\leq x)I为指示函数) 样本$1,3,4F_n(2)=\frac{1}{3}(1个样本≤2);F_n(3)=\frac{2}{3}$ 中文:经验分布函数Fₙ(x)英文:empirical distribution function
\text{Corr}(X,Y) 相关矩阵(多元变量间的相关系数构成的矩阵) 变量X,Y,Z\text{Corr}=\begin{pmatrix}1&\rho_{XY}&\rho_{XZ}\\\rho_{YX}&1&\rho_{YZ}\\\rho_{ZX}&\rho_{ZY}&1\end{pmatrix} 中文:相关矩阵英文:correlation matrix
ANOVA 方差分析(分析多个总体均值是否相等的方法) 单因素ANOVA(比较3个班级的平均成绩);双因素ANOVA(考虑性别和年级对成绩的影响) 中文:方差分析英文:analysis of variance (ANOVA)
r^2(或R^2 决定系数(回归模型中,因变量变异被自变量解释的比例,r^2\in[0,1] 线性回归Y=a+bXr^2=0.8(80%的Y变异可由X解释) 中文:决定系数r平方英文:coefficient of determination

七、 补充说明

  1. 符号约定:随机变量用大写字母(X,Y),其取值用小写字母(x,y);总体参数用希腊字母(\mu,\sigma),样本统计量用拉丁字母(\overline{X},S),是行业通用规范。
  2. 易混淆符号区分
    • 样本方差S^2与总体方差\sigma^2:样本方差分母为n-1(无偏估计),总体方差分母为N(总体容量);
    • 概率质量函数p(x)(离散型)与概率密度函数f(x)(连续型):离散型p(x)=P(X=x),连续型f(x)需积分才得概率(P(a<X<b)=\int_a^b f(x)dx);
    • 相关系数\rho与总体均值\mu:希腊字母不同,\rho刻画关联,\mu刻画平均水平。
  3. 分布符号参数:多数分布符号的参数顺序有固定规则(如二项分布B(n,p):试验次数在前,成功概率在后;正态分布N(\mu,\sigma^2):均值在前,方差在后),不可随意调换。

匠心独运,千锤百炼,品质非凡。
回复 转播

使用道具 举报

回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

您需要 登录 后才可以回复,轻松玩转社区,没有帐号?立即注册
快速回复
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表