概率论+抽样分布
发布网友
发布时间:2023-01-14 13:31
我来回答
共1个回答
热心网友
时间:2023-09-19 17:36
基本知识点:
必然现象和随机现象:必然(不)发生和可能发生
随机现象的统计规律性:相同条件下进行大量重复实验,实验结果呈现出某种固有的特定的规律性-频率的稳定性
事件:随机试验的结果
随机事件:大量试验中具有某种规律性的事件
基本事件(样本点):不能分解成其他事件组合的最简单的事件
对立事件:两个时间的并是全集+两个事件的交集是空集
事件不相容:两个事件的交集是空集
概率:刻画事件发生可能性大小的数量指标
频率是一个比值,随着试验次数的增加,会趋近于一个值,就是统计概率(后验概率)
古典概型(先验概率):基本事件有限个+所有基本事件的发生是等可能的
先验概率和后验概率:先验概率就是指“第一印象,假设”,后验概率是指“印象改变,实验修正”
主观概率:因人而异,凭借的是经验、知识和分析判断能力
概率性质:1.概率范围[0,1];2.必然事件的概率是1,不可能事件概率是0;3.两事件不相容,有p(A+B)=p(A)+p(B)
小概率事件:概率很小的事件
小概率原理(小概率事件实际不可能原理):将小概率事件在一次实验中看成是不可能事件
条件概率:事件B发生的前提下,事件A发生的概率p(A|B)=p(AB)/p(B)
事件独立:P(AB)=P(A)P(B)
随机变量:作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围--离散型和连续型-分布列和概率分布函数
离散型随机变量:
两点分布(0-1分布)X~B(1,p):分布值只有两个期望和方差:p,p(1-p)
二项分布X~B(n,p):n次独立实验 期望和方差:np,根号下npq
几何分布X~G(p):独立实验,直到第一次成功P(X=k)=pq(k-1)
超几何分布X~H(N,M,n):若同类产品有N个,其中有M个次品,现从中抽取n个(n<=N-M),则这n个中有次品的数目X是一个离散随机变量,其概率分布为超几何分布。超几何分布的计算公式为:P(X=k)=C(M,k)*C(N-M,n-k)/C(N,n),k=0,1,…,min(M,n)
泊松分布X~P(λ):x=0,1,2,3,...
连续型随机变量:
均匀分布:f(x)=1/(b-a), a≤x ≤ b
指数分布:f(x)=λe-λx,x>=0
正态分布:
#曲线在x=μ±σ处各有一个拐点
标准正态分布的概率密度函数及分布函数分别记作ψ(u)和Φ(u)
标准正态分布的几种概率:
P(-1≤u<1)=0.6826
P(-2≤u<2)=0.9545
P(-3≤u<3)=0.9973
P(-1.96≤u<1.96)=0.95
P (-2.58≤u<2.58)=0.99
把随机变量x落在平均数μ加减不同倍数标准差σ区间 之外的概率称为双侧概率(两尾概率),记作α;随机变量x小于μ-kσ或大于μ+kσ的概率,称为单侧概率(一尾概率),记作α/2
抽样分布: (从总体到样本)
#统计推断:(从样本到总体)
统计量的概率分布称为抽样分布。--就是说从总体抽样出来的样本统计量的分布
可分为:有返回抽样和不返回抽样(有限总体采取反置抽样)
抽样误差:抽取的样本算得的统计量与原总体的统计量往往表现出不同程度的差异
#随着样本含量 n 的增大, 样本平均数的分布愈来愈从不连续趋向于连续的正态分布
#中心极限定理告诉我们:不论x变量是连续型还是离散型,也无论x服从何种分布,一般只要n>30,就可认为其分布是正态的。
抽样调查:是一种非全面调查。它按随机的原则从总体中抽出部分单位(简称样本)进行调查,以获得有关的数据资料。
抽样推断:是根据抽样调查所获得的样本信息,对总体的数量特征做出具有一定可靠程度的估计和推断。
总体参数:描述总体数量特征的指标。(总体是惟一的,所以参数也是惟一的)
样本统计量:描述样本数量特征的指标,由样本计算而得(由于样本是随机的,所以样本统计量是随机变量)
非抽样误差:在统计调查中,由于主客观原因而引起的诸如测量、登录、计算等误差(该误差可以避免);
抽样误差:在抽样调查中由于抽样的随机性而产生的样本指标对总体指标的代表性误差(可以计算并加以控制,但不可以避免)
设总体服从正态分布,从总体中随机取出容量为n的样本,样本平均数服从正态分布
重复抽样::均值等于总体均值,方差等于总体方差/n;
非重复抽样:均值等于总体均值,方差等于总体方差*(1-n/N)/n
--估计总体均值
两个正态总体+重复抽样:样本均值差服从正态分布,均值差等于总体均值差,方差等于两个总体方差分别除样本量,再相加(讨论两个总体均值是否相等)
#两总体方差未知时,可用样本方差代替
若总体单位的某种标志只有两种表现,总体成数是指具有某种特征和属性的单位在全部总体单位重所占比重(记为p)--当样本量足够大,可近似为正态分布
卡方分布:n个相互独立的标准正态分布统计量相加,自由度为n
t分布:自由度为n的卡方分布/根号下(标准正态分布/n),自由度为n
F分布:两个卡方分布各自除以自由度后再相除
简单随机抽样:直接从总体按随机的原则抽容量为n的样本
分层抽样:首先将总体单位按某一个标志分层;然后在各层按随机抽样的方法分别抽出各层的样本。
等距抽样:首先将总体单位按某标志排队;然后计算抽样的距离;然后随机确定抽样起点,最后等距离抽出样本点构成样本。
整群抽样:首先将总体划分为群;然后按随机的原则不重复抽出群,在每群中进行全面调查
多阶段抽样:指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式#第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。