§2  数理统计方法

 

一、 总体参数的估计

 

1、总体(母体)与样本(子样)

    研究某个问题,它的对象的所有可能观测结果称为总体(或母体),记作。总体中抽取一部分样品称为总体的一个样本(或子样)。样本中样品的个数称为样本的大小(或容量)。,可以认为是大样本,否则称为小样本。

   数理统计方法就是应用概率论的结果,通过样本来了解和判断总体的统计特性的科学方法。

2 样本特征数与总体数字特征对照表

名 称

样本特征数

总体数字特征

 

均 值

 

方 差

 

标准差

 

变异系数

 

偏态系数

 

 

 

 

峰态系数

 

 

 

注意,1°   较大时,取

                 (有时称此为样本方差,而称表中的为样本修正方差)

         2°   样本特征系数还有:

             样本阶原点矩   

             样本阶中心矩     

             样本中位数           (样本大小n为奇数)

             样本均差         

              样本极差         

3总体参数的点估计

   x1 ,x2  ,···,xn是从总体中取出的一个样本,可用样本的特征数来估计总体的数字特征。其常用方法有以下两种:

[矩法] 矩法是用样本的r阶矩作为总体r阶矩的估值。具体步骤如下:

    的分布函数包含k个参数(其取值未知),记作。假定k阶原点矩存在,它们自然是的函数,即

     (r=1,2,···,k)

    考虑总体的一个样本作出这一样本的r阶矩,即

                =     

然后解方程组

                (=  (r=1,2,···,k)

记所得的解为

                

分别作为的估值。

[最大似然法]   设总体的分布是连续型的,分布密度函数为,其中是待估计的未知参数。对于给定的使函数达到最大值的,并用它们分别作为的估值。

由于ln在同一点()上达到最大值,因此,引入函数

    L()=ln=)

它称为似然函数。只要解方程组 

                       (i=1,2,···,k)

就可以从中确定所要求的,它们分别称为参数的最大似然估计值。

   如果总体的分布是离散型的,只要把上述似然函数中的取为就可以了。

     正态总体的参数估计,假定已知总体遵从正态分布N(,但参数未知。现在要用总体的n次观测值x1  , x2  ,···, xn的最大似然估值。

     因为总体的分布密度函数为

                  

因此,似然函数为

             

解方程组

                 

               

               

              

容易检验确实使取到最大值。因此它们分别是的最大似然估值。

[估值好坏的判别标准]

   1°  无偏性  如果参数的估值 x1  , x2  ,···, xn)满足关系式

                   

则称的无偏估值。

   2°  有效性  如果都是参数的无偏估值。

               

则称有效。进一步,如果固定样本的容量n,使极小值的无偏估值就称为的有效估值。

   3°  一致性  如果对任意给定的正数,总有

               

则称的估值是一致的。

  由契贝谢夫不等式(见§1,三)易见,当

                     

对某成立时,的一致估值。

  在实用中,往往应用这一充分条件来验证是否是的一致估值。

 

总体分布

未知总体

    

总体参数估值

无偏性

有效性

一致性

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4、样本的频率分布

   频率分布较完整地反映实验数据的变化规律。建立频率分布的步骤(设样本为x1 ,x2 ,···, xn)是:

  1) 找出最大值与最小值,求得极差

  2) 根据样本大小分组,通常大样本分成10~20组,小样本分成5~6组,再根据组数k和极差R决定组距c,如果按等距分组,则c

  3) 确定分点(常取比原数据的精度高一位)。

  4) 数出各组的频率

  5) 计算频率

  6) 画直方图(分点为横坐标,频率与组距之比为纵坐标)。

  7) 如果变量是连续的,则描出光滑曲线,近似的代替总体的分布。

5、总体参数的区间估计

[小概率原理]  在一次试验中,概率很小(接近于零)的事件认为是实际上不可能发生的事件;而概率接近于1的事件认为是实际上必然发生的事件。

[置信区间与显著性水平]  对总体参数(如)进行区间估计(即估计参数的取值范围)时,如果对于预先给定的很小的概率,能找到一个区间(),使得

=1-

那末称区间()为参数的置信区间,称为置信限(或临界值);称为否定域;概率称为显著性水平,1-称为置信水平(或置信概率)。

[总体参数的区间估计表]  假设总体遵从正态分布)。对于预先给的显著性水平,可用一个样本x1, x2 ,···,xn的均值和标准差s来估计总体的均值和方差的置信区间,也可用两个样本的均值和标准差来估计两总体均值差的置信区间。 

 

样本情况

总体参数的置信区间

与置信区间有关的的确定

大样本

已知总体方差

查正态分布表

 

大样本

总体方差未知

 

同上

小样本

已知总体方差

 

同上

小样本

总体方差未知

t分布表(自由度为n-1

已知两总体的

方差

查正态分布表

 

 

 

两总体的方差

  

式中

t分布表

(自由度为n1 + n2-2

 

 

小样本

已知总体均值

分布表

(自由度为n

 

小样本

总体均值未知

分布表

(自由度为n

 

 

 

小样本

两总体的均值

与方差未知

F分布表

(自由度为

分布表

(自由度为(n2 _-1,n1 –1)