第一章代数、三角公式与初等代数

§2 数理统计方法

一、总体参数的估计

1、总体（母体）与样本（子样）

研究某个问题，它的对象的所有可能观测结果称为总体（或母体），记作。总体中抽取一部分样品称为总体的一个样本（或子样）。样本中样品的个数称为样本的大小（或容量）。，可以认为是大样本，否则称为小样本。

数理统计方法就是应用概率论的结果，通过样本来了解和判断总体的统计特性的科学方法。

2、样本特征数与总体数字特征对照表

名称	样本特征数	总体数字特征
均值
方差
标准差
变异系数
偏态系数
峰态系数

注意，1^° 当较大时，取

（有时称此为样本方差，而称表中的为样本修正方差）

2^° 样本特征系数还有：

样本阶原点矩

样本阶中心矩

样本中位数（样本大小n为奇数）

样本均差

样本极差

3、总体参数的点估计

记x₁ ,x₂,···,x_n是从总体中取出的一个样本，可用样本的特征数来估计总体的数字特征。其常用方法有以下两种：

[矩法] 矩法是用样本的r阶矩作为总体r阶矩的估值。具体步骤如下：

设的分布函数包含k个参数（其取值未知），记作。假定的k阶原点矩存在，它们自然是的函数，即

(r=1,2,···,k)

考虑总体的一个样本作出这一样本的r阶矩，即

然后解方程组

(= (r=1,2,···,k)

记所得的解为

用分别作为的估值。

[最大似然法] 设总体的分布是连续型的，分布密度函数为，其中是待估计的未知参数。对于给定的使函数达到最大值的，并用它们分别作为的估值。

由于ln与在同一点()上达到最大值，因此，引入函数

L()=ln=)

它称为似然函数。只要解方程组

(i=1,2,···,k)

就可以从中确定所要求的，它们分别称为参数的最大似然估计值。

如果总体的分布是离散型的，只要把上述似然函数中的取为就可以了。

例正态总体的参数估计，假定已知总体遵从正态分布N(，但参数未知。现在要用总体的n次观测值x₁, x₂,···, x_n求的最大似然估值。

解因为总体的分布密度函数为

因此，似然函数为

解方程组

得

容易检验确实使取到最大值。因此它们分别是的最大似然估值。

[估值好坏的判别标准]

1^° 无偏性如果参数的估值 x₁, x₂,···, x_n)满足关系式

则称是的无偏估值。

2^° 有效性如果和都是参数的无偏估值。

则称比有效。进一步，如果固定样本的容量n，使极小值的无偏估值就称为的有效估值。

3^° 一致性如果对任意给定的正数，总有

则称的估值是一致的。

由契贝谢夫不等式（见§1,三）易见，当

对某成立时，是的一致估值。

在实用中，往往应用这一充分条件来验证是否是的一致估值。

例

总体分布

未知总体

参数

总体参数估值

无偏性

有效性

一致性

有

4、样本的频率分布

频率分布较完整地反映实验数据的变化规律。建立频率分布的步骤（设样本为x₁,x₂,···, x_n）是：

（1）找出最大值与最小值，求得极差。

（2）根据样本大小分组，通常大样本分成10~20组，小样本分成5~6组，再根据组数k和极差R决定组距c，如果按等距分组，则c。

（3）确定分点（常取比原数据的精度高一位）。

（4）数出各组的频率。

（5）计算频率

（6）画直方图（分点为横坐标，频率与组距之比为纵坐标）。

（7）如果变量是连续的，则描出光滑曲线，近似的代替总体的分布。

5、总体参数的区间估计

[小概率原理] 在一次试验中，概率很小（接近于零）的事件认为是实际上不可能发生的事件；而概率接近于1的事件认为是实际上必然发生的事件。

[置信区间与显著性水平] 对总体参数（如）进行区间估计（即估计参数的取值范围）时，如果对于预先给定的很小的概率，能找到一个区间()，使得

=1-

那末称区间()为参数的置信区间，和称为置信限（或临界值）；和称为否定域；概率称为显著性水平，1-称为置信水平（或置信概率）。

[总体参数的区间估计表] 假设总体遵从正态分布)。对于预先给的显著性水平，可用一个样本x₁, x₂,···,x_n的均值和标准差s来估计总体的均值和方差的置信区间，也可用两个样本与的均值和标准差来估计两总体均值差的置信区间。

样本情况

总体参数或的置信区间

与置信区间有关的与的确定

大样本

已知总体方差

查正态分布表

大样本

总体方差未知

同上

小样本

已知总体方差

同上

小样本

总体方差未知

查t分布表（自由度为n-1）

已知两总体的

方差

查正态分布表

两总体的方差

未知

式中

查t分布表

（自由度为n₁ + n₂-2 ）

小样本

已知总体均值

查分布表

（自由度为n）

小样本

总体均值未知

查分布表

（自由度为n）

小样本

两总体的均值

与方差未知

查F分布表

（自由度为

查分布表

（自由度为(n_{2 _}-1,n₁ –1)）