从总体中抽取部分个体所组成的集合称为样本。样本中所包含的个体的个数称为样本量。
人们从总体中抽取样本是为了认识总体,即从样本推断总体,如推断总体是什么类型的分布?总体均值为多少了使此种统计推断有所依据,推断结果有效,对样本的抽取应有所要求。
满足下面两个条件的样本称为简单随机样本,简称随机样本。
(1)随机性。总体中每个个体都有相同的机会。比如,按随机性要求抽出5个样品,记为X1,X2,…X5,则其中分布相同。
只要随机抽样就可保证此点实施。
(2)独立性。从总体中抽取的每个个体对其他个体的抽取无任何影响。假如总体是无限的,独立性容易实现;若总体量与样本量n相比是很大时,即使总体是有限的,此种抽样独立性也可得到基本保证。
综上两点,随机样本X1,X2,…,Xn可以看做n个相互独立的、同分布的随机变量,每一个个体的分布与总体分布指满足这些要求的简单随机样本。在实际中抽样时,也应按此要求从总体中进行抽样。
这样获得的样本能够很好表示两个不同的总体,图上用虚线画出的曲线是两个未知总体。 若是按随机性和独立性要求进行抽样,则机会大的地方的样品就多;而机会少的地方(概率密度值小),被抽出的样品就少。
分布愈分散,样本也很分散;分布愈集中。