概率和置信区间的问题是不是我犯的错误是把概率定位一个值,应该这样说,例如95%的...
我是这样理解的,比如说,假设要推断的是,样本是否来自于总体N(u,D^2)。u,D都已知。 (1)来自于这个总体的n个样本的均值m也是一个随机变量,服从N(u,D^2/n)。也就是说,(m-u)n^(1/2)/D 服从 N(0,1)。 n已知。(2)Y服从N(0,1)。 F(x)为N(0,1)的分布函数。则,P{|y| 这个是概率,是一个随机变量落在某区间内的概率。但注意,计算这个概率的时候,随机变量的分布函数是确定的,已知的。 (3)若要 P{|y| 则,F(v) = 1 - c/2。若已知c,则可以根据c确定v。[反过来,若已知v,则可以根据v确定c。]这个也是概率,是一个随机变...全部
我是这样理解的,比如说,假设要推断的是,样本是否来自于总体N(u,D^2)。u,D都已知。 (1)来自于这个总体的n个样本的均值m也是一个随机变量,服从N(u,D^2/n)。也就是说,(m-u)n^(1/2)/D 服从 N(0,1)。
n已知。(2)Y服从N(0,1)。 F(x)为N(0,1)的分布函数。则,P{|y| 这个是概率,是一个随机变量落在某区间内的概率。但注意,计算这个概率的时候,随机变量的分布函数是确定的,已知的。
(3)若要 P{|y| 则,F(v) = 1 - c/2。若已知c,则可以根据c确定v。[反过来,若已知v,则可以根据v确定c。]这个也是概率,是一个随机变量落在某区间内的概率。可以利用这个等式,通过查正态分布的分布函数表,由c确定区间的半径v。
同样,计算这个概率的时候,随机变量的分布函数是确定的,已知的。(4)P{|m-u|n^(1/2)/D 这也是概率,是服从总体分布的样本均值落在某区间内的概率。同样,样本是确定性地来自于这个总体的。
(5)有一组n个样本的均值为a。现要在置信度水平为95%(c=5%)的情况下判断这组样本是否来自于这个总体。[这组样本是否来自于这个总体呢?不确定。]那么,如果样本是来自这个总体的,则根据(1)~(4)应该有,P{|a-u|n^(1/2)/D [现在c设定了,可以根据c确定出v。
]这就是你说的落入这个区间的概率。同样是概率,这个概率和(3),(4)中的概率有啥不同的地方啊。(3),(4)中的概率,所有的东西都是确定性的。而(5)的这个概率,是在假设成立的条件下才有的。
[现在还不确定。]把(5)中的这个概率换一个角度说,就是,如果样本是来自这个总体的,则,不等式 |a-u|n^(1/2)/D 成立的概率为 95%不等式 |a-u|n^(1/2)/D 不成立的概率为 5%,是一个小概率事件。
如果a恰好使得上面的不等式不成立。就说明小概率事件发生了,[小概率事件是不可能发生的。天上不可能正好有一块匹萨掉在俺头上。所以,如有东西掉到俺头上了。俺可以肯定地认为,那决不是匹萨。]既然在假设这组样本是来自于这个总体的前提下,小概率事件发生了。
就可以认定,这个假设是错误的。也就是说,可以认定,这组样本不是来自于这个总体的。那么,这种认定有多大的可信度啊。是不是100%绝对可信啊。不是,绝不是。可信度是95%。也就是说,上面的这种认定是错误的可能性还是有的。
只不过可能性很小,只是5%,而已。[是一个小概率事件。]如果a恰好使得上面的不等式成立了。小概率事件没发生,既然在假设这组样本是来自于这个总体的前提下,小概率事件没发生。就不能认定,这个假设是错误的。
也就是说,不能认定,这组样本不是来自于这个总体的。[语气上有差别,一个是,“不能认定,不是”,另一个是“可以认定,不是”]实际上,是没用肯定的语气说,“可以认定,是”。如果这样说了,凡错误的可能性有多大呢,是不是也是5%啊。
呀,这就不能瞎说了。因为,如果真犯错了,也就是样本不是来自于这个总体的。因为这个样本到底来自于啥样的总体,现在不知道。所以没法算一个犯这种错的概率。但肯定不能说是5%,因为5%是根据样本是来自于这个总体来计算的。
现在这个计算的依据不存在了。当然5%也就无从得来了。可是,认为小概率事件不可能发生的时候犯的错误为啥能确定为5%呐。因为,那个时候,样本来自的总体是确定的,已知的。[5%的计算依据是存在的。]说了半天,你糊涂没?反正我有些晕了,准备去接匹萨了。
收起