假设检验与p值


  假设检验是推断统计中的一项重要内容。在假设检验中常见到P值( P-Value,Probability,Pr),P值是进行检验决策的另一个依据。P值一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。
  关于假设检验我先举个例子:
  假设买彩票中一等奖的概率是万分之一,某人连续买了两次,结果都中了一等奖。对于这件事,我们会有两种猜测:

H0:中奖者运气好
H1:不是中奖者运气好,是他作弊了

  我们首先,先假设H0成立(毕竟我们相信人的本质都是好的嘛)。那么我们为了证明我们的假设,就必须要计算H0是真的时,买彩票者连续两次中一等奖的概率,p=(1/10000)X(1/10000)=1/100000000,概率是亿分之一。丫的,这么小概率的事件怎么可能会出现。于是,我们推翻了我们的假设,H0不成立,那小子作弊了(小子,你这个hao社会主义的羊毛啊),我们坚信H1是成立的。
  看到这里,也许各位明白了,p值就是我们假设的条件(H0:中奖者运气好)成立时,在某种结果(如本例中该买彩票者买了两次彩票,中了两次一等奖)出现的概率。
  在这里,当p>0.05时,(在H0下,中两次彩票)碰巧出现的可能性大于5%,概率不算太小,两组差别无显著意义,所以我们接受H0;
  当p<0.05时,(在H0下,中两次彩票)H0碰巧出现的可能性小于5%,概率有点小,两组差别有显著意义,所以我们可以拒绝H0;
  当p<0.01时,(在H0下,中两次彩票)H0碰巧出现的可能性小于1%,概率太小了,两者差别有非常显著意义,所以我们拒绝H0.
  本例中,在H0条件下,中两次彩票的概率p为亿分之一,远远小于0.01,所以我们才拒绝了H0。
  我们对某事件(如彩票事件)进行验证的过程,就是假设检验。实际上,P值不能赋予数据任何重要性,只能说明某事件发生的机率。