谁能用浅显的语言帮忙解释下什么是
卡方分析的方法是这样的:假设两个变量是相互独立,互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表见例1;如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。 这种差值用一个卡方 统计量来表示;对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间...全部
卡方分析的方法是这样的:假设两个变量是相互独立,互不关联的。这在统计上称为原假设;对于调查中得到的两个变量的数据,用一个表格的形式来表示它们的分布(频数和百分数),这里的频数叫观测频数,这种表格叫列联表见例1;如果原假设成立,在这个前提下,可以计算出上面列联表中每个格子里的频数应该是多少,这叫期望频数;比较观测频数与期望频数的差,如果两者的差越大,表明实际情况与原假设相去甚远;差越小,表明实际情况与原假设越相近。
这种差值用一个卡方 统计量来表示;对卡方值进行检验,如果卡方检验的结果不显著,则不能拒绝原假设,即两变量是相互独立、互不关联的,如果卡方检验的结果显著,则拒绝原假设,即两变量间存在某种关联,至于是如何关联的,这要看列联表中数据的分布形态。
例如, 笔者在指导某跨国汽车企业的时候,客户需要研究不同国家的客户与使用车型之间的关联程度,以此为例,将表一中的三列数据“国家”、“车型”和“数量”分别输入到最新版的JMP7和Minitab15中,想得到汇总数据的列联表和卡方分析的结果。
国家车型数量美国人家用型74美国人工作型18美国人运动型23欧洲人家用型15欧洲人工作型4欧洲人运动型21日本人家用型66日本人工作型26日本人运动型56
表一 卡方分析的原始数据
对比项目一:操作的便捷性。
JMP的操作路径为:主菜单Analyze > Fit Y By X,确定Y、X、Freq三项后,即可得到如图一所示的报表;Minitab的操作路径为:主菜单Stat > Table > Cross Tabulation and Chi-Square,确定Rows、Columns、Frequencies三项后,再在Display、Chi-Square选项中做一定设置,即可得到如图二所示的报表。
显然,Minitab的操作步骤稍微多了一些。其实Minitab还有另外一条可以实现卡方分析的菜单:Stat > Table > Chi-Square Test(Two-Way Table in Worksheet),但是分析内容重复,而且行变量表头以“1、2”表示,不能体现实际意义,还增加了菜单的复杂程度,感觉不如不要。
图一 JMP的输出结果
图二 Minitab的输出结果
对比项目二:统计分析的具体内容。
具体内容由两部分组成:列联表中各单元格的计数和比例;卡方分析中两种不同方法(Pearson法和似然比率法)的P值。
JMP和Minitab的输出结果都是一致的,这说明两种软件背后所遵循的统计原理其实都是一样的。当然,正如大家所知道的,JMP的输出报表可以自定义,如调整小数点后的保留位数、自动将转换为数据表等等,因此显得更专业、更友好一些。
对比项目三:统计图形的效果。
Minitab完全是通过数字、表格来表现卡方分析的,而JMP在传统分析的基础上,还用如图三所示的“马赛克图(Mosaic Plot)”来表现不同国家的客户在选择汽车车型上的异同之处,使很多不太懂统计的人也能看懂一些明显的统计结论,使很多精通统计的人也能加深对统计结论的理解。
相比之下,Minitab显得太教条、太呆板了。
图三 JMP的Mosaic图
对比项目四:统计分析的拓展性。
JMP和Minitab都在卡方检验的基础上整合了Fisher's exact test和Mantel-Haenszel-Cochran's test等内容。
但值得一提的是,JMP还在此处恰当地引入了“对应分析Correspondence analysis”的概念,并且还可以用如图四所示的统计图形展现出来对应分析的结果,此例就生动地揭示出不同国家的客户对不同的汽车车型的偏好:欧洲人喜欢运动型汽车;欧洲人喜欢工作型汽车;美国人则喜欢家用型汽车。
在这一点上,JMP的菜单结构非常适合普通用户分析同一个问题时,往往从最简单的情形着手,然后步步深入探索的分析思路,这一点与Minitab罗列统计分析工具让用户自行判断选择的做法有很大的不同,相形之下,Minitab更适合对软件背后的统计学原理有相当了解的用户使用,这样才能有效防止错用统计分析工具。
图四 JMP的对应分析图形
对以上四个项目比较关注、经常使用或认真研究的用户应该都会得出一个结论:JMP在“卡方分析”方面远胜于Minitab。
JMP通过图形生动结合数据报表简明地展示出卡方分析的结果,更便于用户对分析结果的解读,对用户的统计学理论基础的要求也比较低,不像Minitab那样用单纯的数据报表进行分析结果的展现,理解起来比较费劲。
另外JMP的嵌套式菜单能引导用户一步一步将分析深入下去,而使用Minitab的用户须事先对分析数据的思路有一个明确的认识才能进行分析。
以上内容供各位网友参考,笔者还将认真研究和对比这两款主流六西格玛质量管理统计分析软件的异同,希望能帮助企业在进行六西格玛统计分析软件的选择时提供一些有价值的参考。
。收起