histogram的中文意思
ignorant | 11/02 2005, 19:41
柱状图(histogram)
目的: 用图形显示一系列分散的数据
差异: 制造出的产品和设计规格完全一致是最好不过了。 如果我们要生产一些直径规格一定的圆柱, 我们希望生产出的每一个圆柱都有相同的直径值。 但实际不是这样的。 每两个圆柱的直径都会有所不同。 差异也不是完全有害。 差异的一个特点是它展示一种规律, 一种分布。 这个规律可以帮助我们认识制造过程, 和制造过程中的问题。 柱状图可以帮我们认识这个规律。
柱状图: 柱状图是总结, 分析, 和显示数据的工具。 它用图形表现数值的分布, 把现象或测量数据归类, 并显示每类...全部
ignorant | 11/02 2005, 19:41
柱状图(histogram)
目的: 用图形显示一系列分散的数据
差异: 制造出的产品和设计规格完全一致是最好不过了。
如果我们要生产一些直径规格一定的圆柱, 我们希望生产出的每一个圆柱都有相同的直径值。 但实际不是这样的。 每两个圆柱的直径都会有所不同。 差异也不是完全有害。 差异的一个特点是它展示一种规律, 一种分布。
这个规律可以帮助我们认识制造过程, 和制造过程中的问题。 柱状图可以帮我们认识这个规律。
柱状图: 柱状图是总结, 分析, 和显示数据的工具。 它用图形表现数值的分布, 把现象或测量数据归类, 并显示每类出现的频率。
制作柱状图: 下面是制作柱状图的步骤:
收集数据: 最少需要测量50个样品才能达到较好的效果。
计算样品数据的范围: 范围是指最大值与最小值的差。 范围 = 最大值 - 最小值。
把测量值分组: 在X轴上显示每个组, 如下图
如何分组决定柱状图是否能有效地分析数值的变化, 因此是非常重要的, 下表是常用样品数和分组数的对应关系。
计算组距: 组距是每组在X轴上的宽度。
用公式计算: 组距 = 范围 / 组数。
计算组界: 即可以被放入某组中的最大和最小值。
计算每组中的数据数目(出现频率)。 通常用一个记数表来找出每个组距内的数值。
象上面第一个图一样画柱状图, 把数据显示在图中
例子: X公司生产100欧姆的小电阻。
最近客户经常投诉电阻值不合规格。 公司派了一个小组来调查电阻值偏移情况。 小组决定先画一个柱状图来了解一下电阻偏移程度, 从生产线上抽了50个电阻, 下表是各电阻的阻值。
这些样品的范围 = 110 – 74 =36。
组数设置为6。 (见常用样品数和分组数的对应关系)
组距 = 范围 / 组数 = 36/6 =6。
组界和每组的出现频率见下表
下图是根据生产线上抽出的50个电阻样品做成的柱状图。
很明显大部分电阻(约一半)的电阻值在78到90欧姆之间。 这证明X公司关于它的电阻电阻值为100欧姆的观念是不正确的。 下一步是检查制造过程, 找出使电阻值偏移的原因。
结论: 柱状图是一个简单的工具, 它可以让我们辨认和理解数值的变化, 一目了然地总结和展示数据, 但柱状图并不提供结决问题的办法。
它只是制程提高的出发点。 而且柱状图给出的答案取决于测量的数据。 如果数据不准确, 通过柱状图得到的结论也不会准确。
源文件
histogram与10053
histogram是oracle为cbo提供更精确的成本估计而设计的一种直方图数据。
histogram能提供列的数据分布,每次分析表后列的分布信息将会被保存在统计表里面,分析时默认的histogram size是75,意思就是采用75个buckets来表示数据分布。
histogram分为2种类型,基于高度的histogram和基于值的histogram
基于高度的histogram
当histogram buckets的数量少于列的distinct value时,oracle会采用基于高度的直方图反映数据分布,每个bucket容纳相同数量的值。
基于值的histogram
当histogram buckets>=列的distinct values时,那么Oracle会使用基于值的histogram,每个值将会占据一个bucket
与基于高度的histogram的区别,基于值的histogram为每一个值提供了一个bucket,从上面看到值1有19928行,值2有9999行,值3有9999行,值4有9912行,值5-75都分别只有1行,同样我们可以看出值1占的比例最大。
。收起