日历

2008 9.6 Sat
 123456
78910111213
14151617181920
21222324252627
282930    
«» 2008 - 9 «»

日志分类

文章搜索

日志文章

2007年11月19日 15:56:50

数据分析讲堂

数据分析讲堂

第三课 维度的内部结构

第六讲 维度层次(3

不同类型层次之间一个关键差别是从层次的根节点或者叶子节点共享相同距离m的一组实例,是否也从叶子节点或根节点共享相同的距离m,考虑图3.6.1、图3.6.2和图3.6.3。对于图3.6.1中的层次,如果需要访问所有到根节点的距离与家电产品相同的节点,则结果如图3.6.2所示。结果包括了桌子、椅子、床、家电产品和办公用品。其中所有的元素距离根节点的距离都是2
但是从根节点下降两个m距离的层次维度的成员和叶子节点的距离并不完全相同。如图3.6.3所示,其中包含的产品层次和图3.6.2相同,但是其中着重显示了家电产品距离叶子节点相同的元素。家电产品和根节点的距离是2,而叶子节点的距离也是2。但是当我们从叶子节点开始计算的时候,其他距离根节点是2的节点没有一个和叶子节点距离一样的。这种类型的层次被称为非对称或者是非水平的。在实践中,产品、组织和地区报表层次常常都是非水平的。



有些读者可能已经注意到了,从叶子节点统计距离的时候,可能有不只一种方法。一般来说,这个时候可以取其中的最大值,如图3.6.3所示,或者取其中的最小值,如图3.6.4所示。两种计算方法都是有用的。
例如,最大值的方法对于衡量层次的深度是非常有用的,而最小值的概念对于从下而上的数据汇总则是非常有用的。不过由于最大值的方法被使用得更加广泛,因此在本讲义中,如果没有特别说明,则表示采用了最大值的方法。

3.6.5 显示了一个简单的非水平层次,其中每个节点的中心是名字,而周围有三个数字。左上角的数字表示的是该节点与根节点的距离,左下角的数字表示的是根据最小值方法计算的距离叶子节点的距离,右下角的数字表示的是根据最大值方法计算的距离叶子节点的距离。这种类型的图表可以让你看到每种计算方法下各个节点的值。同时,你还可以发现有哪些节点具有多条通向叶子节点的路径。在本例中,CEOCOO 都有不同长度的汇报路径。

3.6.2和图3.6.3中的层次都是典型的非水平层次,而图3.6.5中的层次则是一种极端的非水平层次。它可能比典型的企业汇报层次更加非水平,同时它也是一种决策树的表示方法。考虑图3.6.6中的决策树处理过程。整个过程从根节点开始,在每一个节点,处理过程将会生成一条或者两条路径,最终的结果就是图3.6.5的层次结构所示。决策树也可以是非二元分叉的(如图3.6.7所示)。


类别: 无分类 |  评论(0) |  浏览(1745) |  收藏
发表评论