日历

2008 9.7 Sun
 123456
78910111213
14151617181920
21222324252627
282930    
«» 2008 - 9 «»

日志分类

文章搜索

日志文章

2007年11月23日 12:31:44

数据分析讲堂

数据分析讲堂

第三课 维度的内部结构

第七讲 水平或者对称的层次

虽然非对称的层次非常常见,但是并不是所有的层次都是非对称的。如图3.7.1中的时间层次,其中的每一个成员,无论从上到下还是从下而上,它们的距离都是一样的。对于对称层次来说,你可以按照它们的层次来引用。因此,在图3.7.1中,度量季度的所有实例就是所有叶子有两个度量上升的节点,也就是距离根节点有一个度量下降的节点:它可以简单地用季度层次来引用。

虽然非水平层次非常适合于对非规范的块状数据进行汇总,但是它们没有提供跨堂兄弟分析的功能。但是该方法的语法并不适合于所有的非水平层次。水平层次则不同,由于提供了级别的概念,所以可以进行任何类型的系列分析。基于级别的层次的特征和使用方法将在后面排序部分介绍。


第八讲 具有名词排序实例的带级别维度

在业务维度中,一个典型的名词级别维度的例子是地理位置,如图3.8.1所示。请注意其中命名的级别是商店、城市、地区、国家等。实例需要满足级别之间必须有允许连接的条件。每一个商店必须连接到某个城市,每个城市必须连接到一个或者多个商店。当具有相同度量的实例集合都充分连接到了一个相邻度量的实例之后,那么所有的聚合操作就都会有确定的结果。

例如,级别之间的数据聚合应该是相等的。所有城市的销售数据汇总应该等于所有商店的销售数据汇总。在不同的级别中,求和及平均值也会产生相同的结果。如果结果不相同的话,那么肯定是有些实例没有充分连接,因此只能称为命名分组而不是级别。
在介绍一般层次概念的时候,引用了⊿m/i,对非水平层次而言,该记号被用做上下移动的功能,同样它也可以在水平层次中使用。这个问题只是个开始。如果开始的时候,你使用一个实例并且做了上下移动,那么返回的结果是一个实例或者一组实例。如果开始的时候,你使用了级别的上下移动操作,那么结果就是一个级别。聪明的读者马上会意识到我们需要一种可以访问级别中某个实例或者一组实例的方法。下面就是我们所需要的语法。
l       Under:当作用于一个级别的时候,返回的是给定级别的所有下层级别,不包括给定的级别本身。
Geog.Country.under>>Region,City,Store
当作用于一个实例的时候,它依然会返回给定实例下的所有下级实例,不包括给定的实例本身:也就是说,得到的结果对于层次和非水平层次是一样的。
Geog.Avignon.under>>Store.(13,14)
l       Atunder:当作用于级别的时候,返回的是给定级别的所有下层级别,包括给定的级别本身。
Geog.Country.atunder>>Country,Region,City,Store
l       Over:当作用于级别的时候,返回该级别之上的所有级别,但是不包括该级别本身。
Geog.City.over>>Region,Country,All
l       Atover:当作用于级别的时候,返回的是该级别之上的所有级别,包括该级别本身。
Geog.City.atover>>City,Region,Countey,All
l       Downn:当作用于级别的时候,返回的是位于该级别下n层的级别。
Geog.Country.Down2>>City
l       Upn:当作用于级别的时候,返回的是位于该级别之上n层的级别。
Geog.City.up2>>Country
除了可以上下移动级别外,我们还需要能够返回级别中的某个实例或者是一组实例,下面就是对应的语法。
l       类型.实例.级别返回实例所在级别的名称:
Geog.USA.level>>Country
l       类型.实例.级别.Up/down’x’返回给定实例的上x层级别或下x层级别的名字:
Geog.USA.level.down1>>Region
l       类型.实例.在给定实例的级别上层(atover)的特定名称的级别返回给定实例对应的特定级别上的祖先节点的实例的名称:
Geog.Store.12.Country>>France
l       类型.级别.实例.返回的是给定级别的所有实例:
Geog.USA.level.downq.i.>>Bible belt,Rust belt
为了将问题简化,类型.级别.也返回一个级别的所有实例,因为返回某个级别的所有级别是没有意义的。
除了直接的引用之外,级别还可以用于显示引用,例如,寻找洲级上某个给定商店的税率情况可以用如下的公式实现:
Taxes owed = sales × (Tax rate, Geog.city)

这个公式可以自然地运用于城市级别或者城市级别之下地理维度的任何元素。其表达的意思是取得某个城市的税率。

当使用级别的名称时,在公式中引用特定级别中的数据将会变得很容易。例如,一个公式可以将销售额按照年级别或者国家级别进行划分,而根本不用关心年级别和目前的时间成员有多远,也不用关心国家级别和地理级别有多远。通过使用级别名称,可以让分析员更加专注于公式的含义,而不是太过于关心级别的结构。

类别: 无分类 |  评论(0) |  浏览(1695) |  收藏
发表评论