日历

2008 9.7 Sun
 123456
78910111213
14151617181920
21222324252627
282930    
«» 2008 - 9 «»

日志分类

文章搜索

日志文章

2007年12月06日 14:20:51

数据分析讲堂

数据分析讲堂

第三课 维度的内部结构

第十一讲 固定的换算系数

到目前为止,我们所看到的所有带有级别的维度,甚至是那些基数排序的实例,它们的换算系数都是可变的。现在我们来看一些具有固定换算系数的级别维度。虽然将固定换算系数作用到具有名词排序实例的带有级别的维度上从逻辑上是可能的,但是实践中,固定换算系数仅仅作用在具有基数排序实例的级别上,这一点我们稍后将会看到。
由于基数排序实例之间的差别都是一样的,那么对于众所周知的时间级别,给定秒和分钟之间的转换关系和一个实例的排序位置,我们就可以指出实例之间确切的连接关系。例如,秒成员73是分钟成员2和小时1的孩子,天成员40是月份成员2的孩子。
当使用固定换算系数维度的时候,维度可以通过在级别之间制定换算系数来定义。例如,你可以定义Time.levels.=Second.Minute.Hour.其中三个级别之间的饿关系都可以用整数表示。也就是说Level.Hour=60×Level.MinuteLevel.Minute=60×Level.Second。根据这一点,我们就可以判断出秒、分钟和小时都是完全连接的。
当然,有个别例外,纯粹的数字也是固定换算系数的。我们都知道每个世纪都需要增加几秒,在很多地方至少每两年都需要增加或者减少几个小时。空间看起来要比时间更加稳定一些,因为所有的层次都是派生出来的,但是还是有象引力这样的东西会对空间度量产生影响。因此没有必要去人工制造一些理想的关系,而只要识别出目前存在的两种主要的饿模式,同时展示这两个基本互补的类型,事实上这样已经反映了在目前商业产品中所有可能碰到的层次关系。
第十二讲 单个类型中的多个层次

在单个类型中可能存在多个层次。例如,在地理维度中,商店可以按照地区或者商店类型进行上卷。产品可以按照种类或者商标来上卷。类型中的每个层次是由一组惟一的级别或者具有层次关系的一组实例组成。例如,一个时间类型可以由两个层次组成:一个财政层次和一个日历层次。两个层次都可以共享天和月的级别。然后可以在季度和年份级别上有所差别。
对于一个非水平层次来说,其层次可以用父子表来表示,当在一个维度中存在多个层次的时候,在层次函数中就需要指定其对应的层次。
让我们根据下图来讨论产品的层次,看一下叶子节点所示的不同产品:床、便携式电视、影印机和传真机。我们还可以采用其他的方法对其进行分组而不只是家具和电器。我们还可以按照价格进行分组。如图3.12.1所示,类型便宜货、一般商品和奢移品代表了对产品维度成员的另外一种有效分组的方法。


选择合适的分组或聚合的中间级别对于我们理解和制定决策是非常重要的,因为数据只可能有一个细节级别和一个完全聚合的级别,但是可以存在很多聚合的中间级别。如图3.12.2所示,通向顶层的路径有很多。每一条路径都会特别强调某些因素,而忽略其他一些因素。例如,将商店级别的产品销售额聚合到城市、州和国家是强调了区域,也就是说强调了地区性的销售差别。中间级别可以有非常多种,例如产品价格分组、产品利润分组、产品类型、产品生产商分组,这些中间级别可以让我们从不同的角度观察和理解数据。这就是维度结构和统计之间的一个差别。例如,聚类分析等技术可以帮助你寻找到数据中的自然分组,从而作为一个有用的中间级别。
不同的分组方法不仅将成员进行重组,它们还会产生完全不同的聚合数据。图3.12.3的两个表格显示了两种聚合数据。每一个电子表格都是二维结构,都由一个变量维度和一个产品维度组成。两个电子表格的变量维度是一样的;两个表格中产品的叶子节点都是一样的。但是,在图3.12.3中,表格A上卷成了家具、家用电器和办公用品,而表格B则上卷了便宜货和奢侈品。不同成员产生了差别,同时成员的数量也是不一样的。产品和价格是对单个产品进行分组的两种非常有效的方法。对于大多数多维产品来说,两种不同的上卷方法将被看成是在同一个维度中的两个不同的层次。


从这个意义上说,维度可以看做由叶子成员的集合,以及由这个集合派生出来的层次或者成员的集合这两个部分组成。换句话说,维度的所有成员——叶子成员,中间级别成员和根成员——组成了一个相同类型的单一的成员集合,这些成员作为一个整体组成了多因素/维度情况下的一个因素/维度。你需要记住维度中的所有成员,从叶子到根,在不同的分析中都是不一样的。
让我们再看一下图3.12.1,如果一个维度拥有多个层次,当从任何节点上卷的时候就可能存在两个或者更多个父亲,因此有必要指定你所浏览的父亲或者根节点。例如,如果从传真机上卷的时候,你希望浏览办公用品,那么就必须指明你浏览的方向是所有产品的方向而不是奢侈品的方向。不同的OLAP产品在是否提供和如何提供这个功能上是有区别的。很多OLAP 产品都会定义一个默认的主层次,这迫使你有时候需要使用某种不太直观的方法来指定你所要访问的另外一条路径。而有些产品则提供了很强的灵活性,让你可以根据报表的上下文自定义层次关系。
Time.fiacsl_hierarchy.yearend
读做“时间维度fiscal hierarchy中的yearend成员”。
Geography.store_type_hiearchy.department_atores
读做“地理维度的store_typehierachy中的商店部门级别”。
Myfavoritedimension.alernativehierarchy.most popular member.upl
读做“我喜欢的维度上可替换的层次中最流行的成员的父节点”。

类别: 无分类 |  评论(2) |  浏览(1958) |  收藏
2楼 [匿名]ymwa9noe 2008年08月15日 15:19:42 Says:
%5Burl=http://www.lxwltg.com/%5D%E5%88%9B%E9%B8%BF%E8%BD%AF%E4%BB%B6%EF%BC%8C%E7%8E%B0%E5%9C%A8%E5%8F%AF%E4%BB%A5%E5%90%914200%E5%AE%B6%E5%9B%BD%E5%86%85%E5%88%86%E7%B1%BB%E4%BF%A1%E6%81%AF%E6%B8%AF%E5%8F%91%E5%B8%83%E4%BE%9B%E6%B1%82%E4%BF%A1%E6%81%AF%EF%BC%8C600%E5%AE%B6%E7%9A%84%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%99%BB%E9%99%86%EF%BC%8C800%E5%AE%B6%E7%9A%84%E9%BB%84%E9%A1%B5%E7%99%BB%E9%99%86%EF%BC%8C%E5%B9%B6%E4%B8%94%E5%8C%85%E6%8B%AC36000%E4%B8%AA%E5%90%84%E4%B8%AA%E7%B1%BB%E5%88%AB%E7%9A%84%E5%8F%AF%E5%8F%91%E5%B8%83%E5%95%86%E5%8A%A1%E4%BF%A1%E6%81%AF%E7%9A%84%E7%BB%BC%E5%90%88%E7%BD%91%E7%AB%99%E4%BF%A1%E6%81%AF%E5%B9%BF%E6%92%AD%E5%8A%9F%E8%83%BD%EF%BC%8C%E6%88%90%E5%8A%9F%E7%8E%87%E6%97%A0%E5%8F%AF%E6%AF%94%E6%8B%9F%EF%BC%8C%E9%AA%8C%E8%AF%81%E7%A0%81%E5%87%A0%E4%B9%8E%E5%81%9A%E5%88%B0%E4%BA%86%E5%85%A8%E8%87%AA%E5%8A%A8%E8%AF%86%E5%88%AB%EF%BC%8C%E8%87%AA%E5%8A%A8%E5%A1%AB%E5%86%99%EF%BC%81%E5%B9%B6%E4%B8%94%E5%A2%9E%E5%8A%A0%E4%BA%86%E6%AF%8F%E5%A4%A9%E6%88%96%E6%AF%8F%E5%91%A8%E6%88%96%E6%AF%8F%E6%9C%88%E5%85%A8%E8%87%AA%E5%8A%A8%E6%89%A7%E8%A1%8C%E8%AE%A1%E5%88%92%E4%BB%BB%E5%8A%A1%E7%9A%84%E5%BC%BA%E5%A4%A7%E5%8A%9F%E8%83%BD%EF%BC%81%E6%97%A0%E9%9C
1楼 [匿名]团体 2007年12月11日 10:29:40 Says:
hand的员工乔向英,做技术的,前几天在深圳华为的项目上猝死,12月5日
发表评论