博主资料

留言 加为好友 收藏

用户名:  mahongbin
来自:  北京 朝阳

日历

2008 7.4 Fri
  12345
6789101112
13141516171819
20212223242526
2728293031  
«» 2008 - 1 «»

个人统计

用户名: mahongbin
等级: 一星会员
威望: 305
积分: 1560
在线时间: 43 小时
日志总数: 104
评论数量: 69
访问次数: 335593
建立时间: 2007-07-05
RSS订阅       手机访问

文章搜索

最新评论

最近访问的人:

诚信证件
2008-07-04 04:45:42
zyyuuu
2008-07-03 17:50:30
电子商务研究(B2C)
2008-07-03 13:51:53
sissi
2008-06-30 10:26:44
猪八戒威客
2008-06-25 18:12:40
方圆e家
2008-06-23 19:49:03
大江东去十年IT
2008-06-22 17:30:05
直流电源,直流稳压..
2008-06-07 11:41:20
徐祖哲
2008-06-07 00:10:59
学无止境,苦作舟
2008-06-04 16:47:24

日志文章列表

2008年01月30日 10:38:17

数据分析讲堂

数据分析讲堂

第五课 TM1应用实例

第二讲 采购和货币交换(一)

实例背景

Foodcakes国际(FCI)在20个国家超过100个市场内购买鱼,鱼用当地货币购买,并建立当地的银行账号。目前,开支以当地货币每月报告一次,并在总部依据月平均汇率转换成美元。虽然本地采购代理依据每天的价格波动来采购鱼和其他原材料,但FCI公司管理者意识到鱼的总采购成本是当地价格和美元相对汇率的函数,并且每天的汇率波动可以同本地货币标识的原料价格的日波动一样大。而且,他们还注意到本地采购代理使用的本地货币银行账号对美元的成本更应该是用此货币标识的价格的函数,而不是此货币支出时当天汇率的函数。因此,FCI想添加货币交换模型以区别汇率和货币成本。本地银行所用的和FCI采购代理交易时所用的应该是同一汇率。模型实现后,此模型应允许公司管理者比较各国家、市场的相对原料价格,从而制定每一天的在不同地区提高或减低购买量的公司决策。
1. 采购
采购数据有两个来源:纪录实际采购交易的销售单据和纪录官方汇率的汇率表。由于FCI启动了数据仓库项目,它可以把销售单据从一堆交易头表和细节表换成采购事实表和关联的维表,如图5.2.1所示。
'800')this.width='800';if(this.h..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1607) |  收藏
2008年01月24日 12:18:41

数据分析讲堂

数据分析讲堂

第五课 TM1应用实例

第一讲 实例介绍

Foodcakes国际(FCI)是一个纵向集成的私有公司,它生产和销售两个产品线的foodcakes:鱼和蔬菜。FCI从20多个国家购买原材料,并在3块大陆上设有生产工厂,然后通过75个国家的300个分销中心销往超过10000个商店。去年,FCI年收入第一次达到了5亿美元。公司具有广泛闻名的良好品牌形象,在大多数运作地区都有很强的市场渗透力。FCI愿意通过公开发售股票公开招股。
然而,产品的质量却不太稳定,公司对市场变化响应缓慢,盈利相对其他较小规模的包装食品生产商来说在萎缩。公司已经受到警告:如果公司不提高业务一致性的话,公众将不可能去支持一个IPO。
为了在公开发售股票之前努力提高业务运作一致性,公司启动了一个数据仓库项目。数据仓库涉及公司的各个方面,诸如采购、原料及产品存储、生产、分销、人力资源、销售和市场、客户关系、财务管理等,各个业务系统的数据都按部就班地添加到了FCI的数据仓库中。
数据仓库需要支持的一些查询及其相应得主题域包括:
采购

l       每个时间周期内购买了多少原材料?
l       每个市场购买了多少原材料?
原料存储

l     ..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1548) |  收藏
2008年01月21日 10:15:10

数据分析讲堂

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第七讲 更复杂的聚合与分析

如在本讲开头所述,存在很多不同的方法允许你顺序地定义和实现OLAP模型。根据你自己的情况,你可以考虑或者不考虑更复杂的问题。然而,一般地,你很可能需要先把所有的基本聚合搞通。我感觉本讲之中的问题对某些人来说,可能在某些情况下出现。本讲不讨论如何建立决策树这类分析技术,也不讨论进行聚合分析或定义带约束的优化。相反,我们关注的是,在多维环境中出现的可能影响分析过程的派生说明。
1. 非叶子输入数据
数据并不总是叶子或基本等级输入立方体。我们看一些或本分配的例子,这些例子也是沿着与销售信息集合一样的产品层次结构进行运行的。成本数据在层次结构的最顶层输入立方体,然后向下分配。记住,输入和派生的属性是数据的功能而不是维成员的。
从实践的角度来说,你需要能够识别不再基本等级输入立方体的数据,并且要了解什么时候公式依赖的输入数据来源于非叶子等级,尤其是存在叶子等级数据时。
需要了解存在非叶子等级数据的一个原因是,并不是所有的产品都同等程度接受非叶子等级输入数据。如在本讲前面讨论的,数据共享相同的层次结构但却不共享相同的聚合等级的..

阅读全文>>

类别: 无分类 |  评论(3) |  浏览(1700) |  收藏
2008年01月17日 11:28:55

数据分析讲堂

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第六讲 公式

影响你需要建立分析的一个主要因素是:你自己是最终用户,还是你为最终用户建立执行他们自己分析的系统。如果你在为其他人建立系统,你的目标应该是建立一个方便执行分析的环境:如果你是最终用户,你在一些基本的、预定义分析之上仍然需要执行动态即时分析。不管哪种方式,你都需要执行基本的聚合和分析。
多维建模的一个关键模块是公式或派生的定义,尤其是聚合公式。一个公式可以简单到单个维中单个变量中的两个数字的简单求和,也可以复杂到一个含有级连、条件、加权方程的多立方体系统。对大多数应用来说,大部分公式是基本的求和与平均。图4.6.1显示的MTS视图包含了一个跨3个层次维计算叶子等级数据聚合的简单公式。
'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />
对模型来说并不存在优先级计算顺序。如你在前面见到的,你需要知道你想要计算什么,才能决定公式中各个部分的先后顺序。因此,虽然你通常会在其他类型的计算之前先进行聚合,并且它们在下面的内容中也是首先出现的,但在排序上仍然存在很多例外情况,我甚至不能称其为经验法则。不管怎样,如果你认..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1560) |  收藏
2008年01月14日 15:13:18

数据分析讲堂

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第五讲 维成员和决策环境

一、维成员

如果你想在高等和低等多维模型之间找出一条分割线,想象此线存在的一个好地方是在层次结构和个体成员之间的边界。像产品和客户这样的维,可能会存在5个到10个等级和成千上万的基础等级成员。一个包含所有2000000个客户的图表不会适合任何实际的目的,当然也不能作为摘要之用,因为成员数太多了。一个有用的模型应该是现实世界的缩小版本,而不只是复制。
列举维成员的一些代表样本在确保不发生混淆方面可能是有用的,通过成员的抽象列表建立测试模型也可能是有用的。但一旦开始在成员数很多的维的所有成员上开展工作是时,你所能做的最好的事,就是确保你自己已经对成员列表进行了充分的清理。例如,对于客户列表,你需要确信的是同一个客户没有出现多次。正如在前面讲堂中提到的,数据(或元数据,如本例中)清理是建设数据仓库的一部分。
在一个典型的大模型中,不会有超过1个或2个维有如此高的势。这也意味着大多数立方体都有一个或更多的低势维。场景和市场通常势都足够低,使得列举它们的所有成员是有用的。例如,可能只有10个不同的市场,每个市场的销售特定的一组产品,或..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1486) |  收藏
2008年01月10日 13:54:49

数据分析讲堂

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第四讲 连接与维层次结构

假定你能够识别数据源,这些数据源对应了模型的叶子等级,并且没有对源表中高等级聚合的引用,在此阶段给出从立方体到源数据的初始连接是有用的。
【注意】
如果你的源表定义了聚合等级,或者某些源数据体现了聚合信息,你需要在连接之前在立方体中重新定义这些等级,或者你需要使用具有在连接过程中定义等级能力的工具。

在此步骤装入一些或所有数据的好处是,它给了你测试模型维的能力,以避免一旦维需要改变时,已经定义的大量其他结构也需要重新修改。由于数据已经存在,这也使你能够定义和测试变量公式。由于大部分层次还不存在,也不会存在由于太多时间和存储消耗而使情况复杂化的危险。
你对维本身和每个维中需要建立的层次结构越确信,则你在定义层次之前与之后定义的连接之间的差别越小。
正如你在前面几讲看到的,维可以有层次结构,但不是必需的。例如,产品、时间和地点通常会有层次结构,而场景则通常没有。问题是:维都有哪些层次结构?同样,如你在前面几讲看到的,大多数层次本质上具有更多的水平性或非水平性,大多数工具或者偏爱非水平性,或者偏爱水平性。
如果你从有层..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1560) |  收藏
2008年01月08日 10:01:27

数据分析讲堂

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第三讲 立方体和维

你需要进行的第一件设计是模型的逻辑立方体和维结构。即使你正在使用的是超立方体产品,你也需要把所有的数据放到一个物理立方体内进行交互,同样,查看数据的逻辑立方体结构也是有用的。
虽然人们可以在不提及变量的情况下谈论维结构的设计,OLAP工具也允许你在没有任何变量信息的情况下创建维结构,并将其链接建立立方体,但由于维(或作为定位器的类型)的用途是个体化变量的值,为正确地确定维,你仍需考虑变量。变量是要展现、存储、访问和操纵的内容,并且随着维组合的不同而变化。处理的方法是找出跟踪、测量或计算的变量,并根据它变化所依赖的定位器维分组。
比如,对一个销售应用来说,要把所有的东西都放在一个业务模型内,变量可能包括销售额、成本和销售量,维可能包括时间、市场和产品。对金融应用来说,变量可能包含账户余额和信用评级,维饱含账户号码、分支号码、账户类型和时间。对于预算计划应用,变量可能包含预期收入、head count、间接费用和分配的开支,维可能组织为条目、时间和方案。与用户交谈,他们应该能告诉你基本内容是什么以及何种方式比变化。
假设你正在以表格形..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1491) |  收藏
2008年01月03日 11:28:41

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第二讲 逻辑模型定义

OLAP世界中的逻辑模型和关系世界中的模型存在很大的差别。在关系世界中,逻辑数据模型不会派生出数据。在DDL和DML的商业实现中的SQL,不能够很好地支持一些需要在常规基础上执行的派生计算。在这个意义上来说,多维信息系统的逻辑模型都需要尽可能多地定义各种派生计算。
给定对当前状况的理解、已知的问题、用户需求和对解决方案的约束,你如何定义一个在给定约束下满足用户需求并解决所有已知问题的多维模型呢?定义一个模型有特定的步骤吗?有必须明确的要素吗?
从宏观上来看,你需要把模型定义为一个或更多个立方体,其中包含数据源(或指向数据源的链接)和派生的数据输出(或用户视图),并且所有的派生数据都能通过输入数据来定义。这将确保能够从数据源产生数据输出。图4.2.1是以前讲过的多维数据结构的一个版本,在此用来表示数据转换。竖线仍然表示维,但这里的分段表示的是粒度层次而不是个体成员。连接在一起的点表示了数据进入立方体的粒度层次。箭头表示计算方向。比如图的上半部分,我们可以看到销售数据是从立方体的基本层次进入并向上聚合。而图的下半部分,成本数据是从商店、商品的顶层、时..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1359) |  收藏
2008年01月02日 14:48:02

数据分析讲堂

第四课 设计和实现OLAP模型的实践步骤

第一讲 概述及用户需求

要设计和实现一个多维信息系统有许多工作要做。概括来说,这些任务包括问题定义、工具选择和解决方案的实现。理想情况下,工具选择应该在问题定义之后,如我们在前面谈论的那样,工具通常都是为特定用途而进行优化的。
比如这些工具:
l       只能做客户端或服务器
l       需要把所有数据都加载到内存
l       假定实际的数据都存放在关系数据库中
l       有内置的时间、会计和货币的知识
l       假定存在一些特定的维——如时间、地区或产品
l       功能较少,但在其特定领域内使用更简单
l       难于使用,但通用性更强
然而实际上,工具选择很可能在对问题有全面理解之前进行,涉及的因素也是一些与问题的逻辑或物理层面无关的因素,包括工具的价格、供应商的位置、销售人员易于被人接受的程度、供应商的大小和声誉、供应商的服务和质量,以及企业内是否有供应商的支持者等。因此,工具选择的过程将会对你如何设计和实现联机分析处理模型产生影响。
不论各种影响工具选择..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1799) |  收藏