日历

2008 9.6 Sat
      1
2345678
9101112131415
16171819202122
23242526272829
30      
«» 2007 - 9 «»

日志分类

文章搜索

日志文章列表

2007年09月18日 11:43:26

数据分析讲堂


数据分析讲堂

第一课 数据分析过程中的多维技术

第一讲 如何在N维空间中思考数据分析

理解超立方体,或者说一个大于三维的立方体,是理解多维数据分析的基础,多维数据分析的超立方体与电子表格中的工作表和数据库中的表相对应。多维数据分析所有的浏览、报表、分析都是在超立方体上进行的。
超立方体通常是在低维空间的点、线、面、立方体基础上开始展开的。我们可以通过类比来想象一个多维的立方体。尽管这不是一个最好的方法,因为对于超立方体的理解并不遵循物理立方体的长、宽和高。
这一讲将指导我们如何考虑N维数据集或者现实世界的事物,我们采用的方法是在一个大家都熟悉的二维行列数据的基础上来增加维度。在讲解完本节课后,大家将会对超立方体有一个完整的认识,从而能够有效地吸取任何多维信息系统的信息。
让我们从一个典型的二维数据出发,无论考虑的是每个员工的工时,每个部门的成本、每个客户的余额、还是每个商店的投诉,这些都能够以二维表格的形式组织。
图1.1是一个按照月份组织的有5列销售和成本信息的二维表格。这个表格用任何电子表格软件都可以轻易创建起来并且显示在屏幕上。月份以行的形式按照从小到大的顺序进行排列,最后一行是汇总。这个..

阅读全文>>

类别: 无分类 |  评论(2) |  浏览(2247) |  收藏