|
数据分析讲堂
第一课 数据分析过程中的多维技术
第二讲 多维思考
如果你现在正在为跟踪不同产品在不同商店中每月的销售情况而头疼,说明你遇到了多维数据分析的问题。在这个例子中,我们应该用什么可视化象征物来表示涉及到的数据呢?又如何在一个数据分析系统中组织这些数据呢?如果依然用立方体来作为四维或者更高维可视化的象征物的话,整个可视化过程就会显得杂乱无章。图2.1中显示了一个四次元立方体,但是这个显示看起来已经过于复杂,而不象上一讲中的图那样容易理解。这就是当数据集增加到四个维度或更高时,会产生一个问题,即:逻辑维度和物理维度之间的差别。 '800')this.width='800';if(this.height>'600')this.height='600';" border="0" /> 奥地利思想家Ludwig Wittgenstein曾经针对这样的问题提出过一个基本理论:当使用一件物体来代表另外一个物体时,两者之间必须拥有一些共同的特征。因此用立方体表示的通常应该是数据生成事件中的一些方面,使其能够很好地对数据集进行理解,当然,数据生成事件中必然有一些方面是立方体无法体现的。 立方体的特征之一是在任何一点上所有的维度都是共同存在的。正如图2.2中所显示的,三维空间中的任意点(Xn,Yn,Zn)..
阅读全文>>
|