日历

2008 9.7 Sun
      1
2345678
9101112131415
16171819202122
23242526272829
30      
«» 2007 - 9 «»

日志分类

文章搜索

日志文章列表

2007年09月29日 09:47:32

数据分析讲堂

在www.jupiterst.com的"互动咨询"栏目中也登载了我的"数据分析讲堂"的内容,那里有图形显示(这里的图形显示不出来),所以想了解图形的读者,不妨去那里看看.

数据分析讲堂

第二课 OLAP系统的功能性需求

第二讲 OLAP介绍

OnLine Analysis Process(简称OLAP)是创建Business Intellection(简称 BI)系统的重要技术。
好象单单一个OLAP术语还不够,很多商人和一些行业专家迫切想创建新的名词来描述联系分析处理这个过程。很典型的就是在OLAP之前加一个字母,以区别他们和别人之间的偏好。
最初使用这种前缀的是一些OLAP的供应商,比如MicroStrategy,他们销售位于关系数据库顶层的OLAP产品层,该产品以SQL结果来响应用户的输入。该产品只提供简单的OLAP计算功能,并且一般都是只读系统。但是,当关系数据库在数据仓库数据存储点的选择中击败OLAP系统之后,争论就很自然地出现了,并且宣称关系OLAP(ROLAP)要优于OLAP。这个宣称迫使非ROLAP提供商将其产品重新命名为MOLAP,也就是多维OLAP的意思。

当然,当出现了先例后,每个人都想给OLAP加个前缀。其中有DOLAP分别代表数据库OLAP和桌面OLAP,HOLAP代表混合OLAP,WOLAP代表网络OLAP,MOLAP代表移动OLA..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(2112) |  收藏
2007年09月28日 10:54:28

数据分析讲堂

数据分析讲堂
第二课 OLAP系统的功能性需求
第一讲 OLAP信息特征
信息时代所有商业活动的基石就是信息处理,其中包括数据收集、存储、传输、操作、抽取和检索。
通过比较正确和错误的决策之间的价值差别,我们就可以认识到高质量信息的重要性,因为通常决策是基于信息做出的。正确和错误的决策之间的价值差别越大,拥有高质量信息的重要性就越大。例如,关于消费者购买趋势的低质量信息将会导致零售商做出低质量的采购和分配决策,结果就是导致过度囤积商品的减价销售,同时对于有些商品,则会因为存货不够而丧失获利机会。于是,零售商们越来越重视准确的产品需求预测信息。关于动态的高质量信息能够帮助证券、金融商们做出更好的交易决定,从而直接为交易方带来丰厚的利润,这样的例子有很多很多。目前国内各金融机构及券商们都在信息技术上投入了大量的资金,这是非常重要的。对于注重信息技术的聪明的商人来说,信息的价值回报也是十分丰厚的。
不管处理的是什么信息,也不管是如何进行处理的,最终的目标或期望得到的信息特征都是相同的。好的信息必须是实现存在的、准确的、及时的和可以理解的。所有的需求都是非常重要的。假如你拥有全中国唯一能够根据今天的股票价格..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1784) |  收藏
2007年09月27日 10:58:37

《一个案例——从信息角度看数据价值》之一——总体概论

这是一家国内知名的企业,其产品遍布我国的大江南北,城市乡村。最近这家企业聘请了国际上一家知名的咨询公司给企业做战略咨询。
咨询报告从其产品出发,涉及到了企业生产、管理、销售、市场、渠道、代理商等多个环节。从咨询报告总体看,其结构严谨、观点明确、论述有理有据、文字简练,不失为一个比较好的企业发展战略规划报告。
在原有报告收集该企业大量数据信息基础上,我试图从另外一个角度来阐述我今天要表达的观点——那就是企业信息的价值发现及价值分析。
(出于商业的原因,数据进行了改动,另外数据项也做了部分调整。)


企业在自我生产、发展的同时,积累下大量的信息,针对这次战略规划,我们收集和采集了企业的财务数据、市场数据、销售数据等,对于这些数据,包括企业董事会开会要用到的企业预算信息,我们进行了非常有针对性的整理,按照不同的主题,将数据归类,以便后面的数据利用和数据分析。
首先是生产数据,该企业生产的奶制品包括有鲜奶类产品,有乳酸类产品,有奶酪类产品共132个品种。比如,奶制品有125g的袋装、盒装,袋装又分为纸袋和食品塑料袋。奶制品还有250g的,500g的,1000g的,2000g等等规格。每个规格产品中又分原味的,含钙的,高钙..

阅读全文>>

类别: 无分类 |  评论(1) |  浏览(1895) |  收藏
2007年09月27日 10:51:28

数据分析讲堂

数据分析讲堂

第一课 数据分析过程中的多维技术

第六讲 分析视图

虽然使用网格显示没有绝对的对和错,但是我们还是要遵守一些经验规则以取得更好的分析效果。首先,将对维度嵌套在行或者列中相对于放在页维度中会占据更多的空间。因为整个屏幕空间是有限的,用于显示维度的空间越多,那么用于显示数据的空间就会越少。随着显示数据空间的减少,为了查明同样的数据就需要做更多的卷屏操作。卷屏操作的增加也加大了理解正在寻找数据的难度。因此,我们应该遵循以下的一些经验规则。
第一,     应该将维度尽量放在页中,除非确实需要同时看到一个维度的多个成员。这样能够让屏幕上的信息尽量相关。
第二,     当确实需要将维度嵌套在行或者列中的时候,考虑到垂直空间要比水平空间更为有用,所以将维度嵌套在行中要更好一些。一个经典的显示方式就是在行上有一个维度,而列上嵌套有1个到3个维度,而其他的维度则被放在页中。如图6.1所示。而在图6.2中,有4个维度嵌套在行中,1个维度分布在列中,没有维度分布在页中,这种显示方式就没有图6.1显示的效果好。
'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />
第一..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1790) |  收藏
2007年09月26日 10:05:59

数据分析讲堂

数据分析讲堂

第一课 数据分析过程中的多维技术

第五讲 维度合并影响

维度合并之后发生的两个主要变化是:轴的长度和临近的点;而一个没有发生变化的主要内容是:陈述的事实。
第一个发生的变化是显示数据的形状。就是图4.2和图4.3中显示的那样,一维列表的长度等于原来两个维度长度的乘积。当维度的长度如这些例子中那样短的时候,其影响可以是忽略不计的,但是当维度的长度是几百或者几千的时候,就会产生很大的区别。
'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />

'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />
例如:一个100×100的数据可以一下子展示在整个界面上,而浏览一个10000行的列表则需要很多屏的滚动,显然浏览前者要比浏览后者来得方便。这并不代表或意味着不可以进行维度合并,只是提醒你在合并维度的时候要注意合并后对数据形状的影响。

第二个发生改变的内容是点周围邻居的情况。在二维情况下,每一个点都有四个直接邻居。当两个维度进行合并之后,每个维度列表中的点就只有两个直接邻居。这个现象可以从图5.3中看到。

在该图的上半部分数据是以二维形式组织的,Ne..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(2017) |  收藏
2007年09月24日 11:07:02

数据分析讲堂

数据分析讲堂

第一课 数据分析过程中的多维技术

第四讲 多维显示

我们已经指出了为什么物理立方体不能很好地起到可视化象征物的作用,同时介绍了表示多维数据集的逻辑结构的可视化原则,但是最终我们还是要在某个系统中看到这些数据。这样就产生了可视化多维数据的第三个需要解决的问题:如何将多个逻辑维度映射到二维空间中。一个很具体的案例就是如何将一个具有四个逻辑维度的问题,映射到行、列和页面这三个显示维上呢?方法其实就是将多个逻辑维度组织到同一个显示维度上。
图4.1显示了一个按照产品和变量组织的三维表,其中的每个交叉点都标上了明确的名称。我们需要观察二维网络中的每一个交叉点是如何由维度中的成员构成的,另外还要注意维度中每个成员是如何与其他成员结合的。在这个简单的例子中,2个产品和3个变量一共形成6个产品变量组合。

销售成本利润鞋子鞋子销售鞋子成本鞋子利润袜子袜子销售袜子成本袜子利润图4.1二维分布
将两个维度映射为一个维度意味着创建一个二维交叉点的一维版本。显然任何一种安排都是可行的,但是通常的方法是将一个维度嵌套在另外一个维度中。图4.2显示了如何从图4.1中的二维网络形成一个变量嵌套在产品中的一维列表中。需要..

阅读全文>>

类别: 无分类 |  评论(1) |  浏览(2203) |  收藏
2007年09月24日 10:51:11

《再谈关于农业信息化》

本月19日参加了2007年全国信息化推进大会,在会上发言的各位领导和专家都多次提到了要加大农村信息化建设,并且十分准确和精辟地阐述了这项工作的意义。听完各位领导的报告后,感触颇多。一段时间以来我反复思考着一个问题,这就是——农业信息化的最根本点是什么?换句话说,农业信息化首要解决的问题是什么?就这个问题以下我谈谈我的观点。
毫无疑问,在信息化发展的今天,随着信息技术的渗透,我国的农业作为一个极大的产业,也正在逐步走向信息时代,即人们称之的农业e时代。这几年各种辅助农业发展的信息化系统层出不穷。比如:各地的农科热线、农民一点通、食用农副产品质量安全信息平台、蔬菜信息监控平台、农残监控平台、畜牧安全生产监管平台、动物防疫监控系统、兽药生产管理信息、饲料生产管理系统、奶牛生产管理系统、畜牧生产管理系统等等。
中央也逐年在加大农业现代化的投资力度,在村村通路工程、村村通电工程后,又制定了村村通电话、村村通电视等工程。这些基础性设施的建设和完成、完善为农村信息化建设提供了可靠的保障。
农业信息化是继工业信息化、商业信息化、政府信息化后,国家重点发展的信息化。
那么农业信息化到底应该如何开展才是一条正确的发..

阅读全文>>

Tags: 农业信息化   信息化  

类别: 无分类 |  评论(1) |  浏览(2339) |  收藏
2007年09月21日 13:02:50

数据分析讲堂

数据分析讲堂

第一课 数据分析过程中的多维技术

第三讲 多维类型结构

今天我们将介绍一种新的表示数据、数据生成事件的象征物,最终OLAP的元数据将不再基于带有角度关系的维度,从而能够表示任意数量的事件维度。我们把这种象征物称为多维类型结构(MTS)。
下图3.1给出了一个例子,每个维度都用一条线段来表示。维度中的每一个成员都用该线段上的一个单位区间来表示。在处理前一讲中具有三个维度例子的时候,我们使用三个线段来分别表示时间、产品和变量。从三个线段中分别取出一个区间之后形成的一个组合就对应了数据生成事件和数据立方体中的一个元素。例如,图3.1中MTS表示三月份的靴子销售额,就象数据立方体一样,在数据立方体中你可以在每一个维度上自独立移动,你也可以在MTS的每一个维度上独立移动,如图3.2。
'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />
在图3.2 中存在着12个时间段、10个产品、5个变量,所以一共有12×10×5 = 600个超立方体交叉点,或者说数据点。从这个意义上讲,用MTS比物理的立方体能够更清楚地描述问题。但是,MTS并没有显示实际的数据点,而是维度成员的联合。在这点上看,立方体比MTS更具有说明性..

阅读全文>>

类别: 无分类 |  评论(1) |  浏览(1848) |  收藏
2007年09月20日 10:05:18

数据分析讲堂

数据分析讲堂

第一课 数据分析过程中的多维技术

第二讲 多维思考

如果你现在正在为跟踪不同产品在不同商店中每月的销售情况而头疼,说明你遇到了多维数据分析的问题。在这个例子中,我们应该用什么可视化象征物来表示涉及到的数据呢?又如何在一个数据分析系统中组织这些数据呢?如果依然用立方体来作为四维或者更高维可视化的象征物的话,整个可视化过程就会显得杂乱无章。图2.1中显示了一个四次元立方体,但是这个显示看起来已经过于复杂,而不象上一讲中的图那样容易理解。这就是当数据集增加到四个维度或更高时,会产生一个问题,即:逻辑维度和物理维度之间的差别。
'800')this.width='800';if(this.height>'600')this.height='600';" border="0" />
奥地利思想家Ludwig Wittgenstein曾经针对这样的问题提出过一个基本理论:当使用一件物体来代表另外一个物体时,两者之间必须拥有一些共同的特征。因此用立方体表示的通常应该是数据生成事件中的一些方面,使其能够很好地对数据集进行理解,当然,数据生成事件中必然有一些方面是立方体无法体现的。
立方体的特征之一是在任何一点上所有的维度都是共同存在的。正如图2.2中所显示的,三维空间中的任意点(Xn,Yn,Zn)..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(1948) |  收藏
2007年09月18日 11:43:26

数据分析讲堂


数据分析讲堂

第一课 数据分析过程中的多维技术

第一讲 如何在N维空间中思考数据分析

理解超立方体,或者说一个大于三维的立方体,是理解多维数据分析的基础,多维数据分析的超立方体与电子表格中的工作表和数据库中的表相对应。多维数据分析所有的浏览、报表、分析都是在超立方体上进行的。
超立方体通常是在低维空间的点、线、面、立方体基础上开始展开的。我们可以通过类比来想象一个多维的立方体。尽管这不是一个最好的方法,因为对于超立方体的理解并不遵循物理立方体的长、宽和高。
这一讲将指导我们如何考虑N维数据集或者现实世界的事物,我们采用的方法是在一个大家都熟悉的二维行列数据的基础上来增加维度。在讲解完本节课后,大家将会对超立方体有一个完整的认识,从而能够有效地吸取任何多维信息系统的信息。
让我们从一个典型的二维数据出发,无论考虑的是每个员工的工时,每个部门的成本、每个客户的余额、还是每个商店的投诉,这些都能够以二维表格的形式组织。
图1.1是一个按照月份组织的有5列销售和成本信息的二维表格。这个表格用任何电子表格软件都可以轻易创建起来并且显示在屏幕上。月份以行的形式按照从小到大的顺序进行排列,最后一行是汇总。这个..

阅读全文>>

类别: 无分类 |  评论(2) |  浏览(2252) |  收藏
2007年09月17日 15:52:41

办一个讲座怎么样?

各位好友,从今天起,我想针对数据分析,办一个大家学习和讨论的园地。
共同探讨数据分析带给企业的帮助,以及信息对于企业的价值。
针对信息价值论,我后续会有多篇相关文章来论述。希望这个园地成为大家的好伙伴。
学习内容我参考了Erik Thomsen的著作《OLAP解决方案:创建多维信息系统》



数据分析讲堂

第一课 数据分析过程中的多维技术

前言

如果没有对海量数据进行科学分析的能力,沃尔玛的老板再精明,也绝对想不到“啤酒与尿布”这两个看似风马牛不相及的商品之间还存在着一种必然的联系。根据数据分析的结果,而将它们放在相临货架上销售,竟然创造了一种销售奇迹,可见数据分析威力的巨大作用。
目前各类信息系统数年中收集、积累、沉淀了海量的数据,且数据还在以指数级增长,今天的企业迫切地需要高效、精确、科学地对这些海量数据进行分析,以期望找出其背后的寓意,进而了解企业的经营状况和外部环境,做出科学的决断,使企业在现代激烈的竞争中胜出。所以如何将数据点石成金,就是摆在企业面前很现实也很诱人的一个重要问题之一。
现在,很多人已经意识到了数据中潜在的大量商机,并心甘情愿、踏踏实实地进行着从数据中沙里淘金的工作。特别是在信息化的..

阅读全文>>

类别: 无分类 |  评论(2) |  浏览(2150) |  收藏
2007年09月13日 11:51:08

《也谈信息化系统的更新》

中国的信息化建设已经走过了二十多年的发展历程。就今天而言,信息化系统已经在各行各业普遍应用。恐怕已经没有人再怀疑信息系统给企事业所带来的改变和提高,给整个社会带来的发展推动。

  相对于以前早期的信息化系统,目前的总体感觉是信息系统划分的更细,应用的更普遍,更广泛和更深入,作用也更强大,功能更趋完善。

  综观信息化在我国的建设历程,我们清晰地看到,信息化建设在社会各个行业及领域发展是多层次的,企事业的生产离不开ERP系统的辅助支持,企事业的日常经营与管理离不开OA系统的辅助支持,企事业在市场开拓及营销拓展和服务领域离不开CRM系统的辅助支持,企事业在人才管理与员工职业生涯设计方面离不开HR系统的辅助支持,企事业在财务管理上离不开财务系统的辅助支持,企事业在绩效考核、资本评估、预算制定、信息价值挖掘等方面离不开联机数据分析系统的辅助支持,企事业在业务开展上离不开自己企业的核心业务系统。这些核心业务系统带有强烈的行业特点和企事业业务特点。各个银行的核心业务系统是这样,电信和网通的97工程是这样,海关审报关系统是这样,烟草的综合管理系统是这样,。。。。。。太多太多行业的各种应用信息系统。..

阅读全文>>

Tags: 信息化   系统更新  

类别: 无分类 |  评论(0) |  浏览(1995) |  收藏
2007年09月03日 14:57:04

《营销大变局——传统与现代、渠道与科技的博奕》

可以说中国改革开放成功的一个重要标志是零售业完成了一场流通革命,由商品供不应求到建立了商品大量生产,通过渠道集中起来大量销售的系统,象大型超市、连锁店等就是这次变革的代表。然而,随着产能的不断提高,商品数量极大丰富,消费者口味不断提高,这一零售流通系统遭遇了前所未有的挑战,不知道顾客想买什么,不知道如何把商品信息有效传递给市场,不知道商品该生产多少,不知道渠道何时能够回款,似乎企业自己能做的只有在提高产品质量的同时无休止地进行价格战,营销方式这一瓶颈制约了无数个企业的发展,甚至会置企业于死地。

信息化的发展提供了一种新的营销方法,我们称之为通信营销。通信营销是无店铺营销的一种,无店铺营销分为面对面营销和通信营销两大类。从字面上的意思是指企业的销售人员在不与顾客直接见面的情况下通过电视、电话、网络、目录、直邮等通信手段完成订货、配送、收款的销售行为。有人认为目前流行的电视购物、网上购物等就是通信营销,这是不全面的。电视、网络只是技术手段:电子商务网站多如牛毛,在互联网上找一个商品就象在沙漠里找一粒沙子,没有有效的宣传方法不可能成功。在诚信和广告成本都受到挑战的电视购物模式里,想只通过播..

阅读全文>>

类别: 无分类 |  评论(0) |  浏览(2388) |  收藏