日历

2008 9.7 Sun
 123456
78910111213
14151617181920
21222324252627
282930    
«» 2008 - 9 «»

日志分类

文章搜索

日志文章

2008年06月09日 20:21:08

数据分析讲堂

数据分析讲堂

第七课 TM1应用实例(3)——市场和销售

第六讲 市场和销售的数据挖掘(续)

3.1市场
LuluThor很满意他们对FCI销售的分析,并且开始把注意力转移到FCI的市场分析上。他们想知道的第一件事情是FCI的市场份额是多少。你觉得我们应该如何达到这个目的?Thor问。他在市场分析方面只有有限的经验。你会怎么做?
1) 市场份额
Lulu回答道,我们要做的第一件事情是基于可用的数据源确定粒度,我们在此基础上定义市场。这包括地理、产品和时间。我们是在谈论国家市场、区域市场,还是本地市场?要区分fishcake和蔬菜cake的数据吗?存在低热量cake的数据吗?或者我们必须基于可用的一般食物馅饼的数据给我们每个foodcake产品线的市场规模建立接口呢?目前,我先假定我们可以利用已有的市场数据,如果我错了,我们也许不得不进行一次市场调研。
幸运的是,Lulu的假定是正确的。按地区分的fishcake和蔬菜cake的市场数据已经存在。下面的公式用来计算FCI蔬菜foodcake每个地区月度的市场份额。
“market size”{$},
      Foodcake.vegetarian.,
      Time.month.,
      Geography.region.,
      Scenario.actual << [Source marketing data]
“FCI market share”{R},
      Foodcake.vegetarian.,
      Time.month.,
      Geography.region.,
      Scenario.actual

                  Sales{$}

                  Market size{$}
Thor说,公式看起来很简单,但你为什么把FCI市场份额变量的应用范围限制在蔬菜foodcake上?难道公式不应该在所有foodcake上应用吗?你是对的,Lulu回答,计算市场份额公式应该在所有存在市场数据的foodcake上应用,然而到目前为止,我们只有蔬菜foodcake的数据。如果我们省略了Foodcake.vegetarian的应用范围限制,对于只有foodcake销售,而没有可用市场规模的数据我们会生成很多不正确的0值市场份额。你同意Lulu讲的吗?
Thor不是很信服。但是,Lulu,通过把市场规模的应用范围定义成蔬菜foodcake,市场份额定义中的销售与市场规模的比率也将自动限制在分母的应用范围上,在这里,也就是蔬菜foodcake。没错,ThorLulu回答说,不同工具对此会有不同的处理方式。存在3种不同的稀疏相关因素:市场规模为空,销售额为0,或者销售额缺失。
第一种情况,这里市场规模为空,比如fishcake的市场规模,我们希望在查询fishcake的市场份额时,公式返回不可接受的信息。大多数工具会插入0值或空值,这样在计算没有数据载入的单元(fishcake)时,市场规模变量就成为一个0。如果查询蔬菜foodcake的市场份额,这时市场份额的计算成为一个非0数字与0 的比值,你会得到一个除0错或者简单的NA,这个结果是可接受的。
第二种情况,这里时间销售额是0(世界上确实可能存在一些区域的人们不吃任何鱼或蔬菜foodcake),市场份额的计算会正确的返回0
然而,第三种情况,由于某些原因,一个地区的商店或地区自己没有报告他的销售额,因此销售额目前缺失但正在传过来的过程中,大多数工具在缺乏进一步逻辑的情况下会错误地把空的销售单元转换成0值,并得到不正确的0市场份额值,而实际正确答案应该是缺失。再一次指出,只有通过定义应用范围限制,当空单元意味着不可接受和当空单元意味着缺失时,工具才能进行正确的解释。再者,表示缺失的空值或不存在的单元与表示0值的空值或不存在的单元之间的差异只能具体模式具体分析。

类别: 无分类 |  评论(0) |  浏览(1134) |  收藏
发表评论