摘 要 结合超市进销存业务的实际特点,分析了传统进销存系统的不足,给出了以数据仓库为核心的体系化环境下的构建进销存系统的思路,并重点阐述了数据仓库系统的设计和实现方法,为超市进销存系统的建立提供了可借鉴的经验。
关键词 数据仓库;在线分析处理;决策支持;数据挖掘
1 引言
传统的进销存系统建立在单一的数据库系统上,通常包括业务处理子系统和辅助决策系统,管理信息系统和决策支持系统同在一个数据库中。单一数据库为中心构成的数据库系统,往往满足不了现代超市数据处理多样化的要求。具体表现在以下几个方面: (1)不能同时满足事务处理与分析处理的需要。 (2)无法集成企业内部、外部各方面的数据。 (3)难以适应各类用户对数据综合程度的不同要求。 长期趋势分析预测需要按年度汇总,而中短期预测要用到月、周、日的数据。传统的数据库系统不具备这种综合能力,需要人为地进行综合和汇总,而且每做一次分析,都要进行一次这样的综合,这必将导致极低地处理效率。因此,在事务处理环境中直接构建分析处理应用必将是失败的[1]。 数据仓库和OLAP技术在DSS上的应用已经成为决策支持系统的新趋势。OLAP可以根据需求将决策法过程中的各类信息以多维视图存储于数据仓库中,给决策者提供多元化的业务分析。2 数据仓库环境下的超市进销存系统结构
传统的进销存系统建立的以单一数据库为中心的数据组织模式,已经无法满足决策分析对数据库系统的要求,而数据仓库技术的出现和发展,为上述问题的解决提供了强有力的工具和手段。数据仓库是一种对多个分布式的、异构的数据库提供统一查询的技术。数据仓库管理系统把企业原始数据和来自外部的数据汇集整理成数据仓库,在此基础上通过通畅、合理、全面的信息管理,使最终用户可以直接从数据仓库提取数据进行相关数据分析。 数据仓库并不是对传统数据库的替代,而是在传统数据库的基础上对数据进行重新组织,用于支持决策分析。数据仓库和传统数据库在系统中承担着不同的任务,发挥着不同的作用。即基于传统数据库的业务处理系统完成日常业务数据的录入和处理,这些数据经过加工被送到数据仓库;基于数据仓库的辅助决策系统实现分析处理,为决策者提供完整、及时、准确的决策信息。这样,事务处理环境与分析处理环境实现了分离,相对独立,构成一种新的体系化环境,而数据仓库则是体系化环境的核心[2]。 数据仓库环境下超市进销存系统的结构如图1所示。系统由业务处理子系统、辅助决策子系统和数据管理子系统三部分组成。其中业务处理子系统的后台为传统数据库(可以是多个分布的、异构的数据库),前台是业务应用系统,完成所有进销存业务的日常处理,是整个进销存系统的数据入口,并向辅助决策子系统提供原始数据;辅助决策子系统的后台为数据仓库,前台由联机分析工具、数据挖掘工具等构成,完成统计分析预测功能,实现对决策的支持;数据管理子系统负责对整个系统数据的管理,特别是实现数据从各数据源(传统数据库)到数据仓库的转移以及数据仓库中数据结构和业务规则的管理。 图1 进销存系统结构图3 进销存系统的数据建模
3.1 需求分析
对于数据仓库系统而言,决策者最为迫切的需求在于更加准确的掌握超市的经营状况及进、销、存情况,主要包括: ①进货趋势;②销售市场波动趋势;③企业存货情况。因此,我们认为,分析市场经营状况发展趋势所要求的操作数据库的数据有:①商品进货数据;②商品销售数据;③商品库存数据;④顾客信息;⑤销售商信息。3.2 概念模型设计
下面以销售分析为例进行概念模型设计,具体如下: 1)界定销售分析系统边界 建立销售数据仓库所需的数据应包括:订单数据、产品数据、顾客数据、员工数据、供货商数据、货运数据。 2)确定系统的主题及其内容 我们初步确定超市的进销存辅助决策系统有3个主题:商品、顾客和销售商。 商品主题描述企业商品分类及销售情况;顾客主题描述了企业对顾客进行分类及有关顾客合同的管理情况;销售商主题描述了企业销售人员销售商品及销售地区情况。其中,商品主题作为中心,将这3个主题联系起来。其具体内容包括: ·商品: 商品固有信息(商品代号、商品名称、商品类别等) 商品库存信息(商品代号、库房号、库存量、日期等) 商品销售信息(商品代号、顾客代码、销售日期、销售单价、销售数量等) ·顾客: 顾客固有信息(顾客编号、顾客名称、地址号、电话等) 顾客合同信息(顾客编号、合同代码、起始日期、终止日期、数量、价格等) 顾客购货信息(顾客编号、商品代码、单价、数量、日期等) ·销售商: 销售商固有信息(销售商编号、销售商品、销售商品名、销售商地址等) 由于商品主题作为中心,因此,在本文中只对商品主题展开研究与分析。对于商品主题,用户希望考察的是关于商品在不同方面及不同的维度或者不同维度的组合来考察的销售情况。3.3 逻辑模型设计
1)分析主题域 在概念模型设计中,我们确定了几个基本的主题域,但是,数据仓库的设计方法是一个逐步求精的过程,在进行设计时,一般是一次一个主题或一次若干个主题地逐步完成的。所以,我们必须对概念模型设计步骤中确定的几个基本主题域进行分析,并选择首先要实施的主题域。三个主题中,商品、顾客、销售商都与商品的销售有关,因而商品主题最为重要,所以本文选定商品主题先实施。 2)粒度层次划分 粒度指数据仓库中数据单元的详细程度和级别。为了实现的快速和当前主要的是开发一个原型系统,为以后系统超市进销存辅助决策系统的研制和开发提供理论基础和实际开发经验,因此在此销售分析系统采用单数据粒度。 3)确定数据分割策略 由于数据仓库在获得数据时一般按时间顺序进行,同一时间段的数据往往可以连续获得,并且数据仓库的数据综合常常会在时间维上进行,因此系统按时间对数据进行了分割,查询时可只查询相关的分片而不必搜寻整个数据库。 4)多维数据建模 数据仓库的每个主题由多个表实现,通过公共码键联系在一起形成一个完整的主题。这里对“商品”主题进行模式划分,采用星型雪花架构,分析整理出下面的实事表与维度表的设计,具体如图2所示。
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />
4 在线分析处理
在分析销售数据时,从不同角度审视销售的衡量数值是一种很自然的思考模式。根据用户所选择的分析角度,事先计算好一些辅助结构,以及每一维不同层次重要衡量的总计,以便在查询时能够尽快抽取到所需记录,并快速地从一维转变到另一维。这样用户就可以在短时间内从各种不同的角度审视销售的状况,不但提高了决策的正确性,而且缩短了做出决定所需要的时间。在本例中,使用两种主要多维分析技术:向下钻取、旋转和切片。前者用来查看某一具体数据维中的更详细的数据,后者用来从不同角度或不同层次得到聚合数据。 1)切片(Slice)和切块(Dice) 在多维数据结构中,按二维进行切片,按三维进行切块,可得到所需要的数据。如在“城市、产品、时间”三维立方体中进行切块和切片,可得到各城市、各产品的销售情况。图3 三维立方体切片、切块示意图 2)钻取(Drill) 维度是具有层次性的,如时间维可能有年、月、日构成,维度的层次实际上反映了数据的综合程度。维度层次越高,细节越少,数据量越少;维度层次越低,则代表的数据综合度越低,细节越充分,数据量越大。钻取包含向下钻取(Drill-down)和向上钻取(Drill-up)操作,钻取的深度与维所划分的层次相对应。向下钻取就是从较高的维度层次下降到较低的维度层次上来观察多维数据。反之,则执行的操作就是向上钻取。例如: 3)旋转(Rotate) 旋转即改变一个报告或页面显示的维方向。例如,旋转可能包含了交换行和列,或是把某一个行维移到列维中去,或是把页面显示中的一个维和页面外的维进行交换,令其成为新的行或列中的一个。例如:5 决策支持
利用基于数据仓库和多维分析技术的决策支持系统,在进销存管理中实现了降低库存成本、了解销售全局、进行市场分析和趋势分析等功能。利用数据挖掘技术可以挖掘潜在有用信息,方便企业决策者做出正确有效地决策,具体分析如下: 1)降低库存成本通过数据仓库系统,将成千上万种货物的销售数据和库存数据集中起来,通过数据分析,对知识进行分类,可以知道库存中一段时间内,没有收到订单的货物,很少收到订单的货物和库存中周转很快的货物。从而决策者能决定对货物进行相应增减,确保正确的库存,从而加快资金周转、降低库存成本。最为典型的分类方法是基于决策树的分类方法。它是从实例集中构造决策树,是一种有指导的学习方法。该方法先根据训练子集形成决策树。如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练子集中,重复该过程一直到形成正确的决策集。
2)进行市场分析 利用OLAP数据分析工具对数据仓库的数据仔细研究,以分析客户的购买习惯、产品组成和其它战略性的信息。系统对销售量最大的产品进行分析,然后确保在正确的时间、正确的地点有正确的库存。 3)进行趋势分析 利用数据仓库对产品种类和库存的趋势进行分析,以选定需要补充的产品,研究客户购买趋势,分析季节性购买模式,确定降价商品,并对其数量做出反应。为了能够预测出季节性销售量,系统要检索数据仓库中1万种产品1年多来的销售数据,并在此基础上进行分析。 4)进行商品分组布局、购买推荐和商品参照分析 通过从代销记录中挖掘相关信息,可以发现购买某一种商品的顾客可能购买其它商品。购物篮分析是挖掘此类信息的一个典型例子。通过发现顾客放入其购物篮中的不同商品之间的关系,分析顾客的购买习惯。采用Apriori算法,可以找到哪些商品频繁的被顾客同时购买。这类信息可用于形成一定的购买推荐,或者保持一定的最佳商品分组布局,以帮助客户选择商品,刺激顾客的购买欲望从而达到增加销售额,节省顾客购买时间。 5)进行促销活动的有效性分析 超市常常通过广告、优惠券、各种折扣和让利的方式搞促销活动,以达到促销产品,吸引顾客的目的。但只有充分了解客户,才能定位促销活动,提高客户响应率,降低促销活动成本。通过多维分析可以对比促销期间的销售量和交易数量与促销活动前后的有关情况,关联分析可以挖掘出哪些商品可能随促销商品一同被购买。利用数据挖掘技术还可以分析出应该在什么时间、在什么地点、以何种方式和对什么样的人搞促销活动,能真正达到促销目的,避免企业资源的不必要浪费。同时,数据挖掘也可以使用过去有关促销的数据来寻找未来投资中回报最大的用户。 6)进行顾客忠诚度分析 各个超市往往通过办理会员卡的方式,建立了顾客会员制度来跟踪顾客的消费行为。通过对顾客会员的信息进行数据挖掘,可以记录一个顾客的购买系列,顾客的忠诚和购买趋势可以按系统的方式加以分析。由同一顾客在不同时期购买的商品可以分组为序列。序列模式挖掘可用于分析顾客的消费或忠诚度的变化,据此对价格和商品的花样加以调整和更新,以便留住老客户,吸引新客户[2]。6 结束语
数据仓库及多维分析具有综合数据的能力并能对数据进行快速和准确分析,从而帮助管理者做出更好的商业决策,可以为企业带来竞争优势。目前数据仓库和数据挖掘技术在国内应用还不是很广泛,但是由于商贸企业具有复杂的商业结构,有大量的进销存业务数据,有特定的决策分析的需要,因此数据仓库技术在商贸企业应用有广阔的前景。参考文献
[1] 李嶶,李宛州.基于数据仓库技术的进销存系统的设计与实现.2001(10):93-94[2]Jiawei Han.数据挖掘概念与技术.机械工业出版社2001,8 [3]W.H.Inmon.数据仓库.机械工业出版社2000,5[4]林字等编著.数据仓库原理与实践.北京:人民邮电出版社,2003[5]张春阳,周继恩,刘贵全,蔡庆生.基于数据仓库的决策支持系统的构建,计算机工程.2002(4):249-252[6]陈德军,盛翊智,陈绵云.基于数据仓库的OLAP在DSS中的应用研究.2003(1):30-31[7]朱明,数据挖掘.合肥:中国科技大学出版社2002,5
[8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0424/fontbr />
相关文章:
用于英文字母识别的三种人工神经网络的设计04-26
计算机辅助夹具设计系统的研究与开发04-26
一种可信计算机系统的设计与实现04-26
计算机教学游戏的基本结构与特征综述04-26
计算机液位过程控制综合实验系统研制与开发04-26
IBM高性能计算机系统一次重大故障分析04-26
基于C/S和B/S结构的多数据源电能质量数字化管理平04-26
计算机辅助绘图的工作过程实训04-26
基于BBNs的软件故障预测方法04-26
对品牌期刊网站建设的思考04-26