1 背景介绍
在我国,中小企业是国民经济最活跃的主体,被称为中国经济的生力军。在江苏省,中小企业的重要性则更为突出。江苏省中小企业在拉动GDP,推动社会经济发展,促进就业等繁忙都作出了巨大的贡献。然而,中小企业在发展过程中却面临着各种困难,在面临人民币升值,金融危机等一系列问题下的中小企业生存更是艰辛。其中首要的瓶颈便是融资问题。在我国,按照现有的有关贷款通则以及相关规定,对中小企业的贷款问题限制的比较严格。本文选取了37个成功融资的中小企业,采用数据挖掘中的Apriori算法,对这些中小企业融资途径进行关联分析,找到合适的融资途径组合。
2 关联规则及Apriori算法
2.1 关联规则
关联规则挖掘用于寻找给定数据集中数据项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系,根据所挖掘的关联关系,可以从一个数据对象的信息来推断另一个数据对象的信息。关联规则的挖掘通过规则的支持度和置信度进行度量,这两种度量反映了所发现规则的有用性和确定性。
定义1:设D是事务集,A,B为项集,且有规则A=>B。如果D中,包含A·B事务所占比例为s%,称A=>B有支持度s。
定义2:设D是事务集,A,B为项集,且有规则A=>B。如果D中,c%的事务包含A的同时也包含B,则称A=>B有置信度c。
定义3:设D是事务集,A,B为项集,若A=>B满足置信度c和支持度s,则称A=>B为关联规则。
定义4:对关联规则A=>B,若同时满足最小支持度阀值和最小置信度阀值,则称其为强规则。
关联规则挖掘的过程分为两个步骤。 论文检测天使-免费论文检测软件http://www.jiancetianshi.com
第一步,发现所有的大项目集,即支持度大于给定最小支持度阀值的项集;第二步,从大的项集中产生关联规则。
2.2 Apriori算法
对于Ck中的任一项集c,若c得任一k-1子集在Lk-1中不存在,则将c从Ck中删除。算法的下一步是对数据库进行检索,得到Ck中的项集的支持度,与最小支持度进行比较,从而得到Lk。它由Ck中的一部分项集组成,条件是它们的支持度不小于最小支持度。
3 Apriori算法在中小企业融资途径选择中的应用
由于证券市场门槛高,创业投资体制不健全,公司债发行的准入障碍,中小企业难以通过资本市场公开筹集资金,因此造成了中小企业融资渠道过于狭窄的现状。一般说来,中小企业融资有以下几种方式:①银行贷款;②信用社贷款;③担保机构贷款:④内部职工集资;⑤民间借款;⑥拖欠贷款;⑦亲朋借款;⑧租赁
本文以江苏省中小企业为研究对象开展调查,样本涉及江苏省的南京、常州、南通、连云港、盐城、淮安等多个城市的中小企业。在对大量调查数据进行分析处理后,选择37个成功融资的中小企业作为原始事务集,并将融资渠道分为8种,作为8种项集
首先扫描数据库,识别所有单个项(1-项集)和它们的支持度,建立候选1-项集C1
假定最小支持度(min_sup)s=10%(至少在3个事务中),选择1-项集的支持度大于或等于(min_sup)s的项,建立频繁1-项集,并记作L1
假定最小支持度为至少在2个事务中,选择2-项集的支持度大于或等于(min_sup)s的项,建立频繁2-项集,并记作L2
重复以上过程,建立候选3-项集C3和频繁3-项集L3
这时,由于C4为空集,停止Apriori算法。频繁项集为L=L1∪L2∪L3。
若企业融资的途径多于一种,则通过以上频繁项集可以推导出强规则,即最佳融资途径组合。
考虑频繁3-项集{1,2,3},由于这三种途径频繁地一起使用,我们可以从这个3-项集推导出一些规则。
首先,得到非空真子集:{1},{2},{3},{1,2},{1,3},{2,3}。
然后,对于每个子集,形成如下规则,并计算置信度:
R1∶{1}→{2,3}, 2/26=1/13
R2∶{2}→{1,3}, 2/11
R3∶{3}→{1,2}, 2/4=1/2
R4∶{1,2}→{3}, 2/7
R5∶{1,3}→{2}, 2/3
R6∶{2,3}→{1}, 2/3
令min_conf为50%,选取R3、R5、R6为强规则。
用相同的方法计算频繁2-项集,还可以得到以下四个强规则:
相关文章:
新流转税条例主要变化解读04-26
如何构建动态交互式企业财务模型04-26
信息化环境下企业内部控制系统的优化04-26
国际服务外包项目的财务风险分类及评估04-26
注册会计师执行验资业务中的二元审验标准04-26
改革开放30年我国会计发展历程04-26
存货会计中税金的会计核算方法改革浅探04-26
浅谈企业应收账款管理问题与对策04-26
浅析会计舞弊手法的原因及防范措施04-26
浅谈我国税务会计分立问题04-26