数据仓库为中心的企业人力资源统计信息系统的设计与实

时间:2024-04-26 11:37:05 5A范文网 浏览: 论文范文 我要投稿

  【摘要】利用数据仓库技术对人力资源数据源中的数据进行统计分析,寻找其中有价值的关系和规律,对人员聘用、培养、选拔等实际工作能够起到一定程度上的辅助作用,并且提供一定的决策支持。在系统开发过程中所遇到的问题,采用的开发思路具有一定的普遍意义,可以在绝大多数统计信息系统中得到应用。
  【关键词】人力资源 统计信息系统 数据仓库 OLAP
  
  1 引言
  
  人力资源是指能够推动经济和社会发展的劳动者的能力。从宏观意义上是以国家或地区为单位,从微观意义上是以企事业为单位。本文所论述的系统是以企业为单位。
  人力资源管理是企业生存的命脉。企业人力资源管理的根本目的就在于结合企业战略发展的需要,预测和评估未来可能发生的事件对企业人力资源管理的影响,制定企业人力资源发展战略和工作目标,获得企业所需要的员工,并且创造条件以保证员工能完全投入工作,充分发挥他们的潜能。人力资源管理主要完成招聘和培训员工,制订具有竞争力的薪金福利体系、员工的考勤、休假、退休等管理智能。
  为了解决人力资源管理中存在的诸多问题,有必要利用数据挖掘技术对企业人力资源数据源中的数据进行统计分析,寻找其中有价值的关系和规律,从而为制订人力资源总体规划和各项业务计划提供有效的决策支持,并对人员聘用计划、人员使用计划、培养和选拔计划、薪资计划、劳动关系计划等制定工作起到一定的辅助作用,因此,研究与开发基于数据仓库技术的企业人力资源统计信息系统具有十分重要的意义。
  
  2 数据仓库为中心的统计信息系统
  
  统计信息系统是管理信息系统的一个子系统。管理信息系统是一个具有高度复杂性、多元性和综合性的人机系统,它具有信息的收集、传递、存储加工、维护和使用的功能。统计信息系统是在传统的人工统计工作的基础上,综合运用现代统计学和信息科学的有关原理,应用现代计算机技术、网络技术以及信息处理技术等建立的人/机复合系统。具体地,统计信息系统是一个由人、计算机等组成的,根据统计指标和指标体系进行统计信息的收集、传递、存储、加工、分析、维护和使用以及生成统计信息的系统[1]。统计信息系统的模式如图1所示。
  
  数据仓库是一种从数据库技术发展而来但又不同于数据库的数据组织和存储技术,它是面向主题的、集成的、随时间变化的、非易失性的数据集合,它用于支持管理层的决策过程。数据仓库的创建和使用都是围绕着主题的,数据仓库中的数据不是将业务处理系统中的数据简单集合,而是对各种源数据进行抽取、筛选、清理、综合而得到的数据集合。数据仓库中所存储的数据主要用于查询和分析。由于数据仓库以统计分析技术作为分析数据和提取信息的有效方法,统计学是数据挖掘技术的重要的理论来源之一,因此数据仓库术、以及基于数据仓库的OLAP和数据挖掘形成了新型的统计信息系统框架[2]。数据仓库为中心的统计信息系统的体系结构见图2。
  
  3 数据挖掘技术
  
  数据挖掘(Data Mining)是一个多学科交叉领域,它融合了数据库技术、人工智能、机器学习、统计学、面向对象方法、信息检索、高性能计算等学科。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、事先未知的、潜在有用的信息和知识的过程。提取的知识表示为概念、规则、规律、模式等形式[3]。目前主要的数据挖掘方法有统计分析方法、神经网络、机器学习、遗传算法、模糊集法、近似推理等。数据挖掘不一定需要建立在数据仓库的基础上,但基于数据仓库的数据挖掘能简化数据挖掘过程的某些步骤,提高数据挖掘的效率,同时能更好地满足高层战略决策的需求。
  
  数据挖掘可以看作OLAP的高级阶段,它不仅能对过去的数据进行查询和遍历,并能够找出过去数据之间的潜在联系,从中提取辅助决策的关键性信息。数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析和偏差分析。数据仓库为中心的统计信息系统中数据挖掘的流程见图3。
 
  4 数据仓库为中心的企业人力资源统计信息系统的设计
  
  4.1 系统结构
  基于数据挖掘的企业统计信息系统分为统计管理和数据挖掘两部分,依据数据流图和处理过程,统计管理包括了8个功能模块,数据挖掘包括了3个功能模块。系统结构如图4。
  4.2 系统设计思想
  系统总体设计思路是:
  (1)严格按照软件工程要求组织研究、开发、测试、生产、维护等环节,充分利用支持环境和有利条件,开发出适应新的人力资源管理模式的统计信息系统;
  (2)集成性与开放性并重。既要做到系统内部各模块之间的无缝集成,又要保证对外界系统的开放性;
  (3)充分利用可视化技术,为用户提供一个人机界面友好、操作简单方便的应用环境;
  (4)用现代软件工程的方法,从系统的各个层次考虑系统安全性问题。
  4.3 人力资源总体规划
  人力资源总体规划包括了人力资源的总目标、总政策、实施步骤及总预算的安排。人力资源总体规划与企业的战略目标紧密相连,并以销售预测、市场走向、技术发展及生产率的变化等信息为基础。其中企业发展目标、劳动力信息将作为该模块的输入信息。该模块的执行过程需要决策者大量的信息、知识和模型,因此需要建立模型库和知识库来提供相关的模型和知识规则。该模块将提供人机交互模式和环境为决策者的决策提供辅助。该模块的执行流程见图5。
  4.4 报告生成
  企业统计信息系统应满足人力资源管理的需要,为人员聘用、人员使用、培养和选拔、薪资管理等提供信息。具体地,应包括:
  (1)基础类报告:按年、季度、月等生成员工工资报告、员工考勤报告、员工基本情况汇总报告、人员使用计划、薪资计划、人员聘用计划报告等;
  (2)统计分析类报告:人员及工资的成本分析及统计报告、人员流失分析报告、人员缺口分析报告、人员需求预测报告、人员供给预测报告等。
  4.5 数据结构化及编码规则
  本系统涉及的信息都需要用于计算机处理,因此需要对信息进行编码。主要的编码系统对象包括:岗位编码、职位头衔编码、学历编码、专业编码、能力考核成绩编码、职称编码、薪资范围编码等。在进行编码系统设计时遵循下列原则:
  (1)离散化:离散化是为了适应应用的需要,用有限数量的离散数据替代连续数据,即将连续数据划分区间,每个区间中的数据用一个植代替。
  (2)唯一性:编码必须唯一确定所指代的对象;
  (3)结构化:根据编码对象特点,设计具有一定规律的编码结构,以全面反应编码对象的特点,并方便编码的应用;
  (4)标准化:对于有国际标准或国家标准规定的编码,必须采纳。
  (5)简练化:在唯一描述对象身份的前提下,编码应该尽量简练,便于使用和记忆。
  人力资源库中的数据属性编码规则如下表:
  4.6 数据仓库的建立
  用于企业统计信息系统中数据挖掘的源数据必须是大量的、真实的、经过预处理的,否则会极大地影响结果的准确度。数据仓库的建立步骤[4]如下:
  (1)定义数据仓库的体系结构。数据仓库体系架构可以分为五个层次:数据建模层、数据获取层、数据存储层、数据访问层、数据与元数据管理层。基于上述体系结构的基础上,可以利用数据仓库技术建立适合于企业特殊业务的智能化解决方案,现提出集线器结构和集中式结构两种数据仓库的体系结构供企业统计信息系统选择并创建。
  [8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0425/fontbr /> 

  (2)进行数据仓库容量的规划,定义物理的数据仓库结构,确定数据的存放、分区以及访问的方法。并选择存储服务器、数据库、OLAP服务器以及其它工具。
  (3)定义新的数据模型,设计数据仓库的模式和视图。由于数据仓库注重的是数据查询,因此数据是按照决策分析的主题来组织的,每个主题对应一个宏观的分析领域。数据的逻辑模型是多维数据模型,可以使用不同的存储机制和表示模式来表示,这样可以用多维分析的方法从多角度、多层次对数据进行统计分析。常见的数据模型有:星形模型、雪花模型、星座模型、雪瀑模型等。
  (4)数据仓库的中间件设计。数据仓库的中间件能将数据仓库的各个组成部分无缝地整合在一起。数据仓库的中间件包括:数据抽取、转换、复制的拷贝中间件;数据库访问的网关中间件;对数据仓库进行监控的中间件。
  (5)原始数据的审核与整理,设计并实现数据抽取、清洗、转换、装载和刷新程序。由于数据来源于不同部门的人力资源数据库,不同数据取自不同的途径,因此,大部分数据在放入数据仓库前,要经过整理。为实现异构数据库的数据集成,必须首先通过数据的抽取和转换工具将位于不同操作系统平台、不同数据组织形式的数据按照一定的数据模型集成到数据挖掘库中,其目的就是保证数据仓库中数据的一致性。
  ①抽取。为了将来自不同数据库系统的数据集成到数据挖掘库中,必须首先从外部数据库将有关数据抽取出来,数据的抽取是数据仓库成功的关键。为了将数据抽取出来,必须按照已确定的新的数据模型来抽取数据,因为在新的数据模型中描述了哪些数据需要抽取。为完成抽取功能,需要编写数据的抽取程序,该抽取程序的基本功能就是利用数据网关、ODBC驱动程序或者其它封装器连接异构的数据源。
  ②合并与整合。大部分情况下,要用的数据是分布在不同的数据库中的数据。合并与整合是把来自不同数据源的数据合并到同一个数据仓库中,并且要使那些本来存在冲突和不一致的数据一致化。不同的数据库间在数据定义和使用上通常都存在巨大的差异,在这个步骤中使用数据集成规则进行处理。
  ③转换。从源数据库中抽取出来的数据必须依据事先定义好的标准数据格式进行数据的转换。由于企业信息系统中同一个数据可能存放在不同子系统的数据库中,这些数据库之间是分散和异构的,因此就会出现数据名称、数据单位、数据类型甚至数据值不一致的情况,如果这些数据被抽取到数据仓库中,必然会造成数据的不真实性,为此有必要对这些抽取的数据进行彻底地转换。数据转换的基本思想是:首先建立数据转换规则集和元数据库。抽取出来的数据必须按照数据转换规则集和元数据库中定义的标准对数据进行转换或修补,然后才能将数据装载到数据仓库中。
  (6)将数据库的模式、视图定义以及其它元数据装入数据仓库;用于挖掘的数据经过前面所有的搜集、整理之后,直接导入数据仓库中。
  
  5 结束语
  
  不同于SPSS、SAS等统计软件的应用,统计信息系统在数据源、功能设计方面有着更为复杂的情形,需要结合具体的业务背景设计有效的、用户可以接受的分析方法。而统计类数据挖掘方法应用的过程中较多地依赖于用户解决问题的能力,往往不能自行查找隐蔽在数据背后的知识。统计学是一个完整的应用领域,包括从数据中抽取有价值信息。统计学与想利用分析模型的用户之间总是存在隔阂。因而,针对不同行业设计出行之有效、易于理解的统计分析模型具有非常重要的意义。
  
  参考文献
  [1] 杜栋.现代统计信息系统理论与实践[M].北京:清华大学出版社,2004.
  [2] 陈京民等.数据仓库与数据挖掘技术[M].北京:电子工业出版社,2002.
  [3] 毛国君等.数据挖掘原理与算法[M].北京:清华大学出版社,2005.
  [4] 陈文伟等.数据挖掘技术[M].北京:北京工业大学出版社,2002.
  [5] 米子川.统计软件方法[M].北京:中国统计出版社,2002.
 


  [8]电大学习网.免费论文网[EB/OL]. /d/file/p/2024/0425/fontbr /> 

相关文章:

建设监理项目部人性化管理初探04-26

浅析现代企业薪酬激励机制04-26

油田单位人力资源存在问题分析及激励机制创建的探索04-26

人力资源管理成本估算研究04-26

国有企业人力资源管理出路何在04-26

中小民营企业人力资源管理现状分析04-26

供应链合作伙伴关系原理在人力资源管理中的应用04-26

浅谈企业人力资源培训开发的问题与对策04-26

新员工入职培训的误区及改进策略04-26

浅析企业人力资源管理系统的构建04-26

热搜文章
最新文章