|
数据仓库简介
金融业务主要分为交易和结算两大部份,随着国内经济发展的持续增长和国民收入的不断提高,金融交易必然会越来越多,造成交易和结算业务数据量的剧增,需 要一种信息技术具备可扩展和并行处理能力,对以往的历史数据和每天生成的新数据进行快书的分析,解决各种突发的业务问题,对市场上出现的各种动向进行快速的反应,降低业务风险,提高企业自身的盈利能力。目前,在线的分析和决策支持系统,成为银行电子化的新热点。而这些都需要依赖于大量的对客户的信息的积累和对大量的交易数据进行分析。但是以往的系统大多属于在线联机事务处理(oltp)一类的,这类系统对日常的业务运转比较适合,对于大数据量的分析和决策支持就不是很合适的了,而且,以前的业务系统大多是在以往的不同时期,专门为某种特定的业务而建造的系统,各系统之间数据存在着冗余和不一致,这些系统之间数据不能共享,交叉分析的难度很大,因此,只有数据仓库才能对以往的数据进行整合。可以说,以前的业务系统是将数据放入到计算机的数据库中的系统,而数据仓库则是将数据从数据库中取出并加以充分利用的系统,通过数据仓库的实施,可以将以往的宝贵数据充分利用起来,发挥其最大的效益。
建立数据仓库的步骤
建立数据仓库的构架可以分为多个步骤,从最简单的动态报表系统一直到最复杂的人工智能数据发掘系统都可以算是数据仓库的实施步骤之一。针对目前国内的应用水平和对数据仓库的认识程度,采用首先建立面向主题的数据集市,然后向全面的数据仓库过渡的方案是一种切实可行的方法。在这种方案中,首先针对已经建立了比较完善的数据库应用系统的部门建立一个面向主题的数据集市,为各部门提供动态的报表和静态的数据分析结果,然后,在此基础上,可以随着应用的不断成熟和完善,逐步的过渡到数据仓库的阶段,将所有的数据集成进已有的框架,为业务部门提供各种报表、数据采掘、决策支持。
另外,建立一个数据仓库是一个渐进的过程,在此过程中,数据仓库系统随着用户需求的不断发掘,功能的逐步添加,系统不断升级,最终,成为一个集动态报表和决策分析为一体的在线联机分析处理系统(olap)。整个过程可以表示为:需求→设计→实施→维护→新的需求→…,这样一个循环往复的不断的过程。
数据仓库的解决方案
下面是我们为深圳市某大型国有商业银行做的数据仓库的解决方案。在此系统中,数据流从业务系统中流入到数据仓库中,然后再对这些数据进行加工和处理,最后各种经过处理的数据被pop到用户的桌面上, 数据流图如下:
整个数据仓库的网络拓扑结构图如下:
 |