基于數(shù)據(jù)倉庫技術(shù)的保險(xiǎn)業(yè)統(tǒng)計(jì)分析系統(tǒng)設(shè)計(jì)論文
基于數(shù)據(jù)倉庫技術(shù)的保險(xiǎn)業(yè)統(tǒng)計(jì)分析系統(tǒng)設(shè)計(jì)論文
保險(xiǎn)業(yè)是指將通過契約形式集中起來的資金,用以補(bǔ)償被保險(xiǎn)人的經(jīng)濟(jì)利益業(yè)務(wù)的行業(yè)。以下是學(xué)習(xí)啦小編今天為大家精心準(zhǔn)備的:基于數(shù)據(jù)倉庫技術(shù)的保險(xiǎn)業(yè)統(tǒng)計(jì)分析系統(tǒng)設(shè)計(jì)相關(guān)論文。內(nèi)容僅供參考,歡迎閱讀!
基于數(shù)據(jù)倉庫技術(shù)的保險(xiǎn)業(yè)統(tǒng)計(jì)分析系統(tǒng)設(shè)計(jì)全文如下:
摘 要:通過分析保險(xiǎn)行業(yè)的核心業(yè)務(wù),采用數(shù)據(jù)倉庫技術(shù),對(duì)保險(xiǎn)企業(yè)中的海量歷史數(shù)據(jù)進(jìn)行集成和統(tǒng)計(jì)分析,得到精確的業(yè)務(wù)運(yùn)行分析報(bào)告,對(duì)業(yè)務(wù)及客戶進(jìn)行趨勢分析,以便及時(shí)作出正確決策并根據(jù)自身需要監(jiān)測業(yè)務(wù)運(yùn)營。
關(guān)鍵詞:數(shù)據(jù)倉庫;保險(xiǎn)業(yè);ETL;多維數(shù)據(jù);統(tǒng)計(jì)分析
1 數(shù)據(jù)倉庫簡介
數(shù)據(jù)倉庫(Data Warehouse,DW)是隨著關(guān)系數(shù)據(jù)庫、并行處理和分布式技術(shù)的飛速發(fā)展而產(chǎn)生的[1], W?H?Inmon出版了《Building the Data Warehouse》一書,給出了數(shù)據(jù)倉庫的定義:數(shù)據(jù)倉庫是一個(gè)面向主題的、集成的、非易失的、隨時(shí)間變化的用來支持管理人員決策的數(shù)據(jù)集合[2]。數(shù)據(jù)倉庫包含的是整個(gè)企業(yè)視圖的粒度化數(shù)據(jù)。
數(shù)據(jù)倉庫系統(tǒng)通常對(duì)多個(gè)異構(gòu)數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行重組[3]。存放在數(shù)據(jù)倉庫中的數(shù)據(jù)通常不再修改,用作進(jìn)一步的分析型數(shù)據(jù)處理。
數(shù)據(jù)倉庫系統(tǒng)的建立和開發(fā)以企事業(yè)單位的現(xiàn)有業(yè)務(wù)系統(tǒng)和大量業(yè)務(wù)數(shù)據(jù)的積累為基礎(chǔ) [4],其開發(fā)是一個(gè)循環(huán)迭代過程,通常需要企業(yè)有一定的業(yè)務(wù)數(shù)據(jù)積累,開發(fā)人員將這些歷史數(shù)據(jù)通過ETL輸入到數(shù)據(jù)倉庫中,進(jìn)行分析和統(tǒng)計(jì),以建立決策支持輔助系統(tǒng),為企事業(yè)單位管理者提供決策支持。
2 保險(xiǎn)業(yè)需求分析
隨著保險(xiǎn)業(yè)發(fā)展及保險(xiǎn)市場競爭的加劇,保險(xiǎn)公司在管理和運(yùn)營方面面臨著更高的要求,來自監(jiān)管、競爭、技術(shù)更新及全球化等各方面的壓力不斷考驗(yàn)著保險(xiǎn)企業(yè)。保險(xiǎn)業(yè)發(fā)展的核心動(dòng)力表現(xiàn)在以下幾個(gè)方面:①進(jìn)入新分市場及提高業(yè)務(wù)質(zhì)量;②鞏固客戶忠誠度,適應(yīng)客戶多變的需求;③高效的運(yùn)營;④精確的風(fēng)險(xiǎn)及成本控制;⑤消除各種技術(shù)壁壘。
要做到上述目標(biāo)并不容易。對(duì)高層管理者來說,由于統(tǒng)計(jì)口徑的關(guān)系,很難獲取一致性數(shù)據(jù)進(jìn)行比對(duì),很難及時(shí)監(jiān)控到業(yè)務(wù)狀況,不能有效地進(jìn)行決策支持。對(duì)于業(yè)務(wù)部門主管與業(yè)務(wù)分析員,所需報(bào)表難以及時(shí)獲取,即使取得的數(shù)據(jù)也難用于多視角、全方位地分析業(yè)務(wù)問題。對(duì)于IT部門來說,要不斷幫助業(yè)務(wù)部門制作報(bào)表,時(shí)間相對(duì)較長,而且開發(fā)的報(bào)表越多,特別是分析型的報(bào)表越多,業(yè)務(wù)系統(tǒng)性能越受影響。
以某人壽保險(xiǎn)有限公司為例,該公司的數(shù)據(jù)支持情況如下:
(1)保單管理系統(tǒng)中大致有50張左右的報(bào)表在運(yùn)行,但隨著公司業(yè)務(wù)的發(fā)展,數(shù)據(jù)分析及用于日常管理的制式報(bào)表與日俱增,報(bào)表數(shù)量將很快無法滿足業(yè)務(wù)發(fā)展需求。
(2)各業(yè)務(wù)管理部門有各自的制式報(bào)表及統(tǒng)計(jì)需求,但在將數(shù)據(jù)匯總時(shí),時(shí)常出現(xiàn)因統(tǒng)計(jì)時(shí)點(diǎn)不同、指標(biāo)定義的理解差異等原因造成數(shù)據(jù)不一致,導(dǎo)致額外的數(shù)據(jù)校驗(yàn)工作。
(3)當(dāng)前報(bào)表的IT實(shí)現(xiàn)基本上是按照單個(gè)報(bào)表需求來設(shè)計(jì)的,造成IT設(shè)計(jì)無法復(fù)用,報(bào)表開發(fā)缺乏整體規(guī)劃,呈一種臨時(shí)性狀態(tài),隨著報(bào)表及統(tǒng)計(jì)需求的增加,IT相應(yīng)的工作將與日俱增。
(4)因當(dāng)前報(bào)表及數(shù)據(jù)統(tǒng)計(jì)都在保單管理系統(tǒng)中運(yùn)行,隨著需求數(shù)量的增加,保單管理系統(tǒng)將面臨沉重的夜間批處理壓力并嚴(yán)重影響日間日常業(yè)務(wù)操作的效率及穩(wěn)定性。
針對(duì)上述系統(tǒng)現(xiàn)狀,在建設(shè)中決定采用數(shù)據(jù)建模、ETL、數(shù)據(jù)分析以及數(shù)據(jù)展現(xiàn)等技術(shù),實(shí)現(xiàn)風(fēng)險(xiǎn)管控分析、客戶服務(wù)分析、客戶維持分析、市場銷售分析、綜合分析和綜合管理6大功能,達(dá)到以下目標(biāo):①代替原有手工報(bào)表方式,為業(yè)務(wù)人員節(jié)省時(shí)間;②提供精細(xì)的分析數(shù)據(jù)。業(yè)績分析可以從營業(yè)部,鉆取到營業(yè)組,甚至每個(gè)FC(理財(cái)顧問),保全分析可以分析每種保全項(xiàng)目的明細(xì);③統(tǒng)一的分析口徑。各部門統(tǒng)計(jì)指標(biāo),可以在統(tǒng)一的時(shí)間點(diǎn)上進(jìn)行公司級(jí)匯總;名稱一致的統(tǒng)計(jì)口徑,可以唯一定義一種統(tǒng)計(jì)方式;④唯一的報(bào)表平臺(tái)。從報(bào)表需求獲取到報(bào)表需求分析以及最后的實(shí)現(xiàn)都在一個(gè)體系下完成,公司數(shù)據(jù)分析工作逐步系統(tǒng)化和實(shí)用化。
3 系統(tǒng)設(shè)計(jì)
統(tǒng)計(jì)分析系統(tǒng)采用靈活架構(gòu),在構(gòu)建一個(gè)統(tǒng)一、穩(wěn)定的企業(yè)級(jí)數(shù)據(jù)倉庫基礎(chǔ)上,分步構(gòu)建各個(gè)獨(dú)立的分析應(yīng)用數(shù)據(jù)集市,滿足靈活性、擴(kuò)展性要求,系統(tǒng)架構(gòu)如圖1所示。
保險(xiǎn)數(shù)據(jù)倉庫是一個(gè)中央的知識(shí)數(shù)據(jù)庫,包含來自壽險(xiǎn)系統(tǒng)、團(tuán)險(xiǎn)系統(tǒng)、短期險(xiǎn)系統(tǒng)和電話銷售系統(tǒng)等源系統(tǒng)的源數(shù)據(jù),數(shù)據(jù)模型分為3層:
(1)數(shù)據(jù)準(zhǔn)備層(Staging Layer): 采用同源系統(tǒng)相似的數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)源系統(tǒng)的每日增量數(shù)據(jù)。
(2)保險(xiǎn)企業(yè)模型層(Insurance Enterprise Models Layer): 作為保險(xiǎn)數(shù)據(jù)倉庫的核心,相應(yīng)的保險(xiǎn)企業(yè)模型部署在該層。根據(jù)保險(xiǎn)行業(yè)的業(yè)務(wù)視圖,保險(xiǎn)企業(yè)模型分為10個(gè)主題,根據(jù)保險(xiǎn)信息的特性而非事務(wù)處理的目的來設(shè)計(jì),企業(yè)級(jí)上所有保險(xiǎn)業(yè)務(wù)信息根據(jù)歷史版本進(jìn)行記錄。在數(shù)據(jù)準(zhǔn)備層通過ETL(數(shù)據(jù)抽取轉(zhuǎn)換裝載程序)進(jìn)行數(shù)據(jù)批處理,采用增量機(jī)制裝載進(jìn)入保險(xiǎn)企業(yè)模型。
(3)分析數(shù)據(jù)模型層(Analysis Data Models Layer): 各種各樣的數(shù)據(jù)分析需求歸類到不同的數(shù)據(jù)集市,如市場及銷售數(shù)據(jù)集市、運(yùn)營效能數(shù)據(jù)集市、風(fēng)險(xiǎn)管控?cái)?shù)據(jù)集市等。分析數(shù)據(jù)模型即為滿足數(shù)據(jù)集市需求而采用維度建模方法特別設(shè)計(jì)的模型。分析數(shù)據(jù)模型從保險(xiǎn)企業(yè)模型衍生而來,數(shù)據(jù)通過ETL 批處理,采用增量機(jī)制裝載進(jìn)入保險(xiǎn)企業(yè)模型。
ETL采用增量機(jī)制,每日從源系統(tǒng)抽取變更數(shù)據(jù)至Staging層,接著將Staging層數(shù)據(jù)轉(zhuǎn)換至企業(yè)模型和分析模型。在ETL批處理完成后,系統(tǒng)運(yùn)行報(bào)表批處理生成報(bào)表并發(fā)布到相應(yīng)的報(bào)表文件服務(wù)器上。
OLAP元數(shù)據(jù)管理工具: 提供OLAP 元數(shù)據(jù)管理工具,用于管理所有OLAP 業(yè)務(wù)元數(shù)據(jù),包括指標(biāo)定義、維度層次定義、指標(biāo)與維度的關(guān)系及分析需求。通過使用這個(gè)工具可幫助保險(xiǎn)企業(yè)統(tǒng)一KPI 定義及促進(jìn)企業(yè)標(biāo)準(zhǔn)化管理,同時(shí)其管理的內(nèi)容可作為統(tǒng)計(jì)分析系統(tǒng)所支持的知識(shí)庫來使用。 OLAP平臺(tái):選擇微軟的SQL Server 2008作為OLAP平臺(tái)。OLAP 工具支持分析的類型包括管理儀表盤、平衡記分卡、制式化管理報(bào)表、臨時(shí)查詢、數(shù)據(jù)挖掘等。
4 系統(tǒng)實(shí)現(xiàn)
4.1 ETL實(shí)現(xiàn)
ETL采用SQL Server集成服務(wù)來實(shí)現(xiàn)。Microsoft Integration Services 是一個(gè)可以生成高性能數(shù)據(jù)集成解決方案(包括為數(shù)據(jù)倉庫提取、轉(zhuǎn)換和加載ETL包)的平臺(tái)。Integration Services包括生成和調(diào)式包的圖形工具和向?qū)?執(zhí)行工作流函數(shù)操作和執(zhí)行SQL腳本等任務(wù);提取和加載數(shù)據(jù)的數(shù)據(jù)源和目標(biāo);清除、聚合、合并和復(fù)制數(shù)據(jù)的轉(zhuǎn)換;管理包執(zhí)行和存儲(chǔ)的管理服務(wù),即Integration Services;用于Integration Services對(duì)象模型編程的應(yīng)用程序編程接口(API)。
4.2 多維數(shù)據(jù)實(shí)現(xiàn)
創(chuàng)建報(bào)表之前,需要通過SQL Server分析創(chuàng)建多維數(shù)據(jù)模型。之所以使用SQL Server分析服務(wù)創(chuàng)建多維模型,主要是為了實(shí)現(xiàn)對(duì)業(yè)務(wù)數(shù)據(jù)的即席查詢。系統(tǒng)開發(fā)人員創(chuàng)建多維數(shù)據(jù)集以支持快速響應(yīng),并提供單個(gè)數(shù)據(jù)源以進(jìn)行業(yè)務(wù)報(bào)告。商業(yè)智能的重要性不斷提高,使用單一的分析數(shù)據(jù)源可確保將差異減到最小(如果無法完全消除差異)。
4.3 報(bào)表系統(tǒng)實(shí)現(xiàn)
報(bào)表系統(tǒng)實(shí)現(xiàn)使用了SQL Server報(bào)表服務(wù),報(bào)表服務(wù)包含一整套管理報(bào)表的工具。報(bào)表工具在微軟的開發(fā)環(huán)境中工作,并與SQL Server無縫銜接。通過報(bào)表服務(wù),可以從多種不同的數(shù)據(jù)源創(chuàng)建各種不同樣式的報(bào)表。
5 應(yīng)用效果
該系統(tǒng)目前已經(jīng)在某人壽保險(xiǎn)有限公司正式投入使用,結(jié)果顯示,該系統(tǒng)使業(yè)務(wù)數(shù)據(jù)的分析效率、分析能力大大提高,在一定程度上簡化了業(yè)務(wù)人員數(shù)據(jù)統(tǒng)計(jì)工作,對(duì)公司決策支持起到很大的幫助作用,系統(tǒng)良好的應(yīng)用價(jià)值體現(xiàn)在以下幾個(gè)方面:
?、贁?shù)據(jù)集成。數(shù)據(jù)倉庫能夠把來自多個(gè)不同子系統(tǒng)的數(shù)據(jù)進(jìn)行有效集成,提供統(tǒng)一的、一站式的業(yè)務(wù)報(bào)表系統(tǒng);
?、诓樵冹`活方便。統(tǒng)計(jì)分析系統(tǒng)能夠根據(jù)不同的需求進(jìn)行條件過濾,并支持?jǐn)?shù)據(jù)向上向下鉆取,數(shù)據(jù)查詢方式更加靈活,追溯更加簡單直接,為業(yè)務(wù)分析人員提供了很大的便利;
?、郯踩愿?。為了保證數(shù)據(jù)的安全性和可靠性,對(duì)數(shù)據(jù)倉庫中的數(shù)據(jù)實(shí)行統(tǒng)一管理;
?、芙档统杀?。統(tǒng)計(jì)分析系統(tǒng)的建立,可以代替原來的手工匯總操作,一次創(chuàng)建,只需要進(jìn)行簡單的維護(hù)就可長期使用。
6 結(jié)語
本系統(tǒng)開發(fā)及系統(tǒng)運(yùn)行工作得到如下經(jīng)驗(yàn)及啟示:
(1)理念的轉(zhuǎn)變。在數(shù)據(jù)分析上,需要從清單和簡單匯總上升到數(shù)據(jù)分析,從單個(gè)部門分析到全局分析,從數(shù)據(jù)庫到數(shù)據(jù)倉庫進(jìn)行分析設(shè)計(jì)。
(2)平臺(tái)統(tǒng)一管理要求。在報(bào)表的管理上,一個(gè)統(tǒng)一的部門管理面向高管的報(bào)表,制定統(tǒng)一的口徑;對(duì)沒有報(bào)表的部門需要嚴(yán)格確認(rèn)數(shù)據(jù)準(zhǔn)確性;對(duì)有報(bào)表的部門,不要局限于當(dāng)前的數(shù)據(jù)邏輯。
(3)系統(tǒng)擴(kuò)展。報(bào)表需要不斷擴(kuò)展和改進(jìn),不斷提高深度和廣度,收集更多數(shù)據(jù),提供更多報(bào)表;提升界面功能,精確授權(quán),自動(dòng)分發(fā)報(bào)表;提升可用性,全面取代現(xiàn)有的其它報(bào)表系統(tǒng);從明細(xì)數(shù)據(jù)到統(tǒng)計(jì)數(shù)據(jù),進(jìn)而分析數(shù)據(jù),最終實(shí)現(xiàn)商業(yè)智能、數(shù)據(jù)挖掘的目標(biāo)。