DataMining在信用卡客戶分群之應用**大學統計資訊學系Ben-BenBank總裁***台灣區經理***專員***專員***行銷主任***資訊人員***會議進行中………DataMining的意義DataMining是指找尋隱藏在資料中的訊息,如趨勢(Trend)、特徵(Pattern)及相關性(Relationship)的過程,也就是從大量資料中發掘資訊或知識。DataMining的功能分類(classification)推估(estimation)預測(predication)關聯分組(affinitygrouping)同質分組(clustering)DataMining的相關技術記憶基礎推理法(Memory-Basedeasoning)市場購物籃分析(MarketBasketAnalysis)決策樹(DecisionTrees)基因演算法(GeneticAlgorithm)群集偵測技術(ClusterDetection)連結分析(LinkAnalysis)線上分析處理(On-LineAnalyticProcessing;OLAP)類神經網路(NeuralNetworks)區別分析(DiscriminantAnalysis)羅吉斯迴歸分析(LogisticAnalysis)DataMining和一般統計分析不同之處在於DataMining可以處理多個維度的大量資料,避免了下面幾點困難:巨量的紀錄、高維的資料、蒐集到的資料僅有一小部分用來分析。DataMining和統計分析比較研究工具DataMining軟體—STATISTICA6.0基於經費的考量,已取得軟體的使用授權。研究架構及步驟收集相關的文獻探討整理及清理資料資料轉檔研究動機與目的實際資料挖掘工作(1)集群分析(2)判別分析(3)交叉分析(4)決策樹分析(5)羅吉斯迴歸分析(6)類神經網路分析測試與檢核分析結果DataMining流程圖將原來的資料(2,109,518筆)切割成三大部分:TrainingData(1,000,070筆)TestingData(555,814筆)NewData(553,634筆)TrainingData&TestingData隨機抽出0.2%樣本SampleTrainingData(2054筆)SampleTestingData(1125筆)STrainingData&STestingData做群集分析產生分群變數依分群變數資料集結果進行判別分析將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯迴歸.決策樹….將TrainingData(1,000,070筆)及TestingData(555,814筆)直接做群集分析將TrainingData及TestingData作群集分析產生分群變數資料集將分群變數的資料集作判別分析將分群變數與原來的變數產生合併資料集將合併後的資料集作交叉分析.羅吉斯回歸.決策樹….DataMining抽樣流程DataMining(未經抽樣)流程DataMining(未經抽樣+抽樣流程圖)研究結果樣本與母體結構比較分群結果判別結果瑕疵戶預測結果分群特性群集結果型態分群變數p-value個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00SampleTestingDataClusterAnalysisofVariablesTotalTrainingDataTotalTestingDataSampleTrainingData第一群百分比第二群百分比第三群百分比TotalTrainingData47510147.5%31051431.0%21445521.4%TotalTestingData26455347.6%17232531.0%11893621.4%SampleTrainingData101449.4%60229.3%43821.3%SampleTestingData54548.4%34330.5%23721.1%單位:筆分群個數判別結果型態判別分群變數p-value個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00個人平均月收入0.00平均每月信用卡刷卡刷卡金額0.00家庭平均月收入0.00DiscriminantFunctionAnalysisofVariablesSampleTestingDataTotalTrainingDataTotalTestingDataSampleTrainingData判別結果誤判率第一群第二群第三群Total判斷率TotalTrainingData0﹪10.45﹪0﹪97.58%TotalTestingData0﹪10.7﹪0﹪97.56%SampleTrainingData0.01﹪0﹪0﹪99.80%SampleTestingData0﹪0﹪0﹪100%瑕疵戶預測P-valueTotalTrainingData0.0000TotalTestingData0.0000SampleTrainingData0.0000SampleTestingData0.0000羅吉斯迴歸模型瑕疵戶預測模型結果Y:是否為瑕疵戶X:是否逾期超過30天是否有呆帳紀錄是否有借款餘額800萬是否有退票紀錄是否有拒往紀錄是否有他行強制停卡紀錄對不同顧客如何處理黃金單身漢個人月收入20,000元(100%)20,001~40,000元佔(73.59%)平均月開銷20,001~40,000元(15.46%)家庭月收入60,000元以下(100%)刷卡金額60,001~80,000元(28.02%)農林漁牧(16.55%)事務職(12.21%)銷售業(11.18%)一年內有申請的意願(30.3%)信用卡張數2~3張(55.86%)很少使用信用卡(18.92%)15~24歲(34.23%)30~34歲(15.08%)未婚(49.76%)上,中上(76.78%)銀行殺手個人月收入20,000元以下,其中沒有收入佔(56.87%)平均月開銷20,000元以下(84.69%)家庭月收入60,000元以下(100%)刷卡金額40,001~60,000元(41.73%)逾期30天(10.81%)呆帳紀錄(9.86%)借款餘額800萬(12.40%)退票紀錄(10.82%)拒往紀錄(11.10%)強制停卡紀錄(11.77%)男女(差異最大)血型A型(30.52%)經常使用信用卡(34.33%)偶爾使用信用卡(45.98%)大學生(8.18%)專科學生(8.25%)高中職學生(18.99%)敗金高手個人月收入20,000元以下(100%)其中沒有收入佔(63.05%)平均月開銷10,001~20,000元(33.91%)家庭月收入60,000元以下(97.23%)刷卡金額60,001~80,000元(49.28%)35~49歲(32.21%)已婚(23.73%)中(46.33%)中下(24.78%)下(9.61%)一年內有申請的意願(31.36%)信用卡張數3~4張(14.21%)很少使用信用卡(20.82%)農林漁牧(19.79%)家庭主婦(14.78%)事務職(14.75%)策略黃金單身漢(高利潤+經濟能力較好)刺激顧客增加刷卡次數。結合百貨公司、大型量販店、或飯店等等,促使其消費便利增加消費次數。對於不常外出購物者寄予消費指南及較高檔的商品型錄,來刺激消費、增加刷卡次數。策略銀行殺手(風險變數高)降低信用額度。加強控管銀行殺手的消費行為對舊有之顧客,建議採用降低信用卡額度,並隨時電話追蹤,確認消費無誤,同時長期觀察,確認其安全性。策略敗金高手(高利潤+經濟能力偏低)留住目前的客戶,提高顧客忠誠度。預留一段時間作為審查,合格者施予同黃金單身漢一樣行銷手法。不合格者,加強其風險的把守,同時降低其信用卡額度。黃金單身漢高利潤高風險敗金高手銀行殺手貢獻針對銀行目前的顧客,依其族群的不同,實施不同的解決方法,達到降低銀行風險並增加利潤的目的。對於銀行的新顧客,提供不同的策略,以得到銀行的最大利益。建立一個判定模型,提供銀行在發卡之前的一個審核方針。報告完畢Thankyou!!!