信用評分

信用評分專家系統

  • July 11, 2015

我正在為沒有擔保的信用(消費者信用)研究信用評分模型。

我正在尋找一種不基於統計方法的信用評分決策專家系統的方法。我對我的數據嘗試了幾種統計方法(邏輯回歸,隨機森林) - 沒有成功。我的變數沒有足夠的預測性,而且預測太差,無法建立記分卡。

我正在建模一個級別為 0 和 1 的二進制變數,其中 1 是預設值,並且我有幾個預測變數。

現在我正在尋找一種將數據資訊與專家系統(人類知識)相結合的方法?我能做些什麼?

是否存在這樣的方法/算法?那麼先驗呢?

從業者用來模擬消費者信用的最佳模型是邏輯回歸模型;現在,您說您嘗試使用邏輯模型進行建模但沒有成功,但我想向您推薦我在這種情況下將使用的分步程序。

為了模擬消費者信用,我將遵循以下程序:

  • 樣品分析

我分析了此類樣本的分佈,驗證它具有大致相同的總體或基準分佈。樣本量應該足夠(根據巴塞爾協議的建議,至少 5/7 年的觀測中至少有 50k 次觀測)。

在這樣的步驟中,您可以通過使用人口穩定性指數來執行這種分析,對於每個變數,給定的,通過:

$ PSI $ $ = $ $ \sum\limits_{i=1}^n (P_{i,1}-P_{i,2})*ln\frac{P_{i,1}}{P_{i,2}} $

在哪裡 $ P_{i,1} $ 是您考慮的總體/基準的 j 類中觀察值的百分比,並且 $ P_{i,2} $ 是樣本的 j 類中觀察值的百分比。

通過驗證 PSI 小於 10%,計算樣本中每個變數的 PSI;門檻值是經驗性的,取決於您正在分析的國家/地區/工具。

根據 PSI 從樣本變數中剔除不穩定的變數。

  • 數據質量分析

根據經濟意義分析樣本值,確定缺失值的百分比、值的異常(例如,值 999.999)和錯誤值(例如,應該為正的變數的負值,例如貸款價值)。我會消除所有具有大於 5% 百分比的缺失、異常或錯誤值的變數。

  • 邏輯回歸分析

通過在獨立變數上回歸目標變數來實現邏輯,通過消除在 5% 水平上不顯著的變數;消除相關性大於 30% 的變數(同樣,這是一個經驗規則,因此,將其用作經驗法則而不是門檻值點)。之後,通過僅保留重要變數來執行逐步變數選擇模型。

現在,這是我用來模擬消費信貸市場的基本分步程序。在此之後,您應該獲得大約等於 80% 的 AUROC(測試/驗證集為 70%)。如果不是,您可以通過引入專家/判斷變數來校準/調整模型。這意味著要求您的同事根據他們定義哪些變數會影響違約機率,並通過以下方式調整變數在模型中的權重給它們加蓋;這是更簡單的方法。其次,您可以開發一個完全以判斷方式建構的並行模型(例如,對可能影響 PD 的變數進行問卷調查,並要求幾個從業者進行編譯,最後選取更有意義的變數。

如果您不是從業者,以下是影響 PD 的最常見變數:

  • 貸款/信貸金額;
  • 債務收入比;
  • 年齡;
  • 工作;
  • 工資/薪金數額;
  • 信用局評分;
  • 過去的消費者歷史(如果客戶過去買了東西並且能夠償還債務);

等等……不幸的是,它不存在開發基於專家的信用風險模型的算法。事實上,專家判斷是基於銀行櫃員/經理的經驗,並且這種經驗會根據雇主所在的國家/地區而變化。消費信貸市場因國家文化、規則、法律、中央銀行應用巴塞爾協議的方式等諸多因素而變化。無法將模型建構調整為在英國執行到拉丁國家,如西班牙、意大利等

希望這可以幫助。

引用自:https://quant.stackexchange.com/questions/18811