Nasdaq
優化 SVM 分類時如何正確交叉驗證?
我正在使用 SVM 二進制分類來預測納斯達克股票價格的走勢。我的問題是關於交叉驗證。我將訓練數據分成 V 個子集。將在 (V-1) 個子集上執行訓練,然後記錄對第 V 個子集的預測。這將完成 V 次。
(1) 準確度的最佳衡量標準是所有 V 結果的平均值嗎?或者也許是最低限度?
(2) 子集應該等長嗎?隨機的?
(2a) 子集可以重疊嗎?
(3) 我是否需要確保每個子集至少具有每個類結果的某個最小百分比(1 或 0)才能使結果有效?
交叉驗證過程不會開啟算法的選擇。
- 是 - 在預測數據的第 V 部分時計算擬合模型的預測誤差。使用簡單平均值組合預測平均值的 V 估計值。
- 子集應隨機抽樣(大小大致相同)。2a. 子集不應重疊。
- 不,只要抽樣是隨機的,你就可以了。