動態規劃
最佳停止(參考請求)
我對以下最佳停止問題感興趣:
- 每天都有一個號碼 $ a_i $ 是從(可能是固定的)分佈中得出的。
- 我現在可以停下來,得到回報 $ a_i $ ,或等待稍後的抽獎。
- 原則上,這可以永遠持續下去。然而,未來的回報會以(可能是恆定的)利率貼現。
我知道這類問題已被廣泛分析。誰能推荐一些關於在這種情況下如何描述最佳策略的參考資料?
這在經濟學中被稱為 McCall 搜尋模型。原始論文表明,最優停止策略規則由“保留工資”給出,有一個門檻值,使得接受任何高於該門檻值的平局都是最優的:
McCall, John J. “資訊經濟學和最優停止規則”。商業雜誌38.3 (1965): 300-317。