群
基於相似性的分群和基於特徵的分群的混合
以擁有 500 隻股票的標準普爾 500 指數為例。一些有趣的事情是根據股票的相關性創建集群,以使集群在市場上具有相同的“方向”。這很容易通過分群算法完成,具有與相關矩陣明確定義的距離矩陣。
但是,如果我們想根據股票的相關性和特徵對 500 隻股票進行分群,我們該怎麼做呢?據我所知,分群算法僅適用於相似性度量(通常是相關性)或特徵(P/E 比率、大小……),但不能同時使用兩者。
你有什麼主意嗎 ?
通常在執行這些類型的分群算法之前,最好在它們上執行 PCA 並將它們創建為您的功能集。這使您可以在多維數據上執行分群,而不必過多擔心特徵重要性。
您正在描述類似於具有集群風險而不是市場風險的Fama-French 模型。因此,在計算您的特徵係數之前,先回歸出特定於集群的 beta。
我認為,在實踐中,您的集群將只是一個部門或行業。