量化交易策略

用於選股的 PCA

  • October 29, 2019

假設我是一名股票分析師,我想弄清楚在分析行業時應該使用哪些基本指標,我可以使用 pca 使用行業中的一堆股票的基本數據,我將使用回報率等指標權益賬面價值資產收益率等。

我的問題是,如果我對一個行業股票的基本數據進行 pca,第一和第二主成分應該代表什麼

這是我做的 pca 分析

Importance of components:
                         PC1    PC2    PC3    PC4     PC5     PC6     PC7     PC8     PC9    PC10   PC11    PC12
Standard deviation     1.6224 1.4924 1.3076 1.1561 1.06703 0.97266 0.85922 0.79106 0.73160 0.71013 0.6182 0.40416
Proportion of Variance 0.2025 0.1713 0.1315 0.1028 0.08758 0.07278 0.05679 0.04814 0.04117 0.03879 0.0294 0.01256
Cumulative Proportion  0.2025 0.3738 0.5053 0.6081 0.69571 0.76849 0.82528 0.87342 0.91459 0.95338 0.9828 0.99535
                         PC13
Standard deviation     0.24599
Proportion of Variance 0.00465
Cumulative Proportion  1.00000
Rotation (n x k) = (13 x 13):
                        PC1         PC2         PC3         PC4         PC5          PC6           PC7         PC8
price_book1       -0.2326294  0.23808656 -0.34383928  0.39506594 -0.17589636  0.005631939  1.481288e-01 -0.12544212
price_sales1      -0.2953341  0.03231056 -0.39791599  0.08079662 -0.44956572  0.178211731  1.283100e-01  0.25338915
profit_margin1     0.2452919  0.15146781 -0.23584723 -0.08324291 -0.40242616 -0.415042109 -5.372024e-01 -0.36709976
operating_margin1  0.4604949  0.05695158 -0.44611853  0.02911251  0.13084999  0.141162009  9.830128e-02  0.06904643
rnd1              -0.1481195 -0.51008130  0.08082843  0.31825795 -0.14767174 -0.133578701 -2.235869e-01  0.31669428
wacc1              0.1170286  0.32598489  0.12421475  0.55174254 -0.00349785  0.050214012 -3.885664e-02  0.35618351
si1               -0.1299393  0.09449171 -0.26881615 -0.21901039  0.38126586 -0.671389356  1.775648e-01  0.41125604
revenue1           0.1000749 -0.57110300 -0.18342643  0.14168133  0.01143720 -0.095472155 -2.735005e-01  0.13974257
ev_ebitda1        -0.4190633  0.10875543 -0.30716490  0.01541679  0.04935613 -0.122987639 -9.171709e-02 -0.13389575
ebitda_revnue1     0.4892202 -0.10134004 -0.38000743  0.01587338  0.07191896  0.170465503  1.075778e-01  0.10582745
cashflow1         -0.1778912 -0.22024820 -0.20037303  0.36000644  0.53208906  0.073914046  2.114301e-05 -0.50658912
eps_growth1        0.2009673 -0.22566598  0.14730493  0.22313596 -0.31215893 -0.426656558  6.599544e-01 -0.27885383
analysts1         -0.1921450 -0.30498605 -0.20079300 -0.41950787 -0.17999617  0.253170549  2.235785e-01 -0.03446128

謝謝你的幫助將不勝感激

我所做的第一個觀察是,第一批 PC 的變異數比例不是很高,這意味著我會假設 PC 不是很穩定,也不可靠。(您可以通過改變採樣週期和分析 PC 的一致性來測試)

如果 PC 在不同時期之間不穩定,那麼您可以從它們中收集到的有關下一時期的任何預測的資訊都會帶來嚴重的不確定性。由於您假設未來的關係(相關性)被重複,但如果它們不被重複,那麼整個分析就會失敗。

此外,由於您已經擴展了數據,因此可能會破壞結構特性。例如,與小型、精簡、收入低得多的初創企業相比,同一行業中的大公司可能有更高的收入,但營業利潤率相對較低。您的 PCA 無法檢測到這一點,因為所有公司都已標準化。另一方面,如果您不標準化您的 PCA,則通常由變異數最大的變數主導。

引用自:https://quant.stackexchange.com/questions/49422