非固定固定“轉換”
尊敬的 StackExchange 使用者,
我想知道為什麼固定時間段的日誌返回在將時間序列“轉換”為更平穩的序列時如此普遍?我認為當使用像每日日誌回報這樣的固定時期的回報時,很難找到優勢,因為我在網上看到幾乎每個人都在使用它們。
我也可以使用固定成交量率的成交量條的回報,對嗎?以及如何使用基於固定長度的時間條的兩個 MA 的交叉點的對數返回?
我之所以問這個問題是因為我想知道是否像在應用兩個 MA 之前一樣,獲取兩個 MA 的交叉之類的回報是否違反了某些規則,數據需要是固定的。或者我可以在非平穩數據上應用一些簡單的模型(具有恆定信號),獲取那些日誌返回。瞧,我做了一個固定的回歸系列。對於沒有恆定信號的模型,我可以對這些回報進行建模嗎?
所以問題是:
- 某個固定時間段的日誌返回只是為了簡單起見還是有其他用途?
- 我是否可以將不同類型數據的日誌返回建模為同質系列,如音量條?
- 我是否允許對一個簡單模型的對數返回進行建模,該模型輸入具有恆定信號的非平穩時間序列數據,例如兩個 MA 在非平穩數據(時間蠟燭)上交叉的對數返回?
3.1 由於在模型中插入了非平穩數據,我可以這樣做嗎? 4. 我是否允許對具有非恆定信號的非平穩時間序列數據輸入的更複雜模型的對數返回進行建模,例如非平穩數據(時間蠟燭)上的 RSI 命中時的對數返回70 或 30 到 50 RSI?
我的想法是,當使用價格或時間不固定的東西(美元柱或時間柱)時,基礎統計數據可能具有更好的統計特性和/或信賴區間。
好的,所以我自己做了一些研究,希望我能幫助別人回答我的問題。我還要感謝 Algo Trading 和 Quant Crew Discord 小組幫助我回答問題。我還要感謝 Ramon 與我討論了一些答案。
問題1: 某個固定時間段的日誌返回是為了簡單還是有別的用途?
這很簡單,我不會深入解釋回答這個問題。我將嘗試用一個句子來解釋每一個,要獲得更廣泛的解釋,請訪問來源或參考。有人想要在某個固定時間段內使用日誌返回有四個主要原因。
- 對數正態性,這假設收益是分佈的對數正態分佈,因為許多經典統計數據都假定正態性。
- 近似原始對數相等,確保它們的價值接近原始回報。
- 時間可加性,可以只添加單個日誌返回,這降低了算法的複雜性。
- 數學上的簡單性,來自 e^x 的微積分恆等式是有用的,因為金融數學的大部分是建立在連續時間隨機過程的基礎上的。
資料來源:
- https://quantivity.wordpress.com/2011/02/21/why-log-returns/
- https://stats.stackexchange.com/questions/244199/why-is-it-that-natural-log-changes-are-percentage-changes-what-is-about-logs-th
- https://en.wikipedia.org/wiki/Vector_calculus_identities
- https://en.wikipedia.org/wiki/Rate_of_return#:~:text=Logarithmic%20returns%20are%20time%2Dadditive,in%20models%20from%20becoming%20negative.
問題 2: 我是否可以將不同類型數據的對數返回建模為同質系列(如音量條)?
是的,我可以這樣做,因為我可以使用任何類型數據的日誌返回,因為可以在任何地方找到 Alpha。目標是生成 Alpha,而不是絕對的統計純度。我看到的個人情況是,經常使用基於時間的回報。我認為動機是在固定的時間段內,時間長度(t)是一個常數,只需要分析信號的頻率(f)。對於非固定時間序列或不涉及時間的所有其他序列,需要估計信號的時間長度 (t) 和頻率 (f)。這是因為我們需要隨著時間 (t) 預測模型的未來,因為我們可能希望使用有效邊界在不同模型之間分割我們的投資組合。替代條可能需要一些計算時間,因此模型不需要 它的反應時間與僅使用原始數據的模型一樣快。但從好的方面來說,替代條形可能具有更好的統計特性,正如 Marcos Lopez De Prado 在他的《金融機器學習進展》一書中所解釋的那樣。時間條還假設市場是按時間順序排列的,但事實並非如此,替代條不假設交易以恆定的時間間隔發生。
因此,允許將不同類型數據的日誌返回建模為同質系列,如音量條。這可能會導致更好的統計特性並解決按時間順序排列的市場問題。這樣做時請記住,您可能不僅要估計信號的頻率,還要估計信號的時間併計算信號的延遲。
資料來源:
- 交易量或美元條與波動率正規化和貶低的金融時間序列
- https://davidzhao12.medium.com/advances-in-financial-machine-learning-for-dummies-part-1-7913aa7226f5
- https://alpaca.markets/learn/alternative-bars-01/
- http://www.blackarbs.com/blog/exploring-alternative-price-bars
- https://www.reddit.com/r/algotrading/comments/ihv96z/alternative_bars_that_are_to_solve_some/
- https://towardsdatascience.com/non-stationarity-and-memory-in-financial-markets-fcef1fe76053
- https://poseidon01.ssrn.com/delivery.php?ID=095121121119088082082108069090076078040064035059032043111087085103027020067088098119120010051124040104010081108123126124088002038022029046084100114030099066012094028020094067083065015085094101101120092100065024092095094120026108085086024091079114093&EXT=pdf&INDEX=TRUE
- 金融機器學習的進步,Marcos Lopez De Prado
問題 3: 我是否允許對一個簡單模型的對數收益建模,該模型輸入具有恆定信號的非平穩時間序列數據,例如兩個 MA 在非平穩數據上交叉的對數收益(時間蠟燭)?
是的,正如問題 2 的答案中提到的,您可以對任何類型的數據進行建模,因為可以在任何地方找到 Alpha。目標是生成 Alpha,而不是絕對的統計純度。這基本上就是您在獲取幾個指標並將它們相互疊加時所做的事情。但是插入非平穩數據呢?插入非平穩數據是無關緊要的,因為信號需要是平穩的。
在另一個模型上建模時,第一個模型的誤差範圍需要在第二個模型的統計中考慮。因此,當模型在另一個模型之上製作時,成功的機會越來越小。
資料來源:
- 檢查來源問題 2
問題 4: 我是否允許對更複雜模型的對數返回進行建模,該模型輸入具有非恆定信號的非平穩時間序列數據,例如當 RSI 對非平穩數據(時間蠟燭)達到 70 或 30 直到 50 RSI?
這個問題的答案與問題 3 相同。一切都可以放入模型中以生成 Alpha,目標是生成 Alpha,而不是絕對的統計純度。
資料來源:
- 檢查來源問題 2
推理
一切都可以建模,它可能不遵循某些統計規則,但這沒關係。重要的是 Alpha 信號遵循統計規則。當使用從正常抽樣派生的某種同質序列時,統計特性可能會更好,並可能解決按時間順序排列的市場問題。與其他所有現有選擇一樣,對同質數據進行建模各有利弊。
我們將在非同質和同質數據上建構我們的模型,以確保我們將所有內容都包含在我們的模型中。由於我們沒有無限的電腦能力,我們需要在將數據插入到不同的特徵時找到一個平衡點。