買/賣與低/高
出於實驗原因(求知欲),我正在嘗試收集歷史數據,但無法理解這些數據的計算方式。首先是 2015 年 2 月 10 日開幕時在 AAPL 上收集的一些數據。
dataA = http://hopey.netfonds.no/tradedump.php?date=20150210&paper=AAPL.O&csv_format=txt
dataB = http://hopey.netfonds.no/posdump.php?date=20150210&paper=AAPL.O&csv_format=txt
dataC = http://www.google.com/finance/getprices?i=60&p=4d&f=d,o,l,h,c,v&df=cpct&q=AAPL
dataD = http://chartapi.finance.yahoo.com/instrument/1.0/AAPL/chartdata;type=quote;range=4d/csv
DataA 似乎提供了在規定日期發生的每一筆交易;這是正確的還是我讀錯了數據?如果我取dataC的第一行(close,high,low,open,volume)=(120.3,120.31,120.16,120.17,646886),那麼它對應dataA的前幾筆介紹性交易。同樣,dataD 也對應於 dataA 的事務,但需要幾分鐘。換句話說,dataC 和 dataD 看起來像是對 dataA 的估計(使用 close、high、low、open、volume)。它是否正確?
如果這是真的,那麼 dataA 是“原始數據”並且出於分析原因非常棒。但是,我對dataB感到困惑。我想 dataB 是買賣價差,但是如果我轉到以下行:
20150210T150001 120.54 300 300 120.55 4600 4600
那麼出價/要價似乎是 120.54/120.55,與 dataA(實際交易的原始數據)相比,這似乎完全不准確?甚至Google在開盤的第一分鐘也表示 (c,h,l,o,v) 是 (120.39,120.58,120.25,120.3,576584),這似乎與 120.54/120.55 的價差不太接近?
我誤解/誤讀了什麼?
數據集 A 確實看起來像交易,但我會猶豫說它是每筆交易。您需要調查數據源以及如何定義事務。數據集 B 看起來像 BBO(最佳出價和報價)。數據集 C 和 D不是估計值;它們聚合到更高的周期性。
您需要調查數據集 A 和 B 的數據源。美國股市是一個分佈式系統。有很多交易場所。A 和 B 可能來自特定場所,或特定場所集合,而 Google 和 Yahoo 上的數據可能來自 NBBO(國家 BBO)。
總之,股市數據是複雜的。
Hopey.netfonds 的數據只是交易所的數據。在這種情況下,您看到的所有交易都有納斯達克報價,因此在 AAPL 之後出現“O”。它無法提供來自其他場所(例如 BATS 等)的交易,這是免費數據提供商通常用作 Google 財務的方式