統計
根據天氣+農業數據預測期貨價格
我在數據探勘領域工作,並為我的碩士項目提出了以下想法。文本可能不是最好的結構,但它是一個工作草案,可以讓你快速了解。
基本假設,
- (天氣數據 + 農業數據 + 社交媒體(推特等)數據 + 其他相關數據)的組合是否可用於幫助投資者購買產品/商品“X”的期貨
- 我計劃專注於檢驗“大豆期貨”的假設。核心思想是測試方法,即使我失敗了,也很好。我的方法/方法必須是正確的。
目標,
- 潛在的目標受眾可能是投資者、政府機構或農業行業
方法,
- 關注美國大豆期貨(世界最大的大豆生產商)縮小我的問題範圍
- 更具體地說,伊利諾伊州(引領美國大豆生產)進一步放大
技術,
- 了解期貨定價模型的工作原理
- 查找伊利諾伊州大豆期貨的歷史交易數據$$ from Quandl? $$我仍然不知道如何將大豆期貨交易數據與其產生的地方相匹配,所以這是一個問題,我認為
- 天氣$$ temp, humidity, sea pressure, etc $$&農業$$ yields, farm sizes etc $$數據易於獲取和分析
- 進行一些數字運算/數據探勘以測試“如果伊利諾伊州的天氣影響大豆產量/產量,進而影響大豆期貨價格”;我仍然需要改進技術,但這是一個粗略的想法
您的輸入,
- 你怎麼看整個想法?完全瘋了嗎?不現實?我需要成為數學神才能解決這個問題?
- 如果您認為這甚至是遙不可及的,那麼我必須做什麼,不該做什麼?
- 我的技術完全有缺陷嗎?我錯過了什麼?低估?我怎樣才能提高我的技術?
而不是“數據探勘”,我會嘗試採用一種更有條理的方法來選擇變數/因素:農業價格的關鍵驅動因素,一如既往地在經濟學中,是供求關係。
正如您所說,供應取決於種植面積和產量,而這又取決於天氣和其他因素(例如施肥——不能連續多年大量使用氮)。我將從美國農業部網站開始。
從我在您的問題中讀到的內容來看,需求及其驅動因素缺失。幸運的是,在食品消費方面,需求相對穩定。然而,玉米乙醇在過去幾年是一個很大的波動因素,導致了玉米的瘋狂。
更結構化的方法將幫助您理解和解釋您的結果,imo。我認為這是一個偉大的項目,但也是一個大項目。從理論上講,您可以將整個職業生涯都投入到這個主題上。