統計

根據天氣+農業數據預測期貨價格

  • February 19, 2018

我在數據探勘領域工作,並為我的碩士項目提出了以下想法。文本可能不是最好的結構,但它是一個工作草案,可以讓你快速了解。

基本假設,

  • (天氣數據 + 農業數據 + 社交媒體(推特等)數據 + 其他相關數據)的組合是否可用於幫助投資者購買產品/商品“X”的期貨
  • 我計劃專注於檢驗“大豆期貨”的假設。核心思想是測試方法,即使我失敗了,也很好。我的方法/方法必須是正確的。

目標,

  • 潛在的目標受眾可能是投資者、政府機構或農業行業

方法,

  • 關注美國大豆期貨(世界最大的大豆生產商)縮小我的問題範圍
  • 更具體地說,伊利諾伊州(引領美國大豆生產)進一步放大

技術,

  • 了解期貨定價模型的工作原理
  • 查找伊利諾伊州大豆期貨的歷史交易數據$$ from Quandl? $$我仍然不知道如何將大豆期貨交易數據與其產生的地方相匹配,所以這是一個問題,我認為
  • 天氣$$ temp, humidity, sea pressure, etc $$&農業$$ yields, farm sizes etc $$數據易於獲取和分析
  • 進行一些數字運算/數據探勘以測試“如果伊利諾伊州的天氣影響大豆產量/產量,進而影響大豆期貨價格”;我仍然需要改進技術,但這是一個粗略的想法

您的輸入,

  • 你怎麼看整個想法?完全瘋了嗎?不現實?我需要成為數學神才能解決這個問題?
  • 如果您認為這甚至是遙不可及的,那麼我必須做什麼,不該做什麼?
  • 我的技術完全有缺陷嗎?我錯過了什麼?低估?我怎樣才能提高我的技術?

而不是“數據探勘”,我會嘗試採用一種更有條理的方法來選擇變數/因素:農業價格的關鍵驅動因素,一如既往地在經濟學中,是供求關係。

正如您所說,供應取決於種植面積和產量,而這又取決於天氣和其他因素(例如施肥——不能連續多年大量使用氮)。我將從美國農業部網站開始。

從我在您的問題中讀到的內容來看,需求及其驅動因素缺失。幸運的是,在食品消費方面,需求相對穩定。然而,玉米乙醇在過去幾年是一個很大的波動因素,導致了玉米的瘋狂。

更結構化的方法將幫助您理解和解釋您的結果,imo。我認為這是一個偉大的項目,但也是一個大項目。從理論上講,您可以將整個職業生涯都投入到這個主題上。

引用自:https://quant.stackexchange.com/questions/14772