統計

用作量化的重要統計概念是什麼?

  • July 2, 2020

我正在面試一些對沖基金的量化研究員職位,有人告訴我,將有一場側重於統計數據的面試,另一場側重於機器學習等。這讓我意識到我很難區分統計數據和機器學習,因為存在大量重疊,儘管我認為我對統計數據的哪些部分可能通常不屬於機器學習有所了解。

我在大學和高中上過統計課程,這些課程中從來沒有提到“機器學習”這個詞。在這些課程中,我回憶起更多關注的事情(大部分我已經忘記了),比如假設檢驗、基本機率和常見分佈、信賴區間、條形圖/箱線圖/直方圖和單變數回歸。

您認為哪些統計數據通常不屬於 ML 的一部分,並且對於金融行業中的實際數據推斷/分析/預測很重要,特別是在對沖基金/道具交易公司中?

老實說,這個問題並不真正在 QuantFinance 的範圍內,因為它是基於邊緣意見的,但無論如何我都會向社區提供答案。

如果您無法確定 stats 和 ML 之間的區別,那麼您可能會認為您不了解每個相關學科中使用的用途和方法,並且可能需要做更多的研究,然後才能在面試中取得成功。

統計學涵蓋了抽樣和數據分佈的數學。假設檢驗、簡單機率和常見分佈是如此基礎,以至於您將不斷依賴這些作為量化。我建議你盡一切努力記住你的學業。

ML 涵蓋了各種模型技術和模型擬合技術,用於解決有監督或非監督式問題,即您有輸入數據並且想要預測輸出數據或對該數據執行一些分析。該分析可能是統計的,也可能是算法的。例如,K-means 分群不是一種“統計技術”,它是一種算法。

從廣義上講,ML 和統計屬於數據科學。平均而言,ML 可以被認為是預測/分類問題的統計模型。在機器學習中,您將學習處理決策樹、支持向量機、神經網路等模型。當您將這些模型應用於特定問題時,您將使用基本的統計術語來評估模型的性能。你在大學學到的機率與統計知識對於理解機器學習至關重要。你只需要學習一門好的機器學習課程,我會建議你參加吳恩達教授的課程。在 Coursera 上。快樂學習!

引用自:https://quant.stackexchange.com/questions/55338