房價中的特徵回歸和屬性份額
給定一個有價格的房子 $ P $ 和屬性 $ h_1,\dots,h_n $ ,我想估計每個屬性成本佔房價的百分比 $ P $ . 換句話說,如果我們將房價表示為各個屬性成本的總和 $$ \begin{equation} P=c_0+c_1h_1+\cdots+c_nh_n, \end{equation} $$ 在哪裡 $ c_0 $ 是房屋的“基準成本”,並且 $ c_1,\dots,c_n $ 是住房屬性的成本 $ 1,\dots,n $ , 我對計算感興趣 $$ \begin{equation} p_i=\frac{c_ih_i}{P},\quad i=1,\dots,n, \end{equation} $$ 在哪裡 $ p_i $ 可以解釋為屬性的成本份額 $ i $ 有價格的房子 $ P $ .
假設我有數據 $ P $ 和 $ h_i $ 的。自然的方法是執行一個特徵回歸來估計 $ c_i $ 的。但是,我面臨以下困難:
部分估計 $ c_i $ ’s 可能是負數,這導致相應的 $ p_i $ 也是消極的。例如,一個 $ h_i $ 可能是到工作地點的距離,這會降低房價,因為該物業離工作地點越來越遠。這給解釋帶來了問題 $ p_i $ 作為成本份額,因為它小於零。
文獻中是否有處理特徵回歸中負係數問題的標準方法?任何參考或提示將不勝感激。
你所提議的是關於房價的享樂回歸的不尋常應用。該方法最常用於以下兩個目的之一:
a) 解釋或預測相對房價。
b) 估計房屋及其社區特徵的價值,尤其是那些難以以其他方式估值的特徵,例如非市場環境商品。
當該方法用於這些目的時,負參數不太可能被視為問題。以最近的一項研究為例,Mora-Garcia等人(2019)用各種回歸量的負參數估計了特徵回歸(見表 6,第 15 頁)。他們的討論(第 25 頁)毫無顧忌地指出了負參數(重點關注不同模型之間負號的一致性)。當享樂研究的目的是估計諸如空氣污染之類的環境“壞”對房價的影響時,可以預期污染回歸器的負參數。 科瑪洛娃 (2009)例如,在莫斯科發現了幾種空氣污染物的負參數(見表 III 第 323 頁和解釋第 324 頁)。
只有您將房價分析為正成本份額的特定目標才會使負參數成為問題。沒有解決問題的標準方法,因為對於大多數研究來說這不是問題。
然而,文獻中的一些想法可能會有所幫助。在工作距離(通常是到任何便利設施的距離)的情況下,另一種方法是使用某種可訪問性度量,並將較大的訪問便利性與較大的回歸值相關聯。 Heyman等人(2019)回顧了享樂研究中使用的各種可訪問性度量。特別是他們在第 3.3.2 節中的等式 (3) 包含以下形式的術語 $ e^{-c} $ , 在哪裡 $ c $ 是區域之間的旅行成本,用於衡量所需的屬性。 Franklin等人 (2003 年)提出了一個相當複雜的工作可達性指數,也包括所需的財產,它考慮了具有不同員工數量的多個工作地點(參見公式 2 p 5)。
可用於發現具有負參數的任何回歸量的一般方法是從中得出一個定義為沿相反方向變化的度量。例如,假設財產年齡 $ A_i $ 被發現是顯著的並且具有負參數,並且樣本中的最高年齡是100歲。可以簡單地用定義為的回歸量替換它 $ 100-A_i $ . 或者可以定義離散點的尺度,例如 0-10 年為 5,10-25 年為 4,等等。嘗試這種不同的度量可能具有提高回歸擬合度的額外好處。