回歸

如何解釋銷售量與廣告支出之間的負相關?

  • March 15, 2021

我從我們的經濟學教授那裡收到了以下數據集。它有 15 個觀察值和 4 個變數 - ‘qsold’(產品 X 的銷售量)、psn(X 的價格)、pcb(替代產品 Y 的價格)、adv(X 的廣告支出)。我應該推導出一個需求函式(qsold = B0 + B1 (psn) + B2 (pcb) + B3 (adv))。現在理論上,所有三個自變數都應該與 qsold 有關係,但是,我應該只探索線性關係,所以,我試圖擬合以下模型。

df1
qsold   psn pcb adv
1183    1361.97 1405.78 3.22
974 1520.49 1369.17 3.39
1179    1361.43 1448.71 4.03
1258    1159.67 1465.12 3.91
1161    1297.74 1383.93 3.46
1052    1362.44 1450    3.64
992 1447.25 1404.4  3.55
1213    1316.93 1418.03 3.81
1133    1365.97 1391.95 4.21
1001    1283.92 1403.11 4.22
1221    1329.34 1428.9  3.38
1137    1278.41 1426.81 3.89
1112    1466.21 1442.68 3.65
1025    1355.73 1359.79 4.25
1277    1377.06 1455.03 3.35
lm(formula = qsold ~ psn + pcb + adv, data = df1)

Residuals:
   Min      1Q  Median      3Q     Max 
-118.47  -31.59   12.42   39.46   92.43 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)  635.4451  1240.7873   0.512   0.6187  
psn           -0.5897     0.2647  -2.228   0.0477 *
pcb            1.1835     0.6650   1.780   0.1027  
adv         -103.7231    62.7722  -1.652   0.1267  
---
Signif. codes:  
0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 72.57 on 11 degrees of freedom
Multiple R-squared:  0.5764,    Adjusted R-squared:  0.4609 
F-statistic:  4.99 on 3 and 11 DF,  p-value: 0.02004
  1. 在上面的輸出中,onlypsn是顯著的(基於 t stats)。我們的教授告訴我們,我們應該只考慮需求函式中的顯著係數。我覺得很難同意。在這種情況下,如果我在我的需求函式中只考慮 psn,我可能違反了基於 F 統計數據的原假設(所有係數均為 0)。此外,如果我只考慮,psn我基本上否定了所有三個變數的綜合影響,並且基本上選擇了我所擬合的不同模型。
  2. adv有一個負係數,這違背了我的理論理解。正如我所讀到的,它與需求量呈正相關。我該如何解釋這種關係?

如果可能,請引用文獻,我可以參考。此外,請注意收集其他變數的數據、增加樣本量或擬合非線性模型是不可能的。

在上面的輸出中,只有 psn 是重要的(基於 t stats)。我們的教授告訴我們,我們應該只考慮需求函式中的顯著係數。我覺得很難同意。在這種情況下,如果我在我的需求函式中只考慮 psn,我可能違反了基於 F 統計數據的原假設(所有係數均為 0)。此外,如果我只考慮 psn,我基本上否定了所有三個變數的綜合影響,並且基本上選擇了我所擬合的不同模型。

重要的是要考慮重要性,因為您無法直接觀察數據生成過程。回歸併沒有告訴你什麼 $ \beta_0, \beta_1 … $ 是,它告訴您它們看起來是基於擬合線的,該擬合線通過數據最小化殘差平方和。是的預期(假設所有 OLS 假設成立) $ E[\hat{\beta}] = \beta $ 但是這個結果只在有限的情況下成立,因為觀察的數量會變得無窮大(有關更多詳細資訊,請參見 Verbeek 中的討論。現代計量經濟學指南或任何計量經濟學教科書)。

在這種特殊情況下 $ F $ -stat(自由度為 3,自由度為 11)為 4.99,足以拒絕聯合不顯著性的空值,即 $ H_0: \beta_0 = \beta_1 = … \beta_k = 0 $ 所以這不是問題。

但是,您不能拒絕原假設 $ \beta_3 $ (廣告效果)為零。因此,僅以面值呈現的回歸結果(在實際研究中不一定總是合適,但可能在課堂環境中),正確的答案是“廣告對銷售量沒有顯著影響,我們不能拒絕假設廣告的真實效果為 0”。

adv 的係數為負,這與我的理論理解背道而馳。正如我所讀到的,它與需求量呈正相關。我該如何解釋這種關係?

這可能是因為你有一些反向因果關係。需求方程是內生系統,應該使用聯立方程進行建模,而不僅僅是簡單的回歸(有關如何在 R 中執行此操作的說明,請參閱此說明)。在這種情況下使用簡單的多元回歸可能會導致有偏差的係數。

可能當需求低時,公司會增加廣告支出,而當需求高且公司迅速出售庫存時,他們可能不想在廣告上花費額外的錢。這會產生反向因果關係問題,從而使 $ \beta_3 $ 估計不再給你準確的 adv 效果 $ y $ (銷售數量)。廣告支出可能會增加銷售額,但較高的銷售額只是與較少的支出和銷售的第二個影響有關 $ \rightarrow $ adv 只是占主導地位。

話雖如此,您提到這是您的老師強加給您的練習,而不是真正的研究。如果您了解反向因果關係等概念,您的老師可能只是想測試您是否可以正確解釋係數估計(如果您沒有在課堂上討論這個問題,那麼您的老師可能對討論不感興趣)。您應該詢問您的老師他們對答案的期望。

價格水平和廣告價格之間存在巨大差異。嘗試使用 log 或 ln 轉換。

而且我認為您可以刪除任何不重要的變數,或者您的模型不重要。

引用自:https://economics.stackexchange.com/questions/43031