在統計學中為什麼要對變數取對數 ?

General 更新 2023年10月15日

在統計學中為什麼要對變數取對數

對變數取對數,有三種情況:

1、第一種情況是習慣問題

現在的正在退休年齡的教師,快要成為古人的老老教師,以及他們的老師們,

近乎百年來有一個習慣,現在的年輕人中也有不少受他們影響。遇到x^x求導

數的時候,他們的第一反應就算先取對數,求導之後,再取指數,迂腐曲折。

如果 y = x^x + 5^sinx + (tanx)^cosx + sinx^lnx + 、、、、

三下五除二,幾分鐘能解答的題目,他們要囉裡囉唆寫上幾頁紙,花費多出好

幾倍的時間,在所不惜,迂腐不止。他們最大的毛病在於不願意指數對數連用。

2、第二種情況,為了繪圖所需,因為資料可能相差幾個數量級,無法在同一張圖

上清晰表示,採取對數座標制。

3、第三種情況是:為了運用 linear law 的方法,不是為了簡單的繪圖清晰,而是

一種解題的方法,外推的方法,給人直觀的感覺。我們的教學中幾乎完全忽視

了linear law。因為我們知道這個方法老前輩們對它不屑一顧。

為什麼取對數,為什麼會有對數

GDP取對數是為了避免過度異常波動的影響。資料中有時會出現所謂的異常點,比如價格因素、季節因素,因為某些原因和預想差別非常大的點,當你用log後,這些異常點會變得比較小,會縮回期望範圍內。

在統計學中為什麼要對變數取對數

原因是

(1) 時間序列和麵板資料, 都要做平穩的單位根檢驗, 取對數一般能使序列平穩(stationary), 不然就取差分進行平穩.

(2) 能使模型的殘差呈現隨機的特性, 而不是趨勢或者截距.

(3) 減少共線性和異方差(heteroscedasticity)出現的概率

(4) 有經濟學意義上, 比如增長率, 變化率和彈性.

(5) 統計學認為變數具有內在的指數增長的趨勢, 取對數可以讓聯合分佈 (對應的F-statistics)呈現正態, level形式的資料, 特別是時間序列, 最好做Lavene檢驗

(6) Log-linearization 取對數方便最小二乘的線性擬合, 乘積運算用對數就變成了求和.

在統計學中為什麼要對變數取對數?

對數變換是資料變換的一種常用方式,資料變換的目的在於使資料的呈現方式接近我們所希望的前提假設,從而更好的進行統計推斷。但需要注意的是,資料是離散變數時進行對數變換要額外小心! (Why)為什麼需要做資料變換? 從直觀上講,是為了更便捷的發現數據之間的關係(可以理解為更好的資料視覺化)。舉個栗子,下圖的左圖是各國人均GDP和城市人口數量的關係,可以發現人均GDP是嚴重左偏的,並且可以預知在迴歸方程中存在明顯的異方差性,但如果對GDP進行對數變換後,可以發現較明顯的線性關係。為什麼呢?因為我們度量相關性時使用的Pearson相關係數檢驗的是變數間的線性關係,只有兩變數服從不相關的二元正態分佈時,Pearson相關係數才會服從標準的t-分佈,但如果變數間的關係是非線性的,則兩個不獨立的變數之間的Pearson相關係數也可以為0. 所以,資料變換後可以更便捷的進行統計推斷(t檢驗、ANOVA或者線性迴歸分析)。例如通常構造估計量的置信區間時是使用樣本均值加減兩倍標準差的方式,而這就要求樣本均值的分佈是漸近正態分佈,如果資料呈現出明顯的偏度,則此時使用上述統計推斷方式就是不適用的;另外,最經典的例子就是迴歸分析中的異方差性,誤差項的方差隨著自變數的變化而變化,如果直接進行迴歸估計殘差的方差會隨著自變數的變化而變化,如果對變數進行適當變換,此時殘差服從同一個正態分佈。 作者:五雷 連結:www.zhihu.com/...357107 來源:知乎 著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。

在統計學中為什麼要對變數取對數

你是在用最小二乘法擬合嗎?擬合後的曲線為了讓他形如y=kx+b的形式,我們要採取一些變換,如指數形式可以採取取對數

解這一題,取自然對數,就是在兩邊同時加ln嗎?為什麼要這樣做呢!

你要解的是n的方程,由於n在指數位置,現在想著怎麼把它化成n=?形式

那當然只能取對數,把n拿下來,變成(n-1)=ln|q|

在統計學中為什麼要對變數取對數

(1)減弱模型中資料的異方差性,只能是減弱,並不能徹底消除

(2)模型形式的需要,利用線性迴歸模型的前提是解釋變數和被解釋變數之間的線性關係,但是在實際中這一點很難滿足,很多的時候需要對多個變數或者是單一變數做對數變換,讓模型的形式變為線性

(3)取對數,再配合差分變化,把絕對數變成相對數,這樣,資料更能表示變動的相關性.

(4)對取對數以後的經濟資料進行線性迴歸,其前面的引數表示的就是百分比變化率(dlnx=dx/x),也就是彈性

(5)有時候變數不符合正態分佈的假定,取了對數可以漸近正態分佈

等等。

這裡幹嘛要取自然對數是什麼意思,不就是log e |q|嗎?和證明有什麼關係?

取對數是為了解不等式啊。不然用什麼辦法求出n的表示式?

相關問題答案
學統計學的做什麼工作?
中學生為什麼要愛自己?
無統計學差異什麼意思?
中學生為什麼要入團?
學生為什麼要尊師重道?
學生為什麼要做作業?
學生為什麼要廉潔?
學校為什麼要開晨會?
小學生為什麼要看新聞?
學生為什麼要講文明?