我們在數據分析時有時需要對數據之間的關係進行判斷,然後建立模型進行分析。本例分享如何使用Excel進行上述判斷及分析。
工具/原料
Excel
Raw data
方法/步驟
釐清各個數據之間的邏輯關係,搞清楚哪個是自變量,哪個又是因變量。如附圖所示,這裡我們要對人均gdp和城市化水平進行分析,建立符合兩者之間的模型,假定人均gdp為自變量,城市化水平是因變量。
由於我們不知道兩者之間的具體關係如何,所以我們利用數據生成一個散點圖判斷其可能符合的模型。如附圖1所示為生成的散點圖,一般橫座標為自變量,縱座標為因變量,所以我們需要將x軸,y軸的座標對調一下,這裡採用最簡單的方法,將因變量移動到自變量的右邊一列即可,如附圖2所示。
由步驟2的散點圖,我們可以判斷自變量和因變量之間可能呈線性關係,我們可以添加線性趨勢線進一步加以判斷。如附圖1所示。也可以添加指數,移動平均等趨勢線進行判斷。很明顯數據可能符合線性關係,所以下面我們對數據進行迴歸分析。
選擇菜單欄的“數據分析”-->“迴歸”。具體操作如附圖所示。
步驟4進行的迴歸分析輸出結果如附圖所示。迴歸模型是否有效,可以參見p指,如果p<0.001則極端顯著,如果0.001
0.05則不顯著。本例的p值均小於0.001,所以屬於極端顯著,故迴歸模型是有效的。根據迴歸模型的結果可知
y = 5E-06x + 0.5876R² = 0.9439
如附圖2所示。