如何用excel做卡方檢驗 5分?

General 更新 2023年10月15日

如何用excel做卡方檢驗 5分

卡方(χ2)常用以檢驗兩個或兩個以上樣本率或構成比之間差別的顯著性分析,用以說明兩類屬性現象之間是否存在一定的關係。

卡方檢驗常採用四格表,如圖 5-4-18所示,比較的A、B兩組資料分別用a、b、c、d表示,a為A組的陽性例數,b為A組的陰性例數,c為B組的陽性例數,d為B組的陰性例數。

用EXCEL進行卡方檢驗時,資料的輸入方式按實際值和理論值分別輸入四個單元格,如圖5-4-18所示。

(1)比較的A、B兩組資料分別用a、b、c、d表示。a=52,為A組的陽性例數;b=19,為A組的陰性例數;c=39,為B組的陽性例數;d=3,為B組的陰性例數。根據公式計算理論值T11、T12、、T21和T22。將實際值和理論值分別輸入如圖所示的四個單元格(圖5-4-19)。 選擇表的一空白單元格,存放概率p值的計算結果,將滑鼠器移至工具欄的“ fx”處,滑鼠器左鍵點選工具欄的“ fx”快捷鍵,開啟函式選擇框。

(2)在函式選擇框的“函式分類”欄選擇“統計”項,然後在“函式名”欄內選擇“CHITEST”函式,用滑鼠器點選“確定”按鈕,開啟資料輸入框(圖5-4-20)。

(3)在“Actual_range”項的輸入框內輸入實際值(a、b、c、d)的起始單元格和結束單元格的行列號,在“Expected_range”項的輸償框內輸入理論值(T11、T12、T21、T22)的起始單元格和結束單元格的行列號,起始單元格和結束單元格的行列號之間用“:”分隔(圖5-4-20)。 在資料輸入完畢後,p值的計算結果立即顯示。用滑鼠器點選“確定”按鈕,觀察計算結果。

(4)在表存放概率 p 值的空白單元格處顯示 p 值的計算結果。在“編輯”欄處顯示χ2檢驗的函式“CHITEST”及兩組比較資料的起始與結束單元格的行列號(圖 5-4-21)。

如何進行卡方檢驗

卡方檢驗

你的資料應該用交叉列聯表做,資料錄入格式為:建立兩個變數,變數1是組別,

正常對照組用資料1表示,病例組用資料2表示;變數2是位點,A用1表示,C用2表示,

還有一個變數3是權重,例數

資料錄入完成後,點analyze-descriptive statistics-crosstabs-把變數1選到rows裡

,把變數2選到column裡,然後點選下面的statistics,開啟對話方塊,勾選chi-squares,

然後點continue,再點ok,出來結果的第3個表就是你要的卡方檢驗,第一行第一個數是卡方值,

後面是自由度,然後是P值。

卡方檢驗具體怎麼計算

卡方檢驗計算:

假設有兩個分類變數X和Y,它們的值域分別為{x1, x2}和{y1, y2},其樣本頻數列聯表為:

若要推斷的論述為H1:“X與Y有關係”,可以利用獨立性檢驗來考察兩個變數是否有關係,並且能較精確地給出這種判斷的可靠程度。

具體的做法是,由表中的資料算出隨機變數K^2的值(即K的平方)

K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d為樣本容量

K^2的值越大,說明“X與Y有關係”成立的可能性越大。

當表中資料a,b,c,d都不小於5時,可以查閱下表來確定結論“X與Y有關係”的可信程度:

例如,當“X與Y有關係”的K^2變數的值為6.109,根據表格,因為5.024≤6.109<6.635,所以“X與Y有關係”成立的概率為1-0.025=0.975,即97.5%。

四格表資料檢驗:

四格表資料的卡方檢驗用於進行兩個率或兩個構成比的比較。

1. 專用公式:

若四格表資料四個格子的頻數分別為a,b,c,d,則四格表資料卡方檢驗的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),

自由度v=(行數-1)(列數-1)

2. 應用條件:

要求樣本含量應大於40且每個格子中的理論頻數不應小於5。當樣本含量大於40但有1= <理論頻數<5時,卡方值需要校正,當樣本含量小於40或理論頻數小於1時只能用確切概率法計算概率。< p>

行×列表資料檢驗:

行×列表資料的卡方檢驗用於多個率或多個構成比的比較。

1. 專用公式:

r行c列表資料卡方檢驗的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]

2. 應用條件:

要求每個格子中的理論頻數T均大於5或1

列聯表資料檢驗:

同一組物件,觀察每一個個體對兩種分類方法的表現,結果構成雙向交叉排列的統計表就是列聯表。

1. R*C 列聯表的卡方檢驗:

R*C 列聯表的卡方檢驗用於R*C列聯表的相關分析,卡方值的計算和檢驗過程與行×列表資料的卡方檢驗相同。

2. 2*2列聯表的卡方檢驗:

2*2列聯表的卡方檢驗又稱配對記數資料或配對四格表資料的卡方檢驗,根據卡方值計算公式的不同,可以達到不同的目的。當用一般四格表的卡方檢驗計算時,卡方值=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)],此時用於進行配對四格表的相關分析,如考察兩種檢驗方法的結果有無關係;當卡方值=(|b-c|-1)2/(b+c)時,此時卡方檢驗用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別。

列聯表卡方檢驗應用中的注意事項同R*C表的卡方檢驗相同。

卡方檢驗就是統計樣本的實際觀測值與理論推斷值之間的偏離程度,實際觀測值與理論推斷值之間的偏離程度就決定卡方值的大小,卡方值越大,越不符合,偏差越小,卡方值就越小,越趨於符合,若量值完全相等時,卡方值就為0,表明理論值完全符合。

...

手工卡方檢驗怎麼做

你的資料不適合使用卡方檢驗。卡方檢驗用於2個變數都屬於分類變數(例如性別、婚姻狀態等,屬於定性資料)時的資料分析,例如要分析性別與色盲之間(色盲一般分為“有”和“無”2個分類,屬於定性變數)的關係,就可以使用卡方檢驗。你的資料一個變數是組別(分為對照組和A租),而另一個變數(你的測定值)基本上可以說是定量資料(定量變數,例如身高、體重等都屬於這一類),這種情況首先考慮使用成組t檢驗。

卡方檢驗研究的方法

1、處理四格表資料時不考慮樣本量和最小理論頻數而直接採用卡方檢驗

處理四格表資料是卡方檢驗最為常見的用途之一,其目的在於分析“構成比”或者“率”上的差異是否具有統計學意義。對於四格表資料,使用卡方檢驗的條件為樣本量大於 40,且最小理論頻數應大於 5。對於某些小樣本的、或者指標陽性率較低的研究,總樣本量可能小於 40,最小理論頻數也可能小於 5,此時應該採用 Fisher 確切概率法進行分析。

比如某研究需比較小細胞肺癌和非小細胞肺癌內某個基因的表達情況的差異是否有統計學意義,得出如下四格表:

該研究的樣本量僅為 30 個,且最小理論頻數為(12×9)/30=3.6,所以應該採用 Fisher 確切概率法進行分析。實際上,從理論上講,若要分析四格表資料中的構成比或者率之間的差異是否有統計學意義,Fisher 確切概率法的結果是最可靠的。若是使用軟體對資料進行分析,不論樣本量和最小理論頻數,均可採用 Fisher 確切概率法。

2、不考慮分析目的、設計型別而盲目套用卡方檢驗

有的四格表資料本身是配對的,且研究的目的主要是回答“一致性”或者“不一致性”的問題,此時就不應該用卡方檢驗對資料進行分析。比如:某研究者發明了一種新的 HIV 檢測法,並且用該法和免疫印跡法(檢測 HIV 感染的“金標準”)同時檢測了 100 份血清,得到如下四格表資料:

該研究在設計上與表 1 中的研究最大的區別在於“配對”,即同一樣本分別接受了新方法檢測和免疫印跡法(金標準)的檢測。研究者最關心的問題應該是“新方法和金標準之間的一致性”問題,若採用卡方檢驗進行分析,得出的結論是“免疫印跡法檢測結果的頻數分佈在新方法陽性組和陰性組中是不同的”,這一結論顯然並無多大專業價值。

對於此類研究,可以採用兩種方法進行統計,一是採用 Mcnemar χ2 檢驗公式計算兩種方法不一致的部分是否具有統計學意義;二是採用 Kappa 檢驗分析兩種結果之間的一致性。

需要說明的是,此類研究中的一種方法必須是金標準,否則研究可能沒有價值。以表 2 中的資料為例,若免疫印跡法並非檢測 HIV 感染的金標準,兩種方法的一致性即使好得一塌糊塗,也可能無濟於事。

因為一個顯而易見的問題是:這兩種方法可能都是錯誤的檢測方法。比如:採用金標準對 100 份血清進行檢測後,其中 90 例為陽性,而不論是新方法還是免疫印跡法,均僅僅檢測出了 55 個陽性樣本,漏檢率顯然太高。

3、誤用卡方檢驗處理等級資料

等級資料的表示方法與分類資料相似,因此受“定式思維”的影響,部分同行“習慣性”地採用卡方檢驗對等級資料進行處理,這也是醫學期刊上最常見的濫(亂)用卡方檢驗的行為。卡方檢驗回答的問題僅僅是“構成比”或者“率”上的差異是否具有統計學意義,而不能回答效應指標的強度高低問題。比如某研究比較了兩類人群胰腺癌分期的分佈狀況,如下表所示:

此類資料的一個顯著特點是胰腺癌的分期(Ⅰ、Ⅱ、Ⅲ、Ⅳ期)是一個等級資料,研究者的研究目的是分析甲乙兩群人胰腺癌的分期是否有差別,是一個強度“分期早晚”的問題,而不是“構成比”的差異。若用卡方檢驗處理此類資料,得出的結論就是“甲乙兩類人群胰腺癌分期構成比上的差異是否具有統計學意義”,而無法明確“孰高孰低”的問題。

以上述表格為例,卡方檢驗結果顯示有統計學意義,但問題在於:根據表中資料,人群甲以Ⅰ期和Ⅳ期為主,人群乙以Ⅱ期和Ⅲ期為主,讓人完全無法判斷兩類人群的疾病分期“孰早孰晚”的問題。

處理此類資料的......

下面兩組資料需要做卡方檢驗,怎麼做呀

卡方檢驗

你的資料應該用交叉列聯表做,資料錄入格式為:建立兩個變數,變數1是組別,

正常對照組用資料1表示,病例組用資料2表示;變數2是療效等分類變數,用1表示分類屬性1,用2表示分類屬性2,

還有一個變數3是權重,例數

資料錄入完成後,先加權頻數後點analyze-descriptive statistics-crosstabs-把變數1選到rows裡

,把變數2選到column裡,然後點選下面的statistics,開啟對話方塊,勾選chi-squares,

然後點continue,再點ok,出來結果的第3個表就是你要的卡方檢驗,第一行第一個數是卡方值,

後面是自由度,然後是P值。

如何用spss 做卡方檢驗

按以下弧式錄入資料:

分組 是否發病 人數

1 1 26

1 2 24

2 1 29

2 2 21

將變數“人數”Weight Cases

Analyze->Descriptive Statistics->Crosstabs:將分組放入“行”,將是否發病放入“列”,“統計Statistics”選項框內選擇“Chi-square”,確定執行,OK。祝你好運!

怎樣使用spss進行卡方檢驗和T檢驗

卡方檢驗在 分析欄第二個描述性分析的列聯分析裡

T檢驗分為獨立樣本和配對樣本T檢驗 都在分析欄的均值檢驗裡 不知道你的順序是不是和我的15.0的一樣 你看看

兩個數如何進行卡方檢驗? 10分

表4.3不是已經給了自由度df=2嗎?

df=(m-1)*(n-1),也就是行數-1,列數-1

提供SAS程式:

data gt;

do a=1 to 2;

do b=1 to 3;

input x@@;

output;

end;

end;

cards;

261 48 68

86 384 56

;

proc freq;

weight x;

tables a*b/chisq;

run;

得出卡方值=335.39 ,分佈有差異。

-------------------------------------------------------

Chi-Square2 335.2943 <.0001

Likelihood Ratio Chi-Square2 366.3929 <.0001

Mantel-Haenszel Chi-Square1 98.5513 <.0001

Phi Coefficient 0.6094

Contingency Coefficient 0.5204

Cramer's V 0.6094

--------------------------------------------------

SPSS結果也是類似的

注:卡方計算是有條件的,比如總數大於40,否則只能用fisher精確概率法

--------------------------

表4.4中說的是單項比較,乍一看貌似很荒唐,因為卡方最少也是四格表,光光2個數字是不能做卡方檢驗的

你仔細看看那個備註,看看 到底是哪個跟哪個在比,我猜測估計是放棄與不放棄,但是算了下又不對。

看來一時半刻也幫不了你,原作者這裡沒有交代清楚,文獻發表上市通不過的。

用SPSS怎樣做簡單四個表的卡方檢驗

如果已經是四格表樣子的資料,按以下格式錄入資料

行變數 列變數 人數

1 1 A

1 2 B

2 1 C

2 2 D

1、將人數變數加權:

Data--Weight Cases..

Weight cases by 人數變數 count點選鈕使之進入Frequence Variable,OK

2、卡方檢驗:

analyze--descriptive--crosstabs,將行變數放到行,將列變數放到列

statistics按鈕

勾選chi-square(卡方檢驗),勾選phi and cramer's V(衡量互動分析中兩個變數關係強度的指標),continue

cells按鈕

勾選observed(各單元格的觀測次數),勾選row(行單元格的百分比),continue

ok

相關問題答案
怎麼做卡方檢驗?
如何用充值卡充話費?
如何用紙折正方體?
微信如何用銀行卡轉賬?
如何用紙做地球儀圖片?
如何用紙做一個圓錐?
如何用銀聯卡充話費?
如何用公務卡買火車票?
如何用銀行卡取錢?
移動手機如何用電信卡?