一、 均值比較檢驗與方差分析
在經濟社會問題的研究過程中,常常需要比較現象之間的一些指標有無顯著差異,特別當考察的樣本容量n比較大時,由隨機變量的中心極限定理知,樣本均值近似他服從正態分布、所以,均值的比較檢驗主要研究關于正態總體則均值有關的假設是否成立的問題,研究的數據服從正態分布或近似地服從正態分布是進行均值比較檢驗的前提條件。在菜單中,均值比較檢驗可以從菜單 Means 和 Model得出。
1 單個總體均值的t檢驗(One- T Test)
單個總體的t檢驗也稱為單一樣本的t檢驗,也就是檢驗單個變量的均值是否與假定的均值之間存在差異。將單個變量的樣本均值與假定的常數相比較,通過檢驗得出預先的假設是否正確的結論。
2 兩個總體的t檢驗 (Two- T Test)
2.1兩個獨立樣本的t檢驗 ( - T Test)
- T Test是檢驗兩個沒有聯系的總體樣本均值間是否存在顯著的差異,兩個沒有聯系的總體樣也稱獨立樣本,如兩個無聯系的企業生產的同樣產品之間的某項指標的均值的比較,不同地區的兒童身高、體重的比較等,都可以通過抽取樣本檢驗兩個總體的均值是否存在顯著的差異。
2.2兩個有聯系樣本均值的比較(- T Test)
- T Test是檢驗兩個有聯系正態總體的均值是否存在顯著的差異,又稱配對樣本的T檢驗。如檢驗某種藥品使用的效果是否顯苦,需要對使用者使用前后進行比較;再如對某種糧食進行品種改良,也需要比較改良前后糧食產量有無顯著差異等。
3單因素方差分析(One-Way ANOVA)
單因變量的單因素方差分析主要解決多于兩個總體樣本或變量間均值的比較問題。是一種對多個(大于兩個)總體樣本的均值是否存在顯著差異的檢驗方法。
單因素方差分析的應用條件:在不同的水平(因素變量取不同值)下,各總體應當服從方差相等的正態分布。
例2.5:某個年級有三個班,現在對他們的一次數學考試成績進行隨機抽(見下表),試在顯著性水平0.005下檢驗各班級的平均分數有無顯著差異(數據文件:數學考試成績.sav)。
(1)建立數學成績數據文件。
(2)選擇“分析” →“比較均值” →“單因素方差”spss做時間序列分析法,打開單因素方差分析窗口,將“數學成績”移入因變量列表框,將“班級”移入因子列表框。
(3)單擊“兩兩比較”按鈕,打開“單因素ANOVA兩兩比較”窗口。
(4)在假定方差齊性選項欄中選擇常用的LSD檢驗法,在未假定方差齊性選項欄中選擇’s檢驗法。在顯著性水平框中輸入0.05,點擊繼續,回到方差分析窗口。
(5)單擊“選項”按鈕,打開“單因素ANOVA選項”窗口,在統計量選項框中勾選“描述性”和“方差同質性檢驗”。并勾選均值圖復選框,點擊“繼續”,回到“單因素ANOVA選項”窗口,點擊確定,就會在輸出窗口中輸出分析結果。
4 雙因素方差分析
單因變量的雙因素方差分析是對觀察的現象(岡變量)受兩個因素或變量的影響進行分析,檢驗不同水平組合之間對因變旦的影響足合顯著。雙因素方差分析的應用范圍很廣,如糧食產量受到氣候、溫度因素的影響;共生物廣:艙的牛產過程不僅受催化劑多少的影響,還受溫度高低的影響等,甚至兩因素變雖之間的交互作用對因變量也有 定的影響。要分清楚哪個因素的影響作用比較大,就要以應用雙因素方差分析的方法來解決。
例2.6:研究不同溫度與不同濕度對粘蟲發育歷期的影響,得試驗數據如表5-7。分析不同溫度和濕度對粘蟲發育歷期的影響是否存在著顯著性差異(數據文件:粘蟲.sav)。
(1)建立數據文件“粘蟲.sav”。
(2)選擇“分析” →“一般線性模型” →“單變量”,打開單變量設置窗口。
(3)分析模型選擇:此處我們選用默認;
(4)比較方法選擇:在窗口中單擊“對比”按鈕,打開“單變量:對比”窗口進行設置,單擊“繼續”返回
(5)均值輪廓圖選擇:單擊“繪制”按鈕,設置比較模型中的邊際均值輪廓圖,單擊 “繼續”返回;
(6)“兩兩比較”選擇,用于設置兩兩比較檢驗,本例中設置為“溫度”和
“濕度”。
二 相關分析與回歸模型的建立與分析
相關分析和回歸分析是統計分析方法中最重要內容之一,是多元統計分析方法的基礎。相關分析和回歸分析主要用于研究和分析變量之間的相關關系,在變量之間尋求合適的函數關系式,特別是線性表達式。
相關或回歸分析的數據條件:參與分析的變量數據是數值型變量或有序變量。
1 相關方析 ()
兩個變量之間的相關關系稱簡單相關關系。有兩種方法可以反映簡單相關關系,一是散點圖,可直觀地顯示變量之間的關系,二是相關系數,可準確地反映兩變量的相關程度。
1.1 簡單相關分析
簡單相關分析操作:簡單相關分析是指兩個變量之間的相關分析,主要指對兩變量之間的線性相關程度做出定量分析。
例3.6(簡單雙變量):調查了29人身高、體重和肺活量的數據見下表,試分析這三者之間的相互關系。
(1)建立數據文件“學生生理數據.sav”。
(2)選擇“分析” →“相關” →“雙變量”,打開雙變量相關分析對話框。
(3)選擇分析變量:將“身高”、“體重”和“肺活量”分別移入分析變量框中。
(4)選擇相關分析方法:在相關系數欄有三種相關系數,分別對應三種方法,供使用者選擇。
(5)顯著性檢驗:雙側檢驗、單側檢驗。
(6)“標記顯著性檢驗”復選項:選中該復選項,輸出結果中在相關系數右上角用“*”表示顯著性水平為5%,用“**”表示顯著水平為1%。
(7)“選項”對話框:本例在統計時項選擇“均值和標準差”,在缺失值選項選擇默認,即“按對排除個案”。
1.2 偏相關分析
簡單相關關系只反映兩個變量之間的關系,但如果因變量受到多個因素的影響時,因變量與某一自變量之間的簡單相關關系顯然受到其他相關因素的影響,不能真實地反映二者之間的關系,所以需要考察在其他因素的影響剔除后二者之間的相關程度,即偏相關分折。
2 線性回歸分析()
線性回歸是統計分析方法小最常用的方法之一。如果所研究的現象有若干個影響因素,且這些因素對現象的綜合影響是線性的,則可以使用線件回歸的方法建立現象(因變量)與影響因素(自變量)之間的線性函數關系式。
2.1線性回歸模型假設條件與模型的各種檢驗
1.回歸系數的檢驗(T檢驗);
2.回歸方程的檢驗(F檢驗);
3.擬合程度判定(可決系數R2);
4.D.W檢驗(殘差項是否自相關);
5.共線性檢驗(多元線性回歸)。
6.殘差圖示分析(判斷殘差序列異方差性和自相關)。
2.2線性回歸分析的具體步驟
例3.10:考察中國居民收入與消費支出的關系。數據文件名稱“居民消費水平.sav”。 變量說明:GDPP:人均國內生產總值 CONSP:人均居民消費
(1)建立數據文件“居民消費水平.sav”。
(2)選擇“分析” →“回歸” →“線性”,打開線性回歸分析對話框。
(3)選擇因變量和自變量:將人均居民消費“CONSP” 移入因變量框中; (4)在線性回歸窗口中點擊“統計量”,打開線性回歸統計量窗口,對統計量進行設置。
(5)在線性回歸窗口中點擊“繪制”,打開、“線性回歸:圖” 窗口,選擇繪制標準化殘差圖,其中的正態概率圖是圖。同時還需要畫出殘差圖,Y軸選擇:,X軸選擇: ZPRED。
(6)在線性回歸窗口中點擊“選項”,打開、“線性回歸:選項” 窗口。
◆ 步進方法標準單選鈕組:設置納入和排除標準,可按P值或F值來設置;
◆ 在等式中包含常量復選框:用于決定是否在模型中包括常數項,默認選中。
3 曲線估計(Curve )
上節介紹了線性回歸模型的分析和檢驗方法。如果某對變量數據的散點圖不是直線,而是某種曲線的形式時,可以利用曲線估計的方法為數據尋求一條合適的曲線spss做時間序列分析法,也可用變量代換的方法將曲線方程變為直線方程。用線性回歸模型進行分析和預測。
三 時間序列分析
由于反映社會經濟現象的大多數數據是按照時間順序記錄的,所以時間序列分析是研究社會經濟現象的指標隨時間變化的統計規律性的統計方法。為了研究事物在不同時間的發展狀況,就要分析其隨時間的推移的發展趨勢,預測事物在未來時間的數量變化。
主要內容:
1.時間序列的線圖、自相關圖和偏自關系圖;
2.SPSS軟件的時間序列的分析方法——季節變動分析。
四 非參數檢驗
前面進行的假設檢驗和方差分析,大都是在數據服從正態分布或近似地服從正態分布的條件下進行的。但是如果總體的分布未知,進行總體參數的檢驗,或者檢驗總體服從一個指定的分布,都可以歸結為非參數檢驗方法。非參數檢驗包括下列內容:
1.總體分布的假設撿驗;
2.兩種以下的現象之間的關聯性檢驗(見列聯分析);
3.總體分布未知時,關于單個總體均值的檢驗;兩個總體均值或分布的差異是否顯著的檢驗,以及多個未知總體的單因素方差分析;
4.某種現象出現的隨機性檢驗。