本書的重點是介紹定類和定序變量的統計方法,特點是盡可能地應用簡單的數學知識解釋相關的統計學原理,以利于從事社會科學研究的學者掌握并應用定性數據的量度方法。在本書中,概率比是貫穿全書的最重要的概念和量度。在學習對數概率比和對數線性模型時,讀者要具備普通線性回歸和方差分析的知識,并結合列聯表的分析方法,才能理解模型的設定及其參數的意義。
趙平,中國社會科學院社會學研究所研究員。
第1章 二維列聯表
1 列聯表的頻次和概率結構
2 變量獨立檢驗
3 定序數據的獨立性檢驗
4 定類-定序列聯表的檢驗統計量
5 r×c列聯表的概率
6 小樣本的精確檢驗
7 方差分析
第2章 多維列聯表
1 三維列聯表的變量關聯和控制
2 三維列聯表的統計分析
3 條件關聯的精確推論
4 變量關聯的簡化量度
第3章 對數線性模型
1 定類變量的二維對數線性模型 第1章 二維列聯表
1 列聯表的頻次和概率結構
2 變量獨立檢驗
3 定序數據的獨立性檢驗
4 定類-定序列聯表的檢驗統計量
5 r×c列聯表的概率
6 小樣本的精確檢驗
7 方差分析
第2章 多維列聯表
1 三維列聯表的變量關聯和控制
2 三維列聯表的統計分析
3 條件關聯的精確推論
4 變量關聯的簡化量度
第3章 對數線性模型
1 定類變量的二維對數線性模型
2 定類變量的三維對數線性模型
3 應用對數線性模型分析數據
4 對數線性模型和定序數據
第4章 定序變量的對數線性模型
1 二元定序變量的對數線性模型
2 多元定類和定序變量的對數線性模型
3 含交互項的模型
第5章 對數概率比模型
1 線性概率模型和對數概率比模型的比較
2 對數線性模型和對數概率比模型的關系
第6章 定序應變量的對數概率比模型
1 對數概率比模型的類型和應用
2 定序-定類列聯表的對數概率比模型
3 多元定序概率比模型
第7章 統計軟件的迅猛發(fā)展
1 使用SAS和SPSS對定性數據進行分析
2 用于交互分類表的軟件
參考文獻
定性變量包含定類變量和定序變量。顧名思義,定類變量包含不同的類別,例如性別、黨派;而定序變量是連續(xù)的,如情感、意識等。但是定類變量和定序變量不能量化。例如,比較兩個家庭的夫妻關系,我們只能說一個家庭的夫妻關系比另一個家庭的夫妻關系好,而不能說“好多少”。在社會科學的一些領域,定類變量和定序變量占有很大的比重,一向是統計學要處理的。
20世紀40年代,數理統計學家和應用統計學家經過不懈的努力,撰寫了大量的論文,至1980年完善了數學思想,創(chuàng)立了很多關于定序變量和定類變量的統計與檢驗方法。例如,通過定序變量的層次賦值方法,學者應用尼爾森相關系數,量度列聯表的定序變量的關聯,并將適用于定序變量和定類變量的對數概率比回歸模型和對數線性回歸模型引入社會統計學,取代了有問題的概率線性回歸模型。時至今日,30多年過去了,當時針對列聯表的量度和檢測方法以及對數概率比和對數線性回歸已經成為社會統計學的基礎,不掌握這方面的知識,不僅不能正確地分析和量度定性變量,而且會阻礙我們學習更先進的統計方法。
本書的重點是介紹定類和定序變量的統計方法。一般來講,當一個變量既可以作為定類變量也可以作為定序變量處理時,應該選擇后者,因為應用定序變量的連續(xù)性質及其層次賦值的方法,具有很多特殊的優(yōu)點:
對于同一變量,定序方法比定類方法更靈敏,可以檢測出定類量度否定的變量之間的關聯;
定序數據和定距數據具有相同的連續(xù)性,因此適用于定距數據的統計量,如相關、均值和斜率也適用于定序數據;
有很多簡單的模型適用于定序變量,并且很容易對參數進行解釋,這是定類變量所不及的;
在量度含有相同數目變量的模型的擬合優(yōu)度方面,定序變量的參數往往少于定類變量的參數,所以更簡單,易于計算。
從另一方面講,在社會調查數據中,既有定序數據,也有定類數據。例如在列聯表中,應變量是定序變量,解釋變量是定類變量。更有甚者,研究人員為了方便或其他目的會將定序變量改成定類變量。因此,在介紹處理定序數據的統計方法時,本書也要涉及處理定類數據的統計方法。
本書的宗旨是盡可能地應用簡單的數學知識解釋相關的統計學原理,以利于從事社會科學研究的讀者掌握并應用定性數據的量度方法。盡管如此,書中仍有大量的數學內容。實際上,這些數學內容并不高深,只要具有髙中數學水平就能看懂。在閱讀過程中,讀者要注意以下幾點:首先,數學符號本身不是數學,但是在學習的過程中,常常不是數學知識而是紛雜的符號及其角標令讀者望而卻步。本書中也有很多數學符號,這是無法回避的。讀者只有在理解和記住這些符號后,才能學習那些并不深奧的數學知識。其次,概率比(θ)不僅是對二維列聯表和多維列聯表的變量關聯的量度,而且是對對數概率比模型和對數線性回歸模型的關聯參數的量度。可以說,概率比是貫穿全書的最重要的概念和量度。最后,列聯表和模型對定性數據進行統計量度的目的在于測量定序數據的“線性趨勢”,例如列聯表的累積概率和概率比描述的概率分布就是為此服務的。在學習對數概率比和對數線性模型時,讀者要具備普通線性回歸和方差分析的知識,并結合列聯表的分析方法,才能理解模型的設定及其參數的意義。
在撰寫本書的過程中,陳嬰嬰、夏傳玲、趙峰和張亮杰同志為本書提供了豐富的社會調查數據。此外,社會科學文獻出版社的同志為本書的出版付出了大量精力。對以上諸位同志,我要表示衷心的感謝。
書中如有不當之處,敬請讀者批評指正。