我們已經發(fā)出了李連江教授的《戲說統(tǒng)計》課程中的八篇學習筆記:相關分析、顯著性檢驗、回歸分析、多元回歸分析、因子分析與量表構造、卡方檢驗、對數回歸、最大似然估計。今天,我們將發(fā)出第九篇學習筆記:結構方程模型。希望我們的整理可以繼續(xù)供大家討論學習。 結構方程模型 提綱 一、什么是結構方程模型 二、結構方程模型的三個優(yōu)點: (一)證實性因子分析 (二)路徑分析可以包括中介變量 (三)提高擬合程度 三、舉例 一、什么是結構方程模型 結構方程模型最早應用于心理學領域,因為在心理學領域中的因變量和自變量都是由多個指標來測量的。如果要將這幾個指標合并在一起,就需要建立一個量表。建立量表的方式有很多,但是都會遇到一個問題:如果先把幾個指標變成一個量表,那么在這個過程中會有信息損失,有些在原生的狀態(tài)下測得的東西變成量表之后會成為粗略的東西。在這個過程中會造成信息損失。因此發(fā)展出了結構方程模型。如果用某幾個指標形成量表,再用量表去做回歸分析是可以的,但是會損失很多信息。 還有一個問題是做普通的回歸分析的時候,回歸模塊有一個假定:幾個自變量之間一定是彼此相關的。理論上來講,如果就假定這兩個變量不相關,是不被回歸的模塊所允許的。而我們在做因果分析的時候,往往會面臨這樣的情況:我們有充分的理由或充分的理論依據認為這兩個自變量之間不相關。那么這個時候我們就可以規(guī)定這兩個變量是不相關的,但是在正常做回歸分析的時候,是不能夠這樣做的。另外一個情況是,有一些因果鏈條,A的變化會影響C,但是A的變化不是直接影響C的,而是通過影響B(tài)來影響C。舉個簡單的例子,祖父對于孫子是有影響的,但是祖父對于孫子的影響不是直接的影響,而是通過影響孫子的父母一方。如果我們想分析祖父影響孫子,就要看一看祖父是怎樣影響孫子的父輩,再來看怎么樣影響到孫子。在這里有一個中介變量B。這用普通的回歸分析是不能夠得出結果的,而是需要做一個路徑分析。我們需要畫一個很精確的路徑,從A到B,從B到C,這個也是結構方程模型可以解決的問題。 二、結構方程模型的優(yōu)勢 (一) 結構方程模型簡單來說就是兩個分析工具的結合。我們前面講到的最主要的分析工具一是回歸分析,可以幫助我們確定有沒有獨一無二的一一對應的相關關系;二是因子分析,可以允許我們用多個指標去測量一個潛伏的、看不見的變量(比如說一個人對于政治局勢的態(tài)度,我們是通過看他怎么樣看中國民主問題、國防問題等來看他內心深處對于政治的關心)。結構方程模型就是將回歸分析和因子分析結合起來。證實性因子分析是我們先假定有一個因子,然后看從這個因子應該會影響到幾個指標的情況。我們先將結構畫出來,然后看數據里面是不是這樣的情況,如果不是的話,就可以采取修正模型。證實性因子分析是一個學科到達相對成熟的狀態(tài)時所做的研究,我們根據現在的研究和理論推斷發(fā)現一個人有這樣一種態(tài)度,這種態(tài)度會折射成幾個方面的指標。比如說我們要想檢測一個人對待同性戀的開放度,我們會設計一系列的指標,這些指標都是根據理論推斷出來的,那么這些指標是否都是真正反映人內心的寬容度,我們可以通過看數據來判斷是否符合。從先有理論,再看數據,這是一個證實性的過程。
(二) 另外一個優(yōu)勢是可以包括中介變量,通過觀察A影響B(tài),B影響C。(在第一部分什么是結構方程模型里有舉例) (三) 第三個優(yōu)勢是提高擬合優(yōu)度,結構方程模型有一個特點是在做完模型之后,可以看出我們這個模型和數據是不是合身的。而我們做線性回歸的時候,這一點是看不出來的。有人說我們是不是可以用判定系數來判斷模型是不是合身,是判斷不出來的,因為判定系數只能夠告訴你這個衣服有沒有遮蔽身體,遮蔽了多少的身體。可是這個遮蔽身體并不意味著衣服合身。比如穿衣服最重要的功能是蔽體,另外一種功能是保暖,如果我們關心的是保暖,判定系數只能告訴你這個模型所包含的幾個變量可以告訴你保住一部分身體的溫度,可是這個部分的身體到底是哪個部分,我們是不清楚的,如果我們想要保住的是胸部的溫度,但是實際上保住的是70%腿部的溫度,那么這個衣服就是不合身的。對于衣服是否合身,結構方程模型是有一個非常清晰的檢驗指標。 三、舉例 在數據中看到的指標都是用方框來表示的,這些指標背后看不見的因子是用橢圓形來表示的,每一個箭頭指的都是一個因果關系。例如,想要了解某人對于選舉的愛好程度,當有了一個態(tài)度之后就會直接影響到某人怎么回答方框中的問題。所以橢圓形是一個自變量,方框是一個因變量,圓形是一個誤差量。每一條線所表示的都是一個方程式,每一個方程式都是一個等式,每一個等式都是一個回歸模型。為什么叫做結構方程,一個方程就是一個公式Y=A+BX+E。圖中有5個回歸公式,而這些公式是有結構的,是由同一個自變量影響到5個因變量,而在這5個因變量里面可以認為左邊兩個和右邊兩個是分別相關的,這些都是結構。所謂結構方程就是有結構的一系列方程。圖中就是一個測量模型。在做常規(guī)模型的時候會將這幾個指標匯合起來,變成一個量表。但是如果這樣做就會損失掉一些信息。圖中的測量模型就保全了可能會損失掉的信息。 圖中的5個箭頭中,會發(fā)現箭頭旁有1,這個1是干什么的呢?這個1就是限定自變量與該箭頭所指向的因變量之間的回歸系數為1。我們通過學習知道,如果回歸系數是1的話,意味著自變量變化一個單位,因變量就變化一個單位。我們假定對于選舉的偏好是一個量,但是這個量的單位是不清楚的,它是一個隱含的東西。而因變量是有一個很明確的測量單位的。在此劃定1,是相當于從因變量這里借了一把尺子,然后自變量就有了測量單位了。
測量模型是測量對于選舉的愛好程度,那么什么因素會影響到對于選舉的愛好程度呢?我們根據政治學的常識可以判斷出,如果我們現在的群眾很信任政府領導人,那么群眾對選舉是沒有興趣的,如果不信任的話,那么群眾有可能會要求選舉。所以信任會影響到對于選舉的愛好。另外,如果一個人不一定相信領導人,但是同時如果群眾對自己的政治能力信任度比較低,也會影響對選舉的興趣。所以政治效能感也會影響到對于選舉的偏好。但是信任和效能感這兩個因素也有可能是相關的,因此用雙向箭頭表示,就這樣形成了結構模型。 什么是優(yōu)越性?就是做完方程模型之后,就是要看這件衣服與這個人是否合身,如果合身的話我們可以根據這件衣服來猜這個人的胳膊有多長,腰有多粗。如果這個衣服不合身,那就沒法猜準。圖中所示,最小卡方值除以自由度等于18.55,這個時候我們要來看一下這是不是我們希望看到的。前面講到卡方值的時候,自由度為1時,如果卡方值為4,那么相對應的是5%的概率,所以卡方值除以自由度如果是等于4,那就相當于說是一個自由度對4個卡方值是5%的概率。在圖中的例子里,我們所希望看到的結果是sig大于0.05。這個地方的零假設是認為這個模型與這個數據是天衣無縫的,所以這個時候希望是接納零假設。我們在分析模型的擬合程度的時候,仍然是用卡方檢驗,但是這個時候我們所希望看到的卡方值越小越好,顯著度越大越好。如果做不到這些,會選擇一些替代的方法看這個模型是否合適。這個時候就會有一些替代指標,比如比較擬合系數,正態(tài)化的擬合系數等。 |
|
來自: 心理諮商張老師 > 《統(tǒng)計學》