心理測量和量表操作
大概的介紹。 凡是客觀存在的事物都是有數(shù)量的。 ——桑代克 凡是有數(shù)量的東西都是可以測量的。 ——麥克爾 心理用間接測量。測量行為,來推測心理。 心理測量的結果不絕對。 I. 心理測量的發(fā)展史 一. 中國古代的心理測量思想與實踐 1905 法國——科學心理測量. 孔子——心理測量的思想 "中人以上,可以語上也;中人以下,不可以語上也。" 孟子"權,然后知輕重;度,然后知長短;物皆然,心為甚。" 劉劭《人物志》,"觀其感變,以審常度。" 翻譯后,名為《人類能力之研究》 韓非 一手畫圓,一手畫方。 到現(xiàn)在,用于測注意力 民間,周歲試兒 到現(xiàn)在,嬰幼兒的動作測量 古代的問答法 到現(xiàn)在,臨床談話法,問卷法 莊子:九征 到現(xiàn)在,情景法 博弈(棋)、九連環(huán)、七巧板——古代測智力水平的器具 八陣圖。 二. 心理測量早期探索及嘗試 英國 高爾頓 最早想通過測量人的證明他的"遺傳論"。 美國 卞特爾 心理學只有立足于實驗與測量之上,才會有自然科學的準確度。 德國 馮 特 心理測量的思想。 三. 科學心理測量的誕生與發(fā)展 1905 法國 比納(Binet) 1895創(chuàng)辦第一本心理學雜志《心理學年報》 心理測量的原理:把結果與他人比較,以求概括。 1905:比納-西蒙量表(的標志)-標志著科學心理測量的誕生。 30題,從易到難。 1908、1911兩次修訂,制訂了"智齡"之后,有斯坦福"-比納量表(推孟修訂,1916)[現(xiàn)在的所謂"比納量表]引入了斯騰(德國)的心理商數(shù)概念,變化為: 智齡 IQ=_____ *100使不同年齡層次間兒童的智力水平比較成為可能。也叫比率智商 實齡 后來量表的特點 I. 操作性量表(比納的量表是語言性量表) II. 團體測驗 (比納的量表是個別的測驗) III. 教育測驗(學習測驗,eg桑代克,斯坦福成就測驗) IV. 人格的測驗 V. 特殊能力測驗(eg音樂,繪畫能力etc) 四. 心理測驗在中國的發(fā)展 1916 樊炳清 介紹比納的量表 1920 南京高等師范學校(現(xiàn)南大),廖世承、陳鶴琴開設心理測量課。之后,制定量表,開創(chuàng)雜志… 抗日戰(zhàn)爭開始一度中斷。 1979后,心理測量在中國走進輝煌。智力測驗方面,陸志韋,吳天敏;人格測驗方面,肖孝嶸;艾偉,學業(yè)成就方面。-中國國內(nèi)著名心理測量方面的學者。 第二章 心理測量的性質(zhì) 測量最基本的特征:對事物進行區(qū)分 一. 測量的基本問題。 1.定義 :利用一定的法則[現(xiàn)在,心理學中的法則還不完善,所以結果不精確]。 用數(shù)字對事物[心理學中,是對事物的特征及屬性]加以區(qū)分(描述)。 "數(shù)字"的特性: I. 區(qū)分性 II. 等級性/序列性 III. 等距性 IV. 可加性 2.要素 絕對的零點(沒有此特性)-理想的參照點,加減乘除都可以 I. 參照點{ 人為參照點 只能加減,不能乘除。 確定的意義 II. 單位應有{ 相等的價值 心理測量中的單位,不具有上面的特點,所以單位不夠理想 eg"年齡"不具有相等的價值 ∵4歲-5歲的1年比44-45的1年發(fā)展快得多。 3.種類 I. 名稱測量/類別 特征:僅區(qū)分功能,符號意義 使用數(shù)學統(tǒng)計方法——次數(shù)、百分比、X2 、列聯(lián)相關 II. 等級(代表符號-大于號,小于號)特~_ 分等性 使~ 中位數(shù)、百分位數(shù)、等級相關,秩次相關 III. 等距測量 特~ 分等且等距 使~加減,均數(shù),標準差,t檢驗F檢驗 IV. 比率測量(最好的一種測量水平) 特~具有絕對零點 使~幾何均數(shù)、等比量數(shù),加減乘除 4.直接與間接測量 直接測量:準確 間接測量:需中介,可能失真 二. 測量的特征 1. 定義:依據(jù)一定的心理學理論,使用一定的操作程序,給人的行為定出數(shù)量化的價值。 2. 可行性 3. 性質(zhì) I. 間接性(測外顯行為,推測大腦中的活動) II. 相對性 III. 客觀性(測量要做到標準化) 4. 心理測量的水平 智力、價格測驗等:等級測量 ∵無絕對零點 無等距的單位但,可轉化為標準分數(shù),則可使用等距測量的方法。 三. 心理測驗的基本概念 1. 定義 心理測驗是對行為樣組的和標準化的測量 (eg題目代表全域,則題目是↑,數(shù)據(jù)結果也域,則數(shù)據(jù)也是↑)測量的編制實施,評分,解釋都有一致性 四. 心理測驗的種類功能 I. 按功能分1.能力測驗 智力、潛力(eg職業(yè)能力)特殊能力 2.學習成就測驗 各科目的學習能力、技能掌握情況 3.人格測驗 態(tài)度、性格、情緒、氣質(zhì) II. 按人數(shù)分1.個別測驗 2.團體測驗 比較特點 III. 按材料分1.器具測驗 一類 (不絕對) 2.文字測驗(紙筆測驗) 另一類 IV. 按目的分1.診斷測驗(具體) 2.篩選測驗(大致)[使用對象的不同] 功能 I. 人才選拔 II. 心理問題的預防與診斷 III. 對一個人能力等的評價 五. 怎樣正確對待心理測驗 編制量表示合理 使心理測驗有偏差的原因 實施測驗有問題 1.測驗保密(內(nèi)容保密、結果保密) 2.心理測驗的資格(接受過培訓、有考核) 3.測驗常模的使用范圍 4.不能"測定終身"。(過幾個月可再測幾次) 5.對測驗本身的認識。(參照其他各方面情況,得出適當?shù)慕Y果) 6.測驗結果不能作為歧視人的依據(jù),操作規(guī)范。 第三章 智力測驗 1. 概述 1.定義: 智力——對問題的理解與推理的一般能力。 ——具有正相關的特殊能力的總和。 ——產(chǎn)抽象思維為核心的多種能力的總和。 (國內(nèi)較認同) 2.智力測驗: 在一定條件下,使用特定的標準化測驗量表,對被試施加測驗,從被試的一定反應中測量共智力高低。 3.智齡與智商 I. 智齡 比率智商= 實齡 *100 推孟 10歲前 10-18 具體年齡點有 貝雷、韋克斯勒:13歲前 13-25 II. 離差智商 = X 同齡人-x 4.智商的穩(wěn)定性和可變性 穩(wěn)定性。時間間隔越短,相關越大; 第一次做,年齡小時做,與產(chǎn)后結果的相關越?。?歲后做較好) 可變性。 5.智商的分布和分類 分類:推孟的分類 IQ 140以上 120-140 110-120 90-110 80-90 70-80 50-70 25-50 25以下 類別 天才 上智 聰穎 中材 遲鈍 近愚 低能 無能 白癡 韋克斯勒的分類 IQ 類別 理論(百分比) 實際樣組 130以上 極優(yōu)秀 2.2 2.3 120-129 優(yōu)秀 6.7 7.4 110-119 中上 16.1 16.5 90-109 中等 50 49.4 }82% 80-89 中下 16.1 16.2 70-79 邊緣 6.7 6.0 70以下 智力缺陷 2.2 2.2 55-69輕度,可學習 40-55中度,可訓練 25-39重度,需護理,訓練后可處理 25以下 極重度,全護理。 6.智力的性別差異 總體上,沒有。 發(fā)展上,女性先快后慢;男性先慢后快。 女性在語言,記憶上強。男性在數(shù)理、空間上強。 女性分布集中,男性分布廣。 7.遺傳,環(huán)境對智力的影響 同卵雙生子 同一環(huán)境 .88(智力相關) 同卵雙生子 不同環(huán)境 .75 異生雙生子 相同環(huán)境 同性別 .60 { 不同性別 .50 同胞兄弟姐妹 相同環(huán)境 .50 不同環(huán)境 .35 無血緣關系,但自幼在同一環(huán)境下長大 .20 無血緣關系,但自幼在不同環(huán)境下長大 .00 另:親生父母與子女的智力相關 .50 養(yǎng)父母與子女的智力相關 .30 &2.智力理論 斯騰伯格《超越智商》 智力非一個單一結構,是一個綜合的有整體的結構 1.因素說,(英)斯皮爾曼 一般因素(G因素) 特殊因素(S因素) 2.多因素說,(美)桑代克-凱利。 反對二因素說(尤其是G因素)。 認為——智力是各種特殊能力的綜合 3.群因素(美)瑟斯頓 智力可以分為各種組群,每一組群都有一共同的G因素。分為七種組群(語文理解,語詞流暢,數(shù)字運算,空間關系,機械記憶、知覺速度、一般推理) 由于七個組群仍有較高相關,所以修改后的該理論加入了"次組因素"的說法。后來該理論被稱為"群因—一般因素,理論"。 4.卡特爾 流體智力與晶體智力。 流體~隨神經(jīng)系統(tǒng)成熟 該能力自然發(fā)展開。 是先天的。發(fā)展早衰退也早。 Eg.機械記憶,圖形分辨(反應)知覺速度。 晶體~:受后天環(huán)境。教育的影響。 發(fā)展晚,后來會加快。Eg.語詞.常識.詞匯 5.智力的三維結構(吉爾福特 美) 三維度 內(nèi)容 操作 成果 視聽 圖形 認知 單元 符號 記憶(短時 長時) 類別 語義 發(fā)散性思維 關系 行為 會聚性思維 系統(tǒng) 評價 轉換 蘊涵 4 * 5 * 6=120 細分有5 * 6 * 6=180(已找出105種因素) 6.三重結構論 斯騰伯格 (認為:傳統(tǒng)的智商是靜態(tài)的。) 情境理論 三重:{經(jīng)驗理論 成分理論——核心內(nèi)容 最基本的信息加工單元。元成分對其他成分進行計劃、評價、加工等。另,操作成分執(zhí)行元成分的指令,同時,有反饋;知識獲得成分,選擇問解解決的策略。 元成分: 操作成分 知識獲得成分 前兩種理論,從外部世界、經(jīng)驗角度來看。 情境理論指出智力是主體對環(huán)境的適應、選擇、改造。 經(jīng)驗理論指導測驗編制中應運用大多數(shù)人都有(或無)的經(jīng)驗?;蛐庐惢蚴煜ぁ?br>7.智力的PASS模型 (DSA 戴斯):要產(chǎn)全新的理論取代傳統(tǒng)的。 同時性 三個方面(三級認知功能)計劃-注意-加工 ↓ 繼時性 這一狀態(tài)決定是兩步的基礎。 生理基礎:三級機能聯(lián)合區(qū)。(魯利亞) DAS編制的智力測驗:DN認知評價系統(tǒng)。分四個分量表: I. 第一分量表(計劃性功能系統(tǒng)) 視覺搜索,計劃連接,數(shù)字匹配。 II. 第二分量表(注意-喚醒系統(tǒng)) III. 同時性加工 圖形記憶、矩陣問題,同時性言語加工。表現(xiàn)的注意,找數(shù)字,聽覺選擇注意。 IV. 繼時性加工 句子重復、句子問題、字詞測驗 &3.智力測驗 一. 福-比納量表(S-B量表) 1.19.6推孟第一次修訂 首次用"智商概念"(第一版) 1937推孟第一次修訂 采用復本的形式。(L版、M版) 1960推孟第三次修訂 刪除過時的題目,對題目重新排版,兩個版本合二為一,題量增加。(第三版) 1972在第三版上,對常模進行修改 1986第四次修訂版(桑代克Hagen)對S-B量表大規(guī)模修改(第四版) ↑現(xiàn)在使用的版本。 2.理論框架與構成 引八卡特爾的"流體""晶體"理論,及桑代克與Hagan的認知理論:∴理論框架是認知能力測驗。 構成:3層次,15分測驗 一般推理/理解能力 晶體智力 流體智力/分析能力 短時記憶 獲取、運用語文、 I珠子記憶 數(shù)字的知識來解決 抽象/視覺能力 II語句記憶 問題與學校教育有關 I對圖形或形態(tài)的分析 III數(shù)字記憶 II仿造/仿畫 IV物品記憶 III矩陣 IV折紙和剪紙 語文推理 數(shù)量推理 I詞匯 I算術 (小年齡,7歲上) II數(shù)列關系 II理解 III等式 III謬誤 IV語文關系 共15個分測驗 3.S-B測驗的特點 I. 內(nèi)容上含概了更廣的知識能力與信息加工的能力。 II. 采取分量表的形式(而前之版為年齡量表),框架有很大變化。對能力的各個方面進行評價。 III. 保留了傳統(tǒng)的適應性測驗 IV. 除了給總智商外,還有四個方面的分數(shù)及更多分支詳細。 使用范圍:2歲半~成人 適于找出弱智或超常兒的人。 4.測驗的實施與評分 先測詞匯分測驗,以其成績及年齡決定起測點。停測點因卷而易。采取一邊操作一邊評分。評分多是"0/1計分"。每個分測驗的分數(shù)相加(即:原始分數(shù),轉換成標準量表分把分測檢量表分相加),查常模,得四個量表分。再把四個分相加得總智商。 二. 麥卡錫幼兒智能量表(2歲半~8歲半) (1972編) 1. 特點: I. 測驗材料起點低,近似玩具。 II. 不受民族、地域文化差異的影響。 III. 年齡范圍側重于學齡期兒童。弱智兒童可用到14歲。 2. 構成 五個分量表。 十八個分測驗 總智商 語言 知覺操作 數(shù)量 記憶 運動 I.圖畫記憶 I.積木 I.數(shù)的問題 (把其他四部分 ( 眼、手 II.語詞知識 II.拼圖 II.數(shù)字記憶 與記憶有關的 的動作) III.語詞記憶 III.連續(xù)敲擊 III.計數(shù)和數(shù)的區(qū)分 測驗組合在一起) IV.詞語流暢性 IV.左右方向 V.反義類推 V.圖形臨摹 VI.畫人 VII.概括歸類 3. 評分 原始分數(shù)。查表,每分量表的分數(shù)相加,得合成粗分。 智商把前三部分的合成粗分相加得智商。還可評判"一側性"(或叫"單側化")單側化的完成也意味著智力的發(fā)展。 三. 瑞文測驗(Rowen) 漸進矩陣 A B C D E 60題 標準型 A B C D36題 彩色型-用于幼兒及弱智兒童 I 高級型 II 標準型+彩色型→聯(lián)合型 5歲~75歲 A套:簡單類比、直接辨別 B套:簡單推理 8歲以前只做A.Ab.B三套即可。 C套:單維推理(數(shù)量、位移、組合) D套:二維推理 E套:套合、互換 特點:無文化差別的問題,可用于大規(guī)模篩選。 四. 韋克斯勒智力量表。 1. 發(fā)展:紐約貝勒維精神病院中,雛形,因為韋克斯勒認為: 比納量表的常模不適于成人。 智商術法不適于成人。 智商并不能完全反映智力。 韋克斯勒提出離差智商 兒童量表:WISC,WISC-R(修訂版) WISC-Ⅲ 成人量表:WAIS,WAIS-R 學齡前及學齡初兒童量表(4.5歲-6.5歲)WPPSI,WPPSI-R 2. WISC-R簡介 全量表 語言量表 操作量表 語言量表 分測驗: I. 常識(生活常識-檢查對日常事物的認知能力一般知識) II. 類同 III. 算術 IV. 詞匯 V. 理解 VI. 數(shù)字廣度[備用替代](智力有問題,順背不超過5個,倒背不到3個) 操作量表 I. 填圖 II. 圖片排列 III. 積木 IV. 拼圖 V. 譯碼 VI. 迷津←(備用/替代) 原始分查表,相加得分量表分,再相加,得全量表分。 1991年修訂版 總智商 言語理解 知覺組織 注意集中 加工速度 (常識,類同、(填圖,圖 克服分心(譯碼、符號搜索) 詞匯、理解) 畫排列,積(算術, 木,拼配) 背數(shù)) 另配: 成績測驗:用于學力能力、策略上有困難的學生(智商不低) 五. 考夫曼兒童成套評估測驗(2 1/2歲~12 1/2歲) Kanfman Assessment Battery for Children(K-ABC) 以Das的PASS模型為依據(jù) 設想效果:從認知心理學與神經(jīng)心理學角度測量智力,不僅測量已有知識水平,而且測量解決新問題的能力。所得分數(shù)便于教育安排上的采用。 另,也有非語言量表 總量表 繼時性加工 同時性加工 成就量表 智力(-設想為解決 I.動作模仿 I.圖形辨認 I.詞匯表達 新問題的能力 II.數(shù)字背誦 II.人物辨認 II.人地辨認 流體智力(先天) III.系列記憶 III.完形測驗 III.數(shù)字運用 智力量表分= IV.圖形組合 IV.物體猜迷 繼時性加工的組分 V.圖形類推 V.閱讀發(fā)音 +同時性加工的得分 VI.位置記憶 VI.閱讀理解 (+非語言量表) VII.照片系列 晶體智力(后天) §4對智力測驗的反思的評價 1. 存在價值 2. 智力測驗的優(yōu)點 有標準化的過程——最大的優(yōu)點 比通過學業(yè)成就來評價智力要科學得多。—— I. 評價人的各種能力 II. 評價范圍廣 III. 快速、有效 3. 存在的問題與局限性 局限性表現(xiàn)在 I. 智商只提供量的數(shù)據(jù),而無質(zhì)的分析 II. 只測當時的智力,而不能考慮到以后的發(fā)展速度和趨勢 III. 標準答案有利于聚合思維、抽象思維和推理,而無利于發(fā)散思維 IV. 與文化教育有關,只能部分反映一個人的智力水平。(受理論局限)適應性行為也是智力的一部分。 V. 作智力測驗受很多因素影響(Eg:情緒、動機、疲勞etc) 4. 智力測驗的新理論與新方法。 I. 皮亞杰的發(fā)生認識論 重要的不在于對與錯,而在于怎么推理得到了結果。方法:綜合了觀察、測量、訪談etc,組合成了——臨床法。 II. 生態(tài)文化理論: 強調(diào)重視現(xiàn)時的環(huán)境、情景中人的智力活動。從各種社會環(huán)境中對智力進行評價。 第四章 學業(yè)成就測驗 (學績測驗、教育測驗)*特征與智力測驗相比的異用 旨在對學生在某一科目、某一知識中掌握的程度進行評價。 心理測驗中的學業(yè)成就測驗是標準化了的。 §1概述 一.發(fā)展 1.1894,Rice的拼字測驗揭開了標準化測驗的序幕 桑代克——教育測驗之父 (學生)Stune的算術測驗——最早的標準化的學科測驗 桑代克的書法測驗——第一個用科學方法編制的教育測量工具。 2. 性質(zhì): 學生對某一科目的學習效果,無預測功能。 3. 標準化測驗與白編測驗的不同之處。 I. 教師自編的測驗因教師的進展,班級的情況的不同而不同,易反映所在學校現(xiàn)行的具體的教育目標;標準化中含有的教育目標更普遍。得到很多教育家的共識。 II. 標準化測驗重于理解、思維過程;自編的測驗重于具體知識。 二.成就測驗的類型。 1.(綜合)成套測驗 斯坦福成就測驗(幼級) 學術能力成就測驗 基礎教育及基本技能最低限度測驗 2.單科測驗 3.品質(zhì)量表 4. 教師自編測驗eg:作文(優(yōu)缺點) 要求: I. 量多,范圍廣,覆蓋面大 II. 學生的回答形式越易越好 III. 要有客觀標準的評分方法 IV. 測驗形式多樣化 V. 盡量用要推理思考的題目,避免機械記憶 第五章 人格測驗(個性) Eysenck Personality Questionnaive (EPQ) 艾森克個性問卷。 1752年 產(chǎn)生N分量表(神經(jīng)質(zhì)) 1959年 E分量表(外傾性) 1964年 L分量表(說謊) 1975年 P分量表(精神質(zhì)) L量表值超過一定值之后,表明這份測量無效。 克雷普林,榮格。"聯(lián)想法" 武德沃斯 人格測驗的四種形式 一.自陳測驗--基本假設:人對自己最了解。忽略了:了解的正確性,報告的真實性 非自我描述,而是測驗,一般是紙筆測驗 采用是非題或選擇題 1.內(nèi)容消毒人格測驗(早期采用) 根據(jù)某一種人格理論,來確定要測量的一個特質(zhì)。 缺點:特質(zhì)與試題的聯(lián)系,過于明顯,容易使結果失真。 2.因素分析人格測驗 因素間相關較小。一個因素測一種特質(zhì) eg:Y~G人格測驗 3.經(jīng)驗效標人格測驗 根據(jù)不同的人的反應來編制 eg:MMTI(明尼蘇達。。。) 用詞要盡量中性化 一般加入測慌題目 《卡特爾16種人格因素量表》 (一)根據(jù)"特質(zhì)理論"。特質(zhì)比習慣更一般化。 整個人格體系所包含的行為都可用語詞表現(xiàn)出來。通過因素分析,找到了15個因素:第二項B是從智力理論而來的。為第16個因素。 有ABC三個英文版,各187題。 (二)特點:1??陀^,明確,中性化的詞語 表面效度低,看不出測什么 編排 2.標準化。經(jīng)過三次抽樣,準確性高。測驗程序,抽樣都符合標準化。有部面圖 3.非單一功能,是多功能的 十六個因素組合,得次級得一些人格因素 4.廣普性。 用來評價正常人。16歲以上到老。 8歲到14歲用14P下(或CPQ) 5歲到8歲。還有一個量表。 5.多元性 信息量大。 (三)要求。1。每題都要選一個答案。 2.全部要回答 3.盡量做得快 4.少選折中得答案 《明尼蘇達多項人格文卷》 根據(jù)經(jīng)驗效標來測驗。 (一)編制思路和過程 1930~1940 收集1000多個題目,在效標組(異常人)和對照組(正常人)做實驗。為了測多項,要有許多效標組 10個臨床量表和4個效度量表(Q量表無專門題目) 13個分量表共654題。(有重疊得題目)。不重復,共550題,其中有16題可用兩次。 1至399題是測驗用,其他供研究用 (二)施測和評分。約45分鐘,一般不超過90分鐘 有:卡片式;問卷式 男女分開;把重疊的題的答案比較,不同的在6題以上,作廢;這些題與無法回答的題在30題以上,作廢。 疑病癥: T>60 不愉快,敵意,需求,同情 抑郁癥: T>70 表現(xiàn):易怒,膽小,自責 癔?。?nbsp; T>70 歇斯底里,天真,缺少自知力。用否認,壓抑來處理事情。 精神病態(tài) 高分 很難接受社會價值觀和社會道德規(guī)范易接受反社會行為。 外露,善交際,愛享受,不成熟,家庭關系處理不好,虛偽。 男子氣好氣。(非?。㏕越高,越遠離自己的性別 男:敏感,被動,愛美。(高分) 好攻擊,粗魯(低分) 女:(與男相反) 妄想癥: T>70 明顯精神病行為:認為自己受欺負--障礙 >80(極端) --精神病 ∈[60,70] --傾向 精神衰弱 強迫行為,恐怖,刻板,自責,不安。 精神分裂 分裂的生活方式,退縮,膽小,心情易變,緊張,有奇怪的思想,判斷力差。 70~80 有幻想,幻覺 輕躁狂 T∈[70,75] 外露,樂觀,精力過分充沛,易怒,縱酒,輕浮,夸張,過高估計自己 >75 情緒反復無常 社會內(nèi)向(非?。?nbsp; 高分 內(nèi)向傾向嚴重 膽小,退縮,屈服,過于謹慎,反應慢 低份 外向,沖動,任性,做作,不太真誠 注:要根據(jù)雙高分的原則。 高:>60或70 (三)優(yōu)缺點 優(yōu)點: (I) 客觀;與醫(yī)學診斷一致性高 (II) 首次把效度量表引入測驗 (III) 既可作醫(yī)學診斷,也可以作正常人的人格診斷 (IV) 豐富的題庫 缺點: (i) 人格測驗信度不夠 (ii) 易受被試的年齡,性別,學歷,社會環(huán)境的影響 (iii) 對人格特質(zhì)的描述多用病理學解釋 (iv) 題目多,時間過長易引起煩躁。 二. 投射測驗 投射:個體把自己的思想,態(tài)度,愿望,情緒,性格等人格特質(zhì)不自覺地反映于外界事物或他人身上的心理作用。 特點:刺激本身沒有意義。 強調(diào)無意識,否認自陳測驗。 投射測驗的類型: 1.聯(lián)想法 詞的聯(lián)想(榮格) 羅夏墨跡圖 Rorschach Ink-Blot Test 2.構造法 根據(jù)被試看到的圖片,構造一個故事(有過去,現(xiàn)在,將來)。 主題統(tǒng)覺測驗 TAT 兒童主題統(tǒng)覺測驗:(i)動物版 (ii)人物版 3.完成法 提供殘缺不全的圖片或句子,要求補充完整 語句完成測驗(SSCT)60題(類:家庭,性,人際關系,自我觀念-- 4.排選造 給予幾張照片,按(任何方法)某種順序排列 5.表露法 讓被試利用某種媒介自由表露心理狀態(tài) 畫樹測驗 20個標準 投射測驗優(yōu)缺點 優(yōu):(I)不受題目限制,可測出題目以外的線索,對人格做出綜合探索 缺:(I)評分缺乏標準,無常模,信效度不夠,不易量化理論深奧,對主試要求高,不易普及 三.評定量表(他評量表) 類型: 1.數(shù)字評定量表 2.圖標評定 3.標準評定 4.強迫選擇評定量表 四.情境測驗 1.品格教育測驗 主要用來測兒童的品格發(fā)展 (1) 誠實測驗。Eg:不肯能成績 (2) 自控測驗 (3) 公正測驗(多用于幼兒) 2.情境壓力測驗 eg:無領袖團體情境測驗 3.優(yōu)缺點: 優(yōu):在實際情境中做測驗,表現(xiàn)出來的人格特征較真實,準確。 缺:實施起來較困難,主試需經(jīng)過嚴格培訓。但仍有誤差。 四種人格測驗的缺陷 (i) 人格的定義還不一致。測驗內(nèi)容也不一致。所測的人格特質(zhì)也不相同。 (ii) 人格測驗的信度。效度較低。原因在于:人格受情境和個人當時心態(tài)的影響;人格測驗很難找到準確的效標。 (iii) 人格測驗編測題很難 (iv) 測驗結果的解釋有多樣性。答案無對錯之分。 (v) 測驗中有偽裝和社會贊許的反應。 (vi) 人格測驗關系隱私問題。 第六章 態(tài)度測驗法 社會心理學領域多用此測驗法。 一.態(tài)度的性質(zhì)及態(tài)度量表的公用。 1.基本性質(zhì)。 斯賓塞(Spencen)第一次用此詞。 Combell:態(tài)度是針對一組社會事物而產(chǎn)生的具有一致性的反應群。 三個層面:1.認知(尤其是評價性認知) 2.情感性。 3.行為傾向。 態(tài)度有方向性;也有強弱之分;有多面性;有三層面一致性。 2.態(tài)度量表:由一組相互有關聯(lián)的陳述句組成,一組態(tài)度語或項目。陳述句的方向,強度是有區(qū)別的。 明確的目的,測題質(zhì)量.數(shù)量是好的態(tài)度量表的決定因素. 3.功用 (1) 衡量一宣傳工具影響人們態(tài)度的程度.(或政治預測,市場調(diào)查,偏好) (2) 評估教育的成果 二.等距量表法 1.根據(jù)研究主題,搜集符合的態(tài)度語100~200句.其中反對及贊成的比例1:1.(或1/3反對,1/3中立,1/3贊成).按反對到贊成份5~7組. 主義:語句通順,簡單;沒有歧義,每句句子對主體有清晰的態(tài)度. 公認的事實不要放在測驗中,無鑒別力. 2.請50~60人對反對至贊成的句子分組,至少7組(客觀,對主體明確的人) 3.對每名態(tài)度語做次數(shù)分布表和累積百分比表 4.畫累積百分比圖 5.找出(又值小的句子,并且在0~11組的分布合理. 1~4→3,5~7→4,8~11→3 三.利克特量表法(Likert) 1.針對一個研究主體,收集有關資料,編制成態(tài)度語(包括肯定的態(tài)度和否定的態(tài)度語).回答分五或六等題目及答案由肯定至否定得5,4,3,2,1分. 總加量表 特點 ![]() (2)被試對題目得態(tài)度強度可以盡量分出等級. 2.編制方法 (1)項目的制訂 題目性質(zhì)相同 (若對不同質(zhì)題目的態(tài)度與對研究內(nèi)容的態(tài)度一致,則也可選用) 不少于20個 (2)預測和評分 選一樣組做預測,看題目是否編得理想 (預先測驗) (a值:內(nèi)在一致性) (3)項目分析 分析題目的鑒別力 被試題目得分由高到低排列,取前后各25%人. 一個題目 ![]() 鑒別指數(shù):0.2以下淘汰,0.3以上通過.0.2~0.3修改 四.哥特曼量表法 1.構造原理 項目少(不超過10個),效果較好的一種量表,結構復雜. 每一題程度上有不同 eg:--戰(zhàn)場中的柑桔 經(jīng)常(a) 有時(b) 只有一次(c) 從來沒有(d) 不予回答(e) (1) 心臟脈搏跳動很快 (2) 胃有下沉感 (3) 感到虛弱或暈眩 (4) 胃感到不適 (5) 出冷汗 (6) 嘔吐 (7) 全身顫抖 (8) 尿撒在身上 (9) 膀胱失去控制 (10) 有僵硬感覺 (2),(3)題中 a.b.c 一分 ;d.e 零分 其它題中 a.b零分 ;c.d.e 一分 去掉第(5)題 恐懼程度由弱到強:1~2~7~4~10~3~~6~9~8 一道題目:(理論上) 表(略) 2.步驟 (1) 設計句子,及五或六種反應態(tài)度 (2) 選一個代表性樣組進行預測 (3) 把題目按分數(shù)由上到下(從最贊成到最不贊成)排列 3.缺點。 只注重單向性,不注意設計項目。題目。 第七章 興趣測驗 一.1915.邁納(Miner) -- 不標準化的 1927 斯特朗(Strong) 1939 庫德(Kuder) 高中,高中以后。職業(yè)興趣才穩(wěn)定下來 (15歲~18歲)因為找被試有年齡限制。 可通過(i)興趣表達,(ii)對行為進行觀察,(iii)進行能力測驗(iv)興趣問卷,四個方法來了解個體的興趣。 (綜合以上三種方法,是最常用的) 只能說明有興趣,未必勝任。 二.《斯特朗~坎貝爾興趣問卷》 1. 評卷(I)瀏覽 (II)一般職業(yè)框架(轉換成七分) 低于34,此方面興趣很低 35~42 低 43~57 平均 58~65 高 高于66 極高 (III)對照常模 (IV)做一般解釋,也可再進行特殊分析 2.信度0.80 效度極好 三.庫德職業(yè)興趣調(diào)查表 強迫選擇 有48個大學專業(yè)量表 信度0.90 另外還有"個人匹配"??梢陨钊肓私庖粋€人的興趣 四.自我指導問卷 職業(yè)類型測驗 ~ 人格特點 職業(yè)搜索表 先測興趣特征,再根據(jù)人格特點查找興趣 再寫職業(yè)碼。查指南。 現(xiàn)實型(R),研究型(I),藝術型(A) 社會型(S),企業(yè)型(E),傳統(tǒng)型(C) eg:心理 AIC 圖(略) 第八章 測量的誤差 穩(wěn)定性(一致性) 準確性 一. 誤差形式 (i) 隨機誤差 (ii) 常定誤差(系統(tǒng)誤差)--只影響準確性,而不影響穩(wěn)定性 (iii) 抽樣誤差 二.誤差的來源 1.測驗內(nèi)部引起的誤差(編制過程種,測題本身存在的誤差。) 題目取樣時,題量少,或無代表性 其他編制過程。Eg:句子意義不明確,題目太難,測驗時間設定不對 2.測驗過程中引起的誤差 a. 物理環(huán)境 b. 主試的情況(尤其對兒童會有影響) 步驟,說明被試是否清楚 兒童,或有情緒障礙的人需先交流 c. 意外干擾eg:團體測量中。 d. 計分過程中eg:不客觀,尺寸掌握不同 3.來自于被試本身的誤差 圖(略) 能力高的人不太會產(chǎn)生焦慮;能力不自信 求勝心切的人會產(chǎn)生較高;缺乏自信,適應性不強,情緒不穩(wěn)定的人易高焦慮 很少參加測驗的人,對程序不熟悉易高焦慮 測驗成績對被試而言很重要。易高焦慮 第九章.測量的信度 信度與隨機誤差的關系:信度大,誤差小 一. 信度的定義 實測分數(shù)=真分數(shù)+誤差 X=T+E 信度:真分數(shù)/實測分數(shù)(真分數(shù)不可能測得,只能通過對誤差的推測來估計) 判斷信度系數(shù)的高低:(能力測驗,信度需0.90,人格(態(tài)度)測驗,0.80) 一. 估計信度的方法 1. 穩(wěn)定系數(shù)(重測信度) 成人 隔2,3月至半年 皮爾遜積分相關公式 兒童 隔1,2周至半個月 r=(∑X1X2/N-#*#)/S1*S2 跨時間的一致性 2.復本信度(等值系數(shù)) 跨形式的一致性。時間間隔不要太長。 3.內(nèi)在一致性。 跨題目的一致性 克倫巴赫a系數(shù): (i) 分半信度:以奇偶數(shù)分半 r校正=(2*r分半)/(1+r分半 (ii) 庫德--理查遜估計法 K-R 20公式 Rkk=(k/(k-1))*((1-∑PiGi)/Sx2) --適用于二極性的答案 (iii) a=k/(k-1)*(1-∑Si2 /Sx2) --適用于二級以上的答案 內(nèi)在一致性優(yōu)點:只須做一次測驗,信度比以前兩種方式高。注:測驗是同質(zhì)性的或有分量表才可用。 4.因素分析。 5.評分者信度(主觀題) 三.影響信度的因素。 1.不同測驗范圍與信度 分數(shù)分布越大(誤差越?。?,信度高 eg:6~12歲,信度0.95,其中,10歲,信度<0.95 所以被試年齡多,信度易高。 2.測驗長度與信度 題目多,信度高 n=rnn(1-r11)/r11(1-rnn) r11 原信度 rnn 目標信度 斯皮爾曼--布朗公式 K:改變以后的長度與原長度之比 rxx:原長度 r=Krxx /1+(k-1)rxx 3.測驗難度和信度 分數(shù)分散的分布越廣,信度越高 四.測量的標準誤差 尤其適用于解釋個人分數(shù) 標準誤差,誤差分數(shù)分布的標準差。 實踐中,以一組被試兩次測驗的得分代替一個被試多次測量的得分。 Se=St*(1-rtt)1/2 Eg:韋式測驗 Se=St*(1-rtt)1/2 =3.35 在95%的置信水平上,被試的區(qū)間。 3.35*1.96=6.6 若得分100,在[100-6.6,00+6.6]區(qū)間1概率為95%,也可用標準誤差判斷一名被試兩個測驗的差異 第十章 效度 信度只從測量角度評定測驗 效度:測測驗的特性的程度,測測驗是測什么特性。 &1.效度的概述 一. 什么是效度 一個測驗的結果必須符合測驗的目的。有效性效度相對信度更重要。 實測分數(shù)=真分數(shù)+誤差(隨機) 必要條件:信度,效度 效度:實測分數(shù)中與目的有關的真分數(shù)占實測分數(shù)的比例 二. 信度與效度的聯(lián)系 三. 影響效度的誤差來源 1.測題本身(最主要的來源) 測題長度,編排方式 2.實施過程中 3.被試的反應 四.效度的性質(zhì) 對效度的評價 高,中,低 效度通過推測得到 &2.準則關聯(lián)效度或效標效度 eg:智力水平的效標可以是:學習成績,教師評語,以后的成就 效標:相對的, 受時間的考驗 分:同時性 繼時性 eg:將來的工作成就 效度系數(shù)(測驗分數(shù)與準則的相關程度) 1. 相關法 a. 積差相關法 兩分數(shù)要求連續(xù) 圖(略) b.二列相關法(一組分數(shù)連續(xù),另一組不連續(xù)) c.多元相關法(有多等級) 2. 區(qū)分法(小規(guī)模不易看出有差異,大規(guī)模易看出有差異) 3. 命中率 圖(略) 注意:以上三種方法都要求效標的可靠性 &3.內(nèi)容效度 一. 包含主要方面 各方面的題目要有比例,有一定難度 學業(yè)成就測驗尤其注重內(nèi)容效度 二. 考驗內(nèi)容效度的方法 1. 專家判斷 缺陷 (i)無量化指標 (ii)判斷不一致 (iii)由于教育思想不同,所以判斷內(nèi)容范圍時不一致) 2.統(tǒng)計分析法(克倫巴赫提出) 根據(jù)相同的內(nèi)容范圍,編兩套測題,對被試測試,再進行相關處理(類似復本心信度) 3.再測法 兩次測驗,后一次測驗分數(shù)明顯提高,則內(nèi)容效度高(中間有教學) 4.經(jīng)驗法 測驗分數(shù)隨年齡增長而提高,內(nèi)容效度高 三.內(nèi)容效度和表面效度的關系 被試或外行人從題目看出要測的內(nèi)容。兩者之間不要求同步。表面效度不是一種客觀指標,但會影響被試動機,從而影響內(nèi)容效度。學習成就,職業(yè)測驗,興趣測驗的表面效度高,人格測驗表面效度要低。表面效度降低只要改變措詞。 四.提高內(nèi)容效度的方法 編制命題雙向細目表 圖(略) &4.結構效度 一. 概述 1954念提出 按一定理論編制測驗,測驗結果證明了理論,則有結構效度 二. 考驗結構效度的方法 1. 測驗內(nèi)方法 研究測驗的內(nèi)部結構,來界定測驗的結構范圍 (i) 借用內(nèi)容效度(結構效度與之有直接關系) (ii) 考察測驗的同質(zhì)性 一個因素中的應是同質(zhì)性的,不同因素,之間不能是同質(zhì)性的。 (iii) 分析被試對題目的反應過程外來影響因素越小,結構效度越高 2. 測驗間方法 研究幾個測驗(同類)間的相關,來考察是否測同一特質(zhì)。 (i) 相容效度 求一個新測驗與一已有測驗的相關(若無已有測驗,用部分有關系的測驗代替) (ii) 會聚效度和區(qū)分效度(1960坎貝爾提出) 要求:測同一特質(zhì)的變量有很高相關,并且,測不同特質(zhì)的變量有很低相關,特別適合于人格測驗。多種特質(zhì)--多種方法矩陣 3.準則關聯(lián)效度研究 對準則的預測水平越高,效度越高,主要看測驗分數(shù)可否區(qū)別不同的人。 Eg:Barron巴龍,自我強度量表 4.其他變它證據(jù) 隨自然事件的發(fā)生,測驗結果應有所變化 5.實驗操作 看是否受訓練的影響。Eg:學業(yè)成就--訓練有影響。智商-- 訓練無影響。非訓練測題。 證明了預期,則有效度 對效度的總結 (i) 任何測驗,都二要效度證據(jù)。不同測驗,偏重于不同種類的效度,實際運用中,多用準則關聯(lián)效度,內(nèi)容效度只需說明。 (ii) 三種效度有不同作用。 結構~:幫助我們運用分數(shù)去解釋人的不同心理特質(zhì)。 準則關聯(lián)~:了解分數(shù)是否可以有效估計某種行為表現(xiàn) 內(nèi)容~:幫助決定分數(shù)是否代表測驗結果。 (iii) 效度分析通常是編完測驗后做,但效度的思想已知影響編制過程。效度比信度更重要 第十一章 測驗的實施與計分 &1.測驗的準備 一. 測驗者的準備 主試的準備。經(jīng)過嚴格的訓練與考核,熟悉指導語。 二. 測驗環(huán)境的準備 1. 房間的選擇;2。桌椅安排。(不能太大,易分散主義;不能太小,不易施展開來。一般的光線,溫度,對兒童,引起注意分散的物品拿走)。位置遠離喧鬧,不準有人進出。(主試與被試中不可有一方站著,椅子太高或太低影響視線,桌子太小,傾斜都不能做測驗。不要坐沙發(fā),轉椅,應是直靠椅背的高度適中,桌面足夠大,不要太寬) 3.測驗材料的準備 4.參加測驗的人員 父母,班主任不可做主試 三.被試的準備。 放在被試最佳心理,生理狀態(tài) 1. 選擇的時間(無吸引他們的活動的時間,心理情緒穩(wěn)定,生理狀態(tài)良好的時候) 2. 生理的準備(在測驗時無急迫的生理需要) 3. 心理的準備,親密關系的建立 (i) 先介紹自己(姓名,職業(yè)) (ii) 問一些一般的信息,使他高興 (iii) 不直接地講一些"目的"。(避免提"作業(yè)") (iv) 對大致的一些任務作介紹(所需時間,將有的活動,測驗的難度,鼓勵他們對不明確的地方立即提一些問題) &2.測驗的實施 一.作記錄 1. 記錄要隱蔽 2. 記錄要真是 二.如何對待被試的要求 1. 如果被試沒有聽清題意,要求重復,一般允許,但記憶測驗不能重復 2. 如果被試要求修改回答,一般允許,但若規(guī)定只記第一時間的反應,則不允許更正。 三.對主試的要求。 1. 主試必須集中注意力 2. 不能對被試的回答有所暗示 3. 適當強化被試的行為(適當鼓勵) 4. 鼓勵被試的回答 5. 對磨棱兩可的答案,主試先重復回答,再讓被試解釋。若這類答案無論如何理解都錯,則不需追問。 6. 對計時題,題目說完就按下表 7. 計分嚴格按照手冊要求 &3.測驗的計分 一.年齡的計算法 測驗日期--出生年月 注:借位。有30日,12個月。。。 二.原始分計算法 1.0,1(對,錯)計分法 2.多級計分法 三.原始分換算為標準分數(shù)(以年齡分,以年級分,以百分位。。。來表示) 第十二章。測驗的項目分析 可以分:質(zhì)的分析。 專家對項目內(nèi)容,形式進行分析 量的分析。 采用統(tǒng)計方法來測定項目的品質(zhì)。 包括難度分析與鑒別力分析。 &1.項目的難度 一. 難度:測題的難易程度 難度分析 在能力測驗中,指:對測題難易程度作標定 在非能力測驗中,指:對內(nèi)容通俗性和流行性程度作分析在題目范圍之內(nèi),做回答的人的估計難度的指標。 1. 通過率--通過的百分比越高,題目越容易 (i) 二值記分測題:0,1計分 P=R/N(R:通過人數(shù),N:總人數(shù)) (ii) 非二值記分的測題 P=#/#max #實際的平均分 # max若都得滿分,所得得平均分。 但,先要做修正以排除"猜"得機率 即:再用校正公式 CP=(KP-1)/(K-1)(K代表"K擇一) 選項數(shù)目不一樣,不可直接比較兩題難度,要做校正。 (iii) 分組法 當被試樣本很大,把分數(shù)從高到低排列取高分組,上限27%人;低分組:下限27% P=(PH+Pz)/2(PH,Pz可用P=R/N 或P=#/#max 等得) 2.項目難度的等距量表 (通過率反映出的難度不等距) 二.測驗難度的確定和分數(shù)的分布 通過率越接近0或1,就無鑒別力;越接近0.5,越有區(qū)分力。 但每道題都是50%,一方面不太可能做到;另一方面,題目間的相關會很高。所以一般,把測驗的平均難度控制在0.5,而每道題可在0.3~0.7中波動 若選擇的人數(shù)少,參選的人多,則P可以很小,難度高一些,eg ![]() 分數(shù)分布是常態(tài)的,測題難度就恰當。 反之, 圖(略) &2.項目的鑒別力(區(qū)分度) 1. 鑒別力:測題對于不同水平的被試反應的區(qū)分程度和鑒別能力。 2. 鑒別力估計方式: (1) 項目效度分析:主要依據(jù)效標,來考察測驗中的反應與效標的相關 (i) 可用相關系數(shù) (ii) 用鑒別指數(shù):分數(shù)從高到低排列,對半分,分高分組,低分組。 小樣本時,D= PH - Pz 指數(shù)越高,鑒別力好。 大樣本時,用兩端來挑高分組,低分組 27%為最佳 (2) 有的測量效標難找,就用總分做效標,將每道題的分數(shù)與總分做相關 相關高;鑒別力也高;相關低,鑒別力不夠 計算方法:(i)點二列相關系數(shù) rpbi=#p-#g/St(pg)1/2 #p答對的人的總分平均數(shù)(g=1-p) #g 答錯的。。。。。。。。。。。。。 St標準差 P為難度值 條件:測題0;1記分,總分連續(xù) (ii)二列相關 條件:測題與總分都是連續(xù)的值,測驗又認為分成兩類 rb=#p-#q/St(pg/y)1/2 (iii)積差相關 (3) 方差法 --看離散程度 一道題目,離散程度大,有區(qū)分度。 3.難度與鑒別力的關系 通過率為1或0,無鑒別力 通過率為0.5,鑒別力為1。 通過率為0.7,鑒別力最大值為0.6(書P124) &3.項目分析實例 一. 步驟 1. 選取有代表性的樣組,按規(guī)定程序預測 2. 批出分數(shù)。按總分高到低排序,高分組,低分組各27% 3. 同一測題,高分組,低分組通過人數(shù)比率PH ,Pz 4. 分別求出難度,鑒別力 5. 比較高分組,低分組在每題答案上的反應。 6. 根據(jù)統(tǒng)計結果修改測題 二. 實例 題號 組別 選答人數(shù) 正確答案 難度 鑒別力 A B C D 未答 p rb D 1 高分組 5 92 1 2 0 B .71 .52 .42 低分組 22 50 12 16 0 2 高 58 10 15 16 1 A .42 .33 .32 低 26 21 15 36 2 3 高 17 15 28 28 12 D .31 .-.04 -.06 低 25 11 19 34 11 4 高 1 44 14 36 5 C .12 .08 .04 低 1 56 10 28 5 1. 首先看鑒別力 1, 2題號,3,4題淘汰或修改 2.難度(0.35~0.65之間最好,總難度要居中) 就難度而言,4個題都可使用 3.選答人數(shù) 異常: (i) 正確答案無人或很少有人選,選的人數(shù)少于其他答案選的人;選錯的人過多 (ii) 高分組選正確答案的人少于低分組的,高分組選錯人多 (iii) 某一選項無人選擇 (iv) 未答人數(shù)較多 4.修改 &4.準則參照測驗的項目分析 以上的項目分析都是針對常模參照(與常模對照)測驗的。 1. 準則參照測驗是測接受訓練/教育的與不接受的人或接受前后一個人的差別。無常模,但有人為制定的標準。 準則參照測驗的難度取決于作為準則的東西。如果準則要求不高,難度可降低;標準高,難度就大。鑒別力同樣看準則,準則要求的內(nèi)容,鑒別力即使低,也要。 具體方法: 按成績分組,達到標準的一組,未達到的一組;計算兩族人對每題的差異。 差異:P=(PH + Pz )/N 鑒別力 ![]() 2. 教育效果敏感指數(shù)(訓練效果) 實例: 學生 試題 1 2 3 4 5 前后 前后 前后 前后 前后 A +- -+ ++ —— +- B ++ -+ ++ —— +- C -+ -+ ++ —— +- D -+ -+ ++ —— +- E ++ -+ ++ —— +- F —— -+ ++ —— +- S1=0.5 S2=1 S3=0 S4=0 S5=-1 S∈[-1,1]大于0就有鑒別力,越大越好 &5速度測驗的項目分析 有人以答完此題的人數(shù)為指標,不考慮此題為做的人 也有人延長時間,但這忽略了速度因素的影響。 至今,未有很好的分析方法。 第十三章 量表和常模 &1.標準化樣組 預測的樣本可以較好地代表全域,則其為"標準化樣組"抽樣: 1. 選樣本時,要考慮到與測量有關地變量。Eg:智力測驗時,年齡要注意;地域;性別;父母學歷;家庭經(jīng)濟狀況 若全域中的小團體差異較大,則要分別制定常模 eg:人格測驗分男,女 2. 樣組規(guī)模要適當,有條件的化,越大越好。 3. 為了克服誤差,抽樣方法很重要 根據(jù)性質(zhì)和任務決定。 不能像調(diào)查一樣"愿者上鉤" 以"概率抽樣"將系統(tǒng)誤差減小到最小,誤差大小事無就可知。 (i) 簡單隨機抽樣 (ii) 分層抽樣。優(yōu)點 ![]() (iii) 整群抽樣。 隨機抽幾個整體(單位團體),其中的每個人都要進入調(diào)查得到的均數(shù)離整體較(i)更遠,所以為了避免此缺陷。樣本要大一些。一般,采取分層抽樣的方法(再在每一層,可用整群抽樣或簡單隨機抽樣。 &2.測驗的原始分數(shù)和導出分數(shù) 一. 原始分數(shù)(p136) 分數(shù)可以是任意的,沒有意義 修正 Xc=R+O/K R:正確答對的題數(shù) O:被忽略的 K:選項數(shù) 二. 量表分數(shù) 既有一定的參照,又有一定的單位。轉換后的分數(shù)稱為:"導出分數(shù)"。 1.百分量表 注:(i)原始分數(shù)轉換成量表分時,非線性。 原始分布成正態(tài),百分量表分呈長方形。 (ii)百分量表是等級量表,不能作加減運算。 2.標準分數(shù)(Z分數(shù)) 要做運算時可用。是等距量表,把原始分與平均分的差以標準差來表示。 Z=(x-#)/S 注:原始分數(shù)的分布必須是常態(tài)的。是一種線性轉換 優(yōu)點: (i) 可以做進一步統(tǒng)計分析,加減等運算 (ii) 可以對兩個以上的分數(shù)作比較 缺點: (i) 計算,統(tǒng)計原理較復雜,不易使外行看懂,不能普及 (ii) 有負值,運用起來不方便;單位可能過大 (iii) 若原始分有問題,無法校正 3.常態(tài)化 原始分數(shù)~百分比數(shù)~Z分數(shù) 三. 標準分數(shù)的變化 1.7分數(shù) 以50為均數(shù),10為標準差。T=50+10Z 2.標準九 1,2,3,4,5,6,7,8,9 分為九個等級,5為均數(shù),2為標準差 相應百分比:4%,7%,12%,17%,20%,17%,12%,7%,4% 3.發(fā)展量表 年齡量表,年級量表 a.智齡。 三.剖面圖 使人們對測驗結果一目了然。 第十四章 編制測驗的方法 &1.測驗目的的確立和材料的選擇 一.測驗目的的確立 1. 把目標具體化 2. 測驗的對象確立(團體/個體) 3. 測驗的用途(善查/診斷。。。) 4. 類型(常模參照/標準參照) 5. 被試的文化背景 二.制定編制計劃(藍圖) 考慮測驗內(nèi)容,技能,重要程度(比重) 三.測驗材料的選擇 原則:1.取樣材料豐富,函概各放面 2.材料有普遍性,對全部被試公平 不同測驗還有不同原則。材料有趣(尤其對幼兒) 四.測驗形式的選擇 &2.測題編制技術 一.命題的一般原則 1. 測題內(nèi)容有代表性 2. 測題難度有一定的分布范圍 3. 測題的文字簡明,避免用深奧的詞(避免雙重否定) 4. 各測題之間要相互獨立 5. 正確答案只有一個(人格,創(chuàng)造力測驗除外) 6. 測題內(nèi)容不能超出被試的團體水平 7. 所提問題避免社會禁忌或個人隱私 策略: (1) 先假定被試采取肯定態(tài)度,編題 (2) 假定問題,無所謂好壞 (3) 指出該行為不是異常的,而是普遍的 8. 測題數(shù)目比正式題目要多一倍,便于篩選 二.測題格式的種類 1. 自由反應型 (1) 是非題 猜對的可能大,因為標準化測驗中不用 注: (i) 不能包含暗示,"所有""都"。。。有否定暗示 (ii) 一題只能包含一個概念 (iii) 題目表述簡潔,用正面陳述,不要用反面陳述或雙重否定 (iv) 選擇"是""否"數(shù)量差不多 (v) 測題不能太少,至少30~50題 (2) 選擇題 包含:詞干(詞句或不完整的陳述句),選項(4~5各)每題數(shù)目一致??煽疾?,記憶,鑒別,推理。。。 缺點:編幾個選項有難度,其間有關聯(lián) 注: (i) 選項4~5各,且每題的數(shù)目一致 (ii) 錯誤選項不要太明顯,錯誤選項,高分組很少有人選,低分組有較多人選,錯誤選項被選到的概率要差不多。 (iii) 不要把選項放在詞干當中 (iv) 各選項在形式上要已知(eg:都是圖形,或數(shù)字符號。。。) (v) 選項間不應相互重疊。 (vi) 選項中相同的詞可放在詞干中。 (vii) 選項中正確答案的位置隨機排列。 (3)匹配題 (i) 幾個題目內(nèi)容形式上一致 (ii) 知道語中講明匹配的依據(jù) (iii) 配對項目不要太多,最多十對。 (iv) 同一項目不要印得分開來。用于測概念或事實間的盥洗1 (4)排列題 依據(jù)大小,時間。。。,將項目重新排列 (5)最好理由題 (6)聯(lián)想型 評判難把握。 &3.預測和測題分析 一.預測 目的:為了對測題進行修正 注: (i) 預測對象即以后正式測驗要測的被試。人數(shù)不宜太多,也不能太少。一般,智力測驗要30人以上,學業(yè)成就測驗要370人左右。 (ii) 預測與正式測驗的程序是一樣的 (iii) 預測的時間可以放長(速度測驗例外) (iv) 詳細記下被試的反應,記下完成的時間。記下可能產(chǎn)生誤解的題目。 二.測題分析(項目分析) 難度 鑒別力。區(qū)分等級越多越好 聚類分析。 把相似的內(nèi)容歸為一類。 因素分析 &4.測題的選擇,編排和測驗的標準化 步驟: 1.確定取舍標準 原則:(1)根據(jù)鑒別力 (2)再選難度適中的題目,特別難與特別容易的也要選一些(人格測驗等降低難度要求) (3)測驗長度也有要求1小時左右,測驗長度也取決于被試的年齡 2. 編排原則與方法: 一般在開頭有非常容易的題目 題目從容易到難,在測題最后放最難的題目。 編排形式:(i)并列直進式 -- 有分測驗 (ii)混合螺旋式 -- 無分測驗,純粹按難度 (優(yōu)點,被試不感到枯燥) 3. 測題性能的復核 再做一次預測 4. 編制復本 為了增加實用性 在難度上不能與原來有差別 "蛇"形排列。把所有題目按難度排好,標題號。 Eg: A版 1 3 5 … B 版 2 4 6… 復本再做預測及分析。 5. 標準化 (i) 內(nèi)容方面的標準化 eg:A,B版題目等值。 (ii) 實施上標準化:規(guī)定統(tǒng)一指導語及時間限定。 (iii) 評分時標準化 &5.測驗基本特征的鑒定 信度,效度,量表,常模及指導手冊 第十五章 總結 心理測量的不足(失真) 1. 編制者依據(jù)的理論是否可以解釋所要測量的心理特性 2. 確定反應心理結構的行為樣組有局限,不夠全面 3. 預測的鑒定建立在概率論與統(tǒng)計上 4. 實施過程中的客觀影響不能反映被試的真是水平或態(tài)度。 |
|