華東師大心理學測量

L心緣心路D 2007-01-19

展開全文

心理測量和量表操作

大概的介紹。
凡是客觀存在的事物都是有數(shù)量的。
                              ——桑代克
凡是有數(shù)量的東西都是可以測量的。
                              ——麥克爾
心理用間接測量。測量行為，來推測心理。
心理測量的結果不絕對。

I. 心理測量的發(fā)展史
一．中國古代的心理測量思想與實踐
1905 法國——科學心理測量.
孔子——心理測量的思想
"中人以上，可以語上也；中人以下，不可以語上也。"
孟子"權，然后知輕重；度，然后知長短；物皆然，心為甚。"
劉劭《人物志》，"觀其感變，以審常度。"
翻譯后，名為《人類能力之研究》
      韓非一手畫圓，一手畫方。到現(xiàn)在，用于測注意力
      民間，周歲試兒             到現(xiàn)在，嬰幼兒的動作測量
      古代的問答法             到現(xiàn)在，臨床談話法，問卷法
      莊子：九征                到現(xiàn)在，情景法
      博弈（棋）、九連環(huán)、七巧板——古代測智力水平的器具
      八陣圖。
二．心理測量早期探索及嘗試
英國高爾頓  最早想通過測量人的證明他的"遺傳論"。
      美國卞特爾  心理學只有立足于實驗與測量之上，才會有自然科學的準確度。
      德國馮  特  心理測量的思想。
三．科學心理測量的誕生與發(fā)展
1905 法國  比納（Binet）
1895創(chuàng)辦第一本心理學雜志《心理學年報》
心理測量的原理：把結果與他人比較，以求概括。
1905：比納－西蒙量表（的標志）－標志著科學心理測量的誕生。
30題，從易到難。
1908、1911兩次修訂，制訂了"智齡"之后，有斯坦福"－比納量表（推孟修訂，1916）[現(xiàn)在的所謂"比納量表]引入了斯騰（德國）的心理商數(shù)概念，變化為：
智齡
IQ=_____ *100使不同年齡層次間兒童的智力水平比較成為可能。也叫比率智商
實齡
后來量表的特點
I. 操作性量表（比納的量表是語言性量表）
II. 團體測驗  （比納的量表是個別的測驗）
III. 教育測驗（學習測驗，eg桑代克，斯坦福成就測驗）
IV. 人格的測驗
V. 特殊能力測驗（eg音樂，繪畫能力etc）
四．心理測驗在中國的發(fā)展
1916 樊炳清介紹比納的量表
1920 南京高等師范學校（現(xiàn)南大），廖世承、陳鶴琴開設心理測量課。之后，制定量表，開創(chuàng)雜志…
抗日戰(zhàn)爭開始一度中斷。
1979后，心理測量在中國走進輝煌。智力測驗方面，陸志韋，吳天敏；人格測驗方面，肖孝嶸；艾偉，學業(yè)成就方面。－中國國內(nèi)著名心理測量方面的學者。

第二章心理測量的性質(zhì)
測量最基本的特征：對事物進行區(qū)分
一．測量的基本問題。
1.定義：利用一定的法則[現(xiàn)在，心理學中的法則還不完善，所以結果不精確]。
用數(shù)字對事物[心理學中，是對事物的特征及屬性]加以區(qū)分（描述）。
"數(shù)字"的特性：
I. 區(qū)分性
II. 等級性/序列性
III. 等距性
IV. 可加性
2.要素
絕對的零點（沒有此特性）－理想的參照點，加減乘除都可以
I. 參照點{
         人為參照點只能加減，不能乘除。
         確定的意義
II. 單位應有{
相等的價值
心理測量中的單位，不具有上面的特點，所以單位不夠理想
eg"年齡"不具有相等的價值
∵4歲-5歲的1年比44-45的1年發(fā)展快得多。
3.種類
I. 名稱測量/類別  特征：僅區(qū)分功能，符號意義使用數(shù)學統(tǒng)計方法——次數(shù)、百分比、X2 、列聯(lián)相關
II. 等級（代表符號－大于號，小于號）特~_ 分等性
使~ 中位數(shù)、百分位數(shù)、等級相關，秩次相關
III. 等距測量                      特~ 分等且等距
使~加減，均數(shù)，標準差，t檢驗F檢驗
IV. 比率測量（最好的一種測量水平）  特~具有絕對零點
                                 使~幾何均數(shù)、等比量數(shù)，加減乘除
4.直接與間接測量
直接測量：準確
間接測量：需中介，可能失真

二．測量的特征
1. 定義：依據(jù)一定的心理學理論，使用一定的操作程序，給人的行為定出數(shù)量化的價值。
2. 可行性
3. 性質(zhì)
I. 間接性（測外顯行為，推測大腦中的活動）
II. 相對性
III. 客觀性（測量要做到標準化）
4. 心理測量的水平
智力、價格測驗等：等級測量
∵無絕對零點無等距的單位但，可轉化為標準分數(shù)，則可使用等距測量的方法。

三．心理測驗的基本概念
1. 定義  心理測驗是對行為樣組的和標準化的測量
（eg題目代表全域，則題目是↑，數(shù)據(jù)結果也域，則數(shù)據(jù)也是↑）測量的編制實施，評分，解釋都有一致性
四．心理測驗的種類功能
I. 按功能分1.能力測驗智力、潛力（eg職業(yè)能力）特殊能力
2.學習成就測驗各科目的學習能力、技能掌握情況
3.人格測驗態(tài)度、性格、情緒、氣質(zhì)
II. 按人數(shù)分1.個別測驗
2.團體測驗    比較特點
III. 按材料分1.器具測驗                                  一類    (不絕對)
2.文字測驗（紙筆測驗）                         另一類
IV. 按目的分1.診斷測驗（具體）
2.篩選測驗（大致）[使用對象的不同]
功能
I. 人才選拔
II. 心理問題的預防與診斷
III. 對一個人能力等的評價
五．怎樣正確對待心理測驗
編制量表示合理使心理測驗有偏差的原因
實施測驗有問題
1.測驗保密（內(nèi)容保密、結果保密）
2.心理測驗的資格（接受過培訓、有考核）
3.測驗常模的使用范圍
4.不能"測定終身"。（過幾個月可再測幾次）
5.對測驗本身的認識。（參照其他各方面情況，得出適當?shù)慕Y果）
6.測驗結果不能作為歧視人的依據(jù)，操作規(guī)范。

第三章智力測驗
1. 概述
1.定義：
智力——對問題的理解與推理的一般能力。
——具有正相關的特殊能力的總和。
——產(chǎn)抽象思維為核心的多種能力的總和。
(國內(nèi)較認同)
2.智力測驗：
在一定條件下，使用特定的標準化測驗量表，對被試施加測驗，從被試的一定反應中測量共智力高低。
3.智齡與智商
I.             智齡
比率智商＝實齡  *100
               推孟 10歲前  10-18
具體年齡點有
               貝雷、韋克斯勒：13歲前 13-25
II. 離差智商
＝          X
      同齡人-x
4.智商的穩(wěn)定性和可變性
穩(wěn)定性。時間間隔越短，相關越大；
第一次做，年齡小時做，與產(chǎn)后結果的相關越?。?歲后做較好）
可變性。
5.智商的分布和分類
分類：推孟的分類
IQ  140以上 120-140  110-120  90-110  80-90  70-80  50-70  25-50  25以下
類別天才    上智    聰穎    中材遲鈍近愚  低能無能白癡
韋克斯勒的分類
IQ       類別    理論（百分比）實際樣組
130以上  極優(yōu)秀    2.2             2.3
120-129 優(yōu)秀    6.7             7.4
110-119 中上    16.1             16.5
90-109 中等    50             49.4 }82%
80-89    中下    16.1             16.2
70-79    邊緣    6.7             6.0
70以下智力缺陷 2.2             2.2
55-69輕度，可學習
40-55中度，可訓練
25-39重度，需護理，訓練后可處理
25以下極重度，全護理。
6.智力的性別差異
總體上，沒有。
發(fā)展上，女性先快后慢；男性先慢后快。
女性在語言，記憶上強。男性在數(shù)理、空間上強。
女性分布集中，男性分布廣。
7.遺傳，環(huán)境對智力的影響
同卵雙生子    同一環(huán)境 .88（智力相關）
同卵雙生子    不同環(huán)境 .75
異生雙生子相同環(huán)境  同性別  .60
{
  不同性別  .50
同胞兄弟姐妹  相同環(huán)境       .50
不同環(huán)境       .35
無血緣關系，但自幼在同一環(huán)境下長大 .20
無血緣關系，但自幼在不同環(huán)境下長大 .00
另：親生父母與子女的智力相關    .50
養(yǎng)父母與子女的智力相關       .30

&2.智力理論

斯騰伯格《超越智商》
智力非一個單一結構，是一個綜合的有整體的結構
1.因素說，（英）斯皮爾曼
一般因素（G因素）
特殊因素（S因素）
2.多因素說，（美）桑代克－凱利。
反對二因素說（尤其是G因素）。
認為——智力是各種特殊能力的綜合
3.群因素（美）瑟斯頓
智力可以分為各種組群，每一組群都有一共同的G因素。分為七種組群（語文理解，語詞流暢，數(shù)字運算，空間關系，機械記憶、知覺速度、一般推理）
由于七個組群仍有較高相關，所以修改后的該理論加入了"次組因素"的說法。后來該理論被稱為"群因—一般因素，理論"。
4.卡特爾  流體智力與晶體智力。
流體~隨神經(jīng)系統(tǒng)成熟  該能力自然發(fā)展開。是先天的。發(fā)展早衰退也早。
Eg.機械記憶，圖形分辨（反應）知覺速度。
晶體~：受后天環(huán)境。教育的影響。
發(fā)展晚，后來會加快。Eg.語詞.常識.詞匯
5.智力的三維結構（吉爾福特  美）
三維度內(nèi)容             操作       成果
視聽圖形          認知       單元
符號       記憶（短時長時）  類別
語義          發(fā)散性思維    關系
行為          會聚性思維    系統(tǒng)
                  評價       轉換
                              蘊涵
4    *    5    * 6＝120
細分有5    *    6       * 6＝180（已找出105種因素）
6.三重結構論    斯騰伯格
（認為：傳統(tǒng)的智商是靜態(tài)的。）
   情境理論
三重：{經(jīng)驗理論
成分理論——核心內(nèi)容
最基本的信息加工單元。元成分對其他成分進行計劃、評價、加工等。另，操作成分執(zhí)行元成分的指令，同時，有反饋；知識獲得成分，選擇問解解決的策略。
元成分：

               操作成分          知識獲得成分
前兩種理論，從外部世界、經(jīng)驗角度來看。
情境理論指出智力是主體對環(huán)境的適應、選擇、改造。
經(jīng)驗理論指導測驗編制中應運用大多數(shù)人都有（或無）的經(jīng)驗?；蛐庐惢蚴煜ぁ?br>7.智力的PASS模型
（DSA 戴斯）：要產(chǎn)全新的理論取代傳統(tǒng)的。    同時性
三個方面（三級認知功能）計劃－注意－加工
                  ↓          繼時性
            這一狀態(tài)決定是兩步的基礎。
生理基礎：三級機能聯(lián)合區(qū)。（魯利亞）
DAS編制的智力測驗：DN認知評價系統(tǒng)。分四個分量表：
I. 第一分量表（計劃性功能系統(tǒng)）
視覺搜索，計劃連接，數(shù)字匹配。
II. 第二分量表（注意－喚醒系統(tǒng)）
III. 同時性加工
圖形記憶、矩陣問題，同時性言語加工。表現(xiàn)的注意，找數(shù)字，聽覺選擇注意。
IV. 繼時性加工
句子重復、句子問題、字詞測驗

&3.智力測驗
一．福－比納量表（S－B量表）
1.19.6推孟第一次修訂  首次用"智商概念"（第一版）
1937推孟第一次修訂  采用復本的形式。（L版、M版）
1960推孟第三次修訂  刪除過時的題目，對題目重新排版，兩個版本合二為一，題量增加。（第三版）
1972在第三版上，對常模進行修改
1986第四次修訂版（桑代克Hagen）對S-B量表大規(guī)模修改（第四版）
↑現(xiàn)在使用的版本。
2.理論框架與構成
引八卡特爾的"流體""晶體"理論，及桑代克與Hagan的認知理論：∴理論框架是認知能力測驗。
構成：3層次，15分測驗
一般推理/理解能力

晶體智力          流體智力/分析能力    短時記憶
獲取、運用語文、                         I珠子記憶
數(shù)字的知識來解決    抽象/視覺能力       II語句記憶
問題與學校教育有關 I對圖形或形態(tài)的分析  III數(shù)字記憶
II仿造/仿畫          IV物品記憶
III矩陣
IV折紙和剪紙
語文推理          數(shù)量推理
I詞匯             I算術
（小年齡，7歲上） II數(shù)列關系
II理解          III等式
III謬誤
IV語文關系                            共15個分測驗
3.S-B測驗的特點
I. 內(nèi)容上含概了更廣的知識能力與信息加工的能力。
II. 采取分量表的形式（而前之版為年齡量表），框架有很大變化。對能力的各個方面進行評價。
III. 保留了傳統(tǒng)的適應性測驗
IV. 除了給總智商外，還有四個方面的分數(shù)及更多分支詳細。
使用范圍：2歲半~成人  適于找出弱智或超常兒的人。
4.測驗的實施與評分
先測詞匯分測驗，以其成績及年齡決定起測點。停測點因卷而易。采取一邊操作一邊評分。評分多是"0/1計分"。每個分測驗的分數(shù)相加（即：原始分數(shù)，轉換成標準量表分把分測檢量表分相加），查常模，得四個量表分。再把四個分相加得總智商。
二．麥卡錫幼兒智能量表（2歲半~8歲半）
（1972編）
1. 特點：
I. 測驗材料起點低，近似玩具。
II. 不受民族、地域文化差異的影響。
III. 年齡范圍側重于學齡期兒童。弱智兒童可用到14歲。
2. 構成
五個分量表。十八個分測驗
總智商

      語言知覺操作       數(shù)量       記憶          運動
I.圖畫記憶    I.積木       I.數(shù)的問題（把其他四部分  （眼、手
II.語詞知識    II.拼圖       II.數(shù)字記憶    與記憶有關的的動作）
III.語詞記憶 III.連續(xù)敲擊 III.計數(shù)和數(shù)的區(qū)分測驗組合在一起）
IV.詞語流暢性 IV.左右方向
V.反義類推    V.圖形臨摹
VI．畫人
VII.概括歸類
3. 評分
原始分數(shù)。查表，每分量表的分數(shù)相加，得合成粗分。
智商把前三部分的合成粗分相加得智商。還可評判"一側性"（或叫"單側化"）單側化的完成也意味著智力的發(fā)展。

三．瑞文測驗（Rowen）
漸進矩陣 A B C D E 60題  標準型
      A B C D36題  彩色型－用于幼兒及弱智兒童
      I
高級型
      II
標準型+彩色型→聯(lián)合型  5歲~75歲
A套：簡單類比、直接辨別
B套：簡單推理
8歲以前只做A.Ab.B三套即可。
C套：單維推理（數(shù)量、位移、組合）
D套：二維推理
E套：套合、互換
特點：無文化差別的問題，可用于大規(guī)模篩選。
四．韋克斯勒智力量表。
1. 發(fā)展：紐約貝勒維精神病院中，雛形，因為韋克斯勒認為：
比納量表的常模不適于成人。
智商術法不適于成人。
智商并不能完全反映智力。
韋克斯勒提出離差智商
兒童量表：WISC,WISC-R（修訂版）
      WISC-Ⅲ
成人量表：WAIS,WAIS-R
學齡前及學齡初兒童量表(4.5歲-6.5歲)WPPSI,WPPSI-R
2. WISC-R簡介
全量表

                     語言量表    操作量表
語言量表
分測驗：
I. 常識（生活常識－檢查對日常事物的認知能力一般知識）
II. 類同
III. 算術
IV. 詞匯
V. 理解
VI. 數(shù)字廣度[備用替代]（智力有問題，順背不超過5個，倒背不到3個）
操作量表
I. 填圖
II. 圖片排列
III. 積木
IV. 拼圖
V. 譯碼
VI. 迷津←（備用/替代）
原始分查表，相加得分量表分，再相加，得全量表分。
1991年修訂版

總智商

                     言語理解  知覺組織  注意集中加工速度
               （常識，類同、（填圖，圖  克服分心（譯碼、符號搜索）
詞匯、理解）畫排列，積（算術，
         木，拼配）  背數(shù)）
另配：
成績測驗：用于學力能力、策略上有困難的學生（智商不低）
五．考夫曼兒童成套評估測驗（2 1/2歲~12 1/2歲）
Kanfman Assessment Battery for Children(K-ABC)
以Das的PASS模型為依據(jù)
設想效果：從認知心理學與神經(jīng)心理學角度測量智力，不僅測量已有知識水平，而且測量解決新問題的能力。所得分數(shù)便于教育安排上的采用。
另，也有非語言量表

總量表

                  繼時性加工同時性加工  成就量表智力（－設想為解決
                  I.動作模仿    I.圖形辨認 I.詞匯表達       新問題的能力
               II.數(shù)字背誦    II.人物辨認  II.人地辨認    流體智力（先天）
               III.系列記憶 III.完形測驗 III.數(shù)字運用    智力量表分＝
                              IV.圖形組合 IV.物體猜迷    繼時性加工的組分
                              V.圖形類推  V.閱讀發(fā)音 +同時性加工的得分
                              VI.位置記憶 VI.閱讀理解（+非語言量表）
                              VII.照片系列  晶體智力（后天）

§4對智力測驗的反思的評價
1. 存在價值
2. 智力測驗的優(yōu)點
有標準化的過程——最大的優(yōu)點
比通過學業(yè)成就來評價智力要科學得多。——
I. 評價人的各種能力
II. 評價范圍廣
III. 快速、有效
3. 存在的問題與局限性
局限性表現(xiàn)在
I. 智商只提供量的數(shù)據(jù)，而無質(zhì)的分析
II. 只測當時的智力，而不能考慮到以后的發(fā)展速度和趨勢
III. 標準答案有利于聚合思維、抽象思維和推理，而無利于發(fā)散思維
IV. 與文化教育有關，只能部分反映一個人的智力水平。（受理論局限）適應性行為也是智力的一部分。
V. 作智力測驗受很多因素影響（Eg：情緒、動機、疲勞etc）
4. 智力測驗的新理論與新方法。
I. 皮亞杰的發(fā)生認識論
重要的不在于對與錯，而在于怎么推理得到了結果。方法：綜合了觀察、測量、訪談etc，組合成了——臨床法。
II. 生態(tài)文化理論：
強調(diào)重視現(xiàn)時的環(huán)境、情景中人的智力活動。從各種社會環(huán)境中對智力進行評價。

第四章學業(yè)成就測驗
（學績測驗、教育測驗）*特征與智力測驗相比的異用
旨在對學生在某一科目、某一知識中掌握的程度進行評價。
心理測驗中的學業(yè)成就測驗是標準化了的。
§1概述
一．發(fā)展
1.1894，Rice的拼字測驗揭開了標準化測驗的序幕
桑代克——教育測驗之父
（學生）Stune的算術測驗——最早的標準化的學科測驗
桑代克的書法測驗——第一個用科學方法編制的教育測量工具。
2. 性質(zhì)：
學生對某一科目的學習效果，無預測功能。
3. 標準化測驗與白編測驗的不同之處。
I. 教師自編的測驗因教師的進展，班級的情況的不同而不同，易反映所在學校現(xiàn)行的具體的教育目標；標準化中含有的教育目標更普遍。得到很多教育家的共識。
II. 標準化測驗重于理解、思維過程；自編的測驗重于具體知識。
二．成就測驗的類型。
1.（綜合）成套測驗
斯坦福成就測驗（幼級）
學術能力成就測驗
基礎教育及基本技能最低限度測驗
2.單科測驗
3.品質(zhì)量表
4. 教師自編測驗eg:作文（優(yōu)缺點）
要求：
I. 量多，范圍廣，覆蓋面大
II. 學生的回答形式越易越好
III. 要有客觀標準的評分方法
IV. 測驗形式多樣化
V. 盡量用要推理思考的題目，避免機械記憶
                                    第五章人格測驗（個性）
Eysenck Personality Questionnaive (EPQ)
艾森克個性問卷。
1752年             產(chǎn)生N分量表（神經(jīng)質(zhì)）
1959年             E分量表（外傾性）
1964年             L分量表（說謊）
1975年             P分量表（精神質(zhì)）
L量表值超過一定值之后，表明這份測量無效。
克雷普林，榮格。"聯(lián)想法"
武德沃斯
人格測驗的四種形式
一．自陳測驗--基本假設：人對自己最了解。忽略了：了解的正確性，報告的真實性
非自我描述，而是測驗，一般是紙筆測驗
采用是非題或選擇題
1．內(nèi)容消毒人格測驗（早期采用）
      根據(jù)某一種人格理論，來確定要測量的一個特質(zhì)。
      缺點：特質(zhì)與試題的聯(lián)系，過于明顯，容易使結果失真。
2．因素分析人格測驗
      因素間相關較小。一個因素測一種特質(zhì)
eg:Y~G人格測驗
3．經(jīng)驗效標人格測驗
根據(jù)不同的人的反應來編制
eg:MMTI(明尼蘇達。。。)
用詞要盡量中性化
一般加入測慌題目
《卡特爾16種人格因素量表》
（一）根據(jù)"特質(zhì)理論"。特質(zhì)比習慣更一般化。
   整個人格體系所包含的行為都可用語詞表現(xiàn)出來。通過因素分析，找到了15個因素：第二項B是從智力理論而來的。為第16個因素。
   有ABC三個英文版，各187題。
（二）特點：1?？陀^，明確，中性化的詞語
         表面效度低，看不出測什么
         編排
         2．標準化。經(jīng)過三次抽樣，準確性高。測驗程序，抽樣都符合標準化。有部面圖
         3．非單一功能，是多功能的
         十六個因素組合，得次級得一些人格因素
         4．廣普性。
         用來評價正常人。16歲以上到老。
                        8歲到14歲用14P下（或CPQ）
                        5歲到8歲。還有一個量表。
         5．多元性
         信息量大。
（三）要求。1。每題都要選一個答案。
         2．全部要回答
         3．盡量做得快
         4．少選折中得答案
《明尼蘇達多項人格文卷》
         根據(jù)經(jīng)驗效標來測驗。
（一）編制思路和過程
1930～1940
收集1000多個題目，在效標組（異常人）和對照組（正常人）做實驗。為了測多項，要有許多效標組
  10個臨床量表和4個效度量表（Q量表無專門題目）
  13個分量表共654題。（有重疊得題目）。不重復，共550題，其中有16題可用兩次。
  1至399題是測驗用，其他供研究用
（二）施測和評分。約45分鐘，一般不超過90分鐘
有：卡片式；問卷式
男女分開；把重疊的題的答案比較，不同的在6題以上，作廢；這些題與無法回答的題在30題以上，作廢。
疑病癥：          T>60                不愉快，敵意，需求，同情
抑郁癥：          T>70                表現(xiàn)：易怒，膽小，自責
癔?。?nbsp;             T>70                歇斯底里，天真，缺少自知力。用否認，壓抑來處理事情。
精神病態(tài)          高分                很難接受社會價值觀和社會道德規(guī)范易接受反社會行為。
                                       外露，善交際，愛享受，不成熟，家庭關系處理不好，虛偽。
男子氣好氣。（非?。㏕越高，越遠離自己的性別  男：敏感，被動，愛美。（高分）
                                             好攻擊，粗魯（低分）
                                          女：（與男相反）
妄想癥：          T>70                明顯精神病行為：認為自己受欺負--障礙
                  >80(極端)          --精神病
                  ∈[60,70]             --傾向
精神衰弱                               強迫行為，恐怖，刻板，自責，不安。
精神分裂                               分裂的生活方式，退縮，膽小，心情易變，緊張，有奇怪的思想，判斷力差。
                  70～80             有幻想，幻覺
輕躁狂             T∈[70,75]          外露，樂觀，精力過分充沛，易怒，縱酒，輕浮，夸張，過高估計自己
                  >75                情緒反復無常
社會內(nèi)向（非?。?nbsp; 高分                內(nèi)向傾向嚴重
                                       膽小，退縮，屈服，過于謹慎，反應慢
                  低份                外向，沖動，任性，做作，不太真誠
注：要根據(jù)雙高分的原則。高：>60或70
（三）優(yōu)缺點
優(yōu)點：
（I）客觀；與醫(yī)學診斷一致性高
（II）首次把效度量表引入測驗
（III）既可作醫(yī)學診斷，也可以作正常人的人格診斷
（IV）豐富的題庫
      缺點：
（i）人格測驗信度不夠
（ii）易受被試的年齡，性別，學歷，社會環(huán)境的影響
（iii）對人格特質(zhì)的描述多用病理學解釋
（iv）題目多，時間過長易引起煩躁。
二．投射測驗
投射：個體把自己的思想，態(tài)度，愿望，情緒，性格等人格特質(zhì)不自覺地反映于外界事物或他人身上的心理作用。
特點：刺激本身沒有意義。
強調(diào)無意識，否認自陳測驗。
投射測驗的類型：
1．聯(lián)想法
詞的聯(lián)想（榮格）
羅夏墨跡圖 Rorschach Ink-Blot Test
2.構造法
根據(jù)被試看到的圖片，構造一個故事（有過去，現(xiàn)在，將來）。
主題統(tǒng)覺測驗 TAT
兒童主題統(tǒng)覺測驗：(i)動物版 (ii)人物版
3．完成法
提供殘缺不全的圖片或句子，要求補充完整
  語句完成測驗（SSCT）60題（類：家庭，性，人際關系，自我觀念--
4．排選造
  給予幾張照片，按（任何方法）某種順序排列
5．表露法
  讓被試利用某種媒介自由表露心理狀態(tài)
  畫樹測驗
  20個標準
投射測驗優(yōu)缺點
優(yōu)：（I）不受題目限制，可測出題目以外的線索，對人格做出綜合探索
缺：(I)評分缺乏標準，無常模，信效度不夠，不易量化理論深奧，對主試要求高，不易普及
三．評定量表（他評量表）
類型：
1．數(shù)字評定量表
2．圖標評定
3．標準評定
4．強迫選擇評定量表
四．情境測驗
1．品格教育測驗
  主要用來測兒童的品格發(fā)展
（1）誠實測驗。Eg:不肯能成績
（2）自控測驗
（3）公正測驗（多用于幼兒）
      2．情境壓力測驗
eg:無領袖團體情境測驗
  3．優(yōu)缺點：
   優(yōu)：在實際情境中做測驗，表現(xiàn)出來的人格特征較真實，準確。
   缺：實施起來較困難，主試需經(jīng)過嚴格培訓。但仍有誤差。
四種人格測驗的缺陷
（i）人格的定義還不一致。測驗內(nèi)容也不一致。所測的人格特質(zhì)也不相同。
（ii）人格測驗的信度。效度較低。原因在于：人格受情境和個人當時心態(tài)的影響；人格測驗很難找到準確的效標。
（iii）人格測驗編測題很難
（iv）測驗結果的解釋有多樣性。答案無對錯之分。
（v）測驗中有偽裝和社會贊許的反應。
（vi）人格測驗關系隱私問題。
               第六章  態(tài)度測驗法
社會心理學領域多用此測驗法。
一．態(tài)度的性質(zhì)及態(tài)度量表的公用。
1．基本性質(zhì)。
斯賓塞(Spencen)第一次用此詞。
Combell:態(tài)度是針對一組社會事物而產(chǎn)生的具有一致性的反應群。
三個層面：1.認知（尤其是評價性認知）
      2．情感性。
      3．行為傾向。
態(tài)度有方向性；也有強弱之分；有多面性；有三層面一致性。
2．態(tài)度量表：由一組相互有關聯(lián)的陳述句組成，一組態(tài)度語或項目。陳述句的方向，強度是有區(qū)別的。
明確的目的,測題質(zhì)量.數(shù)量是好的態(tài)度量表的決定因素.
   3.功用
(1) 衡量一宣傳工具影響人們態(tài)度的程度.(或政治預測,市場調(diào)查,偏好)
(2) 評估教育的成果
   二.等距量表法
1.根據(jù)研究主題,搜集符合的態(tài)度語100~200句.其中反對及贊成的比例1:1.(或1/3反對,1/3中立,1/3贊成).按反對到贊成份5~7組.
主義:語句通順,簡單;沒有歧義,每句句子對主體有清晰的態(tài)度.
公認的事實不要放在測驗中,無鑒別力.
2.請50~60人對反對至贊成的句子分組,至少7組(客觀,對主體明確的人)
3.對每名態(tài)度語做次數(shù)分布表和累積百分比表
4.畫累積百分比圖
5.找出(又值小的句子,并且在0~11組的分布合理.
1~4→3,5~7→4,8~11→3
三.利克特量表法(Likert)
1.針對一個研究主體,收集有關資料,編制成態(tài)度語(包括肯定的態(tài)度和否定的態(tài)度語).回答分五或六等題目及答案由肯定至否定得5,4,3,2,1分.
總加量表
特點

1)假定每一題都有相同得量值(因為題目要求同質(zhì)性)
  (2)被試對題目得態(tài)度強度可以盡量分出等級.
2.編制方法
(1)項目的制訂  題目性質(zhì)相同
            (若對不同質(zhì)題目的態(tài)度與對研究內(nèi)容的態(tài)度一致,則也可選用)
            不少于20個
(2)預測和評分  選一樣組做預測,看題目是否編得理想
  (預先測驗)    (a值:內(nèi)在一致性)
(3)項目分析分析題目的鑒別力
            被試題目得分由高到低排列,取前后各25%人.
            一個題目

高分中)(同意人數(shù)/高分組人數(shù))－（低分組中）（同意人數(shù)）/低分組人數(shù)）＝鑒別指數(shù)
            鑒別指數(shù)：0.2以下淘汰，0.3以上通過.0.2~0.3修改
四.哥特曼量表法
1.構造原理
項目少(不超過10個),效果較好的一種量表,結構復雜.
每一題程度上有不同
eg:--戰(zhàn)場中的柑桔
      經(jīng)常(a)    有時(b)    只有一次(c) 從來沒有(d)    不予回答(e)
(1) 心臟脈搏跳動很快
(2) 胃有下沉感
(3) 感到虛弱或暈眩
(4) 胃感到不適
(5) 出冷汗
(6) 嘔吐
(7) 全身顫抖
(8) 尿撒在身上
(9) 膀胱失去控制
(10) 有僵硬感覺
(2),(3)題中 a.b.c 一分 ;d.e  零分
其它題中 a.b零分  ;c.d.e 一分
去掉第(5)題
恐懼程度由弱到強:1～2～7～4～10～3～～6～9～8
一道題目：（理論上）
表（略）
2．步驟
（1）設計句子，及五或六種反應態(tài)度
（2）選一個代表性樣組進行預測
（3）把題目按分數(shù)由上到下（從最贊成到最不贊成）排列
3．缺點。
只注重單向性，不注意設計項目。題目。
                        第七章  興趣測驗
一．1915．邁納（Miner） -- 不標準化的
1927 斯特朗（Strong）
         1939  庫德（Kuder）
      高中，高中以后。職業(yè)興趣才穩(wěn)定下來
（15歲～18歲）因為找被試有年齡限制。
可通過(i)興趣表達，(ii)對行為進行觀察，(iii)進行能力測驗(iv)興趣問卷，四個方法來了解個體的興趣。
（綜合以上三種方法，是最常用的）
   只能說明有興趣，未必勝任。
      二．《斯特朗～坎貝爾興趣問卷》
1．評卷（I）瀏覽
      (II)一般職業(yè)框架（轉換成七分）
      低于34，此方面興趣很低
      35～42       低
      43～57       平均
      58～65       高
      高于66       極高
      （III）對照常模
      （IV）做一般解釋，也可再進行特殊分析
2．信度0.80
  效度極好
三．庫德職業(yè)興趣調(diào)查表
強迫選擇
有48個大學專業(yè)量表
信度0.90
另外還有"個人匹配"?？梢陨钊肓私庖粋€人的興趣
      四．自我指導問卷
職業(yè)類型測驗～人格特點
職業(yè)搜索表
先測興趣特征，再根據(jù)人格特點查找興趣
再寫職業(yè)碼。查指南。
現(xiàn)實型（R）,研究型（I）,藝術型（A）
社會型（S）,企業(yè)型（E）,傳統(tǒng)型（C）
eg:心理 AIC
圖（略）

                           第八章測量的誤差
穩(wěn)定性（一致性）
準確性
一．誤差形式
(i) 隨機誤差
(ii) 常定誤差（系統(tǒng)誤差）--只影響準確性，而不影響穩(wěn)定性
(iii) 抽樣誤差
            二．誤差的來源
            1．測驗內(nèi)部引起的誤差（編制過程種，測題本身存在的誤差。）
題目取樣時，題量少，或無代表性
其他編制過程。Eg:句子意義不明確，題目太難，測驗時間設定不對
            2．測驗過程中引起的誤差
a. 物理環(huán)境
b. 主試的情況（尤其對兒童會有影響）
步驟，說明被試是否清楚
兒童，或有情緒障礙的人需先交流
c. 意外干擾eg:團體測量中。
d. 計分過程中eg:不客觀，尺寸掌握不同
            3．來自于被試本身的誤差
               圖（略）

            能力高的人不太會產(chǎn)生焦慮;能力不自信
            求勝心切的人會產(chǎn)生較高；缺乏自信，適應性不強，情緒不穩(wěn)定的人易高焦慮
            很少參加測驗的人，對程序不熟悉易高焦慮
            測驗成績對被試而言很重要。易高焦慮
第九章.測量的信度
信度與隨機誤差的關系：信度大，誤差小
一．信度的定義
實測分數(shù)＝真分數(shù)＋誤差
X＝T＋E
信度：真分數(shù)/實測分數(shù)（真分數(shù)不可能測得，只能通過對誤差的推測來估計）
判斷信度系數(shù)的高低：（能力測驗，信度需0.90，人格（態(tài)度）測驗，0.80）
一．估計信度的方法
1．穩(wěn)定系數(shù)（重測信度）成人隔2，3月至半年
皮爾遜積分相關公式兒童隔1，2周至半個月
r=(∑X1X2/N-#*#)/S1*S2 跨時間的一致性
2．復本信度（等值系數(shù)）
跨形式的一致性。時間間隔不要太長。
3．內(nèi)在一致性。
  跨題目的一致性
  克倫巴赫a系數(shù)：
(i) 分半信度：以奇偶數(shù)分半
r校正=(2*r分半)/(1+r分半
(ii) 庫德--理查遜估計法
K-R 20公式
Rkk=(k/(k-1))*((1-∑PiGi)/Sx2) --適用于二極性的答案
（iii） a=k/(k-1)*(1-∑Si2 /Sx2) --適用于二級以上的答案
內(nèi)在一致性優(yōu)點：只須做一次測驗，信度比以前兩種方式高。注：測驗是同質(zhì)性的或有分量表才可用。
4．因素分析。
5．評分者信度（主觀題）
三．影響信度的因素。
1．不同測驗范圍與信度
分數(shù)分布越大（誤差越?。?，信度高
eg:6~12歲，信度0.95，其中，10歲，信度<0.95
所以被試年齡多，信度易高。
2．測驗長度與信度
題目多，信度高
n=rnn(1-r11)/r11(1-rnn)
r11 原信度  rnn 目標信度
斯皮爾曼--布朗公式  K:改變以后的長度與原長度之比
                     rxx:原長度
r=Krxx /1+(k-1)rxx
3.測驗難度和信度
分數(shù)分散的分布越廣，信度越高
四．測量的標準誤差
尤其適用于解釋個人分數(shù)
標準誤差，誤差分數(shù)分布的標準差。
實踐中，以一組被試兩次測驗的得分代替一個被試多次測量的得分。
Se=St*(1-rtt)1/2
  Eg:韋式測驗  Se=St*(1-rtt)1/2 =3.35
  在95％的置信水平上，被試的區(qū)間。
  3.35*1.96=6.6
  若得分100，在[100-6.6,00+6.6]區(qū)間1概率為95％，也可用標準誤差判斷一名被試兩個測驗的差異
第十章效度
信度只從測量角度評定測驗
效度：測測驗的特性的程度，測測驗是測什么特性。
                                    &1.效度的概述
一．什么是效度
一個測驗的結果必須符合測驗的目的。有效性效度相對信度更重要。
實測分數(shù)＝真分數(shù)＋誤差（隨機）必要條件：信度，效度
效度：實測分數(shù)中與目的有關的真分數(shù)占實測分數(shù)的比例
二．信度與效度的聯(lián)系
三．影響效度的誤差來源
1．測題本身（最主要的來源）
測題長度，編排方式
2．實施過程中
3．被試的反應
四．效度的性質(zhì)
對效度的評價高，中，低
效度通過推測得到
                                       &2.準則關聯(lián)效度或效標效度
eg:智力水平的效標可以是：學習成績，教師評語，以后的成就
  效標：相對的，
      受時間的考驗
  分：同時性
繼時性 eg:將來的工作成就
  效度系數(shù)（測驗分數(shù)與準則的相關程度）
1．相關法
a. 積差相關法兩分數(shù)要求連續(xù)
圖（略）

b.二列相關法（一組分數(shù)連續(xù)，另一組不連續(xù)）
c.多元相關法（有多等級）
2．區(qū)分法（小規(guī)模不易看出有差異，大規(guī)模易看出有差異）
3．命中率
圖（略）

注意：以上三種方法都要求效標的可靠性
&3.內(nèi)容效度
一．包含主要方面
各方面的題目要有比例，有一定難度
學業(yè)成就測驗尤其注重內(nèi)容效度
二．考驗內(nèi)容效度的方法
1．專家判斷
缺陷  (i)無量化指標
(ii)判斷不一致
(iii)由于教育思想不同，所以判斷內(nèi)容范圍時不一致）
2．統(tǒng)計分析法（克倫巴赫提出）
根據(jù)相同的內(nèi)容范圍，編兩套測題，對被試測試，再進行相關處理（類似復本心信度）
3．再測法
兩次測驗，后一次測驗分數(shù)明顯提高，則內(nèi)容效度高（中間有教學）
4．經(jīng)驗法
測驗分數(shù)隨年齡增長而提高，內(nèi)容效度高
  三．內(nèi)容效度和表面效度的關系
被試或外行人從題目看出要測的內(nèi)容。兩者之間不要求同步。表面效度不是一種客觀指標，但會影響被試動機，從而影響內(nèi)容效度。學習成就，職業(yè)測驗，興趣測驗的表面效度高，人格測驗表面效度要低。表面效度降低只要改變措詞。
  四．提高內(nèi)容效度的方法
編制命題雙向細目表
圖（略）
                                       &4.結構效度
一．概述
1954念提出
按一定理論編制測驗，測驗結果證明了理論，則有結構效度
二．考驗結構效度的方法
1．測驗內(nèi)方法
研究測驗的內(nèi)部結構，來界定測驗的結構范圍
(i) 借用內(nèi)容效度（結構效度與之有直接關系）
(ii) 考察測驗的同質(zhì)性
一個因素中的應是同質(zhì)性的，不同因素，之間不能是同質(zhì)性的。
(iii) 分析被試對題目的反應過程外來影響因素越小，結構效度越高
2．測驗間方法
研究幾個測驗（同類）間的相關，來考察是否測同一特質(zhì)。
(i) 相容效度
求一個新測驗與一已有測驗的相關（若無已有測驗，用部分有關系的測驗代替）
(ii) 會聚效度和區(qū)分效度（1960坎貝爾提出）
要求：測同一特質(zhì)的變量有很高相關，并且，測不同特質(zhì)的變量有很低相關，特別適合于人格測驗。多種特質(zhì)--多種方法矩陣
         3．準則關聯(lián)效度研究
對準則的預測水平越高，效度越高，主要看測驗分數(shù)可否區(qū)別不同的人。
Eg:Barron巴龍，自我強度量表
         4．其他變它證據(jù)
隨自然事件的發(fā)生，測驗結果應有所變化
         5．實驗操作
看是否受訓練的影響。Eg:學業(yè)成就--訓練有影響。智商-- 訓練無影響。非訓練測題。
證明了預期，則有效度
         對效度的總結
(i) 任何測驗，都二要效度證據(jù)。不同測驗，偏重于不同種類的效度，實際運用中，多用準則關聯(lián)效度，內(nèi)容效度只需說明。
(ii) 三種效度有不同作用。
結構～：幫助我們運用分數(shù)去解釋人的不同心理特質(zhì)。
準則關聯(lián)～：了解分數(shù)是否可以有效估計某種行為表現(xiàn)
內(nèi)容～：幫助決定分數(shù)是否代表測驗結果。
(iii) 效度分析通常是編完測驗后做，但效度的思想已知影響編制過程。效度比信度更重要
第十一章測驗的實施與計分
&1.測驗的準備
一．測驗者的準備
主試的準備。經(jīng)過嚴格的訓練與考核，熟悉指導語。
二．測驗環(huán)境的準備
1．房間的選擇；2。桌椅安排。（不能太大，易分散主義；不能太小，不易施展開來。一般的光線，溫度，對兒童，引起注意分散的物品拿走）。位置遠離喧鬧，不準有人進出。（主試與被試中不可有一方站著，椅子太高或太低影響視線，桌子太小，傾斜都不能做測驗。不要坐沙發(fā)，轉椅，應是直靠椅背的高度適中，桌面足夠大，不要太寬）
3．測驗材料的準備
4．參加測驗的人員
父母，班主任不可做主試
三．被試的準備。
放在被試最佳心理，生理狀態(tài)
1．選擇的時間（無吸引他們的活動的時間，心理情緒穩(wěn)定，生理狀態(tài)良好的時候）
2．生理的準備（在測驗時無急迫的生理需要）
3．心理的準備，親密關系的建立
(i) 先介紹自己（姓名，職業(yè)）
(ii) 問一些一般的信息，使他高興
(iii) 不直接地講一些"目的"。（避免提"作業(yè)"）
(iv) 對大致的一些任務作介紹（所需時間，將有的活動，測驗的難度，鼓勵他們對不明確的地方立即提一些問題）
&2.測驗的實施
一．作記錄
1．記錄要隱蔽
2．記錄要真是
二．如何對待被試的要求
1．如果被試沒有聽清題意，要求重復，一般允許，但記憶測驗不能重復
2．如果被試要求修改回答，一般允許，但若規(guī)定只記第一時間的反應，則不允許更正。
三．對主試的要求。
1．主試必須集中注意力
2．不能對被試的回答有所暗示
3．適當強化被試的行為（適當鼓勵）
4．鼓勵被試的回答
5．對磨棱兩可的答案，主試先重復回答，再讓被試解釋。若這類答案無論如何理解都錯，則不需追問。
6．對計時題，題目說完就按下表
7．計分嚴格按照手冊要求
                                       &3.測驗的計分
一．年齡的計算法
測驗日期--出生年月
注:借位。有30日，12個月。。。
二．原始分計算法
1．0，1（對，錯）計分法
2．多級計分法
三．原始分換算為標準分數(shù)（以年齡分，以年級分，以百分位。。。來表示）
                                       第十二章。測驗的項目分析
可以分：質(zhì)的分析。專家對項目內(nèi)容，形式進行分析
      量的分析。采用統(tǒng)計方法來測定項目的品質(zhì)。
      包括難度分析與鑒別力分析。
                                                &1.項目的難度
一．難度：測題的難易程度
難度分析在能力測驗中，指：對測題難易程度作標定
      在非能力測驗中，指：對內(nèi)容通俗性和流行性程度作分析在題目范圍之內(nèi)，做回答的人的估計難度的指標。
1．通過率--通過的百分比越高，題目越容易
(i) 二值記分測題：0，1計分
P=R/N（R:通過人數(shù)，N:總人數(shù)）
(ii) 非二值記分的測題
P=＃/#max ＃實際的平均分 # max若都得滿分，所得得平均分。
但，先要做修正以排除"猜"得機率
即：再用校正公式 CP=(KP-1)/(K-1)(K代表"K擇一)
選項數(shù)目不一樣，不可直接比較兩題難度，要做校正。
      （iii）  分組法
            當被試樣本很大，把分數(shù)從高到低排列取高分組，上限27％人；低分組：下限27％ P=(PH+Pz)/2(PH,Pz可用P=R/N 或P=＃/#max 等得)
   2．項目難度的等距量表
（通過率反映出的難度不等距）
二．測驗難度的確定和分數(shù)的分布
  通過率越接近0或1，就無鑒別力；越接近0.5，越有區(qū)分力。
  但每道題都是50％，一方面不太可能做到；另一方面，題目間的相關會很高。所以一般，把測驗的平均難度控制在0.5，而每道題可在0.3~0.7中波動
  若選擇的人數(shù)少，參選的人多，則P可以很小，難度高一些，eg

可在0.05,當從100人中取5人時）
分數(shù)分布是常態(tài)的，測題難度就恰當。
反之，圖（略）

                                    &2.項目的鑒別力（區(qū)分度）
1．鑒別力：測題對于不同水平的被試反應的區(qū)分程度和鑒別能力。
2．鑒別力估計方式：
（1）項目效度分析：主要依據(jù)效標，來考察測驗中的反應與效標的相關
(i) 可用相關系數(shù)
(ii) 用鑒別指數(shù)：分數(shù)從高到低排列，對半分，分高分組，低分組。
小樣本時，D= PH - Pz  指數(shù)越高，鑒別力好。
大樣本時，用兩端來挑高分組，低分組 27％為最佳
（2）有的測量效標難找，就用總分做效標，將每道題的分數(shù)與總分做相關
相關高；鑒別力也高；相關低，鑒別力不夠
計算方法：(i)點二列相關系數(shù)
         rpbi=#p－#g/St(pg)1/2
         #p答對的人的總分平均數(shù)（g=1-p）
         #g 答錯的。。。。。。。。。。。。。
         St標準差
         P為難度值
            條件：測題0；1記分，總分連續(xù)
            (ii)二列相關
            條件：測題與總分都是連續(xù)的值，測驗又認為分成兩類
            rb=#p-#q/St(pg/y)1/2
            (iii)積差相關
(3) 方差法 --看離散程度
一道題目，離散程度大，有區(qū)分度。
3.難度與鑒別力的關系
通過率為1或0，無鑒別力
通過率為0.5，鑒別力為1。
通過率為0.7,鑒別力最大值為0.6（書P124）
                     &3.項目分析實例
一．步驟
1．選取有代表性的樣組，按規(guī)定程序預測
2．批出分數(shù)。按總分高到低排序，高分組，低分組各27％
3．同一測題，高分組，低分組通過人數(shù)比率PH ，Pz
4．分別求出難度，鑒別力
5．比較高分組，低分組在每題答案上的反應。
6．根據(jù)統(tǒng)計結果修改測題
二．實例
題號組別       選答人數(shù)    正確答案       難度    鑒別力
      A B C  D  未答                   p       rb  D
1 高分組 5 92 1  2 0       B          .71    .52  .42
低分組 22  50  12  16 0
2    高    58  10  15  16 1       A          .42    .33  .32
      低    26  21  15  36 2
3    高    17  15  28  28 12    D          .31    .-.04 -.06
      低    25  11  19  34 11
4    高    1 44  14  36 5       C          .12    .08  .04
      低    1 56  10  28 5
1. 首先看鑒別力
1， 2題號，3，4題淘汰或修改
2．難度（0.35～0.65之間最好，總難度要居中）
就難度而言，4個題都可使用
3．選答人數(shù)
異常：
(i) 正確答案無人或很少有人選，選的人數(shù)少于其他答案選的人；選錯的人過多
(ii) 高分組選正確答案的人少于低分組的，高分組選錯人多
(iii) 某一選項無人選擇
(iv) 未答人數(shù)較多
4．修改
&4.準則參照測驗的項目分析
以上的項目分析都是針對常模參照（與常模對照）測驗的。
1．準則參照測驗是測接受訓練/教育的與不接受的人或接受前后一個人的差別。無常模，但有人為制定的標準。
準則參照測驗的難度取決于作為準則的東西。如果準則要求不高，難度可降低；標準高，難度就大。鑒別力同樣看準則，準則要求的內(nèi)容，鑒別力即使低，也要。
具體方法：
按成績分組，達到標準的一組，未達到的一組；計算兩族人對每題的差異。
差異：P=(PH  + Pz )/N
鑒別力

=RH/NH-Rz/Nz  N人數(shù)。R達到標準
2．教育效果敏感指數(shù)（訓練效果）

實例：
學生                      試題
               1    2    3    4    5
               前后前后  前后  前后  前后
A             ＋－－＋  ＋＋  ——  ＋－
B             ＋＋－＋  ＋＋  ——  ＋－
C             －＋－＋  ＋＋  ——  ＋－
D             －＋－＋  ＋＋  ——  ＋－
E             ＋＋－＋  ＋＋  ——  ＋－
F             —— －＋  ＋＋  ——  ＋－
S1=0.5  S2=1  S3=0 S4=0  S5=-1
S∈[-1,1]大于0就有鑒別力，越大越好
                              &5速度測驗的項目分析
有人以答完此題的人數(shù)為指標，不考慮此題為做的人
也有人延長時間，但這忽略了速度因素的影響。
至今，未有很好的分析方法。
                                 第十三章量表和常模
&1.標準化樣組
預測的樣本可以較好地代表全域，則其為"標準化樣組"抽樣：
1．選樣本時，要考慮到與測量有關地變量。Eg:智力測驗時，年齡要注意；地域；性別；父母學歷；家庭經(jīng)濟狀況
若全域中的小團體差異較大，則要分別制定常模
eg:人格測驗分男，女
2．樣組規(guī)模要適當，有條件的化，越大越好。
3．為了克服誤差，抽樣方法很重要
根據(jù)性質(zhì)和任務決定。
不能像調(diào)查一樣"愿者上鉤"
以"概率抽樣"將系統(tǒng)誤差減小到最小，誤差大小事無就可知。
(i) 簡單隨機抽樣
(ii) 分層抽樣。優(yōu)點

1)抽樣的分布反映總體的分布(2)分層抽樣誤差比(i)小；或誤差一樣，但花費較(i)少。
(iii) 整群抽樣。
隨機抽幾個整體（單位團體），其中的每個人都要進入調(diào)查得到的均數(shù)離整體較(i)更遠，所以為了避免此缺陷。樣本要大一些。一般，采取分層抽樣的方法（再在每一層，可用整群抽樣或簡單隨機抽樣。
                           &2.測驗的原始分數(shù)和導出分數(shù)
一．原始分數(shù)(p136)
分數(shù)可以是任意的，沒有意義
修正  Xc=R+O/K
R:正確答對的題數(shù)
O:被忽略的
K:選項數(shù)
二．量表分數(shù)
既有一定的參照，又有一定的單位。轉換后的分數(shù)稱為："導出分數(shù)"。
1．百分量表
注：(i)原始分數(shù)轉換成量表分時，非線性。
原始分布成正態(tài)，百分量表分呈長方形。
         (ii)百分量表是等級量表，不能作加減運算。
   2．標準分數(shù)（Z分數(shù)）
要做運算時可用。是等距量表，把原始分與平均分的差以標準差來表示。
Z=(x-#)/S 注：原始分數(shù)的分布必須是常態(tài)的。是一種線性轉換
優(yōu)點：
(i) 可以做進一步統(tǒng)計分析，加減等運算
(ii) 可以對兩個以上的分數(shù)作比較
缺點：
(i) 計算，統(tǒng)計原理較復雜，不易使外行看懂，不能普及
(ii) 有負值，運用起來不方便；單位可能過大
(iii) 若原始分有問題，無法校正
   3．常態(tài)化
      原始分數(shù)～百分比數(shù)～Z分數(shù)
三．標準分數(shù)的變化
1．7分數(shù)
以50為均數(shù)，10為標準差。T=50+10Z
2．標準九
1，2，3，4，5，6，7，8，9
分為九個等級，5為均數(shù)，2為標準差
相應百分比：4％，7％，12％，17％，20％，17％，12％，7％，4％
3．發(fā)展量表
年齡量表，年級量表
a.智齡。
三．剖面圖
使人們對測驗結果一目了然。
                                 第十四章編制測驗的方法
&1.測驗目的的確立和材料的選擇
  一．測驗目的的確立
1．把目標具體化
2．測驗的對象確立（團體/個體）
3．測驗的用途（善查/診斷。。。）
4．類型（常模參照/標準參照）
5．被試的文化背景
  二．制定編制計劃（藍圖）
考慮測驗內(nèi)容，技能，重要程度（比重）
  三．測驗材料的選擇
原則：1.取樣材料豐富，函概各放面
      2．材料有普遍性，對全部被試公平
不同測驗還有不同原則。材料有趣（尤其對幼兒）
  四．測驗形式的選擇
                                       &2.測題編制技術
一．命題的一般原則
1．測題內(nèi)容有代表性
2．測題難度有一定的分布范圍
3．測題的文字簡明，避免用深奧的詞（避免雙重否定）
4．各測題之間要相互獨立
5．正確答案只有一個（人格，創(chuàng)造力測驗除外）
6．測題內(nèi)容不能超出被試的團體水平
7．所提問題避免社會禁忌或個人隱私
策略:
(1) 先假定被試采取肯定態(tài)度，編題
(2) 假定問題，無所謂好壞
(3) 指出該行為不是異常的，而是普遍的
8．測題數(shù)目比正式題目要多一倍，便于篩選
二．測題格式的種類
1．自由反應型
（1）是非題
猜對的可能大，因為標準化測驗中不用
注：
(i) 不能包含暗示，"所有""都"。。。有否定暗示
(ii) 一題只能包含一個概念
(iii) 題目表述簡潔，用正面陳述，不要用反面陳述或雙重否定
(iv) 選擇"是""否"數(shù)量差不多
(v) 測題不能太少，至少30～50題
   （2）  選擇題
包含：詞干（詞句或不完整的陳述句），選項（4～5各）每題數(shù)目一致?？煽疾?，記憶，鑒別，推理。。。
缺點：編幾個選項有難度，其間有關聯(lián)
注：
(i) 選項4～5各，且每題的數(shù)目一致
(ii) 錯誤選項不要太明顯，錯誤選項，高分組很少有人選，低分組有較多人選，錯誤選項被選到的概率要差不多。
(iii) 不要把選項放在詞干當中
(iv) 各選項在形式上要已知（eg:都是圖形，或數(shù)字符號。。。）
(v) 選項間不應相互重疊。
(vi) 選項中相同的詞可放在詞干中。
(vii) 選項中正確答案的位置隨機排列。
（3）匹配題
(i) 幾個題目內(nèi)容形式上一致
(ii) 知道語中講明匹配的依據(jù)
(iii) 配對項目不要太多，最多十對。
(iv) 同一項目不要印得分開來。用于測概念或事實間的盥洗1
（4）排列題
依據(jù)大小，時間。。。，將項目重新排列
   （5）最好理由題
（6）聯(lián)想型
評判難把握。
                  &3.預測和測題分析
一．預測
目的：為了對測題進行修正
注：
(i) 預測對象即以后正式測驗要測的被試。人數(shù)不宜太多，也不能太少。一般，智力測驗要30人以上，學業(yè)成就測驗要370人左右。
(ii) 預測與正式測驗的程序是一樣的
(iii) 預測的時間可以放長（速度測驗例外）
(iv) 詳細記下被試的反應，記下完成的時間。記下可能產(chǎn)生誤解的題目。
二．測題分析（項目分析）
難度
鑒別力。區(qū)分等級越多越好
聚類分析。
把相似的內(nèi)容歸為一類。
因素分析
                                       &4.測題的選擇，編排和測驗的標準化
步驟：
1．確定取舍標準
原則：(1)根據(jù)鑒別力  (2)再選難度適中的題目，特別難與特別容易的也要選一些（人格測驗等降低難度要求） (3)測驗長度也有要求1小時左右，測驗長度也取決于被試的年齡
2．編排原則與方法：
一般在開頭有非常容易的題目
題目從容易到難，在測題最后放最難的題目。
編排形式：(i)并列直進式 -- 有分測驗
      (ii)混合螺旋式 -- 無分測驗，純粹按難度（優(yōu)點，被試不感到枯燥）
3．測題性能的復核
再做一次預測
4．編制復本為了增加實用性
在難度上不能與原來有差別
"蛇"形排列。把所有題目按難度排好，標題號。
Eg: A版 1 3 5 …
B 版 2 4 6…
復本再做預測及分析。
5．標準化
（i）內(nèi)容方面的標準化 eg:A,B版題目等值。
（ii）實施上標準化：規(guī)定統(tǒng)一指導語及時間限定。
（iii）評分時標準化
&5.測驗基本特征的鑒定
信度，效度，量表，常模及指導手冊
                                    第十五章總結
心理測量的不足（失真）
1．編制者依據(jù)的理論是否可以解釋所要測量的心理特性
2．確定反應心理結構的行為樣組有局限，不夠全面
3．預測的鑒定建立在概率論與統(tǒng)計上
4．實施過程中的客觀影響不能反映被試的真是水平或態(tài)度。