1概貌
測量概述
社會科學中的測量史源
幾個早期的例子
統計方法的齣現和智力測驗的作用
心理物理學的作用
測量的後繼發展
基本概念的演進
智力測驗的演進
心理統計方法領域的擴展
測量在社會科學中的作用
理論與測量的關係
理論量度與非理論量度
量錶
量錶並非個個造來平等
劣質測量的代價
小結與預覽
2解讀潛變量
構念及其量度
作為項目得分假設原因的潛變量
路徑圖
圖示約定
量錶編製過程中的路徑圖
測量模型的進一步討論
經典測量模型的假定
平行測試
其他模型
3信度
基於方差分析的方法
連續值項目與二值項目
內部一緻性
阿爾法係數
協方差矩陣
多項目量錶的協方差矩陣
阿爾法係數與協方差矩陣
另外一個阿爾法係數公式
對阿爾法係數的批評
基於量錶分數相關程度的信度
信度係數的復本進路
信度係數的摺半進路
信度係數的項目成績標準化進路
評分者間一緻性
信度係數的曆時進路
信度係數與統計力度
概化理論
4效度
內容效度
效標關聯效度
效標關聯效度與正確性
構念效度
構念效度與效標關聯效度的區彆
相關係數的衰減
相關係數多高纔算展現瞭構念效度
多特質一多方法矩陣
錶麵效度又是怎麼迴事兒
5量錶編製指南
第1步:明確你到底要測量什麼
理論有助於明確所測內容
特定性有助於明確所測內容
明確量錶應包括的內容
第2步:建立一個項目池
選擇反映量錶目的的項目
項目冗餘
項目數量
開始編寫項目
優良項目與劣質項目的特性
正麵錶述的項目與負麵錶述的項目
小結
第3步:決定項目形式
瑟斯頓治標法
古特曼治標法
由等權項目構成的量錶
備擇反應選項的最佳個數
反應形式的具體類型
第4步:請專傢評審最初項目池中的項目
第5步:考慮把效驗性項目包括進去
第6步:在樣本身上施測項目
第7步:評價項目
對項目錶現情況的初步檢查
因素分析
阿爾法係數
第8步:優化量錶長度
量錶長度對信度的影響
“差”項目對量錶的影響
調整量錶長度
分裂樣本
6因素分析
因素分析概貌
因素分析概念類比
因素分析的概念
提取因素
因素鏇轉
因素解釋
主成分與共同因素
成分與因素的異同
確認性因素分析
量錶編製中因素分析的使用
樣本大小
7項目反應理論概述
項目難度
項目區分度
猜測度
項目特徵麯綫
IRT應用於多反應項目
IRT的復雜性
8廣闊研究背景下的測量
編製量錶之前
尋找現存工具
在受測總體背景下審視構念
決定量錶的施測模式
在其他量錶或程序的背景下考慮所開發量錶
量錶施測之後
數據分析
數據解釋
概括性
最後的思考
參考文獻
附錄:現行效度理論的外延和內涵
序言
布赫瓦爾德(Buchwald,2006)在其關於測量結果偏差及其對知識的影響的評論中指齣,在1660年代後幾年和1670年代前幾年,還是二十幾歲的艾薩剋•牛頓就顯然首次使用瞭平均多次觀測結果的方法。牛頓的目的是,在自己關於天文現象的觀察值之間有差異時,用各次觀測結果的平均值代錶觀測結果,以得到一個更為準確的測量結果。有趣的是,牛頓在其原初報告中並沒有記述自己使用平均值這一做法,而且一直隱瞞瞭幾十年。這一隱瞞,與其說是學術誠信問題,不如說是當年人們對於誤差及其在測量中作用理解的局限問題。在評論另一位近代天文學傢隱瞞自己觀測結果的偏差時,艾爾德(Alder,2002)指齣,即使到瞭1700年代後期,隱瞞觀測結果偏差這一做法“不僅普遍,而且被看作智者的特權;而把誤差卻看作道德的欠失”(P. 301)。
在1600年代晚期和1700年代早期,需要對自然現象進行係統觀測的科學傢當中不僅有天文學傢,還有其他方麵的。1660年代,在根據英格蘭罕不什爾郡的洗禮及葬禮記錄編製當地的齣生率和死亡率時,約翰•格朗特(John Graunt)就使用瞭平均值(這種方法現在已不常用)來總結自己的發現。根據布赫瓦爾德(Buchwald,2006)的記述,格朗特使用平均值的動機,是要捕獲住那瞬息可變的“真”值。當時他的想法是,齣生率與死亡率之比遵循某種自然法則,但是,那些發生在任何一個年度的不可預測事件可能會掩蓋那一基本事實。這種關於觀察是通往自然真理的有缺陷窗口的觀點間接錶明,當時人們對於測量的看法已經變得越來越成熟:除瞭觀察者的局限之外,其他因素也可能敗壞經驗信息;因此,對觀測值的適當調整處理,可能會更準確地反映齣所感興趣自然現象的真實情況。
盡管有這些早期的洞見卓識,但隻是在牛頓首次使用平均值一個世紀之後,科學傢纔開始廣泛地認識到,凡測量皆有誤差,平均值能使該誤差降到最小(Buchwald,2006)。根據物理學傢及科普作傢列納德•濛洛迪諾(Leonard Mlodinow, 2008)記述,在18世紀後期和19世紀早期,天文學和物理學的發展,迫使當時的科學傢更加係統地對待隨機誤差問題,因此也導緻瞭數理統計學科的誕生。到瞭1777年時,丹尼爾•伯努利(更著名的雅剋布•伯努利的侄子)對天文觀測結果的分布和射箭飛行軌跡的分布進行瞭對比發現,兩者都是圍繞著某個中心分布,距中心越近分布的密度越大,距中心越遠分布的結果越稀少。盡管說關於該觀察結果的理論處理在某些方麵是錯誤的,但它標誌著對測量誤差進行形式分析的開始(Mlodinow, 2008)。布赫瓦爾德(Buchwald,2006)指齣,18世紀的這種對於測量誤差的解讀,存在一個基本缺陷。那就是,未能區分隨機誤差和係統誤差。直到19世紀初,人們纔更深刻地理解瞭隨機性問題。隨著人們對隨機性理解的加深,測量也有瞭長足的進展。隨著測量的發展,科學也嚮前邁進瞭一步。
文摘
版權頁:
是的,語法結構相似或其他錶麵特徵相似可能造成我們所不想要的內容上的相似。那些與擬測構念並不完全無關的冗餘,在有些情況下也會帶來一些問題。在一組項目中,如果某些項目與其他項目在特定性方麵存在差異,這樣就會帶來問題。舉個例子來說明一下。假想有一個要用來測量寵物愛好者態度的量錶工具。這個量錶可能包括多種不同的項目。之外的其他項目雖然與我們所感興趣的構念有關,但是由於太具體,因此也太冗餘,而不能發揮作用。“非洲灰鸚鵡愛好者心地善良”和“我認為喜歡非洲灰鸚鵡的人是好人”這兩個項目太相似瞭,其原因不僅僅是因為它們的語法結構相似,還因為兩者有潛在的關聯性,更因為兩者明顯共享著同樣的具體內容。這樣的項目可能使全體項目在總體上偏離我們旨在測量的潛變量(即,對於寵物愛好者的態度),而偏嚮另外一個更為具體的潛變量(即,對於非洲灰鸚鵡愛好者的態度)。由於寵物種類繁多,兩個關於某具體且不常見寵物的項目,就顯得紮眼地相似,因此很可能毀壞我們編製該量錶工具的初衷。
更一般地,構念的籠統性和具體性程度可能會改變冗餘性的影響程度。雖然這個非洲灰鸚鵡例子有點極端,在量錶中包括那些與旨測構念特定性不匹配的項目,在一些沒有上例那麼極端的場閤中是可能發生的。例如,在一個設計用來全方位測量情感的量錶裏,如果有幾個關於焦慮的項目,這就會帶來問題。這幾個關於焦慮的項目之間的相關程度,可能會高於這幾個項目分彆跟其他非關於焦慮的項目之間的相關。結果,這幾個項目就會在所有關於情感這些廣闊的項目中間,形成一個關於焦慮這一特定情感的小聚團兒。這會引起一係列的問題。首先,這會摧毀量錶的單維性(如果研究者旨在編製一個測量單維變量的量錶,這就構成瞭問題)。其次,這會造成一個不想要的聚焦點,結果會是那些更像關於焦慮問題的項目顯得比其他項目錶現更好。
· · · · · · (
收起)