什么是測試效度的概念意思
測試效度是一套測試是否達(dá)到了它預(yù)定的目的以及是否測量了它要測量的內(nèi)容。那么你對測試效度了解多少呢?以下是由學(xué)習(xí)啦小編整理關(guān)于什么是測試效度的內(nèi)容,希望大家喜歡!
什么是測試效度
測試效度(test validity)亦稱測試的有效性,指一套測試對應(yīng)該測試的內(nèi)容所測的程度。也就是說,一套測試是否達(dá)到了它預(yù)定的目的以及是否測量了它要測量的內(nèi)容。例如:“Is photography an art orscience?Discuss.”這種題目以攝影的知識為前提和主要內(nèi)容,用來考語言能力,就不具有效性。又如用聽寫來測量學(xué)生的聽覺能力,其效度也是不理想的,因為書面記錄有聲語言不僅涉及學(xué)生的聽覺能力,而且還與他們的書寫速度、拼寫能力、語法知識、記憶能力和對全文的理解能力等有關(guān)。
測試的效度的分類
1)表面效度(face validity)
指測試應(yīng)達(dá)到的卷面標(biāo)準(zhǔn),即一套測試題從表面看來是否是合適的。例如,若一次閱讀理解力的測試包括許多受試者沒有學(xué)過的方言詞匯,則可認(rèn)為這次測試缺乏表面效度。表面效度是測試出受試者正常水平的一種保證因素。
2)內(nèi)容效度(content validity)
指一套測試題是否測試了應(yīng)該測試的內(nèi)容或者說所測試的內(nèi)容是否反映了測試的要求,即測試的代表性和覆蓋面的程度。例如,如果某一套發(fā)音技能測試題僅僅考查發(fā)音所必須具備的某些技能,如只考單一音素的發(fā)音,而不考查重讀、語調(diào)或音素在詞語中的發(fā)音,那么,該測試的內(nèi)容效度就很低。
3)編制效度(construct validity)
指一套測試題的諸項目對編制該測試所依據(jù)的理論的各個基本方面的反映程度。例如,以結(jié)構(gòu)主義語言理論為基礎(chǔ),認(rèn)為系統(tǒng)的語言習(xí)慣是通過句型而獲得的,那么,強(qiáng)調(diào)詞匯和語法環(huán)境的測試題目就失去了編制效度。
4)經(jīng)驗效度(empirical validity)
經(jīng)驗效度是一種衡量測試有效性的量度,通過把一次測試與一個或多個標(biāo)準(zhǔn)尺度相對照而得出。經(jīng)驗效度可分為兩種:一是共時效度(concurrent validity),即將一次測試的結(jié)果同另一次時間相近的有效測試的結(jié)果相比較,或同教師的鑒定相比較而得出的系數(shù);二是預(yù)測效度(predictive validity),即將一次測試的結(jié)果同后來的語言能力相比較,或是同教師后來對學(xué)生的鑒定相比較而得出的系數(shù)。
一般來說,對某次測試的效度進(jìn)行檢驗時,除了要根據(jù)教學(xué)大綱的要求和觀念有效性的理論對試卷的內(nèi)容進(jìn)行考查以外,還須采用計算相關(guān)系數(shù)的定量方法,即計算出本次試卷與另一份已被確定能正確反映受試者水平的試卷之間的相關(guān)系數(shù)。系數(shù)高則有效性大。課堂測試的效度應(yīng)在0.4-0.7之間,規(guī)模較大的測試其效度應(yīng)在0.7以上。
測驗的因素
由測驗本身帶來的影響因素有測驗題目的質(zhì)量、測驗實施中的干擾、測驗的長度、被試的因素等。
測驗題目的質(zhì)量
題目的指導(dǎo)語不明確、試題的表達(dá)不清晰、試題太難或太容易、題目中出現(xiàn)額外的線索、誘答設(shè)計不合理、題目過少、試題的安排和組織不恰當(dāng)、試題不符合測驗?zāi)康牡纫蛩?,都會影響測驗的效度,使效度降低。
實施測驗時的干擾因素
測驗的環(huán)境太差、被試不遵從指導(dǎo)語、記分錯誤,都會使測驗的效度降低。
測驗的長度
一般來說,增加測驗的長度通??梢蕴岣邷y驗的信度,而效度系數(shù)能否達(dá)到最大值也受信度的影響,因此,增加測驗的題目往往也能提高測驗的效度。不過,效度增加的前提是這些增加的題目必須與測量的目標(biāo)相關(guān)。
被試的影響因素
被試的反應(yīng)定勢、測驗動機(jī)、情緒和身心狀態(tài)都會對測量效度的影響。
看過“測試效度是什么“的人還看了:
1.大學(xué)英語四六級考試聽力試題調(diào)整說明(附樣題)
4.大一心理考試論文