- 相關(guān)推薦
運(yùn)用教育測(cè)量知識(shí)進(jìn)行數(shù)據(jù)分析與處理
教育測(cè)量是對(duì)學(xué)習(xí)能力、學(xué)業(yè)成績(jī)、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測(cè)定。下面由小編為大家整理的運(yùn)用教育測(cè)量知識(shí)進(jìn)行數(shù)據(jù)分析與處理要點(diǎn),歡迎大家閱讀瀏覽。
運(yùn)用教育測(cè)量知識(shí)進(jìn)行數(shù)據(jù)分析與處理
教育測(cè)量是對(duì)學(xué)習(xí)能力、學(xué)業(yè)成績(jī)、興趣愛好、思想品德以及教育措施上許多問題的數(shù)量化測(cè)定。測(cè)量要具備單位、參照點(diǎn)、量表。教育測(cè)量中所使用的量表多以文字試題的形式出現(xiàn),也有以圖形、符號(hào)、操作要求形式出現(xiàn)的。
(一)基本概念
1.教育測(cè)量
教育測(cè)量有廣義和狹義之分。從廣義上說,教育測(cè)量泛指運(yùn)用測(cè)量手段對(duì)教育活動(dòng)所進(jìn)行的量的測(cè)定。它涉及的范圍很廣,凡是需要并能夠測(cè)量的與教育有關(guān)的活動(dòng)均在研究之列,如教育投入、教育過程各要素、教育的效果等。從狹義上講,教育測(cè)量專指按一定規(guī)則對(duì)學(xué)生的知識(shí)、智能、個(gè)性發(fā)展、思想品德等所進(jìn)行的量的測(cè)定。通常所提及的多是狹義上的教育測(cè)量。
2.教學(xué)評(píng)價(jià)
教育評(píng)價(jià)是按照一定標(biāo)準(zhǔn),運(yùn)用科學(xué)可行的方法,對(duì)教育活動(dòng)所進(jìn)行的價(jià)值判斷的過程。它包括對(duì)教學(xué)過程和教學(xué)效果的評(píng)價(jià),諸如學(xué)校、教師的教學(xué)工作、課堂教學(xué)、教學(xué)方法、模式和內(nèi)容以及學(xué)生的學(xué)業(yè)成就、一般智能發(fā)展、個(gè)性發(fā)展、思想品德狀況等評(píng)價(jià)。
3.測(cè)驗(yàn)及其種類
測(cè)驗(yàn)是指對(duì)通過一定的儀器和試題所引起的受測(cè)者的行為樣本進(jìn)行測(cè)量的系統(tǒng)程序。教育測(cè)量的對(duì)象和內(nèi)容是非常豐富的。測(cè)驗(yàn)作為教育測(cè)量的主要工具,種類也很繁多,可按不同標(biāo)準(zhǔn)加以分類。按測(cè)驗(yàn)的功用分類:(1)學(xué)績(jī)測(cè)驗(yàn);(2)能力測(cè)驗(yàn);(3)人格測(cè)驗(yàn)。
按測(cè)驗(yàn)的目的分類:(1)診斷性測(cè)驗(yàn);(2)形成性測(cè)驗(yàn);(3)終結(jié)性鋇4驗(yàn)。
按解釋分?jǐn)?shù)和方法分類:
(1)常模參照測(cè)驗(yàn)
指參照被測(cè)群體的實(shí)際水平解釋分?jǐn)?shù)的測(cè)驗(yàn)叫做常模參照測(cè)驗(yàn)。群體的平均分?jǐn)?shù)一般可以反映群體的水平,稱為常模。以常模為參照點(diǎn),將被測(cè)個(gè)人的成績(jī)與常模比較,并把比較結(jié)果所反映出來(lái)的差異數(shù)量化,作為導(dǎo)出分?jǐn)?shù)。參照常模解釋分?jǐn)?shù),便于比較和選拔工作的進(jìn)行,它屬于相對(duì)評(píng)價(jià)的范疇。例如,在升學(xué)考試中,按標(biāo)準(zhǔn)化的要求進(jìn)行的分?jǐn)?shù)轉(zhuǎn)換就是參照常模得出的。
(2)目標(biāo)參照測(cè)驗(yàn)
參照被測(cè)達(dá)到目標(biāo)的程度來(lái)解釋分?jǐn)?shù)的測(cè)驗(yàn),叫做目標(biāo)參照測(cè)驗(yàn),也稱作標(biāo)準(zhǔn)參照測(cè)驗(yàn)。通過與特定的標(biāo)準(zhǔn)進(jìn)行比較,了解被測(cè)的達(dá)標(biāo)程度,這是一種絕對(duì)評(píng)價(jià)方法。例如,畢業(yè)考試就是以某一學(xué)段的教育目標(biāo)為標(biāo)準(zhǔn),衡量學(xué)生的達(dá)標(biāo)情況而進(jìn)行的。
4.測(cè)量的要素測(cè)量的三要素:
、賲⒄拯c(diǎn)。分絕對(duì)零點(diǎn)和相對(duì)零點(diǎn)。教育測(cè)量所應(yīng)用的參照點(diǎn)都是相對(duì)零點(diǎn)。
、诮y(tǒng)一的單位。
、哿烤(測(cè)量工具)。教育測(cè)量常用的工具是試卷,而試卷由測(cè)題構(gòu)成,故我們必須高度重視命題的研究,提高試題的質(zhì)量,這樣才能保證測(cè)驗(yàn)的可靠性和有效性。
(二)數(shù)據(jù)整理
在教育測(cè)量中。通過各種測(cè)驗(yàn)獲得大量分?jǐn)?shù),這些雜亂無(wú)章的分?jǐn)?shù)有三個(gè)問題:一是看不清它們的分布形態(tài),二是不了解它們的特征和變化規(guī)律,三是每個(gè)分?jǐn)?shù)表達(dá)的意義含混模糊。因此,需要對(duì)零亂分散的分?jǐn)?shù)進(jìn)行整理和分析,以便在此基礎(chǔ)上做出解釋和評(píng)價(jià)。
1.分?jǐn)?shù)整理
(1)順序排列表
順序排列是簡(jiǎn)單的整理分?jǐn)?shù)的方法。它是將所有個(gè)體的成績(jī),按高低順序排列,并且列于表中,稱作順序排列表。這種方法簡(jiǎn)明清晰,一眼便能看到最高分?jǐn)?shù)和最低分?jǐn)?shù),而且可以大致了解個(gè)體成績(jī)
在總體中的位置。(2)頻數(shù)分布表是一種反映數(shù)據(jù)分布情況的統(tǒng)計(jì)表。所謂頻數(shù)是指一群數(shù)據(jù)在各個(gè)數(shù)值(或區(qū)間)上
所出現(xiàn)的數(shù)據(jù)的個(gè)數(shù),也稱為次數(shù)。每一個(gè)頻數(shù)除以數(shù)據(jù)的總個(gè)數(shù)稱為頻率,或稱相對(duì)次數(shù)。
(3)頻數(shù)直方圖
由頻數(shù)分布表可以制作頻數(shù)直方圖。方法是:以分?jǐn)?shù)為橫軸,頻數(shù)為縱軸,建立直角坐標(biāo)系,在橫軸上標(biāo)出各組分?jǐn)?shù)的組中值,頻數(shù)值等距標(biāo)在縱軸上;然后以組中值為底邊中點(diǎn),組距為底邊,組頻數(shù)為高作出各矩形。即得頻數(shù)直方圖。
(三)統(tǒng)計(jì)數(shù)據(jù)
1.算術(shù)平均數(shù)一組數(shù)值的總和除以數(shù)據(jù)的總頻數(shù)所得的商稱為算術(shù)平均數(shù),簡(jiǎn)稱平均數(shù)。
2.方差
一組數(shù)據(jù)中。各個(gè)數(shù)據(jù)與平均數(shù)之差的平方和的算術(shù)平均數(shù)稱為這組數(shù)據(jù)的方差。又叫均方差或變異數(shù)。用符號(hào)S2或σ2表示。
3.標(biāo)準(zhǔn)差
方差的算術(shù)平方根稱為標(biāo)準(zhǔn)差。用符號(hào)S或σ表示。
標(biāo)準(zhǔn)差是反映全體考生分?jǐn)?shù)之間的離散程度和差異情況。它與平均分一起使用,決定了某次考試分?jǐn)?shù)分布情況。σ值越大,表示部分考生離平均分的“差距越大”,也就是分?jǐn)?shù)分布較廣;σ值越小,則分?jǐn)?shù)分布較窄或說“集中在平均分附近”。
4.差異系數(shù)
標(biāo)準(zhǔn)差較準(zhǔn)確地反映了一組分?jǐn)?shù)的離散程度,它與原數(shù)據(jù)的單位相同,是一種絕對(duì)差異量數(shù)。在進(jìn)行不同組間離散程度比較時(shí),適用于單位相同、平均數(shù)相近的情況。如果各組數(shù)據(jù)單位不同,或雖然單位同但平均數(shù)相差甚遠(yuǎn)時(shí),不能直接用標(biāo)準(zhǔn)差比較,這時(shí)應(yīng)使用差異系數(shù)。
5.標(biāo)準(zhǔn)分?jǐn)?shù)(Z分?jǐn)?shù))
標(biāo)準(zhǔn)分?jǐn)?shù)是以平均分為參照點(diǎn),標(biāo)準(zhǔn)差為度量單位的分?jǐn)?shù)。它具有重要理論價(jià)值和應(yīng)用價(jià)值。
6.難度
難度是指試卷(題)的難易程度。一般用試卷(題)的得分率或答對(duì)率(P)表示,所以難度事實(shí)上是容易度。P值在0~1之間,數(shù)值越大,說明試卷(題)越容易。
一般情況下,測(cè)驗(yàn)的平均難度接近O.50時(shí),分?jǐn)?shù)趨于正態(tài)分布,否則分?jǐn)?shù)分布將出現(xiàn)偏態(tài)。就整個(gè)測(cè)驗(yàn)而言,當(dāng)平均難度為0.5且題目組間的相關(guān)為零的情況下,分?jǐn)?shù)呈正態(tài)分布,而難度值越小,則題目越難,低分段人數(shù)必然較多。難度值越大,題目越容易,分?jǐn)?shù)將大部分集中在高分區(qū)。這樣,在分?jǐn)?shù)的分布上,就會(huì)呈現(xiàn)出兩種不同的偏向,前者為正偏態(tài)。后者為負(fù)偏態(tài)。
7.區(qū)分度
區(qū)分度是試題對(duì)不同考生的知識(shí)、能力水平的鑒別程度。如果一個(gè)題目的測(cè)試結(jié)果使水平高的考生答對(duì)(得高分),而水平低的考生答錯(cuò)(得低分),它的區(qū)分能力就很強(qiáng)。題目的區(qū)分度反映了試題這種區(qū)分能力的高低。一般認(rèn)為,區(qū)分度的數(shù)值達(dá)到了0.3.便可以接受;達(dá)到了0.3以上為好的題目:在0.4以上為優(yōu)秀題目:低于0.3的題目,區(qū)分能力差。
可見,題目區(qū)分度的實(shí)質(zhì)是用以鑒定一個(gè)題目有效性的指標(biāo),它的高低變化對(duì)測(cè)驗(yàn)的質(zhì)量具有深刻的影響。與題目的難度相比,人們更關(guān)注題目的區(qū)分度的高低,并以此作為篩選和修改試題的主要依據(jù)。
試題的區(qū)分度的計(jì)算比較方便的方法有以下兩種:(1)得分率求差法
將受測(cè)群體按題目得分的高低排列,取高分人數(shù)的27%為一組,他們的得分率記作Ph;低分人數(shù)的27%為另一組,他們的得分率記作PV,用D表示區(qū)分度,則該題的區(qū)分度為
(2)得分求差法
將受測(cè)群體按題目得分的高低排列,取高分人數(shù)的27%為一組,低分人數(shù)的27%為另一組,用D表示區(qū)分度,用日表示高分組得分總和,用1表示低分組得分總和,用n表示高分組(低分組)人數(shù), Xh表示該題的最高得分,X1、該題的最低得分,則
8.信度
信度是衡量測(cè)驗(yàn)分?jǐn)?shù)一致性或可靠性的一個(gè)指標(biāo),即用一個(gè)或一組測(cè)驗(yàn)對(duì)同一被試群體施測(cè)多次,所得結(jié)果的一致性的程度,以及測(cè)驗(yàn)分?jǐn)?shù)所反映被試真實(shí)水平(即真分?jǐn)?shù))的可靠性程度。
(1)分半相關(guān)
將全卷中全部試題按題號(hào)或分?jǐn)?shù)適當(dāng)分半,得到兩個(gè)平行的“子試卷”,計(jì)算這兩個(gè)子試卷考生得分的相關(guān)系數(shù),這樣求得的是半個(gè)試卷的信度,然后再用斯皮爾曼一布郎(Spearman—Brown)公式校正,得到考試的分半信度系數(shù)。一般認(rèn)為分半信度系數(shù)在0,90以上比較合適。這個(gè)方法比較適合多數(shù)為選擇題的試卷。
(2)內(nèi)部一致性信度
通常采用的是克倫巴赫(Cronbach)的α-系數(shù)公式,它適用于非選擇題(多重記分)較多的試卷。α-系數(shù)為試卷信度的最低限,一般認(rèn)為其值在0,80以上,考試的信度比較好。
9.效度
效度是測(cè)驗(yàn)有效性或準(zhǔn)確性的指標(biāo)。由于效度分析可以針對(duì)各種要求和運(yùn)用各種程序,而在特定的條件下,使用不同的分析方法可以得到不同的效度。因此,一個(gè)測(cè)驗(yàn)可以具有不同的效度指標(biāo)。當(dāng)我們討論一個(gè)測(cè)驗(yàn)的效度時(shí),只有界定了它的條件,效度才有確切的意義。
對(duì)常模參照測(cè)驗(yàn)來(lái)說,主要有效標(biāo)關(guān)聯(lián)效度、內(nèi)容效度和結(jié)構(gòu)效度。
(1)效標(biāo)關(guān)聯(lián)效度
測(cè)驗(yàn)的效標(biāo)又可稱為準(zhǔn)則,它是衡量測(cè)驗(yàn)效度的參照標(biāo)準(zhǔn)。我們可以用一類標(biāo)準(zhǔn)化測(cè)驗(yàn)作為某次測(cè)驗(yàn)的效標(biāo)(如國(guó)家級(jí)高考、省級(jí)各類會(huì)考等),用積差相關(guān)法計(jì)算效度。
由于客觀上的種種原因,難以確定有效的效標(biāo),因此,效度的計(jì)算,采用求平均區(qū)分度代替。
(2)內(nèi)容效度
測(cè)驗(yàn)的題目對(duì)所要測(cè)量的內(nèi)容具有代表性的程度稱作內(nèi)容效度。它反映測(cè)驗(yàn)題目在所要測(cè)量的內(nèi)容范圍和教學(xué)目標(biāo)內(nèi)取樣是否充分和確切的問題,主要用于學(xué)科成績(jī)測(cè)驗(yàn)。內(nèi)容效度一般不用數(shù)量化指標(biāo)來(lái)表示,主要依靠在某種依據(jù)的基礎(chǔ)上作出邏輯分析。為了提高測(cè)驗(yàn)的內(nèi)容效度,首先要注意界定測(cè)驗(yàn)的內(nèi)容范圍,其次要注意系統(tǒng)取樣。目前,大多數(shù)學(xué)科成績(jī)測(cè)驗(yàn)的編制者根據(jù)教學(xué)目標(biāo)的分類,先擬就測(cè)驗(yàn)的藍(lán)圖,將各部分內(nèi)容和教學(xué)目標(biāo)各層次按確定的比重表達(dá)出來(lái)。然后編制測(cè)題,以滿足提高內(nèi)容效度的要求。
(3)結(jié)構(gòu)效度(構(gòu)造效度)
結(jié)構(gòu)效度是指考試對(duì)理論上構(gòu)造或特質(zhì)的測(cè)量程度,
確定結(jié)構(gòu)效度需三個(gè)步驟:建立理論體系(理論結(jié)構(gòu))并以此出發(fā)提出關(guān)于某一心理特征的假設(shè):設(shè)計(jì)和編制測(cè)驗(yàn),并進(jìn)行實(shí)施;用收集證據(jù)和邏輯分析的方法來(lái)驗(yàn)證與理論假設(shè)的相符程度。
由于建立理論和提出假設(shè)的困難,操作步驟較為復(fù)雜,且沒有單一的量化指標(biāo)來(lái)描述有效程度,所以,在一般的考試質(zhì)量分析中很少采用。
【運(yùn)用教育測(cè)量知識(shí)進(jìn)行數(shù)據(jù)分析與處理】相關(guān)文章:
圖像處理中ps通道的運(yùn)用09-09
2017物流師考試知識(shí)點(diǎn):數(shù)據(jù)統(tǒng)計(jì)與分析07-14
IBM大數(shù)據(jù)分析07-09
OracleDBA數(shù)據(jù)庫(kù)性能進(jìn)行優(yōu)化09-14
利用PS進(jìn)行圖像處理的思路構(gòu)架10-19
標(biāo)識(shí)設(shè)計(jì)中色彩運(yùn)用分析10-13