四、
學校的定期考試主要在瞭解學生一段期間內的學習成效。此種測驗最主要的效度證據為何?教師要如何確保這類成就測驗的效度?學生接受測驗後該如何分析學生的測驗表現與檢驗試題的品質?(25分)
二、
近年來,測驗學者及校務研究(Institutional Research)透過資料採礦(Data Mining)來分析大數據或資料庫資料,以瞭解測驗變項之可能分配的組型、群組或關聯性是重要的趨勢。資料採礦包括監督式(supervised)及非監督式(unsupervised)取向。請問,這兩種取向的意義與差別、資料採礦特性、兩種取向各有那些技術可以應用。(25分)
三、
S-P表(Student-Problem Chart)分析是近年來測驗評量很重要的實務議題,請說明S-P表的意涵與特點,(10分)以及使用注意事項。(15分)
四、
解釋名詞:(每小題5分,共25分)
1.測量標準誤(Standard Error of Measurement)
2.陸軍普通分類測驗(Army General Classification Test, AGCT)
3.測驗等化(Test Equating)
4.定錨試題(Anchor Items)
5.高斯分配(Gaussian Distribution)
一、
某教育學者根據文獻評閱心得發現,一份「學科成就測驗」編製的好壞,將影響到能否有效評估學生學習成就的正確性。請問:你會提醒他注意那些因素,以免他所發展出來的測驗工具缺乏效度(validity)?(25分)
二、
某教育學者想探究自然科學教育中,教師是如何進行教學評量的。他建議第一線的教師,應該採行實作評量(performance assessment)方式來進行,方能評估出學生動手操作的學習成就。請問:第一線的教師可以採用什麼評定方法,來評量學生動手操作的學習成就?(25分)
三、
在描述統計學中,試比較平均數(mean)、中位數(median)及眾數(mode)三者,在常態分配、正偏態分配、負偏態分配中的大小關係?(25分)
一、某校在數學(M)與英語(E)的評量方式包括教室觀察(O)、紙筆測驗(T)以及實作表現(P)等三種,分別以MO、MT、MP、EO、ET、EP 代表學生在這三種評量方式中,數學和英語的得分情形。該校計算學生這6 項分數之間的兩兩相關。請問若要證明這些評量有聚斂(Convergent)及區辨(Divergent)效度,則這些分數中,那些相關應該較高?而那些相關應較低?
請先說明何謂聚斂(Convergent)及區辨(Divergent)效度。(15 分)
再說明那些應較高,那些應較低。(10 分)
二、請問何謂效標參照測驗?何謂常模參照測驗?請問大學學科能力測驗與補救教學科技化評量是屬於那種測驗?請說明你的理由。(20 分)
三、有一個研究者其研究所得平均值為103,N=36,已知σ = 12
當H0:μ=96(附常態分配表)
當其設定α=.05,統計考驗力為何?(7 分)
當N 增加至64 人,在α=.05 的情形下,統計考驗力為何?(8 分)
一、何謂標準化測驗?(5 分)舉兩個具體例子,對照說明標準化與非標準化測驗的不同適用場合及其主要理由。(15 分)
二、王校長在新學期進行閱讀教學實驗,他選用國語文能力測驗甲、乙兩式測驗做為前、後測工具,依據測驗手冊資訊,兩式測驗平均數都是50,標準差都是10,兩測驗的相關為0.84。試回答下列問題:
以複本信度估計這兩測驗的測量標準誤應為何?(5 分)
王校長在實驗結束後發現實驗效果達顯著水準,但對實驗組學生而言,這兩式測驗的相關只有0.5,你認為在實驗有效情況下,實驗組學生前、後測成績相關低於常模的資料,這個現象是否合理?為什麼?(10 分)
王校長希望頒發最佳進步獎給前、後測進步最多的10 位小朋友,對於後測減前測這項進步量,其誤差變異數會不會小於前測的測驗誤差變異數?為什麼?(10 分)
一、李老師編製了一份數學推理測驗X,下表為該份測驗的一些相關資料,請根據數據
回答問題。
平均數 20
標準差6
題數20
KR-20 0.64
以KR-20 為例:(10 分)
從古典測驗理論真分數模式的角度,解釋該係數所代表之意義及其基本假定。
計算觀察分數與真分數的相關。
說明此信度係數之高低受那些因素的影響。
小英與小明在該份測驗上分別得到20 分及25 分,請據此建立68%信心區間,並
解釋及比較兩人的表現。(6 分)
若X 測驗之兩週再測信度為0.70,以68%信心區間預測小英兩週後的再測成績為何?
(4 分)
由於X 測驗之信度不理想,李老師決定將測驗題數增加至40 題,請根據KR-20
之值估計40 題測驗的信度。李老師在編製完成40 題的新測驗後,以該校200 位
資優生進行預試,得到KR-20 係數0.68,說明係數未如預期提高的可能原因為何?
(5 分)
二、
什麼時候適合使用配合題?其主要的限制為何?(10 分)
配合題的命題應注意那些事項?(10 分)
三、請以圖說明「莖葉圖(stem-and-leaf plot)」的主要成分為何?並說明莖葉圖的特色。
(10 分)
四、
何謂抽樣誤差?抽樣誤差會受到那些因素的影響?(10 分)
什麼是統計檢驗力(power)?什麼因素會影響統計檢驗力?(10 分)
五、陳老師根據一個具有代表性的學生樣本測得智力測驗分數(X)的平均數為105,標準差為15,而同時也知道該樣本的學業成就(Y)之平均數為80,標準差為6。智力測驗分數與學業成就之間的相關為0.8。根據這些資料回答下列五個小題。(每小題5 分,共25 分)
學生的學業成就分數的變異中有多少%是無法以智力測驗分數加以解釋的?
若將學業成就的分數加以標準化之後,再以Z = 50+10z 的方式來加以直線轉換
成Z 分數,那麼轉換後的學業成就與智力測驗分數的相關係數變為多少?
如果陳老師想利用智力測驗的分數來預測學業成就的分數,則陳老師所得到的非
標準化直線迴歸的方程式為何?
根據所計算得到的迴歸方程式,則估計標準誤將等於多少?
如果有一位學生的智力測驗分數為90,則該生實際的學業成就分數有95%的機會
將落在那一個區間之內?
一、PISA(Programme for International Student Assessment,中譯為國際學生能力評量計
畫)係一種國際性評量計畫,我國各界對於此評量也頗為重視,並於2006 年首次
參與國際評比。試就有關PISA 回答下列問題:
PISA 係那一個組織所籌劃?其目的為何?包含那些內容?施測的對象為何?(20 分)
PISA 何以採素養(literacy)而非學習成就(achievement)的觀點設計題目?(5 分)
二、試回答下列有關測驗選用的問題:
某教育局先後編製兩套(甲和乙)閱讀成就測驗。甲的折半信度為.90,乙的重測信度為.75。乙有其教學目標的內容效度。甲與某閱讀測驗有同時效度,但甲有一些測量的內容並未被老師教到。若老師擬評量其閱讀教學的效果,其前、後測宜用那一套測驗較適合?請說明你的理由。(15 分)
有一測驗機構發行兩套(A 和B)閱讀準備度測驗。此兩測驗國小一年級新生適用。測驗A 的內部一致性信度為.92,測驗B 的重測信度為.76。兩者皆未提供有關效度的資料。如果校長向你請教測驗的選用,你會推薦那一套?請說明你推薦的理由。(10 分)
一、解釋下列名詞,並指出其使用時機:(每小題5分,共20分)
長條圖(bar chart)
直方圖(Histograms)
莖葉圖(Stem-and-Leaf displays)
盒鬚圖(box-and-whisker plot)
二、檔案評量(portfolio assessment)的意義為何?有關檔案評量中對於檔案的類型,根據一般說法,可分成那幾種,請加以說明。(20分)
三、學生的學業成績可能與父母關心程度及家庭社經地位有關。今若對100名高中生以量表測量他們父母的關心程度(X1,分數介於0到10分),家庭社經地位(X2,區分為高中低三組),由學生勾選,學業成績(Y)則是前學期的總平均分數(分數介於0到100分)。請問X1對Y,X2對Y,以及X1與X2合起來對Y的影響,分別要以什麼統計方法來分析?(15分)檢驗的重點在那裡?(10分)
四、某公司以20題的「工作滿意度量表」測量約300名員工的工作滿意度,每一題有「非常不滿意」到「非常滿意」5個選項可勾選,5個選項分別計為1-5分,20題的總分即為個人的工作滿意程度。結果整體員工工作滿意分數的全距為79,平均數為73.6,標準差為7.8,中位數為77,四分差為6。請問如果數據正確的話,你會以那一種集中量數指標與離散量數指標,來向總經理報告公司員工工作滿意的情形呢?簡述理由為何?(10分)
五、某市教育局想檢測該市國小六年級學生的國語文程度,發展出甲、乙兩套複本測驗,測驗題型包含選擇題和多點計分的建構題型。從該市六年級學生中隨機選取兩個班級共70名學生,先做甲測驗,隔一週後,再做乙測驗。兩次測驗得分之相關為0.73。甲、乙兩測驗的量尺分數以250為平均數,50為標準差。
請問根據上述所蒐集的測驗資料,教育局可以估計此國語文測驗的那幾類信度?前述信度所關心的誤差種類為何?(8分)
如果教育局在同一時間內,同時對那70名學生施測甲、乙兩測驗,請比較隔週施測與同時施測誤差分數變異占觀察分數變異百分比的差異,並陳述理由。(5分)
若全體考生的分數呈常態分配,小玲在這個考試上得到300分,請計算小玲的標準分數並估計其可能的百分等級。(7分)
根據題目所給的數據,計算此一測驗的測量標準誤。(5分)
一、請舉一個資料蒐集設計來說明適用獨立樣本t考驗的研究問題及基本假定,並列出其虛無假設(H0)與對立假設(H1)。(25 分)
二、某項入學考試有 50 位考生報考,其中48 位考生報名一般組,年齡介於20 到30 歲之間,中位數是25 歲,年齡分布呈常態分配。另外有2 位考生報名在職組,年齡
分別是45 與55 歲。請問:(20 分)
這2 位在職組考生對於全體50 名考生的平均年齡與標準差的計算有何影響?
(請列舉統計公式來說明你的答案)
50 名考生年齡平均值的位置是否為PR=50?為什麼?
四、所謂標準參照測驗,一則清楚描述測驗所欲評量的內容領域,二則清晰描繪出所欲測量的建構,故其試題分析目的在檢驗試題是否能評量出學生在測驗表現所展現的所知與所能,已達到精熟水準或既定水準(通常以決斷分數區分精熟與否)。當教師使用標準參照測驗時,大多希望其教學是成功有效的,故此種測驗的試題分析目的在回答「試題能否測量到教學的效果」。
試說明三種標準參照測驗所使用的鑑別度分析法。(15 分)
請簡單描述標準參照測驗的難度分析有何特色?(5 分)
五、請簡要說明如何偵測多元迴歸中預測變項(predictors)的共線性(multicollinearity)?(10 分)