第五章非正式評量傳統上,「非正式評量」(informalassessment)就已用來建立資格,並決定分類對象,誰需要接受補救或特殊教育服務,以及學生與其同儕比較的方法。雖然正式評量會有其目的和價值,惟本章將著重於描述非正式或非標準化評量程序的優弱點、用途或形式。…表5-1提供了正式與非正式評量間的區別。基本上,非正式評量要比標準化或效標評量,能夠提供更多診斷的資料來發展個別化教育計畫(IEP)目標。這種評量方式的主要目標在於提高學習而非證明學習而已。評估學生知識和能力精熟的非正式評量,通常可在很短的時間內一再改變,協助教師了解歷程(非結果),以及提供教學和評鑑間直接的連結。它們可以直接測量到有關學生本身能力表現的方法。正式與非正式評量間的區別表5-1正式與非正式評量間的區別第一節非正式評量的種類教師會針對特定科目和在特定情境下準備非正式測試,加以調整或修正來迎合學生需求與教師的目的。非正式評量提供了評估學生創造與生產性推理、回應新情境、評論和修訂任務、評鑑本身與他人任務,以及運用口頭和視覺的方式來溝通。第一節非正式評量的種類一、真實評量二、標準參照評量三、任務分析四、動態評量五、課程本位評量六、實作評量七、檔案評量八、生態評量九、非正式評量第一節非正式評量的種類十、反應或學習日誌十一、大聲思考技術十二、檢核表十三、工作樣本分析十四訪談十五、問卷十六、觀察十七、錯誤分析十八、自我評鑑十九、同儕評鑑一、真實評量由於傳統的標準化測驗扭曲了教育的真正目標,而真實評量有助於實現教育目標,此種評量方式比標準化測驗更人性化且具多元性,因而更能配合實際的教學設計與教學過程,確實地評量出教學與學習的真正情形,以提供真實的評量結果作為教學改進或是課程改革的參考依據、改善教師的價值觀與表現、強化學生的合作學習與自我監控的能力等(Inger,1993)。一、真實評量(一)真實評量的涵意真實評量有助於實現教育目標,「真實評量」所重視的是實質內容的評量,而不是形式上的評量。設計至少需符合4個基本特徵(1)評量的設計必須能表現出該領域所應有的表現;(2)評量的內容需依照教學與學習的情形或過程來設計;(3)在真實評量中,自我評量所扮演的角色要比傳統測驗的角色更為重要;(4)在真實評量中,學生常被預期能呈現他們的工作或學習成果,並能以公開與口頭的方式為自己所學的內容加以辯論。(二)真實評量的特性(1)評量應能反映出真實的生活,且是課程的一部分。(2)評量應是有計畫且有結構的。(3)評量強調以更廣泛的標準來作為計分的基礎。(4)學生在評量中是主動參與者。(三)評量工具的設計與應用測驗應是形成性的,須能喚出並引起學生的優勢能力。測驗應能提供學生不同的機會,讓學生在不同的情境脈絡下表現出他們所知道的知識或事物。測驗應能深化擴展學生對自己、學科內容及所處生活世界的了解,以協助發展學生的智力和認知能力。測驗應能讓學生在他們認為可以清楚說明所精熟學習內容的基礎下,選則適合他們的評量方式。(四)真實評量的方式和評分真實評量的方式很多,目前較常被提及的為檔案評量與實作評量。Hart認為真實評量的評分,應注意下列幾點:(五)真實評量之評析優點優點優點最大的缺點便是非常費時、費力、所費不貲等等。評量結果的效度、信度與可比較性也是一直備受質疑的問題。缺點二、標準參照評量「標準參照評量」(criterion-referencedassessment),將學生的成就表現跟預定的精熟或成就水準相比較,可用於大多數學業領域或由教師自行建構,以及適用於學習特定能力的學生。標準參照評量使用各自分立的能力領域或行為目標清單來比較學生的成就表現。標準參照評量乃是基於任務分析模式。評量形式可以是標準化的或非標準化的。標準參照測驗有助於方案計畫與進展情形的監督。標準參照測驗的品質是很難建立的。三、任務分析「任務分析」(taskanalysis)或稱「工作分析」,包括將一項任務分解成需要完成任務的最小步驟。「任務分析」是用來確定任務主要的因素與安排適當教學順序上的必要能力。任務分析直接與標準參照評量有關聯。任務可以運用下列三種方法來加以分析:1)暫時性的順序任務需要演示的次序2)發展性的順序在先前已習得的能力上逐漸的進展能力3)困難水準容易的任務要先習得四、動態評量「動態評量」(dynamicassessment)是非正式評量取向之一,為彌補傳統評量方式的不足。(一)動態評量的涵義指在教學前、教學中及教學後,以因應及調整評量情境的方式,對學習者的認知能力進行持續性的評量。在過程中,特別強調評量學生如何產生學習及學習如何發生變化的心理歷程。(二)動態評量的特色(三)動態評量的模式或類型1)學習潛能評量模式「學習潛能評量模式」(learningpotentialassessment,LPA)評量目的在於鑑別被錯誤分類的智能障礙兒童為目的,運用「前測─訓練─後測」的程序,來評量學生從訓練中所獲得的能力。教學介入方式係採用「標準化教學」。2)學習潛能評量計畫模式「學習潛能評量計畫模式」(learningpotentialassessmentdevice,LPAD)評量目的有二:(1)找出個體的認知功能缺陷;(2)評量學生對教學的反應程度,採取「前測─中介─後測」(或教學─後測)的程序,來評量學生經中介訓練後的表現。教學介入方式採用「非標準化臨床介入」。其優點在於可提升學生的認知和遷移能力。3)極限評量模式「極限評量模式」(testing-the-limits)評量目的有二:(1)找出估計個體能力上限的最佳方式;(2)採取「測驗中訓練」的標準化介入模式,來了解學生實際智力,分析學生人格因素和測驗情境的互動關係,以評析不同施測情境介入的最佳表現及介入策略的有效程度。4)心理計量取向評量模式心理計量取向評量模式」(psychometricapproachassessment,PAA),以空間推理為材料,採取「前測─訓練─後測」的程序來評估學生的能力。運用標準化介入來協助學生,以評估學生訓練後學習能力(前後測分數的差異)改變的情形。5)連續評量模式此模式以數學、閱讀等領域為材料,採取「前測─訓練─再測─訓練─後測」的程序,分兩大階段評量學生的認知能力和缺陷。第一階段:先使用「靜態評量」評估學生的一般能力,再實施「漸次提示」,並測量未經協助的「獨立表現」水準。若第一階段未達預定標準,則進行第二階段的訓練或漸次提示,然後施予靜態評量,以評估學生的學習保留和遷移能力。6)漸進提示評量模式「漸進提示評量模式」(graduatedpromptingassessment,GPA)或稱支持性學習和遷移動態評量。此模式中,「教學提示量」是用以評量學生學習能力的指標。此一模式主要在評估學生的學習量數和遷移量數。優點(四)動態評量的評析動態評量具有以下幾項優點:1.較能評估文化或身心障礙兒童的認知潛能2.評量與教學密切結合3.重視學生的潛能表現和認知歷程4.連續歷程的評量模式動態評量有待克服的難題:1.個別評量成本太高2.研究題材仍待積極研發3.信度與效度有待努力4.評量執行不易五、課程本位評量直接使用學校所教的課程進行評量。「課程本位評量」(curriculum-basedassessment,CBA),Tucker(1987)認為「任何以實際上課的課程內容為依據,來考量學生技能發展的程序,都可稱為課程本位評量」。(一)課程本位評量的涵義課程本位評量的基本條件:「課程本位評量」是基於學生目前的課程表現來決定他們的教學需要,以提供教學者快速而有效的資訊,是教學與評量並重的。是一種非正式的評量技術,與正式測驗不同。目前常見的課程本位評量有三種:1.)著重流暢性的課程本位評量模式(fluency-basedCBAmodel):直接測量學生的進步情形,作為教師長期觀察與修正教學的依據。Deno(1985)等人所發展出來的「課程本位測量」(curriculum-basedmeasurement,CBM)最具有代表性。教師能系統性的實施課程本位測量,可有效提高輕度障礙學生學習成就,也能提升教師的教學效能。(二)課程本位評量的種類2.)著重正確性的課程本位評量模式(accuracy-basedCBAmodel):目的在於檢視教材內容對於個別學生的難易程度,作為挑選教材和分組教學的依據。以Gickling等人所提出的最具有代表性。著重於計算比例;學校教師最常使用,也是最熟悉的方法。可作為選取形成性數學評量工具的依據。3.)標準參照的課程本位評量模式(criterion-referenceCBAmodel):目的是以學生在具有順序性之課程目標上的表現,來作為教師設計教學的參考。以Blankenship(1985)和Idol(1986)等人所提出的模式最為著名。評量系統的內容效度甚佳,但技術性的資料並不多,而標準化的方法也尚未建立。評量的方法主要有下列幾種:A.觀察觀察法可分為兩種:有系統的和無系統的。有系統的觀察:是預定行為的觀察。【優點】能夠精確評量【缺點】較為費時(三)課程本位評量的方法無系統的觀察:未依嚴謹的程序去觀察行為。【優點】可以幫助系統性的觀察產生一個行為目標【缺點】(1)可能觀察到不具有代表性的行為;(2)觀察者對於個人行為的定義可能不夠正確精細;(3)可能流於主觀或個人偏見。B.測驗測驗的來源有兩種,一是商業出版品,另一為教師自編的測驗。商業出版品最基本的問題在於測試內容與上課內容未必完全相符合。教師自編測驗在提供學習表現的訊息有四項潛在的優點:C.主觀印象指基於非系統化的蒐集資料(或全然無資料)或未經界定的標準,來對個人下一個結論。包括評定量表、面談及臨床的主觀印象。「轉介前評量」(preferredassessment)採用非正式的主觀印象。1.分析課程包括探究課程上知識和能力的安排、評估課程上知識和能力間的邏輯關係、關鍵性的檢視課程上的教學活動,以及評估學生在課程上所需成就表現或能力。2.決定每位學生目前的表現水準是一項從各方面合併資料的過程,包括:(1)教師對學生的經驗和觀察;(2)學習困難學生的特性;(3)成就表現的資料。(四)課程本位評量的共通實施程序3.選擇特定的目標行為和成就標準教師必須確認能夠被觀察到的目標行為和有意義的學業成就指標。教師必須選擇可以觀察和測驗、能用以顯示教學問題上改變目標行為。4.決定適當的精熟標準下列幾種精熟概念可用來協助作決定:(1)布魯姆的認知分類:包括記憶、理解、應用、分析、評鑑及創造等六個層次。(2)考量所需操弄內容的層次(3)第三種精熟概念是指期望學生的學習層次5.設計評量工具教師首需關心的課題a.)設計一套實施評量卻融於教學的系統。b.)關於評量的內容為何?評量應該包括探測以決定先前習得的技能是否有保留,以及是否教學作用能類化以促進相關或高層次能力的學習。有效實施評量,探測必須:(1)事先準備(2)針對特定能力或次能力(3)容易施行(4)內容多到能可靠的評估學生的成就6.蒐集和展示資料分析和展示資料可以協助教師準備作教育性決定。Jones和Southern(1998)認為CBA資料的視覺性展示,可以促進較高的成就水準。7.作教育性決定資料分析完成後,教師必須使用資料作有關每位學生教學成效的決定。Wolery、Bailey和Sugai提出幾項決定規則1)不要改變介入2)改變教學3)提高教學目標學生如果表現高成功率,那麼教師應該考量改變教學目標。依據任務和真實世界的要求,教師應該考量下列三種可能的選項擇一:進入新的學習階段增加任務的難度提供新的技巧特殊教育方案制訂:特殊兒童的甄選→鑑定、分類→安置、編班分組→安排課程→編選教材→實施個別化教學活動。教學時,特殊教育教師需不斷的評量學習成果,配合學生需求,改變教學策略。課程本位評量在特殊教育上,以鑑定安置及診療教學兩項功能最為重要。(五)課程本位評量在特殊