1運動技能測驗的發展姚漢禱國立體育學院運動技術系教授壹、前言測驗測量和統計一樣,本身是屬工具學科;本質上,測驗測量植基於計量學的理論上,運用更基礎的數學和統計學為工具,以達到測驗測量的目的。其發展的歷程,源自十九世紀中期的心理生理(Psychophysical)實驗室,心理計量學理論開始萌芽,二十世紀心理測驗的發展主要是古典測驗理論,1907年至1913年斯皮爾曼(Spearman)提出了許多的方法(相關),到了1930年代才開始發展標準化的測驗;1968年洛(Lord)和諾瓦克(Novick)介紹的測量基本模式,爾後,試題反應理論快速的發展變成心理學測量的主流。心理計量學主要被應用在教育和心理測驗測量上,從外顯的行為,估計人類建構的構念或特質,這個特質是看不見的潛在變項。換句話說,就像是看到海上的冰山,想用水面部份的浮冰,推估一個整體的冰山。二十世紀體育被納入教育課程,體育測驗一直都被包含在教育測驗中,也一直追隨著教育測驗的腳步;1956年布魯姆(Bloom)分析人類成績表現(HumanPerformance)客觀的範疇(area),分為三個領域:一、認知領域:知識為基本的訊息。二、情意領域:心理和情感相關的特質(屬性)。三、技能領域(PsychomotorDomain)。運動技能領域到了1972年哈洛(Harrow)2有更完整的分類,包括六個階層:一、反射動作(ReflexMovements)。二、基本動作(Basic-fundamentalMovements),有移位動作、非位移動作和技巧動作。三、知覺能力(PerceptualAbilities),有動覺的識別力、視覺的識別力、聽覺的識別力、觸覺的識別力和協調的識別力。四、身體能力(PhysicalAbilities),有耐力、肌力、柔軟度、和敏捷性。五、技術動作(Skilledmovements),有簡單技術、組合技術和複雜技術。六、有体系的動作(Nondiscursivemovements):整體、完整性的表現,有動作表達和動作詮釋。至今仍是體育運動測量分類的準則,事實上,技能測驗方面有很多特屬性,和認知、情意測驗不盡相同,而且,要有專業知識(如專項運動技術、規則…)和本身實際的專業經驗(如運動選手經驗、裁判經驗、教練經驗…),否則很難介入;筆者特別稱為:運動計量學(Sportsmetric),它是體育和運動領域研究的測驗測量工具和方法。運用統計和測驗理論,以探討體育和運動科學的現象,進而估計潛在能力,驗證各種體育和運動的理論和模式;問題呈現清楚明確的目的,編製成測驗,並用在現實情境,進而提供問題的解釋,進而達到所欲知道的目的。(詳情參考姚漢禱,2001)體育和運動相關的測驗,目前的分類包括:1、體育運動的認知測驗。2、體育運動的情意測驗。3、體能測驗。4、運動技術測驗。5、運動成績表現(比賽)。6、運動能力測驗。前兩項認知和情意類別,與心理計量學近乎完全相似,後面四項類別就具有獨特的運動計量特質,在研究上要特別的注意。現就這些測驗探討研究的重要課題和發展趨勢。3貳、健康體適能在美國體適能測驗的發展,1970年末期至1980年初期,為常模參照評量健康體適能測驗時期,強調和身體健康相關的體適能;1980年代為效標參照評量健康體適能測驗時期,強調效標參照測驗的健康體適能,發現早期編製體適能測驗的常模無法說明健康所需的水準。Looney和Plowman(1990)收集大量的測驗資料,以活動為分類標準,發現:主觀設定的標準有問題。對照組法研究的標準,其ψ相關也太低,僅有一個一致性達到50﹪。Kang(1994)發展健康體適能效標參照測驗的標準,採用標準測驗法,根據心臟疾病危險因子(總膽固醇、低密度膽固醇、高密度膽固醇、血壓)水準,參考Going等人(1992):「依性別、年齡界定血壓和膽固醇在前面百分之二十者為高危險群。」結果效度低,無法有效的分類,以致效標參照測驗標準難定。其結論是:「1.常模是個人和團體的比較,而非健康所需最低限度的體能。2.以85%或更高為目標,易產生氣餒或孩童的低動機。3.常模優秀級(7%)為標準,結果無人能達到,也許是一種誤導(健康)。」健康體適能測驗1980年開始重視效標參照測驗,最初以主觀的判定效標參照測驗的標準,因為測驗的信度和效度不佳,改用標準測驗法或對照組法設定標準;由於健康體適能概念的界定和量化不易,無法真正測量不健康者的體適能,乃採訓練效果、運動行為、自我評估和生理特質等間接的推估,這些操作性定義和目的未必有因果關係,以致效標參照測驗的品質不良。另一方面,健康體適能忽略組合測驗的特性,使健康體適能測驗缺乏完整性和整體性。從許多重要的文獻發現,肥胖做4為效標變項,可能做為健康體適能效標參照測驗的標準。編製效標參照體育運動組合測驗,運用logistic迴歸分析的統計方法,方法參考姚漢禱(1998)「發展效標參照體育運動組合測驗」,實例參考姚漢禱(1999)「編製國小六年級女生健康體適能效標參照的組合測驗」和姚漢禱(1998)「編製國小六年級男生健康體適能效標參照的組合測驗」。以「編製國小六年級男生健康體適能效標參照的組合測驗」為例,其效標參照測驗效度係數0.705,複核效度為0.685,效標參照測驗信度的一致性比率0.888、kappa係數0.690和修正kappa係數0.776。因此研究的結論為:編製我國小學六年級男生健康體適能效標參照的組合測驗,具有良好的測驗品質。參、身體活動在教育中技能領域被納入之後,許多年來體適能一直被重視,由一般的身體適能,轉變以與健康相關的身體適能;再從常模參照評量的健康體適能,變成效標參照評量的健康體適能。由訓練強健的體魄,轉為培養運動習慣,1996年美國政府更推動:「足夠的身體活動有助於健康,而且可減低慢性病的危險。」(USDHHS1996)與健康相關方面的身體活動已經變成官方的重點,全民健康與身體活動相關,健康生活方式是參與適當的身體活動、規律性的運動。因此,身體活動指標和健康體適能是息息相關,它是研究者重要的數據,也是大眾所要知道的事。身體活動(physicalactivity)和身體適能(physicalfitness)是有區別的,身體活動是指:身體的動作,骨骼肌收縮和增加能5量的消耗。身體適能則是:執行身體活動相關的能力,個人的身體特質。身體活動的測量關係到個體健康的促進和慢性疾病的預防,但是身體活動測量的信度、效度涉及:個人的身體活動量(個別化的差異)。健康狀態中身體活動所扮演的角色(健康情形的問題)。身體活動行為的相關因子(行為涉及因素)。促進身體活動介入的效果(身體活動的效果)。而且吾人所談論的健康定義,根據世界衛生組織的定義,包括身體、心理和社會三方面的健康,並非單指身體的健康;在推動健康生活方式的計畫時,研究發現除了「參與適當的身體活動、規律性的運動」之外,日常生活的規律性、習慣、態度和飲食都是重要的影響因素。所以在研究上,測量身體活動的信度和效度比測量身體適能更困難,人的行為測量反而比特質測量更難掌握。現在評估身體活動的方式,主要有兩類:一是自我報告的調查研究方式。二是直接追蹤的觀察研究方式。在「自我報告」方式常用的工具有四種:日常工具界定(分類分析)。回憶問卷(七日回憶量表)。日常生活的量化(身體活動日誌圖)。整體性的自我反省。「直接追蹤」方式使用的工具多達十二種:行為觀察。工作分類。心跳器和動作計量器。心跳追蹤器。電子動作計量器。計步器和測速計。步伐(走路)評估。水平時間追蹤。穩定計。直接熱量測量和間接熱量測量。其中小孩母群的身體活動,無法用「自我報告」方式和工作分類來評估,穩定計為七歲以下兒童專用的工具;老人年除了沒有工作,不適合用工作分類來評估外,和成年相同可以使用各種工具評估。評估身體活動時,須考慮:頻率、持續時間和強度等因素,才能有較準確的評估;同樣的身體活動也會受「活6動型式」、「個人條件」和「外在環境」左右,所以要準確的控制干擾變項,精確的計算處理變項,是相當不容易的是。因此,在研究上,盡可能抽取相同母群的樣本,收集大量的樣本,由巨觀來呈現不同類型的趨勢。評估身體活動,將其歸類為不同的生活型式,是其中一種可行的方法,Sharkey(1990)指出:「每日的健康習慣和生活型式對身體健康和長壽之影響,遠超過醫藥的作用。」支持此項論點有力的說法。生活型式和健康體適能的相關文獻,1990年Looney和Plowman就規律運動的有無,針對兒童加以研究,發現有部份單項健康體適能,有運動組一致優於無運動組;但在參照標準上沒有顯著的差異,認為兒童天生具有良好的體適能,只有在不良的生活習慣中逐漸的喪失體適能。姚漢禱(1993)研究:大學男子生活型式和健康體能的關係,使用「生活型式調查表」蒐集每天主要活動時間和運動習慣的資料,測驗健康體適能,首先是典型相關分析(CANONICALANALYSIS)主要活動時間分配和健康體適能。其次進行「主要活動時間分配」的集群分析(CLUSTERANALYSIS),分出不同類型的生活方式,然後進行多變項變異數分析不同生活方式的健康體適能。最後是運動習慣的健康體適能比較,先將「有、無規律運動」和「不同運動程度」分類,再用多變項變異數分析和卡方考驗其健康體適能的差異。結果得到結論:一、主要活動時間和健康體適能有顯著相關,但無實用上的價值。二、單項體適能的比較,從生活類型、運動習慣、運動程度等觀點而言,都僅有乙項中的兩組有顯著差異,表示自變項的影響不大。三、在通過健康體適能的標準上,和運動習慣有相關,運動程度方面高強度組的通過百分比顯著高於坐式生活組。7上述的研究還有相當多的發展空間,對於人類健康生活、社會變遷、科技的利益、醫療的發達和教育措施等,都是吾人當前重要的課題。在人類健康生活上,生活品質的提昇,人類須要多少的健康體適能,才能充分的享受人生的意義,其最低限在那裡?最理想的健康體適能水準是多少?不同年齡母群的健康體適能應該是多少?其次是,社會變遷方面,近半世紀以來,由戰後的復甦,農業社會、工業社會到科技文化的社會,生活形態的改變,價值觀念的變遷,不同社會下的健康體適能有沒有差異?現代社會的健康體適能是比較好還是比較差?現代社會應該用什麼樣的身體活動來維持或增進健康體適能?休閒、娛樂、健身、美容、護膚、塑身、營養食品、……等等,和身體活動、傳統運動項目、新式運動的複雜、糾葛的關係又如何?在科技的利益方面,食衣住行育樂的方便,有無帶來了健康體適能負面的效果?有那些指標可精確的說明身體活動和健康體適能?其間的結構關係和互動因子如何?有無預估的迴歸分析?有無健康體適能組合測驗能解釋多少變異?在醫療的發達方面,老年人的健康體適能標準何在?復健和治療過程動作、活動和運動多層面的測量指標如何量化?在教育措施方面,九年一貫課程綱要的實施,如何評量健康與體育領域的能力?吾人是否已具體的掌握了各年齡層的健康體適能標準?高中學分制的實施,那些人應該選修體育或相關的身體活動課程,才能達成教育的目標。大學體育由必修走向選修,健康體適能的變化如何呢?是正面效果、還是負面效果?此教育措施應該有所評鑑,如果是負面的效果,應該怎麼樣的方式來補救?上述等等問題,值得體育從業人員、政府單位,甚至全民的關注。8肆、運動能力測驗回顧美國體育測驗的歷史,1920年代裡智力包括運動能力,1940年代時,認為身體成份是人類成績表現的基礎,認為能力分班教學較有效率,1932年麥可樂(McCloy)發展三種身體分組指標:小學:(10年齡)+體重。中學:(20年齡)+(6身高)+體重。大學:(6身高)+體重。它是第一個企圖預測成績表現,但事實上,此時尚無運動成績表現測驗(motorperformancetests)。在同一個時期,研究者開始進行運動能力測驗(motorabilitytesting),一般運動能力(generalmotorability,GMA)推論為與運動相關的能力,第一個運動能力測驗要屬1921年的SargentJump(