生物统计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

生物統計1課程簡介(Introduction)陳光琦助理教授(Kuang-ChiChen)chichen6@mail.tcu.edu.tw,Office:H603-2:PrinciplesofBiostatistics,2nded.,Pagano&Gauvreau,Duxbury,2000.Reference:FundamentalsofBiostatistics,6thed.,B.Rosner,Duxbury,2005.生物醫學統計概論,3rded.,戴政、江淑瓊,台北翰蘆圖書,2004.。生物統計原理:林為森、陳怡君、陳青浩、陳俞成、謝秀幸、魏美珠,歐亞:台北,台灣,2002。Schedule-1W1.09/19IntroductiontoBiostatisticsW2.09/26DescriptiveStatistics:DataPresentationandNumericalSummaryMeasures+SPSS1W3.10/03BasicProbabilityW4.10/10國慶日放假W5.10/17DiscreteProbabilityDistributionW6.10/24Quiz1&ContinuousProbabilityDistributionW7.10/31StatisticalEstimationandInference(I):SamplingDistributionoftheMean+SPSS2W8.11/07StatisticalEstimationandInference(II):ConfidenceIntervalsW9.11/14--Midterm--Schedule-2W10.11/21HypothesisTesting(I):HypothesisBuildingandOne-sampleTestW11.11/28HypothesisTesting(II):ComparisonofTwo-sampleW12.12/05AnalysisofVariance+SPSS3W13.12/12Quiz2&InferenceofProportionsW14.12/19ContingencyTablesW15.12/26Multiple2by2TablesW16.01/02Correlation+SPSS4W17.01/19SimpleLinearRegression(more...MultipleRegression)W18.01/16--Final--EvaluationAssignment:Homework+Attendance20%,Labwork(Bonus);Exam:Quiz#110%,Quiz#210%,Midterm30%,Final30%.1.前言統計啊統計…WhatisStatistics?-利用分析的技巧從資料(data)與事實(facts)中萃取訊息(extractinformation),對於被觀察研究的複雜狀態,提供了簡明的摘要及訊息的傳遞。-統計是以數據敘說故事,因為數字(numbers)通常比文字(words)更為精確(moreprecise),更能簡潔的傳遞訊息。統計分析的結果特別適合於科技成果的交流。前言(cont’d)統計啊統計…WhatisStatistics?-人們可以利用文字來說謊,同樣的亦可以用數字來說謊。-英國首相BenjaminDisraeli曾說「有三種類型的謊言:謊言、漫天大謊及統計」。(Therearethreekindsoflies:lies,damnedlies,andstatistics)-然而,FrederickMosteller教授說的更好,「用統計說謊很容易,但沒有統計則更容易說謊」。(Itiseasytoliewithstatistics,butitiseasiertoliewithoutthem)2.研究範圍與應用領域統計啊統計…ApplicationsofStatistics?-統計是數字資料的蒐集(collection)、組織(organization)、分析(analysis)及解釋(interpretation)。-統計的應用領域涵蓋工業、商業、經濟、政治、民生、影視、娛樂、天氣、心理、農業、科學研究等。當焦點是生物及衛生科學時,特稱為生物統計(biostatistics,biometry,biometrics)。3.意義統計啊統計…WhatistheMeaningofStatistics?-文字起源:bio是由希臘文的bios變化而來,它的涵義為「生命」或「生物體」;metry或metrics是由metrikos而來,它的意思是「測度」,所以生物統計學的直觀意義為:量測生物體上特徵的學問。-Biostatistics則是由bio與statistics合併而來,statistics就是統計學。-廣義而言,biostatistics、biometry和biometrics指的都是將統計學或數學的方法應用於生物、醫學或農學上,意義是相同的,近年來,應用在流行病學及臨床試驗方面的統計學蓬勃發展,e.g.,生物遺傳、生物資訊。4.目的統計啊統計…WhatisthePurposeofStatistics?-針對生物醫學各種實際問題,應用適切的統計分析方法,以獲得正確的科學結論,提供關於被觀察對象在某些特定狀態之數字資訊,並用合理的方式來解釋說明。5.特性(i)統計是對資料的變異性(variability)與不確定性(uncertainty)的研究。(ii)統計分析的成功與否,奠基於資料的正確與否,而資料的正確與否,取決於資料收集過程的客觀性,是否能充分反應資料來源的母群體(population)特性。-若資料正確,則對統計分析的主題提供了充分的訊息(sufficientinformation);-若資料正確度不足,或因樣本數過少導致樣本代表性不足,或因取樣偏差致使所取樣本無法正確反應母群體的分布,都會增加統計分析的困難度,降低分析結果的解釋力與可信度,故統計分析及推論的價值完全取決於資料的真實性。...因此…-因此…本課程一開始我們先就數據資料(numericaldata)的收集(collection)、摘要(summarize)、探討(explore)與解釋(explain)資料的方法做介紹,然後區別母群體(populations)與樣本(samples)之間的差別,並探討因抽樣(sampling)而衍生的變異(inherentvariability)及不確定性的量化(quantificationofuncertainty),進而進展到統計推論(inference)。6.名詞解釋(i)群體、母群體(Population)有興趣的研究主題所含括的全部資料。(ii)樣本(Sample)由抽樣(sampling)或取樣而得到的資料,是群體資料的部分資料。Q:為何需要抽樣?一方面節省經費,另一方面有時普查(census)是不可能。e.g.飛利浦省電燈泡的壽命、91年度全台灣糖尿病患的研究因此,藉著抽樣調查的方式取代普查,對抽樣的資料作統計分析,進而對母群體做推論。代表觀察或測量的特性,以符號X表示。e.g.,當感興趣主題的是「資工系學生們的身高」,則X=資工系學生們的身高變數意味著是一個可變的數,因不同的觀察對象而有不同的數值。當數值為連續不斷的,為連續變數(continuousvariable)。當數值如整數般可數的,為離散變數(discretevariable)。(iv)數值(Variates)對每一個觀察個體,需同時用X來描述,故另以小寫的xi來表示這n個可變的數值,簡稱數值,並記為xi,其中i=1,2,…,n。(iii)變數(Variable)(v)觀測單位(ObservationUnit):觀察或測量的對象。(vi)觀測值(Observation):觀察或測量的結果。也就是X:代表可變的數(variable),簡稱變數對每一個觀察個體,因同時用X來描述,故另以小寫的xi來表示這n個可變的數值(variates),記為xi,i=1,2,…,n例:收集來的資料為資工系10個學生的身高171,172,168,177,180,173,171,165,167,170,令X=資工系學生的身高,則x1=171,x2=172,x3=168,…,x10=170,n=10收集來的數據具有相當程度的變異性(variability),但通常不是很有訊息除非以某些方法組合(combine)它們,除了用數字的(numerical)方式歸納資料,通常我們還會用列表(tabular)及圖形的(graphical)方式表達,使其活潑、令人印象深刻、更具可讀性,這就是描述型統計(descriptivestatistics),是統計的最基本方法,也是摘要資料的第一步。但在決定何種方法最合適之前,我們必須先知道資料的型態。7.資料型態(i)類別資料(NominalData)類別資料的數值代表不同的組別(categories,classes,groups),其數字的大小、次序並不具意義。類別資料是無次序的(unordered)。e.g.,性別可以「0」代表女性,「1」代表男性。血型:「1」-A型,「2」-B型,「3」-O型,「4」-AB型。出生地:「1」-北,「2」-中,「3」-南,「4」-東,「5」-其他。類別資料中,各個組別佔全體的比例(proportion)具有意義的。當分類組別間的次序(order)具有意義時,則為序位資料。但其數字本身的量的大小(magnitude)、組別間的差值並不具意義。e.g.,傷害若依受傷程度分類:「1」代表輕傷,「2」代表中等傷害,「3」代表嚴重傷害,「4」代表致命傷害。癌症依嚴重程度分為:第零期,第一期,第二期,第三期,第四期。1,2,3,4僅代表受傷的程度,2比1嚴重,3比2嚴重,但2與1的相差1,和3與2的相差1並不具意義,也不等同。(ii)序位資料(OrdinalData)把原始資料(rawdata)依數值量的大小(magnitude)排列成序(sequence,order),然後依排列的順序另外給予一整數代號。e.g.,資工系10位學生的身高,可以依原始身高的大小順序給予1~10的等級代號。(ii)*等級化資料(RankedData)其排序(order)及量(magnitude)的大小都是有意義的,其數字本身為真正可測量的值(measurablequantities)而非代號()。數值為非负的整數(nonnegativeintegers),可數的(countable),彼此間的差(difference)、距離(distance)是有意義的。e.g.,某校的化工系有25位老師,企管系15位老師,資工系20位老師,社會系18位老師,醫學系0位老師。該校沒有醫學系,所以醫學系0位老師;化工系師資比資工系多5位,而資工系又比企管系多5位。(iii)離散型資料(DiscreteData)數值為可測量的值(measurablequantities),且不限定為整數。連續型資料可以依研究的需要轉換(transform)為離散型、等級化、序位或類別資料以簡化分析,但會遺失細節訊息及精密度。(iv)連續型資料(ContinuousData)8.量測尺度(MeasurementScale)(i)類別尺度(NominalScale)數字代表不同的類別,但數字本身的大小、順序不具意義。(ii)序位尺度(OrdinalScale)數字代表不同類別及順序等級,但不可測量彼此間的差異。(iii)等距尺度(IntervalScale)數字具有大小的順序,也可用來測量彼此間的距離(distance),但等距尺度沒有真正的「零」。等距尺度不能求比值(ratio)。e.g.,今天清晨溫度25oC,下午溫度30oC,昨天清晨溫度24oC,

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功