概率与统计学基础概率的定义•概率有两种定义:–theclassicaldefinition(古典定义),–therelativefrequencydefinition(相对频数),and–Bayesiandefinition(notdiscussedhere).古典概率定义:–如果一项试验有N种可能的、互斥的结果,且有n个发生事件A的结果,那么发生事件A的概率是:P(A)=n/Nn:事件A发生结果的数目数N:试验结果的总数–掷一个均匀的骰子,有6个可能的互斥的点数:1,2,3,4,5or6,即N=6.如果我们感兴趣的件数是偶数点数(2,4or6),则n=3,掷一次骰子出现偶数点数的概率是:P(Even)=3/6=0.50概率的相关频数定义–如果大量重复进行一项试验,即事件A发生的概率是:P(A)=k/M–在此:•k=在重复试验中,事件A发生的次数•M=在重复试验中,事件A发生的最大次数例如,假设大掷骰子的例子中,骰子总共被投掷了100,000次并且点数2,4,or6出现50,097次.那么,掷出一个偶数在一项试验中的相对频数概率是:P(Even)=50,097/100,000=0.50097掷出偶数的古典定义和相对频数定义计算得到概率的结果是不同的.分析型研究与相对频数概率–进行分析研究是为了确定过程的特性,但是过程的特征的有过去和现在,同时也将会有将来,因此,在一个缺乏完整框架的情况下,不可能有这样的古典概率–有关过程特征的概率必须通过试验来获取,因此只能是相对频数概率TypesofData•Dataisinformationcollectedaboutaproduct,service,process,person,ormachine.•Weclassifydataintotwotypes:–attributedata(属性数据)–variables(measurement)data.(变量数据)•属性数据–属性数据包括:•将项目分成不同的类别(e.g.,生产或服务)•对于给定类别中的项目数目进行计数或给定类别所占比例(e.g.,theproportionofdefectiveunitsinasampleofunits).•对于每单元发生数目的计数(e.g.,thenumberofdefectsperunit).申诉号申诉级别1121314254617181931011112003年联合申诉的4种分类级别申诉量比率FirstLevel88/11=0.73SecondLevel11/11=0.09ThirdLevel11/11=0.09FourthLevel11/11=0.09变量(测量)数据–对产品、服务或过程的特性进行测量–对变量数据的两个或多个测量的数值的计算数据特征•计数型研究–一个完整框架的普查可以提供对该框架采取行动所需的全部信息.–如果被用来采取行动的信息是来自于一个框架的一个随机样本,那么,这些误差可以被量化,且对框架所做出的统计推断是有效的.分析型研究–对框架的完整地普查是不可能的,因为一个框架包括了所有过去、现在和将来的观察,而未来的观察资料是无法测量的–不同于计数型研究,由于这种框架是未知的(未来不能被计量),所以无法量化这些误差.–然而,如果对该过程和环境的知识以及数据的分析显示该过程是稳定和可靠的,并且在不久的将来会保持这种状态,那么,就可以以下方法就可以用来对过程未来的行为做出推断和采取行动可视描述性数据TabularDisplays(列表显示)–FrequencyDistributions(频数分布).频数分布以列表形式向我们显示给定的一个值或一组值发生的次数或频数.–Cumulativefrequencydistributions(累计频数分布)很多情况下,我们关心的是那些测量值小于一数值的项目的频次容量为80的样本中每个垫圈的缺陷数量的频数分布累计频数分布频数分布的局限性.•我们前面讨论的频数显示没有包括时间顺序数据的信息图型显示–数据常以图型的形式表示出来.–变量数据的频数分布通常以频数多边形或直方图的形势表示出来•属性数据通常以条形图的形式显示.•横轴表示分组区间,纵轴表示绝对或相对频数.RunChart(链图):分析研究型研究中时间顺序的重要性•我们想要发现趋势或其他与时间有关的形态,以便在不远的将来对于一个过程采取行动.•在链图中,时间顺序的信息被保存下来,是通过在纵轴上表示观察值和在横轴上表示观察时间的每15分钟巧克力条的重量•集中趋势的测量–Mean(均值)–Median(中位数)–Mode(众数)•均值计算nxx•如果我们在过去和现在计算了样本量为n的各组平均值,我们通过计算各组均值的均值来估计一个过程的均值subgroupsofNumberxx6.0228168.68subgroupsofNumberxx–中位数:不受极端值影响•n是奇数时•n是偶数时•有些数据不适合用算数平均数来测量.–随机抽取7根小蜡烛,经测量其燃烧时间为3min,2min,4min,6min,19min,5min,3min–众数•不受极端值影响.