计数型测量系统分析是一种测量数值为一有限的分类数据的测量系统,和获得一连串数值结果的计量型测量系统不同。通/止规是最常用的量具,它只有两种结果;测量的零件是被接受或是拒收。范例对于通/止规的测量系统,小组从过程中随机选取了50个零件(或限度樣品),进行测量系统的分析;以3评价者,每位评价者对每个零件测量3次。得出的结果如下;评价者零件A-1A-2A-3B-1B-2B-3C-1C-2C-3参考决定111111111112111111111130000000000400000000005000000000061101101001711111110118111111111190000000000101111111111111111111111120000000100131111111111141101111001151111111111161111111111171111111111181111111111191111111111201111111111211101010101220010101100231111111111241111111111250000000000260100000010271111111111评价者零件A-1A-2A-3B-1B-2B-3C-1C-2C-3参考决定281111111111291111111111300000000000311111111111321111111111331111111111340010010110351111111111361101111011370000000000381111111111390000000000401111111111411111111111420000000000431011111101441111111111450000000000461111111111471111111111480000000000491111111111500000000000“1”表示可接受的决定;“0”表示不可接受的决定。假设试验分析小组展开了交叉表格来比较每个评价者和其它人结果。A*B交叉表B01总计A0数量45550期望数量16(50*48/150)34(50*102/150)50.01数量397100.期望数量32(100*48/150)68(100*102/150)100.0数量48102150总计期望数量48.0102.0150.0○1,○2,○3B*C交叉表C01总计B0数量43548期望数量15.6731.3348.01数量795102期望数量34.3368.67102.0数量50100150总计期望数量50.0100.0150.0A*C交叉表C01总计A0数量42749期望数量15.3533.6549.01数量596101期望数量31.6569.35101.0数量47103150总计期望数量47.0103.0150.0这些表格的目的在于确定评价者间的一致性程度。小组使用Kappa来衡量两个评价者对同一物体评价时,其评定结果的一致性。Kappa为1时,表示有完全的一致性(0,0和1,1占了全部的数量),为0时,表示一致性不比可能性(0,0/0,1/1,0/1,1的数量一样多)来得好。Kappa测试在诊断区(获得相同评定的零件)中的数量和那些基于可能性期望的数量是否有差别。P0=在对角栏框中,观测的总和。Pe=在对角栏框中,期望的总和。则P0─PeKappa=────────N─Pe通常的比例法则是Kappa值大于0.75表示有很好的一致性;小于0.4则表示一致性不好。透过以上对评价计算了Kappa程度,小组得到以下的结论KappaABCA—.86.78B.86*—.79C.78.79—*[(45+97)—(16+68)]/[150—(16+68)]说明所有评价者和其它评价者间有很好的一致性。使用新的信息建立了另一组交叉表,衡量每个评价者和参考决定的比较。A*参考决定交叉表参考决定01总计A0数量45550期望数量16.034.050.01数量397100期望数量32.068.0100.0数量48102150总计期望数量48.0102.0150.0B*参考决定交叉表参考决定01总计B0数量45247期望数量14.7332.2747.01数量2101103期望数量32.2770.73103.0数量47103150总计期望数量47.0103.0150.0C*参考决定交叉表参考决定01总计C0数量42951期望数量16.334.751.01数量69399期望数量31.767.399.0数量48102150总计期望数量48.0102.0150.0小组也算出了Kappa值以确定每个评价者和参考决定间的一致性。ABCKappa.88.92.77以上数据说明所有评价者和参考决定间有很好的一致性。然后这个过程小组计算这个测量系统的有效性。作出正确决定数有效性=————————————总决定数评价者%评价者%和归因的比较变异来源ABCABC总检查数505050505050相配数424540424540虚发警告524漏发警告336不相配851095%UCL93%97%90%9397%90%计算结果84%(42/50)90%80%84%90%80%95%LCL71%78%66%71%78%66%系统有效结果%系统有效结果%和参考决定的比较总检查数5050一致的数量393995%UCL89%89%计算结果78%78%95%LCL64%64%每位评价者结果的计算值均落在其它人的置信度区间内,小组接受零假设,这个结论进一步证实了Kappa得到的结论。为进一步分析,小组中订出下表,为每个评价者的结果提供指南:决定测量系统有效性漏发警告%虚发警告%可接受的评价者≧90%≦2%≦5%可接受边缘的评价者→可能需改进≧80%≦5%≦10%不可接受的评价者→需改进80%5%10%对之前所得到的资料进行汇总,小组得到以下的结论:有效性漏发警告%虚发警告%A84%6.3%(3/48)*4.9%(5/102)B90%6.3%(2/47)2.0%(2/103)C80%12.5%(6/48)8.8%(9/102)思考:是否要更改过程的标准?这样的风险顾客接受吗?评价者是否需要更好的培训?测量的环境是否需要改善?*第4頁參考決定交叉表。