半导体测试的奥秘原文本出自internet,版权归原作者所有2006龚轶编译版权所有目录:1,测量可重复性和可复制性(GR&R)2,电气测试可信度(ElectricalTestConfidence)3,电气测试的限值空间(Guardband)4,电气测试参数CPK5,电气测试良品率模型(testyield)6,晶圆测试和老化(WaferlevelTestandburn-in)7,Boundary-Scan测试/JTAG标准8,自我测试电路(Built-inSelfTest)9,自动测试图形向量生成(ATPG)1,测量可重复性和可复制性(GR&R)GR&R是用于评估测试设备对相同的测试对象反复测试而能够得到重复读值的能力的参数。也就是说GR&R是用于描述测试设备的稳定性和一致性的一个指标。对于半导体测试设备,这一指标尤为重要。从数学角度来看,GR&R就是指实际测量的偏移度。测试工程师必须尽可能减少设备的GR&R值,过高的GR&R值表明测试设备或方法的不稳定性。如同GR&R名字所示,这一指标包含两个方面:可重复性和可复制性。可重复性指的是相同测试设备在同一个操作员操作下反复得到一致的测试结果的能力。可复制性是说同一个测试系统在不同操作员反复操作下得到一致的测试结果的能力。当然,在现实世界里,没有任何测试设备可以反复获得完全一致的测试结果,通常会受到5个因素的影响:1,测试标准2,测试方法3,测试仪器4,测试人员5,环境因素所有这些因素都会影响到每次测试的结果,测试结果的精确度只有在确保以上5个因素的影响控制到最小程度的情况下才能保证。有很多计算GR&R的方法,下面将介绍其中的一种,这个方法是由AutomotiveIdustryActionGroup(AIAG)推荐的。首先计算由测试设备和人员造成的偏移,然后由这些参数计算最终GR&R值。EquipmentVariation(EV):代表测试过程(方法和设备)的可重复性。它可以通过相同的操作员对测试目标反复测试而得到的结果计算得来。AppraiserVariation(AV):表示该测试流程的可复制性。可以通过不同操作员对相同测试设备和流程反复测测试所得数据计算得来。GR&R的计算则是由上述两个参数综合得来。必须指出的是测试的偏移不仅仅是由上述两者造成的,同时还受PartVariation(PV)的影响。PV表示测试目标不同所造成的测试偏差,通常通过测试不同目标得到的数据计算而来。现在让我们来计算总偏差:TotalVariation(TV),它包含了由R&R和PV所构成的影响。TV=sqrt((R&R)**+PV**)在一个GR&R报表中,最终的结果往往表示成:%EV,%AV,%R&R,和%PV。他们分别表示EV,AV,R&R和PV相对TV的百分比。因此%EV=(EV/TV)x100%%AV=(AV/TV)x100%%R&R=(R&R/TV)x100%%PV=(PV/TV)x100%%R&R如果小于10%,则此测试设备和流程是良好的;%R&R在10%和30%之间表示可以接受;如果大于30%则需要工程人员对此设备和流程进行改良。2,电气测试可信度(ElectricalTestConfidence)很多测试工程师都会发现测试的结果往往都不能预见,即使是用最先进的ATE也不能保证测试结果的正确性。很多情况下,必须对产品重新测试(retest),浪费了大量时间。电气测试可信度简而言之就是衡量一个测试设备提供给使用者测试结果正确性的指标。一个电气测试可信度很高的测试设备无需作重复的retest,从而节省大量宝贵的测试时间。如果把第一次测试下来的失效器件(rejects)重测,其中有些可能会通过测试,原因在于原始的错误可能由测试设备造成的,而非器件本身。这样的失效被称为“非正常失效”(invalid),测试可信度可以通过衡量这些“非正常失效”的数量来计算。非正常失效产生有很多原因:1,DUT和测试头之间接触不良2,测试设备硬件问题3,不合理的硬件搭构4,金属接触面氧化或污染导致接触失效5,测试环境湿度过高6,GR&R过高其中第一条是很多测试工程师面临的普遍问题,其原因有:1,DUT引脚和接触面没有对齐2,接触器件老化3,接触器件氧化和污染4,接触面湿度太大很多公司试图解决这个问题,毕竟其他的问题可以在产品测试正式release之前解决:1,测试程序调试和设计2,正确设置测试限值3,使用性能优良的测试设备4,使用可靠的接触件5,测试环境优化等等由此可见,电气测试可信度很大程度上依赖于电气接触可靠性。具体的说,就是电气测试中各部件正确良好接触的几率。90%的电气测试可信度就表示平均100个被测器件中有90个获得良好接触而其他10个则遇到了电气接触问题。通过几轮的重测可以将这些非正常失效器件变成好的器件,因此重测获得的非正常失效器件的数量也由电气测试可信度决定。假设初测成品率为Y1,那么这批产品真正的成品率为Y=Y1/C,其中C为该系统电气测试可靠度。如果这批产品重测成品数量为R2,R2=Q(1-Y1),其中Q为产品总数。重测成品率为YY,YY=Rinvalid/R2而重测后增加的成品率Y2=(Rinvalid/R2)xC.通过计算可得:C=1-[Y2(1-Y1)/Y1]C:测试系统测试可信度Y1:初测成品率Y2:重测后成品率有人观察过RFIC测试的结果得出如下结论:1,C小于85%的测试是不合理的,应该重写2,C大于95%的测试无需重测3,C在85%和95%之间的需要重测当然以上数据不一定适合所有公司和所有产品,公司的测试经理应该通过计算得适合自己产品的测试原则,这是对测试专业人员提出的挑战。3,电气测试的限值空间(Guardband)很多测试工程师认为电气测试参数的限值就是在进行参数测试的时候设定的允许范围,电测限值的使用是为了在产品量测的时候相对产品电气标准参数更保守,从而降低客户使用产品时出现问题的几率。在大部分半导体测试工序中,往往采用两个版本的测试程序:1,产品量测程序2,质量确认程序(QA)前者用于产品量测线上,后者则用于抽样测试。QA测试用于确保通过量测的产品是真正的没有问题,由于被测器件已经通过量测程序,理论上他们应该100%通过QA测试。因此,QA不通过的器件将被重点调查。QA测试程序是根据产品参数标准来设计的,而量测程序则是使用了更加严格的测试限值。很多测试同时有上下限值,在这种情况下,必须保证两者都是用更加严格的限值。那么,为什么在量测和QA之间有一个限值空间呢?答案在于没有两个测试系统的完全一致的,两个系统总会给出不同的测试量结果。这可能导致一个器件在不同系统上测试得到不同的结果,事实上即使同一个系统上多次测试的结果也可能不尽相同。测试系统的不一致性原因很多,而且很难全部解决,这也是为什么在量测和QA测试之间留置限值空间的原因。4,电气测试参数CPKCPK=processcapabilityindex.一个工序的性能可以由结果的集中度和距离标准的偏移度来衡量。对于一个结果可以由正态分布表示的工序来说,它的性能可以由CpK来表示。一个工序的CpK指数表示该工序输出结果在上下限之间的集中度和偏移度。实际上,CpK代表了输出结果的和平均值之间的距离和比较近的标准限值之间的比率。(也就是3个sigma)如果结果的平均值更靠近下限(LSL),假设标准差为Stdev,那么Cpk=(Mean-LSL)/(3Stdev)。如果结果平均值更靠近上限(USL)那么Cpk=(USL-Mean)/(3Stdev)。理想情况就是输出值一直在分布的正中间,那么Stdev=0,CpK=无限大。当输出值离中间值越来越远,CpK将减小。CpK减小代表了该工序产生结果在标准限值之外的可能性怎增大了。因此,每个CpK的值可以表示相应的失效比率(PPM)。下表列出CpK和相应的PPM值,在半导体业中,CpK的标准值应在1.67左右,最低不能低于1.33。CpK在半导体测试中用于描述测试工序的稳定度,它只适用于测试结果呈正态分布的情况下。CpK衡量两个指标:1,测试结果靠近中间值的距离2,测试结果分布情况CpK越高表示测试工序越好。在电气测试中,CpK只能用于有数量读值并能构成正态分布的测试结果。一个低的CpK暗示了3件事:1,结果的平均值远离中间值2,Stdev太大3,两者皆是测试工程师因该能够通过观察CpK变化寻找提高CpK的方法。推荐的解决方法有:排出无效数据,维修出错的测试设备,调试测试程序,重新定义上下限值。5,电气测试良品率模型(testyield)良品率就是通过电气测试的器件数量和器件总数量的比例,同常用百分比来表示。所有半导体厂商想方设法提高良品率,低良品率意味着成本的提高。良品率低的原因有很多,包括工艺问题,产品设计问题等等。下面举例说明工艺问题导致良品率低:1,氧化层厚度不匀2,参杂浓度不匀,导致某些区域的电阻增大3,掩模版偏移4,离子污染5,多晶硅层厚度不匀设计失误也会导致低良品率,对工艺过度敏感的器件不能经受生产工程的正常参数变化。即使器件设计和制造工艺没有问题,某些产品批次也会遇到低良品率,这有可能是由于硅片的“点坏区”造成的。因为在硅片生产过程中,很容易受到灰尘的污染,硅片的某个区域就不能正常工作。我么必须了解低良品率的原因来降低生产的成本。这可以通过数学方法“良品率模型”来获得,它将失效密度(defectdensity)转化为可以预计的良品率。通常我们使用泊松模型,墨菲模型,指数模型和Seeds模型来计算。半导体厂商往往通过实际数据来选择合适的数学模型。比如一个晶圆厂的良品率数据可能是根据晶元大小对比其他数学模型而得来的。一个简单的良品率数学模型假设造成良品率损失的原因是平均的失效密度和随机的失效点分布。如果该晶圆上有很多晶元(N)其中有很多随机分布的失效晶元(n),那么一个晶元存在k个失效晶元的可能性可以根据泊松分布估算:Pk=e-m(mk/k!)其中m=n/N。假设Y为良品率那么Y就是一个晶元没有任何失效的可能性即K=0,Y=e-m。设D为晶元的失效密度,那么D=n/N/A=n/NA,其中A是每个晶元的面积,由m=n/N,m为每个晶元平均的失效晶元数即AD。因此Y=e(-AD),这也就是泊松良品率模型。许多专家提出泊松分布估算的良品率太低了因为失效晶元通常不会随机分布在晶圆上,他们一般都集中在某个区域。这种现象导致估算的良品率要比实际良品率低的多。另一个简单的数学模型假设失效晶元是不均匀的分布,此时良品率Y=0∫∞e(-AD)f(D)dD,其中f(D)为失效密度分布函数。假设有一个三角形的失效密度分布函数如下图1所示,那么Y=[(1-e(-AD))/(AD)]2,此时模型被称为墨菲模型。如果失效密度分布函数为长方形的(图2)那么Y=(1-e(-2AD))/(2AD),许多实验数据都和此模型吻合。另一个数学模型称为指数良品率模型,它假设极高的失效密度只会集中在某个小区域内。因此它很适用于高失效密度集中的情况下,Y=1/(1+AD)。最后Seeds模型给出的方程式Y=e–sqrt(AD).6,晶圆测试和老化(WaferlevelTestandburn-in)晶圆测试和老化(简称WLTBI)指对半导体器件在未包装之前进行电气测试和老化。老化是指通过加压加热对半导体器件进行老化从而分辨可靠性较差的器件。WLTBI通常要使用晶圆探针台以连接晶圆上细小的引脚,而探针台也提供了测试和老化所需要的温度。WLTBI不仅可以提供早期测试,也适用于1,裸片器件(KGD,knowgooddie)2,晶元级封装器件最理想的情况就是所有的测试都能在晶圆级完成,这样就不需要最终测试,可以节省大量成本。不过,目前的WLTBI只不过是传统晶圆制造的后端延伸。WLTBI基本的原理和普通的半导体器件终测没什么区别,都是通过对DUT加激励并观察其输出功能来判别器件的好坏,区别在于如何对器件进行激励。在终测时,电流和电压是通过ATE连接器件引脚而进入器件内部。在老化时,器件被放置于烤箱中并由老化板提供所需的