可靠性定义
一、可靠性定义产品的可靠性是指:产品在规定的条件下、在规定的时间内完成规定的功能的能力。从定义本身来说,它是产品的一种能力,这是一个很抽象的概念;我们可以用个例子(100个学生即将参加考试)来理解这个定义,可靠性就是指:100个学生的考分的平均是多少?对这个平均分的准确性有多大把握?分数越高、把握越大,可靠性就越高。
我国的可靠性工作起步较晚,20世纪70年代才开始在电子工业和航空工业中初步形成可靠性研究体系,并将其应用于军工产品。其他行业可靠性工作起步更晚,差距更大,与先进国家差距20~30年,虽然国家已制订可靠性标准,但尚未引起所有企业的足够重视。
对产品而言,可靠性越高就越好。可靠性高的产品,可以长时间正常工作(这正是所有消费者需要得到的);从专业术语上来说,就是产品的可靠性越高,产品可以无故障工作的时间就越长。
二、可靠性的重要性
调查结果显示(如某公司市场部2001年调查记录):“对可靠性的重视度,与地区的经济发达程度成正比”。例如,英国电讯(BT)关于可靠性管理/指标要求有产品寿命、MTBF报告、可靠性框图、失效树分析(FTA)、可靠性测试计划和测试报告等;泰国只有MTBF和MTTF的要求;而厄瓜多尔则未提到,只是提出环境适应性和安全性的要求。
产品的可靠性很重要,它不仅影响生产公司的前途,而且影响到使用者的安全(前苏联的“联盟11号”宇宙飞船返回时,因压力阀门提前打开而造成三名宇航员全部死亡)。可靠性好的产品,不但可以减少公司的维修费用,而且可以很快就打出品牌,大幅度提升公司形象,增加公司收入。
随着市场经济的发展,竞争日趋激烈,人们不仅要求产品物美价廉,而且十分重视产品的可靠性和安全性。日本的汽车、家用电器等产品,虽然在性能、价格方面与我国彼此相仿,却能占领美国以及国际市场。主要的原因就是日本的产品可靠性胜过我国一筹。美国的康明斯、卡勃彼特柴油机,大修期为12000小时,而我国柴油机不过1000小时,有的甚至几十小时、几百小时就出现故障。我国生产的电梯,平均使用寿命(指两次大修期的间隔时期)为3年左右,而国外的电梯平均寿命在10年以上,是我们的3倍;故障率,国外平均为0.05次,而我国为1次以上,高出20倍,这样的产品怎么有竞争力呢!因此要想在竞争中立于不败之地,就要狠抓产品质量,特别是产品可靠性,没有可靠性就没有质量,企业就无法在激烈的竞争中生存和发展。因此,可靠性问题必须引起政府和企业的高度重视,抓好可靠性工作,不仅是关系到企业生存和发展的大问题,也是关系到国家经济兴衰的大问题。(呵呵,这是唱高调的内容,可以不看的……)
三、可靠性指标
衡量产品可靠性水平有好几种标准,有定量的,也有定性的,有时要用几种标准(指标)去度量一种产品的可靠性,但最基本最常用的有以下几种标准。
1.可靠度R(t);它是产品在规定条件和规定时间内完成规定功能的概率。一批产品的数量为N,从t = 0时开始使用,随着时间的推移,失效的产品件数逐渐增加,而正常工作的产品件数n(t)逐渐减少,用R(t)表示产品在任意时刻t的可靠度。
2.可靠寿命;它与一般理解的寿命有不同含义,概念也不同,设产品的可靠度为R(t),使可靠度等于规定值r时的时间tr的,即被定义为可靠寿命。
3.失效率(故障率)λ(t);它是指某产品(零部件)工作到时间t之后,在单位时间△t内发生失效的概率。
4.有效寿命与平均寿命;有效寿命一般是指产品投入使用后至达到某规定失效率水平之前的一段工作时间。而平均寿命MTTF对于不可修复产品,指从开始使用直到发生失效这一段工作时间的平均值;对于可修复的产品,是指在整个使用阶段和除维修时间之后的各段有效工作时间的平均值。
5.平均无故障工作时间MTBF;是指相邻两次故障之间的平均工作时间,也称为平均故障间隔。它仅适用于可维修产品。同时也规定产品在总的使用阶段累计工作时间与故障次数的比值为MTBF。其他如可靠度、有效度、维修度、平均维修时间等也是衡量产品可靠性水平的一种标准,但是一般以可靠寿命失效率就足以说明产品可靠性程度了。
1. 平均故障间隔时间;
可维修的产品,其可靠性主要的参数是MTBF(Mean Time Between Fail),即平均故障间隔时间,也就是两次维修间的平均时间;不可维修的产品,用MTTB(Mean Time To Fail);两个参数的计算没有区别,下文只提到MTBF。MTBF越大,说明产品的可靠性越高。
可以用以下理想测试来精确测试一批产品的MTBF;即将该批产品投入使用,当该批产品全部出现故障以后(假如第1个产品的故障时间为t1,第2个产品的故障时间为t2,第n个产品的故障时间为tn),计算发生故障的平均时间,则
由上式可以看出,理想测试就是用全部的时间和全部的故障数来算出精确的MTBF;
2、失效密度λ
另外一个常用的参数是λ,它是指在产品在t时刻失效的可能性,是失效间隔时间的倒数,也就是:λ=1/MTBF。 对某一类产品而言,产品在不同的时刻有不同的失效率(也就是失效率是时间的函数),对电子产品而言,其失效率符合浴盆曲线分布(如下图):
浴盆曲线,分为三部份(I、II、III三部份):
第I部份是早期失效阶段。这段时间内,从外形上看,在失效率从一个很高的指标迅速下降;从物理意义上理解,由于少数产品在制作后,存在一些制程、运输、调试等问题,产品有比较明显的缺陷,在投入使用的最初期,这缺陷很快就显露出来,随着时间的增长,这些明显的缺陷越来越少,也就形成了“失效率迅速下降”的现象;
第II部份是中期稳定阶段。这段时间内,产品的失效率稳定在一个较低水平;从物理意义上理解,当少数产品的明显缺陷显露出来后,剩下的就是正常的产品,这部份产品可以较稳定、持久地工作,所以失效率也稳定在一个较低水平;
第III部份是后期失效阶段;这段时间内,产品的失效率迅速上升;从物理意义上理解,到了后期,产品经过长时间的工作、磨损、老化,慢慢接近寿命终点,随着时间的增加(Tmax以内),到达寿命终点的产品越来越多,失效率也就随之上升;
知道了λ,就可以找到产品连续工作 了t时间后、还正常的概率为R(t)=e-t,此时已经失效的概率为F(t)=1-R(t)=1-e-t。
R(t)=e-t是一个经验公式,一般电子产品的寿命服从这一指数分布,其它分布下文再叙; 加入vip会员
可靠性测试
第二节 可靠性测试可靠性测试应该在可靠性设计之后,但目前我国的可靠性工作主要还是在测试阶段,这里将测试放在前面(目前大部分公司都会忽略最初的可靠性设计,比如我们公司,设计的时候,从来都没有考虑过可靠性,开发部的兄弟们不要拿砖头仍我……这是实话,只有在测试出现失效后才开始考虑设计上的更改)。
为了测得产品的可靠度(也就是为了测出产品的MTBF),我们需要拿出一定的样品,做较长时间的运行测试,找出每个样品的失效时间,根据第一节的公式计算出MTBF,当然样品数量越多,测试结果就越准确。但是,这样的理想测试实际上是不可能的,因为对这种测试而言,要等到最后一个样品出现故障――需要的测试时间长得无法想象,要所有样品都出现故障——需要的成本高得无法想象。
为了测试可靠性,这里介绍:加速测试(也就增加应力*),使缺陷迅速显现;经过大量专家、长时间的统计,找到了一些增加应力的方法,转化成一些测试的项目。如果产品经过这些项目的测试,依然没有明显的缺陷,就说明产品的可靠性至少可以达到某一水平,经过换算可以计算出MTBF(因产品能通过这些测试,并无明显缺陷出现,说明未达到产品的极限能力,所以此时对应的MTBF是产品的最小值)。其它计算方法见下文。(*应力:就是指外界各种环境对产品的破坏力,如产品在85℃下工作受到的应力比在25℃下工作受到的应力大;在高应力下工作,产品失效的可能性就大大增加了);
一、环境测试
产品在使用过程中,有不同的使用环境(有些安装在室外、有些随身携带、有些装有船上等等),会受到不同环境的应力(有些受到风吹雨湿、有些受到振动与跌落、有些受到盐雾蚀侵等等);为了确认产品能在这些环境下正常工作,国标、行标都要求产品在环境方法模拟一些测试项目,这些测试项目包括:
1 高温测试(高温运行、高温贮存);
2 低温测试(低温运行、低温贮存);
3 高低温交变测试(温度循环测试、热冲击测试);
4 高温高湿测试(湿热贮存、湿热循环);
5 机械振动测试(随机振动测试、扫频振动测试);
6 汽车运输测试(模拟运输测试、碰撞测试);
7 机械冲击测试;
8 开关电测试;
9 电源拉偏测试;
10冷启动测试;
11盐雾测试;
12淋雨测试;
13尘砂测试;
上述环境试验的相关国家标准如下(部分试验可能没有相关国标,或者是我还没有找到):
1、 低温试验
按GB/T 2423.1—89 《电工电子产品环境试验第二部分:试验方法低温试验》;
GB/T 2423.22—87 《电工电子产品环境试验第二部分:试验方法温度变化试验方法》
进行低温试验及温度变化试验。
温度范围:-70℃~10℃。
2、 高温试验
按GB/T 2423.2—89 《电工电子产品环境试验第二部分:试验方法高温试验》;
GB/T 2423.22—87 《电工电子产品环境试验第二部分:试验方法温度变化试验方法》
进行高温试验及温度变化试验。
温度范围:10℃~210℃
3、 湿热试验
按GB/T 2423.3—93 《电工电子产品环境试验第二部分:试验方法恒定湿热试验》;
GB/T2423.4—93 《电工电子产品环境试验第二部分:试验方法交变湿热试验》
进行恒定湿热试验及交变湿热试验。
湿度范围:30%RH~100%RH
4、 霉菌试验
按GB/T 2423.16—90 《电工电子产品环境试验第二部分:试验方法长霉试验》进行霉菌试验。
5、 盐雾试验
按GB/T 2423.17—93 《电工电子产品环境试验第二部分:试验方法盐雾试验》进行盐雾试验。
6、 低气压试验
按GB/T 2423.21—92 《电工电子产品环境试验第二部分:试验方法低气压试验》;
GB/T2423.25—92 《电工电子产品环境试验第二部分:试验方法低温/低气压试验》;
GB/T2423.26—92 《电工电子产品环境试验 第二部分:试验方法高温/低气压试验》;
进行低气压试验,高、低温/低气压试验。试验范围:-70℃~100℃0~760mmHg 20%~95%RH。
7、 振动试验
按GB/T 2423.10—95 《电工电子产品环境试验第二部分:试验方法振动试验》进行振动试验。
频率范围(机械振动台):5~60Hz(定频振动5~80Hz),最大位移振幅3.5mm(满载)。频率范围(电磁振动台):5~3000Hz,最大位移25mmP-P。
8、 冲击试验
按GB/T 2423.5—95 《电工电子产品环境试验第二部分:试验方法冲击试验》进行冲击试验。冲击加速度范围:(50~1500)m/s2。
9、 碰撞试验
按GB/T 2423.6—95 《电工电子产品环境试验第二部分:试验方法碰撞试验》进行碰撞试验。
10、 跌落试验
按GB/T 2423.7—95 《电工电子产品环境试验第二部分:试验方法倾跌与翻到试验》;
GB/T2423.8—95 《电工电子产品环境试验第二部分:试验方法自由跌落试验》进行跌落试验。
说明:上面13项比较全面地概括了产品在实现使用过程中碰到的外界环境;实际测试时,因为各产品本身属性的相差较远、使用环境相差也很大,各公司可以根据产品的特点,适当选取、增加一些项目来测试(此产品对应的国/行标中要求的必测试项目,当然是必须测试的);也可以根据产品特定的使用环境与使用方法,自行设计一些新测试项目,以验证产品是否能长期工作。
测试条件:不同的产品测试条件不一样;就拿高温测试来说,有些产品要求做高温贮存测试,有些要求做高温运行测试,有些产品的高温用85℃做测试,有些产品的高温是用65℃做测试。但是,宗旨只有一个,那就是至少满足国/行标。要测试一种产品的可靠性,找到这种产品的国/行标是必需的,按照国/行标的要求和指引找出必须的测试项目与各项目的测试方法,从而进行环境测试;
同一种产品,在不同的阶段,测试条件也不一样;一般而言,产品会经过研发、小批量试产、批量生产三个不同的阶段。在研发阶段,测试条件最严(应力最大)、测试延续的时候最短;小批量试产阶段,测试应力适中、测试时间适中;批量生产阶段,测试应力最小、测试时间较短;三个阶段的主要差别见下表:
阶段 实验目的 实验特点 实验要求
研发 发现设计缺陷,扩大设计余量 高应力、短时间 无故障
中试 考察产品是否达到基本的可靠性水平 中应力、中长时间 无明显故障
批量生产 生产工艺条件的稳定性 低应力、短时间 有条件的允许故障发生
鉴定 鉴定产品的可靠性、计算产品的MTBF 低应力、长时间 无特别要求
加速环境试验技术
传统的环境试验是基于真实环境模拟的试验方法,称为环境模拟试验。这种试验方法的特点是:模拟真实环境,加上设计裕度,确保试验过关。其缺陷在于试验的效率不高,并且试验的资源耗费巨大。
加速环境试验AET(Accelerated Environmental Testing)是一项新兴的可靠性试验技术。该技术突破了传统可靠性试验的技术思路,将激发的试验机制引入到可靠性试验,可以大大缩短试验时间,提高试验效率,降低试验耗损。加速环境试验技术领域的研究与应用推广对可靠性工程的发展具有重要的现实意义。
加速环境试验
激发试验(Stimulation)通过施加激发应力、环境快速检测来清除产品的潜在缺陷。试验所施加的应力并不模拟真实环境,而以提高激发效率为目标。
加速环境试验是一种激发试验,它通过强化的应力环境来进行可靠性试验。加速环境试验的加速水平通常用加速因子来表示。加速因子定义为设备在自然服役环境下的寿命与在加速环境下的寿命之比。
施加的应力可以是温度、振动、压力和湿度(即所谓“四综合”)及其他应力,应力的组合亦是有些场合更为有效的激发方式。高温变率的温度循环和宽带随机振动是公认最有效的激发应力形式。加速环境试验有2种基本类型:加速寿命试验(Accelerated Life Testing)、可靠性强化试验(Reliability Enhancement Testing)。
可靠性强化试验(RET)用以暴露与产品设计有关的早期失效故障,但同时,也用于确定产品在有效寿命期内抗随机故障的强度。加速寿命试验的目的是找出产品是如何发生、何时发生、为何发生磨耗失效的。下面分别对2种基本类型进行简单阐述。
1、 加速寿命试验(ALT)
加速寿命试验只对元器件、材料和工艺方法进行,用于确定元器件、材料及生产工艺的寿命。其目的不是暴露缺陷,而是识别及量化在使用寿命末期导致产品损耗的失效及其失效机理。有时产品的寿命很长,为了给出产品的寿命期,加速寿命试验必须进行足够长的时间。
加速寿命试验是基于如下假设:即受试品在短时间、高应力作用下表现出的特性与产品在长时间、低应力作用下表现出来的特性是一致的。为了缩短试验时间,采用加速应力,即所谓高加速寿命试验(HALT)。
加速寿命试验提供了产品预期磨损机理的有价值数据,这在当今的市场上是很关键的,因为越来越多的消费者对其购买的产品提出了使用寿命要求。估计使用寿命仅仅是加速寿命试验的用处之一。它能使设计者和生产者对产品有更全面的了解,识别出关键的元器件、材料和工艺,并根据需要进行改进及控制。另外试验得出的数据使生产厂商和消费者对产品有充分的信心。
加速寿命试验的对象是抽样产品。
2、可靠性强化试验(RET)
可靠性强化试验有许多名称和形式,如步进应力试验、应力寿命试验(STRIEF)、高加速寿命试验(HALT)等。RET的目的是通过系统地施加逐渐增大的环境应力和工作应力,来激发故障和暴露设计中的薄弱环节,从而评价产品设计的可靠性。因此,RET应该在产品设计和发展周期中最初的阶段实施,以便于修改设计。
国外可靠性的有关研究人员在80年代初就注意到由于设计潜在缺陷的残留量较大,给可靠性的提高提供了可观的空间,另外价格和研制周期问题也是当今市场竞争的焦点。研究证明,RET不失为解决这个问题的最好方法之一。它获得的可靠性比传统的方法高得多,更为重要的是,它在短时间内就可获得早期可靠性,无须像传统方法那样需要长时间的可靠性增长(TAAF),从而降低了成本。
RET的目的是要引起失效,因此它是破坏性试验,试样数量尽可能少。进行RET的理想时间是在设计周期的末期,此时设计、材料、元器件和工艺等都准备就绪,而生产尚未开始。通常RET的做法是施加预定的环境应力和工作应力(单独加、顺序加或同时加),从小量级开始,然后逐步增加直到出现以下3种情况:
全部试样失效;
应力值大大超出服役期望值;
出现非相关失效。(非相关失效是指服役中不可能出现的失效模式)
可靠性强化试验也是针对少量抽样产品进行的。
3、其它类型加速环境试验
可靠性试验还包括可靠性统计试验,即可靠性鉴定试验和可靠性验收试验。基于加速环境的可靠性统计试验(即加速可靠性鉴定试验和加速可靠性验收试验)是加速环境试验亟待解决的一个问题。该问题的核心是通过高量级的加速环境试验数据去评估试样在低量级的服役环境中的可靠性水平。在产品的全寿命周期管理中,它们的功能在一定条件下可以由前述2种加速环境试验来实现。
4、加速环境试验在产品全寿命周期管理中的应用
在产品的设计、研制、生产和使用直至寿命末期整个寿命周期内,其可靠性的设计、改进、评估都离不开环境试验手段,而加速环境试验在产品的设计、研制和生产中是实现产品的可靠性增长和确定、评估产品可靠性水平的重要手段。
根据市场需求和用户的要求确定产品之后,就可初步设计好产品雏形。此时一般需要对元器件和原材料进行选择,选择代表试样进行加速寿命试验,从而确定所选择的元器件和原材料。产品设计完成并制造试样后就可以进行可靠性强化试验(RET),以实现可靠性增长。这将是一个逐步清除设计上的薄弱环节的过程,同时,可以对材料和工艺方法进行加速寿命试验,为产品的正式生产奠定基础。这是一个反复的过程,即是一个试验——分析改进——试验的循环过程。为了确定产品的有效寿命,需要对产品的抽样进行加速寿命试验(ALT或HALT),同时加速寿命试验还将为ESS提供必要的有关产品的数据。在清除了设计上的缺陷及薄弱环节之后,产品可以正式批量生产。环境应力筛选方案可以根据ALT(或HALT)确定的极限来确定。以最为有效的温度循环和宽带随机振动为例,两端的温度应该比工作极限约低20%,用在生产中的ESS振动量级应该约为振动破坏极限的50%。在确定了试验剖面后,便应该对几个(一般至少3个)试样进行筛选方案的验证(POS),以证实筛选既不造成缺陷,又不消耗掉很多有效寿命。
通过筛选的产品可以出厂,没有通过筛选的产品在经过纠正后同样可以出厂,因为筛选并没有过多地降低产品的有效寿命,只是检测到了在制造过程中引入的缺陷。
应该指出的是,何时进行何种试验并没有严格的界线,如环境应力筛选可能会在可靠性强化试验中进行,不过此时所进行的环境应力筛选目的是对试样进行筛选、老炼、排除产品试样的早期故障,使其故障率趋于稳定,而不让早期故障在可靠性强化试验中暴露,造成不必要的浪费。另外,并不是所有的加速环境试验都是必需的,如可靠性强化试验所提供的信息,在承制方及订购方的共同认可下,是可以完成加速可靠性鉴定试验的功能的,而环境应力筛选(或高加速应力筛选)亦能实现加速可靠性验收试验的要求。
产品在使用过程中所获得的数据对于产品的可靠性增长也是相当有用的。同样的产品在不同的环境条件下使用,可能会表现为不同的可靠性量值,故产品的可靠性必须在真实的使用环境中或者在模拟的真实环境条件下验证,才能获得准确的可靠性数据。因此,应该重视在使用中反馈的信息,与以前的试验进行分析比较,对于改进试验方法、进一步提高产品的可靠性都有重要的意义。
总之,可靠性管理是贯穿于产品全寿命周期的一项工程,也是增强产品的市场竞争力的保证。
加速环境试验已应用于通讯、电子、电脑、能源、汽车等工业部门,并且在航空、航天、军工方面的应用也得到了迅速的发展。据报道,惠普、福特、波音等国际知名企业已相继采用可靠性强化试验技术进行新产品研制的可靠性增长试验,并由此获得高可靠性,缩短产品研制周期,取得了明显的经济效益。我国有关研究机构也对此进行了研究,加速环境试验将成为可靠性试验的补充和发展。
环境测试一般偏重于产品对外部条件适应能力的测试,如温度,湿度,电磁环境等。而其本身的工作状况不会变化,如电流、电压、机械负载等。
狭义的可靠性测试一般偏重于产品本身的性能,如在大电流或机械过载的条件下的性能稳定性,而其工作环境则保持在正常使用条件下。
广义的可靠性测试也可包括环境测试。
二、EMC测试
随着电子产品越来越多地采用低功耗、高速度、高集成度的LSI电路,使得这些系统比以往任何时候更容易受到电磁干扰的威胁。而与此同时,大功率设备及移动通讯和无线寻呼的广泛应用等,又大大增加了电磁骚扰的发生源,因此我们应提高产品本身抗干扰能力,即要求产品必须具备在一定的电磁环境下能正常工作的能力。某些产品在EMC方面的测试是国家强制要求进行的。通常状况下,EMC需要测试如下项目:
传导发射;
辐射发射;
静电抗扰性测试;
电快速脉冲串抗扰性测试;
浪涌抗扰性测试;
射频辐射抗扰性;
传导抗扰性:
电源跌落抗扰性;
工频磁场抗扰性;
电力线接触;
电力线感应;
三、其它测试
环境测试和EMC测试基本上包括了通常状况下所有的测试;这里再列举一些测试项目,可以根据情况适当选用:
1、 外观测试;
附着力测试;
耐磨性测试;
耐醇性测试;
硬度测试;
耐手汗测试;
耐化妆品测试;
2、 寿命测试;
某一器件中活动部件的活动次数;
某一配件(如电视的摇控器)的使用寿命;
两个器件拨插联结的拨插次数;
3、 软件测试;
基本性能测试;
兼容性;
边界测试;
竞争测试;
压迫测试;
异常条件测试;
上述测试中,对于可以找到国/行标的产品,按国/行标的要求执行,对于找不到国/行标的产品,就只能做对比测试*了;*对比测试就是用至少两种产品在同一状况下做测试,然后测量各产品的性能,找出一系列数据,判定被测产品的那一种更好;
四、测试条件
说明:对某一具体产品做测试时,所有的测试条件必须以对应的国标、行标为准。没有国/行标时,应该根据实现的使用情况选定测试条件,下面的测试条件是由中兴公司的大虾提供(非常感谢这位不知道姓名的老兄),主要是用于测试CDMA手机,在此仅作其他产品的参考使用。
1. 高温贮存
高温测试的温度TH必须高于Tmax(Tmax指产品技术条件规定的高温工作温度)。研制测试时温度最高(一般取Tmax+20℃)、小批量试产测试时温度次之(一般取Tmax+15℃)、例行测试最低(一般取Tmax+10℃)。
2. 低温贮存
低温测试的温度TL必须低于产品技术条件规定的低温工作温度。研制测试最低,转产测试次之,例行测试最高;通常状况下三个阶段的TL都取-40℃。
3. 温度循环应力
高温保持温度同高温测试温度;低温保持温度同低温测试温度。
温变率大于1℃/min,但应小于5℃/min。
循环次数大于2次(研制测试)或8次(转产测试)。
温度保持时间大于0.5小时(对无外壳单板)或2小时(对整机)。
4. 高温高湿应力
测试温度为产品的高温工作温度加5℃。湿度为90%±3%;测试时间为24小时。
5. 随机振动应力
最高频率大于500Hz. 最大功率谱密度为0.02(对单机)∽0.04(对单板)g2/Hz.
测试方向为X,Y,Z,每方向30min.但如果抗振动性能较差的方向能通过振动测试,则其它方向可以免作。移动产品带电振动。
6. 扫频振动的应力
频率范围10-55Hz;恒定振幅0.35mm.
扫频速率每分钟1个倍频程。
测试方向X、Y、Z,每方向25分钟。但如果抗振动性能较差的方向能通过振动测试,则其它方向可以免作。移动产品带电振动。
7. 冲击振动的应力
冲击波型半正弦,脉冲宽度11ms.
冲击强度30g;冲击方向X、Y、Z,每方向正负3次。
如果抗冲击能力较差的方向能够通过冲击测试,则其它方向的冲击测试可以免做。
8. 开关电应力
在高温,低温和湿热条件下各开关电3次以上,在整个测试过程中开关电10次以上。
9. 电源拉偏应力
在常规条件下做电源拉偏测试。
一次电源(如交流220V和直流-48V)要求拉偏20%,至少10%。
二次电源(如直流5V)拉偏10%,至少5%。
将市电转换成产品使用的高压直流电的AC/DC设备为一次电源,将一次电源转换成单板使用的低压直流电的DC/DC设备为二次电源。
10.冷启动应力
将产品关电,在产品低温测试温度下“冷浸”0.5(对单板)∽2小时(对机柜式产品),然后开电,产品应能正常工作。
将以上过程重复100次以上。
11.盐雾应力
盐溶液为浓度5%的NaCl溶液。连续盐雾测试的时间为24小时。
交变盐雾测试的时间为:盐雾2小时,40℃90%湿热22小时,重复3个周期。
盐雾测试温度为35±2℃。
12.模拟汽车运输的应力
按实际发货的要求包装和装载。用载重汽车在三级公路上以20-40公里时速跑200公里,或在J300模拟汽车运输台上振动90min.
13.淋雨测试的应力
将产品按实际使用的状态放置,上电工作,功能正常。
用花洒喷头对产品喷水,流量约为10L/min。喷头距产品表面约半米,对产品表面各处均匀喷水(底面除外)。
喷头中心的出水方向与水平方向的夹角大于30度。
喷水时间根据产品体积大小,分别选取5分钟、10分钟、20分钟。
喷水后产品功能正常。
14.附着力测试
用锋利刀片(刀锋角度为15°~30°)在测试样本表面划10×10个1mm×1mm小网格, 每一条划线应深及油漆的底层;用毛刷将测试区域的碎片刷干净;用粘附力350~400g/cm2的胶带(3M600号胶纸或等同) 牢牢粘住被测试小网格,并用橡皮擦用力擦拭胶带,以加大胶带与被测区域的接触面积及力度;用手抓住胶带一端,在垂直方向(90°)迅速扯下胶纸,同一位置进行2次相同测试;
结果判定: 要求附着力≥4B时为合格。
5B-划线边缘光滑,在划线的边缘及交叉点处均无油漆脱落;
4B-在划线的交叉点处有小片的油漆脱落,且脱落总面积小于5%;
3B-在划线的边缘及交叉点处有小片的油漆脱落,且脱落总面积在5%~15%之间;
2B-在划线的边缘及交叉点处有成片的油漆脱落,且脱落总面积在15%~35%之间;
1B-在划线的边缘及交叉点处有成片的油漆脱落,且脱落总面积在35%~65%之间;
0B-在划线的边缘及交叉点处有成片的油漆脱落,且脱落总面积大于65%。
15.耐磨性测试
用专用的日本砂质橡皮(橡皮型号:LER902K),施加500g的载荷,以40~60次/分钟的速度,以20mm左右的行程,在样本表面来回磨擦300个循环。
结果判定:测试完成后以油漆不透底时为合格。
注:如果采用的是UV漆,用方法一测试要求达300个循环,用方法二测试要求达500个循环。
16.耐醇性测试
用纯棉布蘸满无水酒精(浓度≥99.5%),包在专用的500g砝码头上(包上棉布后测试头的面积约为1cm2),以40~60次/分钟的速度 ,20 mm左右的行程, 在样本表面来回擦拭200个循环。
结果判定: 测试完成后以油漆不透底时为合格。
17.硬度测试
用2H铅笔(三菱牌),将笔芯削成圆柱形并在400目砂纸上磨平后,装在专用的铅笔硬度测试仪上( 施加在笔尖上的载荷为1Kg,铅笔与水平面的夹角为45°),推动铅笔向前滑动约5mm长,共划5条,再用橡皮擦将铅笔痕擦拭干净。
结果判定:检查产品表面有无划痕,当有1条以下时为合格。
注:如果采用的是UV漆,硬度要求达3H以上。
18.耐化妆品测试
先用棉布将产品表面擦拭干净,将凡士林护手霜(或SPF8的防晒霜)涂在产品表面上后,将产品放在恒温箱内(温度设定在60℃±2℃,湿度设定在为90%±2%), 保持48h 后将产品取出,用棉布将化妆品擦拭干净。检查产品外观,并测试油漆的附着力、耐磨性。
结果判定:产品表面无异常, 附着力和耐磨性测试合格。
19.耐手汗测试
将汗液浸泡后的无纺布贴在产品表面上并用塑料袋密封好,在常温环境下放置48h后,将产品表面的汗液擦拭干净,检查油漆的外观,并测试油漆的附着力、耐磨性。
结果判定:产品表面无异常,附着力和耐磨性测试合格。
注:汗液的成份为氨水 1.07% ,氯化钠0.48%,水98.45%。
20.温度冲击测试
将样品放入温度冲击测试箱中;先在-40℃±2℃的低温环境下保持1h ,在1min内将温度切换到+85℃±2℃的高温环境下并保持1h ,共做24个循环(48 h)。测试完成后,检查产品的外观,并测试油漆的附着力、耐磨性。
结果判定:产品表面无异常,附着力和耐磨性测试合格。
补:三类测试的差别
可靠性试验则是提高产品可靠性的重要工作项目和手段,典型的可靠性试验有三类:A.可靠性增长试验; B.可靠性鉴定试验; C.例行试验。 三类主要差别如下:
可靠性增长试验 可靠性鉴定试验 例行试验
试验目的 在研制过程中模拟实际的或加速的使用条件进行试验,使产品存在的设计(包括电路设计、结构设计和工艺设计)缺陷变为硬故障而充分暴露,对故障进行分析、采取纠正措施,根除故障产生的原因或降低故障率到可以接受的值,使产品的固有可靠性得到增长 验证产品的设计能否在规定的环境条件下满足规定的性能及可靠性要求。试验结果作为判断设备能否定型的依据。适用于设计定型的鉴定 对产品各项指标进行全面检验,以评定产品质量和可靠性是否全部符合标准和达到设计要求。对于批量生产的产品检验其质量稳定性和一致性。适用于生产定型、批量生产后的一定周期和在产品设计、工艺、材料有较大变动后的检验。
试验条件①电应力 根据输入交流电源电压和输入直流电源电压的允许变化范围,部分时间在设计的标称输入电压下工作,部分时间在最高输入电压下工作,部分时间在最低输入电压下工作。例如:程控用户交换机应在AC220V,DC-48V、DC-40V~-57V范围内正常完成接续 同可靠性增长试验 除电源电压拉偏试验外,在标称输入电压下工作。电源拉偏试验根据不同的产品参考有关标准在最高、最低电压下工作
试验条件②热应力 所施加的应力强度可略高于使用时的应力强度,以不引起新的故障机理为限。如温度循环一般可以将略高于产品高温温度、略低于产品低温温度作为温度循环的上、下限温度,温度变化率可取5℃/min或10℃/min。循环周期时间根据温度变化率而定 将产品工作高温温度作为试验温度 按产品标准的工作高、低温温度进行各种功能和指标的检验。按产品标准的储运高、低温温度进行储运试验。
③工作模式试验条件 模拟在规定条件下的各种工作模式。工作模式指的是:连续工作,断续工作,高温启动,低温启动,全负荷工作,轻负荷工作等 模拟在规定条件下满足全面检测受试产品的功能、性能参数和指标的工作模式 同可靠性鉴定试验
④检测参数试验条件 在试验前、后及过程中某些规定控制点应检测受试产品的性能参数。可以检测产品标准中规定的所有参数,也可以只检测某些主要参数 在试验过程中全面检测受试产品的功能、性能参数和指标 在试验过程中或试验后检测受试产品的规定功能、性能参数和指标
⑤试验时间 一般为试验 产 品 的 MTBF(θ1最低可接受值)的几倍。试验时间=每个产品实际试验时间×试验产品数加速系数τ 根据统计试验方案确定 按各种试验项目的相应标准规定进行。例如:高温、高温储存、低温、低温储存保持时间2小时,恒定湿热保持48小时等;
⑥试验产品数试验条件 至少2个产品(如果可能) 为了缩短产品实际试验时间,只要试验装置允许,应尽可能增加试验产品数量,一般至少要2个 根据GB2829周期检查计数抽样程序及抽样表(适用于生产过程稳定性的检查)和试验装置的具体情况决定试验产品数量
试验方案或试验项目 可靠性增长方案:可靠性增长应有增长目标值(θ0可接受质量水平),必须要有可靠性增长模型。典型的可靠性增长模型有Duane模型和Amsaa模型。在试验达到终点应该达到或超过规定的可靠性指标 见下(一) 例行试验包括如下试验项目:① 高温试验② 低温试验③ 恒定湿热试验④ 运输(振动);
试验合格性 在规范化的试验设备中,当试验结果达到规定的可靠性指标,认为合格。若增长试验结束时未达到规定的可靠性指标,则作为不合格处理 按选择的统计试验方案规定的接收或拒收判据作为产品是否合格的依据 抽样方案在GB 2829 选择。产品质量以不合格数表示。产品质量等级的最终判定按检测项目所达到的最低质量等级确定。(即B类不合格数达到的质量等级和C类不合格数达到的质量等级两者中取较低者)
失效判据 见下(二) 同可靠性增长试验 对受试产品进行试验和检查,根据每一项试验的结果和检查结果确定是否有B类不合格或C类不合格,分别累计所有试验和检查的B类不合格和C类不合格即为受试产品的B类不合格数和C类不合格数
(一):可 靠 性 鉴 定 试 验
① 试验方案的种类有两种:
a 定时截尾试验方案
根据已知的0(可接受质量水平),1(最低可接受值),(生产方风险),(使用方风险)(或鉴别比d),查表可得具体的试验方案,包括:需要的试验时间(以1为单位)、接收判决数和拒收判决数。试验时间=受试产品累计试验时间之和×加速系数τ。采用这种试验方案时,试验到需要的试验时间,按规定的试验方案做出接收或拒收判决。或者若试验虽未达到规定的试验时间,但失效数已大于或等于标准中规定的拒收判决数时,亦可停止试验。
b 截尾序贯试验方案
根据已知的0,1,鉴别比d,查表可得具体的试验方案,再根据已进行的累计试验时间和累计失效数确定是接收、拒收还是继续试验。
② 试验方案的选择
a 当需要预先知道准确的总试验时间和试验费用时,选用定时截尾试验方案。
b 对于质量较好或质量较差的产品时,选用截尾序贯试验方案。
c 如果需要短时间内做出判断,并且可承担较高的风险时,选用高风险试验方案(==30%)。
③ 用试验观察数据估计平均故障间隔时间MTBF
a 区间估计的置信度:选取1-2β作为双边置信区间的置信度,选取1-β作为单边置信区间的置信度。
b 采用定时截尾方案接收时对MTBF的估计:MTBF的观测值θ=试验时间/失效数
根据总失效数及规定的置信度,查表读出下限因子和上限因子,用下限因子和上限因子分别乘观测值θ,得MTBF的下限值θL和上限值θU。非定时截尾接收方案,MTBF的观测值同上式,上、下限因子查有关国/军标。
(二):可 靠 性 增 长 试 验
① 在产品标准中应该对每个被测参数规定可接收的性能范围。若任一参数超出这种范围时,应称作一次失效。如果不只是一个参数偏离了规定范围,而且能证明不是同一原因使这些参数超出规定范围时,每一种参数的偏离都应算作产品的一次失效。如果参数偏离规定范围是同一原因造成的,只记作产品的一次失效。
② 出现两种或多种独立失效的情况下,每一种失效情况都应认作受试产品的一次失效。
③ 由于元器件时好时坏,或因虚焊、漏焊、短路、开路、接触不良等造成的产品故障,均记入失效数内。
④ 产品在一个有限时间内停止工作,接着又在没有任何外界激励的情况下恢复工作,这叫间歇失效,应记作受试产品的一次失效。
⑤ 已经证实是未按规定的条件使用所引起的故障、仅属某项将不采用的设计所引起的故障、以及外加应力超过规定值所引起的故障叫“非关联故障”,否则叫“关联故障”, “非关联故障”不记入受试产品失效数内。但应记录并采取措施以防止再度发生。
⑥ 由于另一个组成部分失效而引起的失效,称作从属失效,不记入产品失效数内。
经过各种测试,若发现产品失效,就应该采取相应的措施,有些时候只需要更换一个器件即可,有些时候只需要调整一个器件的输出即可,但有些时候却要更改设计才能避免一个缺陷。当增加一个器件受到成本和产品大小的限制时,也会考虑到更改设计(如当某一器件发热导致产品时,可以增加一个风扇,当产品内部空间不允许这样做时,就要考虑更改设计了);
下一节将介绍,在设计时常用的方法,以增强产品性能、增长产品可靠性。 期待下一節 我也期待下一節
可靠性增长
第三节 可靠性增长假设对某一产品/系统要求的可靠性为:MTBF大于2000H,那么在对此系统立项时,MTBF应该设立怎么样的目标值?如何达到这一目标值,这就关系到可靠性预计和分配。
开展可靠性预计和分配工作,是确保设计、生产“好”产品的指导性和基础性工作。首先将产品可靠性指标自上而下逐级地分配到产品的各个层次,借此落实相应层次的可靠性要求,并使整个与各部分之间的可靠性相互协调。尽量做到既避免出现薄弱环节又避免局部“质量过剩”而带来浪费。可靠性预计则是自下到上地预计产品各层次的可靠性参数,判断各层次设计是否满足分配的可靠性指标。只有各层次的可靠性分别达到分配的要求,才能保证产品可靠性指标得以实现。对未达到分配指标要求的设计,则能发现其可靠性薄弱环节、设计上的隐患及提供选择纠正措施的指南,并依此改进设计直到满足指标要求为止。在产品设计阶段就应该“设计进”规定的可靠性指标,也就是必须通过开展可靠性预计和分配工作尽早来落实产品的可靠性指标,而不是靠产品既成之后的抽样统计试验结果。
一、MTBF的设计目标值
为了使产品满足使用要求,也就是为了使产品的MTBF达到一定的最基本的要求,我们应该在从设计阶段就开始考虑这个要求;很显然,如果要求产品在使用时MTBF为200H,那产品在设计的MTBF就应该比200H大,才有把握保证产品的MTBF满足这一要求。使用时MTBF与设计时MTBF一般情况下满足如下关系:
可靠性定量指标MTBF(θ)有诸多参数,它们之间关系上图所示。
θT(MFHBF)——门限值。根据用户需求或使用要求而定;
θMAV——最低可接收值,一般θMAV/θT=1.25,它是考核指标;
θ1——MTBF检验下限值,在统计测试方案中,当产品MTBF真值接近或等于θ1时,以高概率拒收该产品,一般θ1/θMAV =1.25。
θ0——MTBF检验上限值,在统计测试方案中,当产品MTBF真值接近或等于θ1时,以高概率接收该产品,一般θ0/θ1 =D0;
按GJB 899测试方案Ⅲ,α=β=0.1,D0=D=2;
θp——MTBF设计值,又称规模值,是《研制任务书》中规定和期望达到的指标;按GJB299预计θp/θo=1.25。
所以θp/θT=3.9;也就是说,设计目标值最小应该在实现使用要求值的4倍;一般情况下设计值为实现使用要求值的5~10倍。
二、可靠性模型
为了定量分配、估计和评价产品的可靠性,建立产品的可靠性模型是一种直观的、有效的方法。可靠性模型包括可靠性方框图和可靠性数学模型。产品典型的可靠性模型有串联模型和并联模型,还有些复杂的模型等等。例如(本例中各参数的意义、各参数与其它可靠性参数之间的关系,随后有详述):
(1)m个单一系统串联(只要有一个单元失效,整个系统就失效)
(2)m个单一系统并联(只要有一个单元能工作,整个系统就能工作):
(3)三个混合联结:
(4)复杂可靠性模型的建立
对于复杂结构模型,如果是简单的串并或并串的混联结构,其建模和数学模型的计算较简单。对很难转换为简单的串并结构模型的分析需采用其他方法,常用的有布尔真值法、概率展开分析法、贝叶斯法等;这里不作叙述。
注:产品的可靠性框图表示产品中各单元之间的功能逻辑关系,产品原理图表示产品各单元的物理关系,两者不能混淆如,某振荡器由电感和电容器组成,从原理图(图A)上看两者是并联关系,但从可靠性关系上看,两者只要其中一个发生故障,振荡器都不能工作,因此是串联模型(图B)。
三、可靠性分配
在产品的设计阶段,就要把要求的MTBF“设计进”产品里。当产品的结构复杂时,将可靠性指标自上而下逐级地分配到各个简单的结构。它是一个由整体到局部,由上到下的分解过程,这个过程就叫做可靠性分配。可靠性分配有许多方法,如等分配法、评分分配法、比例组合法、动态规划法等。
1、等分配法
顾名思义,等分就是将失效率分配到各个部件时,是均分的。如一个有两个模块的系统要求MTBF为500H,则分配到每个模块的MTBF都为1000H。
2、评分分配法
在产品的可靠性数据缺乏的情况下,可以请熟悉产品、有工程实际经验的专家,按照影响产品可靠性的几种主要因素(如:复杂度、技术成熟度、重要度及环境条件)进行评分(每一种因素的分值在1~10之间,难度越高评分越高),然后根据评分的结果给各分系统或部件分配可靠性指标。例如某个系统(要求的MTBF为500h)由A/B/C/D四个部件组成,各部件评分如下表:
部件 复杂度 技术成熟度 重要度 环境条件 各部件评分 各部件评分系数Ci 分配给各部件的故障率 分配给各部件的MTBF
A 8 9 6 8 3456 0.462279 0.00092456 1081.597
B 5 7 6 8 1680 0.224719 0.00044944 2225
C 5 6 6 5 900 0.120385 0.00024077 4153.333
D 6 6 8 5 1440 0.192616 0.00038523 2595.833
合计 7476 1 0.002 500
说明:(1)对四个部件(A/B/C/D)按四种因素评分后,填入上表;
(2)对A部份而言,最后评分为8*9*6*8=3456;B的评分为5*7*6*8=1680;同理C的评分为900、D的评分为1440;最后四部分总分为:7476;
(3)对A部份而言,评分系数为3456/7476=0.46;B的评分系数为1680/7476=0.22;C的评分系数为0.12;D的评分系数为0.19;
(4)对整个系统而言,失效率为1/500=0.002;
所以分配给A的失效率为:0.46*0.002=0.0009,对应的MTBF为1081.6H;
同理得B/C/D的失效率和MTBF。
3、比例组合法
只是在一些资料上看到说有这项内容,但是我也没有听说过,也没有查到,所以………………55555555……
四、可靠性预计
为了达到分配的目标值,首先要知道的是将要设计的系统的可靠度可以达到什么水平。如果系统可以达到的MTBF远大于设计目标,就可以进行研发;如果小于设计目标值,就必须重新设计。那么如何确定将要设计的系统的MTBF值?在产品研发早期阶段各种信息还不足,无法计算,仅能用概略预计法进行可靠性指标预计;
现推荐一种简便、准确、实用方法,即《简单枚举不完全归纳快速预计法》,简称CW可靠性指标预计法。CW法预计公式:
λS——系统失效率
λ0——电子元器件平均基本失效率,对于国产器件λ0=10-5-10-6(1/h)、对于进口器件λ0=10-7-10-8(1/h);
K1——降额设计*效果因子,根据降额设计水平不一样,一般取K1=(10--1)×10-2;考虑到产品的体积、重量与成本,一般取K1=10-1;
K2——环境应力筛选效果因子、产品经过环境应力筛选测试,可靠性将有一定幅度提高,一般K1=0.5--0.1。
K3——环境影响因子。产品使用于不同环境其取值也不同,K3取值见下表:
使用环境 K3 推荐值
测试室内 0.5--1 1
普通室内 1.1--10 5
陆用(固定) 5--10 8
车载 13--30 20
舰船载 10--22 15
机载 40--80 50
K4——机械结构影响因子。在使用中,机械结构件也会产生故障。一般取值K4=1.5--3.5;
K5——制造工艺影响因子。产品在制造过程中,制造工艺不良也会影响产品可靠性;一般取值K5=1.5--3.5;
N——系统所含电子元器件数量;
MTBFS——系统平均故障间隔时间;
用CW法预计可靠性指标,只需要知道设计中所以用到的电子元器件的个数、电子元器件的产地、系统将要使用的环境(就可以估计出系统的λS,从而得到MTBF);
*降额设计是一种为了提升产品可靠性而常用的设计方法,此部分内容随后给出说明。这里先给出一个CW法预计实例(例一):
某陆用移动产品,该产品含有进口电子元器件约为2000个,其固有可靠性指标为:
λS=λ0·K 1·K 2·K3·K4·K 5·N
=10-7×10-1×0.5×5×1.5×2×2000
=15×10-5/h
在使用过程中,要求MTBF为200H,则设计目标值为800H,6667>800,也就不需要改动了。但用户要求MTBF为2000H(则设计目标值为8000H),对于一个MTBF为6667H的系统(此时的可靠性称为系统的基本可靠性),为了达到MTBF为8000H的要求,就必须提升系统完成任务的能力(也就是提升系统的任务可靠性)。这种使产品的可靠性获得提高的过程称为可靠性增长。
五、可靠性设计方法
1、降额设计;
降额设计,为了提升电子设备的可靠性而常用,主要是指构成电子设备的元器件使用中所承受的应力(电应力和温度应力)低于元器件本身的额定值,以达到延缓其参数退化,增加工作寿命,提高使用可靠性的目的。
施加在电子元器件上的电应力、热应力大小直接影响电子元器件的失效率高低。如锗NPN晶体管基本失效率与电应力及热应力关系,如果温度不变(0℃),而从满负荷使用降至额定负荷的0.1使用,则基本失效率降低了6倍;如果电应力不变(额定负荷的0.1)而温度从90℃降至0℃,则基本失效率降低了16倍;如果负荷及温度都降低,电应力从额定值0.6降至0.1,而温度从55℃降至0℃,则基本失效率降低到原来的1/20。
在降额设计中,“降”得越多,要选用的元器件在性能就应该越好,成本也就越高,所以在降额设计过程中,要综合考虑。电子产品发展到今天,人们已经总结出“降额”的通用准则。但并不所有的电子产品都可以“降额”,在实现设计过程时,应该注意:
A、不应将标准所推荐的降额量值绝对化,应该根据产品的特殊性适当调整;
B、应注意到,有些元器件参数不能降额;
C、一般说来,对于电子元器件,其应用应力越降低越能提高其使用可靠性,但却不尽然。如聚苯乙烯电容器,降额太大易产生低电平失效;
D、为了降低元器件的失效率,提高设备可靠性而大幅值降低其应用应力,按其功能往往需要增加元器件数量和接点,反而降低了设备可靠性;
E、对器件进行降额应用时,不能将所承受的各种应力孤立看待,应进行综合权衡;
F、不能用降额补偿的方法解决低质量元器件的使用问题,低质量产品要慎重使用;
2、冗余设计
一个系统的可靠度为MTBF=6667H,达不到设计目标值MTBF=8000H;如果把两个这样的系统“并联”起来,结果将会怎么样呢?
分析:
一个系统的可靠度MTBF=6667H,对应的失效密度为λ1,可靠度为R1,失效率为F1;并联后的系统对应的失效密度为λs,可靠度为Rs,失效率为Fs;则:
Fs=F1×F1,
F1=1-e-1t
Fs=1-e-st
λ1 =1/MTBF
MTBFs=1/λs
近似计算后得:MTBFs=1.5×MTBF=10000(h),也就满足了设计目标值;
这就是一个简单的冗余设计例子;
冗余设计过程中,必定会增加整个系统的体积、成本等;在整个设计过程中也要综合考虑。在进行冗余设计时,一般情况下应注意:
A. 在设计时应在可靠性、体积、重量及成本四者之间进行权衡优化设计;
B. 在设计时,不是构成系统所有的单元都需要进行冗余设计,应选取那些可靠性薄弱环节和对执行任务及安全性影响至关重要单元进行冗余设计。
C. 为了提高系统的任务可靠性,如果提高单元的元器件可靠性可以与进行冗余设计有相同可靠性水平;同时,提高单元的元器件水平较易且成本不高,那就采取提高单元的元器件可靠性水平,即选用高可靠元器件,尤其对长期工作的通讯产品尤为重要,往往在较长工作时间更显现出选用高可靠元器件的优越性;
从上面的冗余设计中,可以看出两个单元结构是并联的。除并联处还有很多其它的结构/模型,这里不作多述。
3、热设计
对电子产品而言,一方面当温度升高时失效率成指数形式增加、一方面是有些电子只能在某一温度下使用,为了提升产品的可靠性,工作过程中,让系统稳定在一个合适的温度是非常必要的;这样,在设计的最初就应该考虑到热量的产生与发散的问题,这部份工作就是热设计的主要内容;
3.1 热量的产生
电子设备内部热源主要是一些发热的电子元器件,如电真空器件、半导体器件、集成块以及电阻器、电容器、变压器、流圈等,它们的热能均由电能转换而成;集成电路的热耗一般用Vcc×Icc计算;
高速飞行的导弹以及其它的飞行器,由于空气阻力的作用,在设备的外壳上将产生大量的热量,这些热量将传到装在飞行器内的电子设备中;
为了克服机械运动过程中的摩擦力将损失部分能量,这又是一种热能的转换形式;
新电子设备所使用地点不同和载体用途不同及其在载体上所处位置其环境温度也大不相同。如月球表面在太阳照射情况下可大274℃,而石油厕井仪探头在进入300m井下可达300℃多;
3.2 热传导公式
传热类型 数学公式 参数说明
传导散热 Q=KA△t/L Q=传导散热量(W) K=导热系数(W/m ℃)A-导体横截面积(m2) △t-传热路径两端温差(℃)L-传热路径长度(m)
自然对流 散热 Q=h△t Q=对流散热量(W) R=换热系数(W/m2℃)A-有效散热面积(m2) △t-换热表面与流体温差(℃)
辐射换热 Q=εσT4 Q=辐射散热量(W) ε=散热表面辐射率(W/m2℃)T-绝对温度(K) σ-斯蒂芬-玻尔兹曼常数(W/m2℃)
半导体器件 自然冷却 (tj-ta)/ф=Rj+Rb +Rf tj——器件结温 ta——环境温度Rj——内热阻 Rb——界面热阻Rf——散热器热阻 ф——器件功能
3.3 热设计常用的技术措施
为了使元件不在过高温度下工作、以避免参数漂移、保持电气性能稳定,为了提升电子设备的可靠性、延长使用寿命,在产品最初设计时,我们就应该考虑到产品的热性能,使整个系统工作在合理的温度范围内。电子设备的冷却方法有多种,可以单独地或由几种冷却方法联合作用(如自然冷却、强迫冷却、蒸发冷却、半导体制冷等方法),将热量从设备中(或元件上)带走,或传到设备外的周围介质中去;
在热设计时,常用的技术措施有:
1. 应最大限度地利用传导、自然对流和辐射等简单、可靠的冷却技术。
2. 应尽可能地缩短传热路径,增大换热(或导热)面积。
3. 元器件安装时,要充分考虑周围元器件辐射换热的影响,热敏器件应远离热源或采取热屏蔽措施。
4. 增加表面黑度,提高辐射换热能力。
5. 对太阳辐射应有相应的防护措施。
6. 对嵌埋状态的热源,须用金属传热器通至冷却装置。
7. 对需散热1K以上的元器件应安装在金属地底盘或传热通道上,并通至散热器。
8. 在需要高传热性能时,可靠考虑采用导热管,导热管散热量可比实心铜导体高数百倍。
9. 如果环氧玻璃树脂印制线路板不足散发所产生的热量,应考虑加设散热网络和金属条散热。
10. 应控制印制板组装件之间的间距,一般可控制在19-21mm之间。
11. 采用强制风冷系统时应保证在箱内有足够的正压强。
12. 进气口和排气口之间应有足够距离,要避免热风回流。
13. 进入的空气与排出的空气之间的温差应小于14℃。
14. 设计时,应注意强迫通风与自然通风的方向尽量一致。
3.4热设计常用流程
4、EMC设计
电磁兼容是研究在有限的空间、时间和频谱资源下,各种设备或系统可以共存而不致引起降级的一门科学。电磁兼容(EMC)包括电磁干扰(EMI)和电磁敏感度(EMS)两个方面。电磁兼容是指设备或系统在其电磁环境中能正常工作且不对该环境中任何事物构成不能承受的电磁骚扰的能力。
要提升这种能力,有许多应用课题要解决,如:电磁波的散射、透射、传输、孔缝耦合,各种干扰源的机理和特性,各种干扰参数的计算和测试,各种结构的屏蔽效果,各种防护方法、测试方法、标准等等。对应设计的方法也有多种,如:防静电设计、防雷设计、防地电位升设计等等;一般从以下方面考虑,以保证产品的EMC特性:
1、静电放电的防护。首先要阻止电流直接进入电子线路,最普通的办法就是建立完善的屏蔽结构(必要时在外壳与电路之间增加第二层屏蔽层),屏蔽层接到电路的公共接地点上。对内部的电路来说,如果需要与金属外壳相连时,必须采用单点接地的方式,防止放电电流流过这个电路,造成伤害。
2、屏蔽。采用屏蔽的目的有两个:一是限制内部的辐射电磁能越过某一区域;二是防止外来的辐射进入某一区域。主要对电场、电磁场、磁场进行屏蔽(现实对磁场的屏蔽更难)。
3、接地。接地的目的一是防电击,一是去除干扰。接地可分为两大类,即安全接地与信号接地。接地时应该注意:接地线愈短愈好、接地面应具有高传导性、切忌双股电缆分开安装、低频宜采用单点接地系统、高频应采用多点接地系统、去除接地环路;
4、滤波。实际工作中,无法完全做好接地与屏蔽的工作。因此,会采用滤波(将不需要的信号去除)的方式来弥补不足,主要通过滤波电路来实现。在实际使用中,由于设备所产生的杂讯中共模和差模的成分不一样,所采用的滤波电路也有变化,可适当增加或减少滤波元件。具体电路的调整一般要经过EMI测试后才能有满意的结果。
5、三次设计
三次设计也称田口方法,是田口玄一(日本)创立的优化设计的方法。他认为,设计可以分三个阶段进行:系统设计(提出初始设计方案)、参数设计(寻求参数的最佳搭配,提高产品性能的稳定性)、容差设计(对关键件以合适的公差范围)。三次设计的目的是用廉价元器件做成质量上乘、性能稳定可靠的产品。
在三次设计中,参数设计是最重要的,是三次设计的核心。通过参数设计,即使采用参数波动大的元器件,产品的整机性能仍十分稳定。如何达到此目的?首先使系统达到最大的信噪比(即保证系统在各种干扰的影响下是最稳定的),而不是保证目标输出值;接着再把系统的输出特性值调整到目标值(这样可以大大地提高产品的稳定性)。这个过程其实质在于非线性效应的利用。
在一个非线性系统/器件中:
1、器件的输入X与输出Y的一般波形如下图;
2、我们期望的目标输出值在A点;
3、在A点附近,如果输入的变化量Dx,对应的输出变化量Dy将很大;
4、所以在参数设计时,找到此器件最稳定的输出点:B点;
5、在B点附近,如果输入的变化量Dx,对应的输出变化量DY将很小;
6、针对B点的输出,我们采用一个线性器件把输出值调整到对应A点的值即可。
可靠性保证
第四节 可靠性保证研发阶段,产品可以达到较高的可靠性要求,这只是第一步,只说明产品内在可靠性能达到要求(下文简称“设计可靠性”);但在生产制造过程中,若无适当的质量控制或可靠性措施,就会引起可靠性退化现象;批量生产的产品的可靠性,下文简称“生产可靠性”。实际上,在绝大部分企业内,生产可靠性都会比研发可靠性差。另外,大家都知道,虽然产品在工厂进行了各种测试,但由于测试设备和运行操作都比较正确,在这种情况下往往处于较好的磨合状态,问题尚不能及时暴露;而实际使用中运行条件(如野外的风沙,海上的风浪等)和使用人员的文化素质以及操作水平往往不够规范,在使用中失效的发生频率要高得多。因此,从整个系统上来保证可靠性得以“延续”是必要的。
一、文件的控制
文件控制的基本要求:保证所有使用的文件都是有效文件。
文件是知识的表现形式(如培训资料等)、是指导作业的基础(如操作指导文件等)、是衡量产品质量的标准(如检验规范等)、是处理异常事情的依据(如合同等),是一个公司必不可少的东西,而公司也应该确保文件的正确性和充分性。对文件的控制,包括对客户资料的控制、各种标准的控制、公司内部四级文件(质量手册、程序文件、操作指导、作业记录)的控制,一般由文控中心(或资料室)来完成文件的控制。
为方便控制,所有要求控制的文件都应该有编号、版本号;文控中心通过对每一次发放做记录来完成新文件的发放、新旧文件的更换,保证使用者手上只有一个最新版本。为方便查找,文控中心可以通过一些Excel表格、Access数据库来管理文件;
怎么与ISO9000如此相似?其实也就我从ISO9000上摘录下来的。
二、原材料和供应商的控制
原材料和供应商控制的基本要求:保证每个原材料满足技术图纸要求。
对原材料,通过检验来控制质量。对原材料分为两类检验:一是性能方面的常规检验,针对每批进货检验,采用两方都同意的AQL依GB2828抽样、检验;二是可靠性方面的例行测试,在一段时间(一个月、或一个季度)内进行一次测试,采用两方都同意的RQL依GB2829抽样、检验。对检验结果的记录、统计和分析,也直接影响到采购量的多少,以及是否有必要更换供应商等等。一般要求,每种原材料至少有两家供应商。
对供应商,主要能过产品质量、交货期、服务等方面考查,并给予适当的评价,必要时到供应商生产地点做现场审查;以确认供应商能及时地提供性能稳定的产品。
三、生产过程和异常改善的控制
生产过程控制的基本要求:制作流程中的每个工艺都满足相应的规范要求;
对生产过程而言,要求每次投入生产的物料都是合格物料并有明确的标识,每个工艺中用到的设备在有效校验期内、设备的参数设定正确,每个工位的操作过程与操作指导完全一致,每个工艺的输出满足标准要求,每个操作指导是最新有效版本等等。对生产过程中可靠性出现的异常,应该有记载,找出原因、分析改善、防止再发,并按改善后的内容,写入标准,指导今后作业。生产制作的控制主要考虑以下几个方面。
3.1 生产工艺过程的可靠性控制
一般说来,生产工艺由生产制造加工方法、设备、工序、作业标准(规程)、检测方法等要素构成。同一种产品往往可采用各种不同的工艺制造;相同的工艺,如果构成要素的参数表述不同,对产品可靠性影响的作用也会有所不同。生产工艺对可靠性指标的作用与影响如下图所示:
显然,优良的工艺方法是生产过程中可靠性增长的保证。众所周知,产品在生产过程中又常会有许多随机事件发生,同时产品在使用过程中也存在很多随机事件直接影响产品的可靠性,这就使定量表示生产工艺对可靠性指标的影响有相当困难,但我们可以把工艺引起的故障原因分析归类(见下图)。
由工艺引起的故障原因除了1.1产品参数标准与1.3检验测试标准外,其余的都会导致生产过程中可靠性的退化。因此,在生产工艺方面实行可靠性控制,有两大任务。
①通过完善工艺结构,改进工艺方法,制定与实施作业标准等措施,保障生产过程中减少乃至消除可靠性退化。
②通过工艺方面的可靠性分析、评审,找出影响可靠性的各种隐患,反馈给设计部门更正,改进设计质量,以提高产品的内在可靠性。
3.2 设备的工艺可靠性控制
设备的工艺可靠性是指在规定范围和时间内,设备保持满足工艺过程中与其有关的质量指标数值的性质。它是引起产品可靠性退化的重要因素。
依据设备在生产工艺过程中接受的任务不同,一般分为生产设备、检测设备和运输设备等,可靠性控制内容与要求主要有:
1.生产设备的工艺可靠性控制
生产设备的工艺可靠性与其本身的完善程度、自动化水平、工作原理与控制方式等情况有密切联系。
用来减轻工人劳动强度或弥补人类工作能力的生产设备,因其使用效果取决于工人的技术熟练程度(如手工操作的电焊机),则其工艺可靠性控制要由操作工人素质(如技术水平、工作责任心等)来保证。为此,要重视和强化生产操作工人的质量意识教育和业务技能培训,制订与坚决实施先进合理的作业标准,通过人的控制,完成工艺任务的设备装置工艺可靠性。因加工结果与设备装置的调整及工艺参数密切相关,故应明确规定需控制的工艺参数值,严密监控工艺流程或工序,以保证工艺参数值稳定,从而保证这些设备装置的工艺可靠性。
用于自动控制的生产设备,则应重视和保证传感器、计算机程序等硬、软件的可靠性,以保证设备的工艺可靠性。
2.检测设备的工艺可靠性控制
检测设备用于测量生产过程中工艺参数(此部份测试直接影响工艺过程的可靠性)或检验成品/半成品的质量状况(此部份虽本身不直接影响工艺过程的可靠性,但检测不正确既会影响对上道工序工艺可靠性做出正确评估,又影响下道工序的工艺可靠性)。因此,必须按ISO10012《计测设备的质量保证要求》配备齐全,检定合格,严格管理。如检测设备精度一定要满足工艺参数测量要求,并与其相匹配,量值传递和溯源要保证计量准确、量值可靠;没有通过ISO标准,也应该有足够的证据说明设备能满足生产需要。
3.运站设备的工艺可靠性检测
生产过程中,免不了产品、半成品或零部件的搬运、包装、保管和运输等工序,也就必然要使用一些传递、运输方面设备。这就要注意和防止振动、冲击、压力及环境等因素对产品可靠性的影响,并加以严格控制,以防止可靠性退化。
4. 设备使用过程的可靠性控制
绝大多数产品在使用期内的失效率与其使用状况密切相关。产品的可靠性随使用条件、使用时间而变化,如超额使用时,失效率提高,有效使用期缩短。因此,使用过程中的可靠性控制就成为可靠性管理十分重要的环节了。
一般说来,随着使用时间的延长,产品系统在内外各种原因及使用中所产生的各种能量(如:机械能、热能、化学能、电磁能等)的影响下可靠性会降低。不同结构、不同用途的产品系统,其使用周期(从使用至报废为止的整个产品生命周期,包括:工作期、停工期和维修期)也不相同。
我们按产品工作期内特征进行分类,并根据这些特征采取可靠性控制措施,以延长产品保持正常工作能力的时间(详见表6)。 表6:
工作期特征 示例产品 无故障时间要求 可靠性控制措施
修理 维护保养
连续不断工作 发电站组监控仪表 √ 全部使用工作时间 载荷频谱分析技术辅助分析和检测可靠度
周期性工作 机床 √ 两次修理之间工作期 不知道,我也没有查到
季节性工作 农业机械渔业机械 √ 季节工作持续时间 不知道,我也没有查到
断续工作 汽车 视情况而定 工作所需时间 不知道,我也没有查到
短期性工作 火箭弹药 × 储存时间+工作 不知道,我也没有查到
3.3 可靠性改进
可靠性改进是生产过程中,提升可靠性的最有利手段,也是唯一可以使生产可靠性高出设计可靠性的方法。通过对工艺、设备的有效控制,可以使生产可靠性无限接近设计可靠性;只有在生产过程中对可靠性的改善,才可以让生产可靠性超过设计可靠性。
依靠产品在可靠性测试时的不良、使用期的实际信息,进一步优化产品系统结构,采用新材料、新技术和新工艺,提高产品所用的各种元器件、零部件质量等级,必要时调整其安全系统和降额系数,以提高产品的可靠性水平,这些活动统称为可靠性改进。它是质量改进的重要组成部分,可以用PDCA循环来处理,也可以用SPC中的二十字真经来指导作业“找出异因、查明真象、改善措施、防止再犯、形成标准”。
四、产品贮存和运输的控制;
产品贮存/运输控制的基本要求:不让产品受到额外的应力; 对贮存而言,需要控制温、湿度,防止挤压、倒塌等,必要时防静电;运输过程中要防止受到超标准的振动、碰撞等,必要时控制温度、温度和静电;
五、人员的培训
无论是从那个方面来说,人员的培训都应该做好。按照ISO9000的要求和规定,我们应该把各个岗位的人员培训到最合适的程度。在所有的培训当中,操作工人的培训最容易被忽视,在自动化程度不高的情况下,操作工人的培训恰恰是最重要的。
这一节,概括性较强,主要是其指导思想与ISO9000一致。一个满足ISO9000要求的公司,在这方面也就做得很好。较难的是:每次发现异常后的改善。它需要良好的沟通和浑厚的技术基础,它要求工作人员在工作中不断地积累经验。
可靠性实施
第五节 可靠性实施通常状况下,在一个公司里,先进行生产,当生产进行到一定阶段后,才开始考虑质量控制,最后随着时间的推移,产品隐含的问题慢慢暴露出来,才体会到要进行可靠性控制,才考虑到需要一名可靠性工程师。作为一名可靠性工程师,在这种情况下,如何推行可靠性工作?一般情况下,实施可靠性分为:编写计划、可靠性测试、可靠性提升、可靠性保持等四大步;
其实可靠性工作中最主要、最有效、最根本的是上面四大步之外的第五步:可靠性设计;但目前99%以上的公司(除军工企业外)其可靠性设计都只停留在前四步,没有充分的可靠性设计。我们也就不在这里讨论如何实施可靠性设计的问题(各位大虾在今后的工作中,应该把这为主要目标)。
现在,你有幸成为一个公司的可靠性工程师,那么你要做的就是前面四步。
一、制定可靠性工作计划
对大部份公司来说,可靠性工作还只是在起步阶段;相当一部份公司在可靠性方面的工作也很被动,有些在客户要求提供有关可靠性的资料、数据时才开始做可靠性工作,有些甚至是在产品遭到退货后才起步做可靠性工作,或者比如小霸王,即使退货了也不愿意改变自己的僵化的错误思想;很多公司在可靠性方面的工作还是空白。虽然公司领导人开始着手考虑可靠性的问题(不然,他不会招你做可靠性工程师),但是在公司而言,绝大部分人员对可靠性还是陌生的,所以最初的计划阶段就显得尤为重要。
首先,你被公司招聘为可靠性工程师,负责有关的可靠性的工作。
接着,你需要宣传可靠性工作的重要性;可靠性工作不是靠一个人的力量能完成的,要让公司上下每个人员都明白可靠性的重要性、必要性,特别是高层领导的重视。可靠性不够好的产品,依然能用,所以很容易被大部份人忽视。另外可靠性的工作,其效果在半年内很难看出来,没有领导的重视,很难顺利进行下去。你可以在适当的时候用对比性较强的数据(如以前的产品遭客户投诉/返修率,与做过可靠性的产品的客户投诉/返修率)说明可靠性的重要性。
之后,编写可靠性测试计划;在对可靠性的重要性作普及性的介绍后,就可以针对本公司的产品做一些可靠性测试的计划。建议可靠性计划分两部分,第一部分是可靠性测试方案,包括测试流程、取样方法、测试方法、结果判定等具体内容;第二部分是可靠性工作目标,这部分当然是写你希望在工作期间把可靠性工作做在研发阶段,通过可靠性设计来控制公司产品质量、降低产品成本。这一个可以见的成果,计划一定要写,而且还要领导签字。第一部份是让领导知道你能做很多实际的事,第二部份是让领导知道你有大志向。
最后,推广可靠性测试计划;这是较关键的一步,其主要目的做到是让公司员工知道可靠性要测试什么,以便有针对性地提升可靠性;通过推广、讨论,还能使公司员工在更多方面达到一致,减少走弯路的可能性。可以跟生产技术部、研发部讨论可靠性测试工作,可以给市场部、生产、售后等部门开展一些培训的工作,必要时还可以请其它公司“高手”来本公司做一些讲座等等。总之,要让全公司都知道你是可靠性工程师,这样做的好处你很快就能亲身体验到。记住:不要担心你讲的内容太简单(隔业如隔山,即使有个别人对某一点理解比你深,但他知道的也不会比你全面)、不要担心培训时间太短(越短越好,只要长于10分钟即可),不要怕(没有人是完美的,不然你年薪早超过百万美元了),你是被公司领导确认后专门做可靠性的专家。
二、执行可靠性测试
一切准备工作做好后,就开始第二步:测试产品的可靠性。
在开真正测试前,还有一些准备工作,如是否有用于测试的设备等。一般来说,可靠性测试主要分为环境测试和机械测试;做环境测试你至少需要一台“温湿度交变箱”,最好还有一台低温冰箱;做机械测试在执行测试时,你至少应该有“机械振动台”,最好还有一个“机械冲击台”。一般小公司,在实验设备上不会很完善,需要你一手把它建起来(从温湿度箱到振动台、到EMC实验室….)。如果公司里什么设备都没有,那么购买一台温湿度箱是必要的(价格不高,利用率不低),机械振动台可以不买(价格较高,利用率不高;可以出资金去第三方测试)。如果在你来公司之前,公司零零散散地做过有关可靠性的测试,可能有一些人员和设备,那么你在进行可靠性测试时,就应该申请把这部份纳入你的“门”下,命名为“可靠性实验室”或“可靠性测试部”,其实可能只有一台温温度箱、一个作业人员,但没关系,只有“自立门户”才有发展。等有了温湿度箱后,你就可以开始测试了。
基本性能的测试;可靠性测试前,必须对产品的基本性能做出判断。经过性能的测试,可以将产品分为三个档次:一是良品、二是不良品、三是次品(介于良品和不良品之间,在标准左右20%的部分)。良品可以用来做可靠性测试、不良品不可以用来做可靠性测试、次品需要分析(有些是因为制作过程中的缺陷导致-这部分不可用来做可靠性测试、有些只是一些随机现象参数略有偏差-这部分可以用来做可靠性测试)。除了判断是否可以用来测试外,最主要的是还可以用来与可靠性测试后的性能做对比。
可靠性测试;按测试计划,对相应的产品进行振动、高温等测试。每次测试后,需要对产品的基本性能进行测量(有些测试要求在测试过程中进行基本性能的测量);再进行对比、分析可靠性测试前后基本性能的变化,确定可靠性测试结果。测试时注意:测试过程中,让设备自动记录(最好能打印)测试环境;测试后对样品的测量最好能与样品所属阶段责任人一起。
测试的变动;很多原因,导致你在实际工作过种中需要对某些测试进行相应的变动。如:①去较远的地方进行振动测试,你可以将多种产品的振动测试“集中”到一起;②有人认为测试时间太长(可靠性测试可能会在1000Hrs左右),你应该考虑加速测试(按近似做法:温度很升高10℃,产品的寿命减半;详细做法见下一节);③如设备同时控制温湿度时在最初的上升阶段可能会超出范围,你可以改成先设定温度再设定湿度;④温度冲击测试可能由一个高温箱、一个低温箱和人工来实现(不用花30万购买温度冲击箱);⑤当需要在100℃以上时带湿度,你可以用高压锅来实现(要考虑测试的精度);等等。不管有怎样的变动,你都应该有详细变动记录、测试记录。
三、可靠性增长
你不能只停留在可靠性测试阶段,可靠性工作的精髓在于可靠性设计,只有做好可靠性设计/增长才能节约成本、提升产品质量。可靠性的提升主要集中在研发阶段、定型之前。一旦设计已经定型、或进入量产阶段,再想从设计上改善可靠性,已经是不太可能(浪费太多、成本太高)。而大部分公司都是因产品可靠性差、受到整个市场的要求后(返修成本增加、退货增多)才开始考虑到可靠性的,但此时产品已经投入市场!此时想把这些产品的可靠性提升到一个新的高度已经不可能,你能做的只是看着居高不下的返修率,但你必须做好下一次产品的可靠性。建议最初你把精力放在一个产品上,做好一个产品的可靠性。如何进行可靠性增长?
首先,要掌握的是生产流程、制作工艺,每个流程的操作方法也是应该完全了解的。这一点,无需解释,必须做到。
其实,要学习一定的技术,至少你要掌握该公司产品的工作原理。你虽然不是研发部门,但你要责任研发产品的可靠性,完全不懂相应的技术,工作很难开展。如果是元器件产品,对用到的每种原材料及原材料的特性应该了解;如果是系统类产品,对硬件、软件、结构都应该有了解,如各模块的功能、模块之间的接口、软件的功能等等。
接着,要建立一个团队(给她一个好名字),负责可靠性增长,成员多多益善,但至少应包括:公司领导、可靠性工程师、研发工程师、生产技术、物流人员各一名。团队的力量和必要性这里我就不多说了。
最后就是改善行动;当测试过程中出现不良时,必须针对不良现象进行分析、改善,将改善措施标准化,这样才能保证品质得到提升。最常用的方法就是“测试-改善-测试”,如此循环,逐步提升。需要强调的是,每一次改善,应该认真、彻底地处理,用数据来结案。与ISO9000一样,一次改善通常包括以下几个步骤。
1、可靠性测试;按测试计划,取样进行测试;
2、现象描叙;这一部份应该尽可能详细地描叙不良现象,包含产品的名称(软硬件版本号),发生时间、地点,做到“按时间顺序记录与产品有关的所有状况”;
3、原因分析;对原因的分析,应该追根究底,找出问题的根本原因,而不是在现象之间转化,做到“人工产生此原因时,现象能完全再现”;
4、改善行动;根据分析的原因,采取对应的措施。此时应该考虑两方面:一是现有的其它产品是否也会这样的问题,如何改善;一是如何防止后续产品出现此类问题;
5、效果确认;主要确认两点:一是改善行动是否有执行;一是执行了改善行动后的产品是否还会出现这样的问题(用数据证明)。
6、形成标准;如果经确认,改善措施有效(不良率下降),就应该把这些措施写进操作规范,指导后续生产。还要考虑这种措施是否对其它类似产品也有效等问题;
7、再取样,再测试。
经过多次这种“测试-改善-测试”,产品的缺陷会越来越少,品质也就越来越好。最终,当样品进行可靠性测试时,无缺陷出现。
四、可靠性保持
可靠性保持主要是指在进行大批量生产时,产品的可靠性能稳定保持在最佳状态;较难做到的是“稳定地保持在最佳状态”,要做到这一点需要多方面的努力。
1、供应商
为了保证供应商供应的原材料稳定在最佳状态,我们可以分四步控制:
1. 认真选择供应商,确保其满足“合格供应商资格”;
2. 供货过程中,IQC检验、可靠性检验要严格执行;
3. 所有过程信息共享;检验过程中出现的问题和异常情况,应该第一时间通知供应商,寻求改善,要通过各种途径证明改善效果良好,方可结案;
4. 定期向供应商反馈品质状况,必要时开会讨论。
2、生产过程
生产是一个包含最多“变数”的过程,机械化与自动化是保证稳定的最有效因素;在未现实完全自动化的状况下,生产过程主要有以下控制点:
1. 检验投入使用的物料状况良好;
2. 检验各工位操作是否满足操作要求;
3. 检验各工位输出是否达到下一工位要求;
4. 检验产品性能是否满足成品要求;
5. 检验产品可靠性是否达到规定的要求;
3、测试
针对公司的产品进行各种测试。测试过程中,任何问题都需要给予改善,以提升产品品质。
任何一个问题的出现,就是给我们指出一个前进的方向;对问题的改善,标志着品质又上升了一个台阶。有这种态度,还有什么办不到的。
可靠性计算
第六节 可靠性计算一、概率与统计
1、概率;这里用道题来说明这个数学问题(用WORD把这些烦琐的公式打出来太麻烦了,因为公司不重视品质管理,所以部门连个文员MM都没有,最后我只好使用CORELDRAW做的公式粘贴过来,如果你的电脑系统比较慢,需要耐心等待一会公式才会显示来,不过别着急,好东西往往是最后才出来的嘛!)。
题一、从含有D个不良品的N个产品中随机取出n个产品(做不放回抽样),求取出d个不良品的概率是多少?
解:典型的超几何分布例题,计算公式如下(不要烦人的问我为什么是这样的公式计算,我虽然理解了一些,解释起来非常麻烦,别怪我不够意思,是你自己上学的时候只顾早恋,没有学习造成的,骂自己吧!):
超几何分布:(最基本的了):
最精确的计算,适用比较小的数据
其中: N—— 产品批量 D —— N中的不合格数
d —— n中的合格数 n —— 抽样数
另外的概率计算的常用算法还有:
二项分布:(最常用的了,是超几何分布的极限形式。用于具备计件值特征的质量分布研究):
只是估算,当N≥10n后才比较准确
其中:n —— 样本大小 d —— n中的不合格数
ρ—— 产品不合格率
泊松分布:(电子产品的使用还没有使用过,只是在学习的时候玩过一些题目,我也使用没有经验)
具有计点计算特征的质量特性值
其中:λ—— n ρ n —— 样本的大小
ρ—— 单位不合格率(缺陷率) e = 2.718281
2、分布;各种随机情况,常见的分布有:二项分布、正态分布、泊松分布等,分位数的意义和用法也需要掌握;较典型的题目为:
题三、要求电阻器的值为80+/-4欧姆;从某次生产中随机抽样发现:电阻器的阻值服从正态分布,其均值80.8欧姆、标准差1.3欧姆,求此次生产中不合格品率。
公式好麻烦的,而且还要查表计算,555555555555,我懒得写了,反正我也没有做过电阻。
3、置信区间:我们根据取得样品的参数计算出产品相应的参数,这个“计算值”到底跟产品的“真实值”有什么关系?一般这样去描述这两个量:把“计算值”扩充成“计算区间”、然后描述“真实值有多大的可能会落在这个计算区间里”,从统计学上看,就是“估计参数”的“置信区间”;较典型的题目为:
题四、设某物理量服从正态分布,从中取出四个量,测量/计算后求得四个量的平均值为8.34,四个量的标准差为0.03;求平均值在95%的置信区间。
解:因为只知道此物理量服从正态分布,不知道这个正态分布对应的标准差,所以只能用样品的标准差来代替原物理量的标准差。这时,样品的平均值的分布就服从t分布。4个样品、95%的置信区间,对应的t0.975(3)=3.182;所以平均值的置信区间为:
8.34±3.182×(0.03/2)=
这说明,此物理量的总体平均值有95%的可能落在8.292和8.388之间。
二、可靠性常用的分布
1、指数分布;第一章里提到浴盒曲线对应的指数分布为F(t)=1-e-t;如何得到这一分布?
设产品在t时间内总的失效率F(t),则:
在t时刻产品的存活率R(t)=1-F(t);
在t时刻的失效为t时间内的失效率的导数、即f(t)=F’(t);
在t时刻的失效率为t时刻的失效比t时刻的存活率、即f(t)/R(t)。
根据浴盆曲线,当产品在稳定失效阶段时任意时刻的失效率为λ。
综上,即得到等式:λ=f(t)/R(t)=F’(t)/(1-F(t));
解此微分方程得到一个特解:F(t)=1-e-t;
所以R(t)=e-t,这就是指数分布;
2、威布尔分布;与指数分布相比,只是变量λ不一样。威布尔分布的F(t)=1-e^(-t/a)^b;当b=1时,F(t)=1-e^(-t/a),这也就是指数分布;我们威布尔分布来看看其它参数:
R(t)=1-F(t)=e^(-t/a)^b;
f(t)=F`(t)=(b/t)*(t/a)^b*e^(-t/a)^b;
失效率=f(t)/R(t)=(b/t)*(t/a)^b;
3、对数正态分布;顾名思义,说明产品在t时间内的失效率与t服从对数正态分布,也就是说F(t)与ln(t)成正态分布。标准表达式为:F(t)=Φ((lnt-ln(T50))/δ);
根据各种分布,都可以方便地求出产品MTBF。
要求出产品的MTBF就必须找到样品的失效时间,这样我们必须取出一定的样品做特定的测试、记录样品的失效时间,然后计算产品的MTBF。在开始计算MTBF之前,我们先插述各种测试的筛选强度,也就是此种测试能发现样品存在缺陷的可能性。
三、筛选强度
在进行环境应力筛选设计时,要对所设计的方案进行强度计算。这样才能更有效的析出产品缺陷。在典型筛选应力选择时,一般恒定高温筛选用于元器件级,温度循环用于板级以上产品;温度循环的筛选强度明显高于恒定高温筛选。下面介绍一些筛选强度(SS)的数学模型。
1、恒定高温筛选强度
SS=1-exp [-0.0017(R+0.6)0.6t]
式中:R—高温与室温(一般取25℃)的差值;t—恒定高温持续时间(h);例:用85℃对某一元器件进行48H的筛选,则其筛选强度为:44.5% =1- EXP(-0.0017*((85+0.6)^0.6)*48);
2、温度循环的筛选强度
SS=1-exp{-0.0017(R+0.6)0.63N}
式中:R—温度循环的变化范围(℃);V—温变率(℃/min);N—温度循环次数;例:用60℃到-40℃以10℃/min的速率做15次循环(每个循环20min,15个共计5H)则对应的筛选强度为:99.87%=1-EXP(-0.0017*((100+0.6)^0.6)*((ln(2.718+10))^3)*15);
3、随机振动的筛选强度
SS=1-exp{-0.0046(Grms)1.71·t}
式中:t—为振动时间(min);Grms---单位G;(这个地方我也没有找到资料)。
四、MTBF的计算
1、基本MTBF的测试
在实际工作过程中,很多时候并不需要精确在知道某个产品的MTBF,只需要知道是否可以接受此产品。这时,只需要对产品进行摸拟运行测试,当产品通过了测试时,就认为产品达到了要求的MTBF,可以接受此产品。
如何确定产品应该进行什么样的测试,也就是我们应该用多少样品进行多长时间的测试?根据MTBF(平均失效间隔时间)的定义,从“平均”这一个看来,失效的次数越多计算值就越能代表“平均值”,当然失效的次数越多对应的总测试时间也就越长;一般情况下要求:只要测试时间允许,失效的次数就应该取到尽可能地多。
下面用一个例子来说明测试条件的确定方法。
题五:某种产品,要求在90%的信心度下MTBF为2000H,如何判定此产品的可靠性是否达到了规定的要求?
可以转化为判定此产品是否能通过规定时间的模拟运行测试,其关键是要找出测试时间;测试时间=A×MTBF,A这个因子与“在这段时间内允许失效的次数”和“90%的信心度”有关系。根据已经成熟的体系,直接代用公式:
A=0.5*X2(1-a,2(r+1))
X2(1-a,2(r+1))是自由度为2(r+1)的X平方分布的1-a的分位数;
a 是要求的信心度,为90%;r 是允许的失效数,由你自己决定;
此分布值可以通过EXCEL来计算,在EXCEL中对应的函数为CHIINV;
如允许失效1次时,A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89;所以应该测试的时间为:3.89×2000=7780H。也就是当设备运行7780H是只出现一次失效就认为此产品达到了要求的可靠性。
7780H是324天(7780/24=324),快一年了,做一次测试花一年的时间?太长!我们可用这样去调整:①增加测试的总样品数;7780从统计上看,准确地说是7780台时、它是“机台×时间”这样一个量,也就是所有样机的测试时间总和;如果测试中有50台样机,则只需要测试155.6H;如果有100台样机,则只需要测试到77.8H(强烈建议在MTBF的测试中采用尽可能多的样品数);②减少允许失效的次数;允许失效的次数为0时,同上计算后得到测试时间为4605台时(一般不建议采用此种方式来缩短测试时间,这样会增大测试的误差率)。
对于价格较低、数量较多的产品(如各种元器件、各种家用电器等),用上面介绍的方法,可以很方便地进行测试;但当产品的价格较高、MTBF较高的产品如何测试?
题六:某种产品,要求在90%的信心度下MTBF为20000H,因单价较贵,只能提供10台左右的产品做测试,请问如何判定此产品的可靠性是否达到规定的要求?
还是转化为测试。即使有10台产品全部用于测试,20000H的MTBF也需要测2000H左右,这个时间太长,应该怎么办?
此时一般用到加速测试。对一般电子产品而言,多用高热加速,有时也用高湿高湿加速。根据加速模型(Arrhenius Model),得知加速因子的表达式为:
AF=exp{(Ea/k)*[(1/Tu)-(1/Ts)]+ (RHu^n-RHs^n)}
Ea为激活能(eV),k为玻尔兹曼常数且k=8.6*10E-5eV/K。T为绝对温度、RH指相对湿度(单位%)、下标u指常态、下标s指加速状态(如RHu^n指常态下相对湿度的n次方),一般情况下n取2。
Ea根据原材料的不同,有不同的取值,一般情况下:
氧化膜破坏 0.3Ev
离子性(SiO2中Na离子漂移) 1.0—1.4Ev
离子性(Si-SiO2界面的慢陷阱) 1.0eV
由于电迁移而断线 0.6eV
铝腐蚀 0.6—0.9eV
金属间化合物生长 0.5—0.7eV
根据产品的特性,取Ea为0.6eV,则在75℃、85%RH下做测试1h,相当于在室温(25℃、75%RH)的加速倍数为:
AF=EXP(0.6*((1/298)-(1/348))*10^5/8.6+(0.85^2-0.75^2))=34
若充许一次失效,在90%的置信度下,需要测试的时间为:Ttest=A*MTBF ,A的计算同上用EXCEL计算,即:A=0.5*CHIINV(1-0.9,2*2)=0.5*CHIINV(0.1,4)=0.5*7.78=3.89;
所以要求的室温下的测试时间为:Tu=3.89*20000=77800H;
换算后,在高温下的测试时间为:Ta=778000/AF=2288Hrs;
最后,测试方案就是:将10台设备在75℃、85%的下进行228.8Hrs的测试,如果失效次数小于或等于一次,就认为此产品的MTBF达到了要求。
还有一种情况就是,不知道Ea,公司内部以前没有数据、行业也没有推荐使用的具体值。此时就只能近似估计。具体方法如下:在三个高温(t1,t2,t3, t1<t2<t3)下做测试,t1下的产品较多(建议在50台),t2下的产品其次(建议在30台),t3下的产品最少(建议在10台),计算出三个温度下产品的寿命,然后计算出此产品对应的Ea。只考虑温度时,产品寿命Life=EXP(Ea/kT),对方程式两边取对数Ln(life)=(Ea/k)*(1/T),将三个温度点下对应Ln(life)和(1/T)画图,拟合直线的斜率就是Ea/K。
实际工作中,没有那么样品,只能用最少的样品数:9台(每个温度下各三台)。具体做法是:
a.取三台设备在高温T下运行,观察产品的失效情况。若产品较快失效,则取t1=T,t2=t1-15℃,(1/t3)-(1/t1)=2((1/t2)-(1/t1));若产品长时间没有失效,则取t3=T,t2=t3+15℃,(1/t3)-(1/t1)=2((1/t2)-(1/t1))。
b.根据三个温度点对应的产品寿命时间,计算出此产品的Ea。
上面的方法对元器件都比较适用,对一些系统,可能就不太合适了。
2、基本MTBF的计算
因为MTBF是一个统计值,通过取样、测试、计算后得到的值与真实值有一定的差异;而且具体到每个产品时,其失效间隔时间与MTBF又有一定的差异,又有置信度的概念,这样您的计算值与客户的要求高出一些(如多出1个数量级),就可以接受。如客户要求产品的MTTF为20年,我们计算出来为100年,是可以接受的,如果计算出来刚好是20年,反而让人觉得是不是用不到20年。如何计算产品的MTBF,这里给出两个我用到的方法。
一个日本客户要求我们的“光隔离器”(一种用在光路上的不可修复的元器件,只能让光顺行而不能逆行,相当于电路上的二极管)的产品寿命为20年,我们进行了如下动作。
第一步:找到计算公式;我们使用Bellcore推荐的计算公式:MTBF=Ttot/( N*r);
说明:N为失效数(当没有产品失效时N取1);r为对应的系数(取值与失效数与置信度有关);
Ttot为总运行时间;
第二步:找到可靠性测试的数据;我们直接采用我们做过的“高温高湿贮存”的结果:11个样品在85%RH、85℃下贮存2000Hrs时没有失效发生;
第三步:找到对应的激活能(Ea);我们采用Bellcore推荐的Ea,为0.8eV;
第四步:计算在温室下的运行时间;
①因为没有样品失效,所以N=1;
②r取0.92(对应60%的置信度)或2.30(对应90%的置信度);
③光隔离器在室温下运行,相当于40℃/85%的贮存;
④Ea为0.8eV,计算得到从85℃/85%到40℃/85%的加速倍数为42;
⑤60%的置信度下,MTBF=Ttot/(N*r)=(11*2000*42)/(1*0.92),结果即为114年;
90%的置信度下,MTBF=Ttot/(N*r)=(11*2000*41.6)/(1*2.30),结果即为45年;
从上面的计算可以看出,此计算用到了两个条件:进行了高温高湿测试、产品对应的激活能取0.8,这两个条件在Bellcore里、针对光隔离器的文件1221中有推荐使用。很多时候,因为测试时间太长(如1000H、5000H等)没有进行、激活能难以确定用多少才合适,所以不可直接计算,需要进行一些相关的测试。
取9个样品,分三组,分别在85℃、105℃、127℃下运行,运行过种中“在线监测”产品性能(虽然产品本身有很多参数要测试,在我们的测试中取最主要的参数IL监测,光通信业认为当产品的IL变化量超过0.5dB时就认为产品Fail)。实际测试中,产品在127℃下运行很快Fail,当产品在105℃下运行Fail,停止了测试,各种数据如下表:
温度值(A) 初始IL(B) 停止时间(C) 停止IL(D) 变化量(D-A) 变化量均值
127 0.31 300 0.81 0.50 0.50
0.46 500 0.96 0.50
0.37 400 0.87 0.50
105 0.35 800 0.85 0.50 0.446667
0.38 800 0.90 0.52
0.33 800 0.65 0.32
85 0.32 800 0.40 0.08 0.103333
0.41 800 0.53 0.12
0.34 800 0.45 0.11
从上表可以看出:
①在600H时,第二组样品中2个出现Fail,测试停止;
②在127℃时,产品的寿命为400H,即(300+500+400)/ 3;
③在105℃时,产品的寿命为895.5H,即(800/0.4467)×0.5;
说明:产品在105℃下800H时,并没有全部失效,不能像127℃那样直接算出,只能用“线性外延”来计算,虽然不是很准确,但可以接受。因为800H时变化0.4467dB,所以变化量达0.5dB时总运行895.5H;
④同理在85℃时,产品的寿命为3870.2H;
⑤将Arrhenius 公式两边取自然对数得到:Ln(Life)=(Ea/k)*(1/T);T温度下对应的Life满足上述公式,把②③④三点中的温度和寿命,按(X,Y)的形式,X =1/T、 Y =ln(life),得到相应的三点(0.002793,8.26126)、(0.002646,6.797407)、(0.002498、5.991465);
⑥将第⑤步中的三点在EXCEL中作图,将对应的曲线用直线拟合、交显示公式得到直线的斜率为7893.0;也就是(Ea/k)=7893.0,故Ea=0.68eV;
⑦故产品在常温25℃(对应的1/T=0.003356)时寿命为:(105℃时的寿命)×(105℃对25℃的加速倍数);当(Ea/k)=7893.0时,105℃对25℃的加速倍数为272。
⑧故25℃时产品寿命为272*895.5/356/24=27.8 (年)。
⑨故产品失效率为10E9/(272*895.5)=4103 FIT.
上面的计算过程有很多地方可以讨论:
①第一种方法有很多优点:Ea的取值是Bellcore推荐的值(目前整个业界都不会疑问)、数据由11个样品做同一种测试得到(比3个样品更有说服力)、11个样品没有Fail(这说明实际值比计算出来的值还要大,更让人信服)、考虑了置信度;
在第二种方法里:
②样品数据较少,每组只有3个样品,随机性较大;
③中温、低温时产品没有达到寿命时间,以平均值“外延”代替,误差较大;
④取到三个点时,用直线拟合,带来很多误差;
⑤计算25℃度时的寿命,用“85℃时的寿命”与“加速倍数”相乘,而这两个参数都有误差;
但是,在什么都没有(以前的测试数据没有、激活能用多少也没有)的情况下,用上面的计算也算是一种方法,可以用来回复客户,一般客户都不会“较真”。
最后介绍另一种计算方法。此方法是在常温下运行产品,记录每次故障发生的时间,然后套用寿命模型、选择最好的一种来计算。(我没有用过,只好将书上的例子Copy下来)。
在常温下,对100个产品做测试,当出现10次故障时停止测试。10次故障的时间为:268、401、428、695、725、738、824、905、934、1006小时。求此产品的MTBF。
第一步:求F(t),即产品的累积失效率(CDF)。这里用这样的方法:
①第一次失效的F(1)=(1-0.3)/(100+0.4)=0.006972;
②第二次失效的F(2)=(2-0.3)/(100+0.4)=0.016932;
③第三次失效的F(3)=(3-0.3)/(100+0.4)=0.026892;
其它类推(分子为:失效次数-0.3;分母为:样品数+0.4)。
第二步:求Ln(1/(1-F(t)),即第一步求得的F(t)代入Ln(1/(1-F(t))计算出数据。如:
①第一次失效的Ln(1/(1-F(1))= Ln(1/(1-0.006972)=0.006997;
②第二次失效的Ln(1/(1-F(1))= Ln(1/(1-0.016932)=0.017077;
③第三次失效的Ln(1/(1-F(1))= Ln(1/(1-0.026892)=0.027261;
其它类推;
第三步:套用公式。不同产品有不同的寿命分布模型,如正态分布、威布尔分布等等。
1、套用正态分布;
①根据正态分布公式1-F(t)=EXP(-λt),变换后得到:Ln(1/(1-F(t))=λt;
②将第二步中求出的Ln(1/(1-F(t))作为y,将每个故障发生的时间t作为x,组成坐标点(x,y),如(0.006997,268)、(0.017077,401)、(0.027261,428)等,将10个点以EXCEL作图;
2、套用威布尔分布;
①由威布尔公式1-F(t)=EXP(-(t/m)^n),变换后得到:Log(ln(1/(1-F(t)))=n*log(t)-n*log(m);
②将第二步中求出的Ln(1/(1-F(t))作为Y,将每个故障发生的时间t作为X,取y=logY, x=logX,组成坐标点(x,y),将10个点以EXCEL作图;
3、套用其它分布;方法同上,先找出对应的公式,再变换,再作图;
第四步:观察与计算;查看第三步中作的图。
①找出哪一个图的10个点看起来最有线性关系,并选定“最直”的那一图;
②将“最直”的那个图用直线拟合,找出直线的斜率k、截距b;
③若是正态图最直,则MTBF=1/k;若是威布尔图最直,则由k,b计算出m,n,MTBF=m*Γ(1+1/n);
说明:1、此种方法可以较准确地计算出产品在常温下的MTBF。
2、若常温下产品MTBF很长,也可以用这种方法先计算85℃、105℃等高温下的MTBF,再通过计算激活能后计算出常温下产品的MTBF。 樓主辛苦了,不錯的!多謝分享! 我们单位一直在搞石油设备的可靠性研究与测试。这可不是做广告,希望能多讨论这方面的相关内容。
页:
[1]
2