睿地可靠度論壇(TW-REDI Forum)

標題: 求助:可靠性试验设计时的样品寿命分布模型的选择 [打印本頁]

作者: xxex    時間: 2015-4-9 13:54:01     標題: 求助:可靠性试验设计时的样品寿命分布模型的选择

本帖最後由 xxex 於 2015-4-9 14:37 編輯

假设我已经有了一些市场应用的数据,因此通过寿命数据分析可以得到样品的寿命分布模型,假设我分析得到的样品寿命分布是Generalized Gamma分布,这个时候我若要设计一个可靠性验证试验,确保样品通过试验后,首年的可靠性能达到一个指定的水平,很多软件只能提供weibul,指数,正态,对数正态,logistics,对数logistics,最小极值,最大极值,Frechet这些常用分布的试验设计。我数据分析得到的Generalized Gamma分布不在其中,这个时候我应该选择什么样的分布进行试验设计?设计时的参数如何确定?

作者: hlperng    時間: 2015-4-9 17:54:29

本帖最後由 hlperng 於 2015-4-13 19:22 編輯

大哉問,那要看解決問題及判斷決策是從工程的觀點,還是從數學的觀點。從工程與應用的觀點,這是業界所需要的,數學永遠只是工具,再完美的數學也不能解決現實的工程問題。況且樣本還是樣本,解決問題的目標在於群體的代表性。

通用伽瑪分布有三個參數:一個尺度參數 λ 或 η、兩個形狀 β 及 κ,通用伽瑪分布的機率密度函數可以寫為:

[tex]f(x;\lambda, \kappa, \beta) = \frac{\beta\lambda}{\Gamma(\kappa)}\left(\lambda x\right)^{\kappa\beta  -1}exp\left(-\left(\lambda x\right)^\beta\right)[/tex]



[tex]f(x; \eta, \kappa, \beta) = \frac{\beta}{\eta \Gamma(\kappa)}\left(\frac{x}{\eta}\right)^{\kappa \beta -1} exp\left(-\left(\frac{x}{\eta}\right)^\beta \right)[/tex]

其中 Γ(κ)為伽瑪函數:

[tex]\Gamma(\kappa) =\int_0^\infty x^{\kappa - 1}e^{-x} dx[/tex]。

所有 T ≥ 0 (或 X ≥0)的隨機變數,最常見的就是失效發生時間或壽命,普通機率分布理論數學模型,例如指數分布、伽瑪分布、卡方分布、瑞雷分布、馬克斯威爾分布、對數常態分布等,都是通用伽瑪分布的特例,

分布λκβ
通用伽瑪分布λκβ
伽瑪分布λκ1
韋伯分布λ1β
指數分布λ11
卡方分布1/2r/21
瑞雷分布1/(η √(2))12
馬克斯威爾分布1/(η √(2))3/22

請參閱:
http://redi.org.tw/forum.php?mod=viewthread&tid=629&page=1&extra=#pid1585

有關通用伽瑪分布在可靠度的應用,可參閱 Reliasoft 公司的可靠度維基網站 (reliawiki.org),對於通用伽瑪分布的特質有詳細的數學推導,並提供通用伽瑪分布分析壽命試驗資料的應用案例,回歸分析所得到的參數推論值,利用該公司發行的可靠度分析套件 Weibull[sup]++[/sup] 7 (?) 的對數常態機率圖模組,討論說明分析結果的處理方式,判斷該壽命試驗結果比較符合韋伯分布或對數常態分布,分析結果得到的參數分別為 ε = 0.2980、σ = 0.5221、μ = 4.2258,或者 λ = 1.01653、η = 0.98374、β =0.57077、κ = 10.58329,κ 接近 0、而 κ 遠大於 1,當然就資料而言,對數常態分布的假設 (ε = 0.2980 ∼ 0) 是比韋伯分布 (κ = 10.58 >> 1) 的假設要好很多。該組資料的平均值為 73.52522、標準差為 37.27531。若以兩參數機率分布,利用 Weibull[sup]++[/sup]6 圖解分析,得到對數常態分布的參數為 μ[sub]y[/sub]=4.1468、σ[sub]y[/sub]=0.5667,韋伯分布的參數為 η=81.1026、β=2.2007,請參閱:
http://reliawiki.org/index.php/The_Generalized_Gamma_Distribution


有一個議題值得思考,三參數的通用伽瑪分布,經過數學轉換可以簡化收斂其數學模型複雜度,變成大家熟悉常用的機率分布,大致可歸納為下述四種情形: (1) 伽瑪分布是 κ 個指數分布獨立總和的機率分布,(2) 韋伯分布是由許多元件所構成系統(以零為界限)的極小值分布,(3) 對數常態是多項影響因素為乘積關係的壽命分布,(4) 常態分布構成分量的平方和的開根值,例如一度空間、二度空間、三度空間的偏心距(半徑)。許多單變數機率分布彼此有關聯,各種常用單變數機率分布之間的關係,請參閱:

http://redi.org.tw/forum.php?mod=viewthread&tid=41&extra=page%3D1


可靠度評估的主要目的在於透過資料統計分析,獲得有用的可靠度推論及機率分布參數的推論值,提供現有產品的改進及未來產品創新的依據或參考。可靠度議題討論壽命的機率分布時,應瞭解資料的特性,一般多以極值分布為進階研究的方向,根據甘伯近似分布,極值分為極大值與極小值兩種,極值分布有三型:第一型極值分布,其原始分布的尾端呈指數 (exp) 快速遞減者屬之,此類極值分布尾端一般較單薄(機率相對較小),亦即收斂較快,因此又稱為輕尾分布,例如常態分布、指數分布,代表分析一般稱為極值分布(extreme value distribution)或甘伯分布 (Gumble distribution),嚴謹而言,它是一型極大值分布;第二型極值分布,其原始分布的尾端成多項式或幂次方遞減,此類極值分布尾端一般較厚重(機率相對較大),亦即收斂較慢,因此又稱為重尾分布,代表性的分布為 Frechet 分布;第三型為尾端有界限(例如 X ≥ 0)的極值分布,代表性的分布為第三型極小值分布,也就是有名的韋伯分布 (Weibull distribution)。資料統計回歸分析過程中相關係數或類似資訊,那是數學模型誤差多寡的指標,只是作為決策判斷的依據之一,對於試驗資料的分析與應用,工程判斷往往優於統計判斷,這就是為什麼美國商務部 (DOC) 國家標準與技術研究院 (NIST) 資訊技術實驗室 (information technology laboratory, ITL) 的統計工程組 (statistical engineering division, SED) 積極推動探索式資料分析 (exploratory data analysis, EDA) 技法及長期經營發展「工程統計手冊」(engineering statistical handbook) 線上電子書的主因,其中第 8 章就是討論工程統計技法在可靠度的應用。工程統計手冊網址為:

http://www.itl.nist.gov/div898/handbook/





作者: liaojenyi    時間: 2015-4-9 18:53:34

請提供Generalized Gamma分布實例,可以試試看如何解決!
作者: xxex    時間: 2015-4-10 10:07:16

hlperng 發表於 2015-4-9 17:54
大哉問,那要看解決問題及判斷決策是從工程的觀點,還是從數學的觀點。從工程與應用的觀點,這是業界所需要 ...

谢谢大师指点
作者: xxex    時間: 2015-4-10 10:15:43

本帖最後由 xxex 於 2015-4-10 10:19 編輯
liaojenyi 發表於 2015-4-9 18:53
請提供Generalized Gamma分布實例,可以試試看如何解決!

廖博,您好!我通过数据拟合回归分析已经确定Generalized Gamma (GenGamma)的拟合优度最好,这里分布模型的形式如下:

[attach]479[/attach][attach]478[/attach]
模型参数估计如下:
参数估计标准误差下限 95%上限 95%
mu

11.40948

1.297308

8.8668

13.95215

sigma

20.74267

2.300275

16.23421

25.25113

lambda

-10.9419

3.241094

-17.2943

-4.58946

根据模型,用Wald和极大似然估计法对12个月,18个月,24个月,120个月的累积失效概率和生存概率估计如下:
起始时间失效概率失效概率 95% 下限 (Wald)失效概率 95% 上限 (Wald)失效概率 95% 下限(似然)失效概率 95% 上限(似然)生存概率生存概率 95% 下限 (Wald)生存概率 95% 上限 (Wald)生存概率 95% 下限(似然)生存概率 95% 上限(似然)
120.0020968.55E-080.0156940.0019430.0022580.9979040.98430610.9977420.998057
180.0028768.78E-070.0169710.0026150.0031690.9971240.9830290.9999990.9968310.997385
240.0035113.39E-060.0178870.0031310.0039660.9964890.9821130.9999970.9960340.996869
1200.0081250.0003510.0231190.0064260.0109480.9918750.9768810.9996490.9890520.993574

假定我要验证12个月时的生存概率大于0.997904,样本数量分别为10,20,30,允许失效0,置信水平95。如何利用上面的分布模型设计试验?
作者: liaojenyi    時間: 2015-4-10 18:57:55

1. 假如試驗也是做12個月,則不用考慮分布!
2. 要求12个月时的生存概率大于0.997904,允许失效0,置信水平95條件下,共需1428個試件!你的樣本數還差的遠!
3. 如果有加速因子,就需考慮分布
作者: xxex    時間: 2015-4-13 15:05:37

liaojenyi 發表於 2015-4-10 18:57
1. 假如試驗也是做12個月,則不用考慮分布!
2. 要求12个月时的生存概率大于0.997904,允许失效0,置信水平 ...

    谢谢廖博!
      我在进行试验设计时是有加速因子的,我的思路是先设计不同样本量例如:50,100或150台,0失效数,特定时间,例如12个月,特定可靠度,例如0.997904,无加速的试验方案。得到对应的试验时间后,再根据试验加速应力和现场应用条件,根据加速模型计算得到加速因子。最后用试验时间除以加速因子得到最后 加速后的试验时间。
      例如本案例的数据,我的CL取0.9,分布选择次优的Fréchet分布,分布的尺度参数计算结果为:5.966188,允许失效0pcs,时间取12个月,0.997904的可靠度,样品数选择50,100或150台,分别计算得到703.61,215.00和117.75个月的无加速试验时间。根据试验条件和现场应用条件的温度加速模型得到55.94倍的加速因子,最终计算得到加速试验时间为:11.82个月,3.61个月和1.978个月。
     
      这种计算方式不知道是否有错。
作者: liaojenyi    時間: 2015-4-13 21:59:03

CL取0.9,Fréchet分布,分布的尺度参数为:5.966188(沒有形狀參數?2.253?),允许失效0pcs,0.997904的可靠度
1.时间取12个月,樣本為1098
2.請核對 0.997904^1098=R(703.6)^50 = R(215)^100 =R(117.75)^150?
3. 如果以上OK、加速模式也沒問題,應該計算就OK了!
作者: xxex    時間: 2015-4-14 08:40:36

本帖最後由 xxex 於 2015-4-14 10:25 編輯
liaojenyi 發表於 2015-4-13 21:59
CL取0.9,Fréchet分布,分布的尺度参数为:5.966188(沒有形狀參數?2.253?),允许失效0pcs,0.997904的 ...

廖博,您好
这里我设计试验假设的寿命分布模型为Fréchet
[attach]481[/attach][attach]480[/attach]
数据拟合得到的模型参数如下:
参数估计
位置

13.30817

尺度

5.966188



之所以采用这个分布是因为拟合优度排名靠前的其它分布都没有现成的试验设计工具,而试验设计工具软件里面只支持这个分布,并且软件里面不需要使用位置参数设计试验。

作者: xxex    時間: 2015-4-14 10:27:14

hlperng 發表於 2015-4-9 17:54
大哉問,那要看解決問題及判斷決策是從工程的觀點,還是從數學的觀點。從工程與應用的觀點,這是業界所需要 ...

太详细了,自己找资料不知道要翻多少
作者: liaojenyi    時間: 2015-4-14 20:18:12

CHECK OK!
作者: function    時間: 2015-4-15 02:13:43

55.94倍的加速因子是怎麼來的?
試驗數據分析得到的嗎?還是假設模型算出來的?
作者: hlperng    時間: 2015-4-15 09:08:40

本帖最後由 hlperng 於 2015-4-15 09:45 編輯
xxex 發表於 2015-4-10 10:15
廖博,您好!我通过数据拟合回归分析已经确定Generalized Gamma (GenGamma)的拟合优度最好,这里分布模型 ...

根據資料分析結果所得到的對數型通用伽瑪分布的機率分布參數推定值為:
ε = -10.9419,σ = 20.74267,μ = 11.40948。
ε >> 0,根據通用伽瑪分布的應用原則,表示這些資料是不適宜選用對數常態分布。

一般常用的傅雷切 (Frechet) 分布的累積分布函數 (CDF) 為:

[tex]F(x;\gamma, \eta, \beta) = exp \left(-\left(\frac{\eta}{x-\gamma}\right)^\beta \right)[/tex]

韋伯 (Weibull) 分布的累積分布函數為:

[tex]F(x;\gamma, \eta, \beta) = exp \left( -\left( \frac{x-\gamma}{\eta}\right)^\beta \right)[/tex]

傅雷切分布是甘伯 (Gumble) II 型極大值分布,與甘伯 III 型極小值分布(亦即韋伯分布),兩者有互為倒數關係。

甘伯 I 型極大值分布一般稱為雙指數分布,其累積分布函數為:

[tex]F(x;\mu, \sigma, \alpha) = exp \left( -exp\left(\frac{x-\mu}{\sigma}\right)^\alpha\right)[/tex]

甘伯分布、傅雷切分布、韋伯分布,都是通用極值分布 (generalized extreme value, GEV) 的特例。

本資料分析案例所使用的機率分布為:

[tex]F(x;\mu, \sigma) = exp \left(-exp\left(\frac{log(x)-\mu}{\sigma}\right)\right)[/tex]

好像是位置參數  μ、形狀參數 β = 1 的甘伯 I 型極大值分布,但是做資料分析之前,先將隨機變數作對數轉換,以 log (x) 取代 x。不知這樣經過變數轉換的目的為何。在根據資料分析推論結果作決策時,應該先將此一數學轉換納入說明,否則可能會得到不同的結論。

壽命或失效發生時間是極小值問題,應力是極大值問題,可靠度是比較供給強度 (supplied strength) 與要求應力 (required stress) 之間的互動關係,關切的是極大應力與極小強度。根據此一工程原則選擇適當的機率分布。

應用數學模型處理工程問題時,儘量使用簡單、一致、有物理意義的數學模型書寫方式,對於問題解決與後續決策制定是有絕對的好處!!再次強調數學只是工具,不要被所使用的工具模糊了原有工程問題的焦點。






作者: xxex    時間: 2015-4-15 10:11:55

function 發表於 2015-4-15 02:13
55.94倍的加速因子是怎麼來的?
試驗數據分析得到的嗎?還是假設模型算出來的? ...

是用阿伦纽斯方程和Hallberg-Peck加速模型计算得来的
加速的试验条件是温湿度恒定,
而现场应用的条件是变化的,现场应用条件按照各个温度区间的时间进行加权,最后综合计算得到总的加速因子为55.95倍
作者: xxex    時間: 2015-4-15 10:39:21

hlperng 發表於 2015-4-15 09:08
根據資料分析結果所得到的對數型通用伽瑪分布的機率分布參數推定值為:
ε = -10.9419,σ = 20.74267,μ ...

彭大师,我这里采用的傅雷切分布的表达式来自于JMP
http://www.jmp.com/support/help/Technical_Details_8.shtml#1311036
软件采用这种对数转换的方式的目的我不清楚,
但因为我采用的试验设计工具就是JMP的,软件当中计算模型参数结果给出的就是位置和尺度参数。实际计算我根本没有去研究公式本身是否正确,判定结果完全基于对于软件计算结果的信任。
作者: hlperng    時間: 2015-4-15 12:07:25

本帖最後由 hlperng 於 2015-4-15 12:56 編輯
xxex 發表於 2015-4-15 10:39
彭大师,我这里采用的傅雷切分布的表达式来自于JMP
http://www.jmp.com/support/help/Technical_Details_ ...

謝謝提醒,隨機變數取對數轉換,是為了簡化數學模型而做的標準化處理,將雙指數變成單指數,讓 Gumbel I、II、III 型極值分布都可使用標準極值分布表示(就像標準常態分布一樣),如何簡化數學模型是電腦軟體撰寫程式常需要做的努力 。(把自己的時間點拉回到 1988 年時代!)

因為隨機變數已經對數轉換處理,轉換後變數的位置應該是原始變數的尺度參數,尺度參數則是形狀參數,所以經過數學(電腦套裝軟體)處理後的解答,應該回到原始分布的特質。

不過還是提醒,傅雷切分布適合極大值 (LEV)、韋伯分布適合極小值 (SEV),應該是不變的原則。先思考所要解決的工程問題是極大值問題,還是極小值問題!


作者: xxex    時間: 2015-4-15 13:28:35

hlperng 發表於 2015-4-15 12:07
謝謝提醒,隨機變數取對數轉換,是為了簡化數學模型而做的標準化處理,將雙指數變成單指數,讓 Gumbel I、 ...

谢谢大师的指点,我这里的工程问题其实就是要根据寿命分布模型确定可靠性验证试验的目标值,试验时间,样本量,然后利用试验的环境应力条件进行加速,缩短试验时间
作者: hlperng    時間: 2015-4-15 15:08:30

本帖最後由 hlperng 於 2015-4-15 15:11 編輯
xxex 發表於 2015-4-15 13:28
谢谢大师的指点,我这里的工程问题其实就是要根据寿命分布模型确定可靠性验证试验的目标值,试验时间,样 ...

就個人所知,壽命及失效發生時間問題,都是壽命短或失效時間小的先發生,關心的是極小值,所以多選擇 Gumbel III 型極小值分布,也就是韋伯分布,這就是韋伯分布常用於處理存活機率的原因;氣候資料、財務資料,關心的是極端氣候最大雨量或最大獲利,屬於極大值性質,所以大多選用 Gumbel I 型極大值的甘伯分布,或傅雷切分布 (Gumbel II 型極大值分布)。

作者: function    時間: 2015-4-17 02:50:47

xxex 發表於 2015-4-15 10:11
是用阿伦纽斯方程和Hallberg-Peck加速模型计算得来的
加速的试验条件是温湿度恒定,
而现场应用的条件是 ...

我要問的是阿伦纽斯方程和Hallberg-Peck加速模型中的活化能與濕度的係數是如何得到的?
作者: xxex    時間: 2015-4-17 12:34:55

function 發表於 2015-4-17 02:50
我要問的是阿伦纽斯方程和Hallberg-Peck加速模型中的活化能與濕度的係數是如何得到的? ...

许老师,本例的激活能取0.7eV,湿度的指数取2。激活能取0.7ev经验取值,主要是大多数材料和零部件厂家的推荐取值,没有试验数据支撑。湿度是因为取2保守点。
作者: function    時間: 2015-4-21 21:28:47

本帖最後由 function 於 2015-4-21 21:29 編輯
xxex 發表於 2015-4-17 12:34
许老师,本例的激活能取0.7eV,湿度的指数取2。激活能取0.7ev经验取值,主要是大多数材料和零部件厂家的 ...

活化能是很敏感的,通常經驗值跟實際的值不一樣!
你可以試算看看如果活或能取0.8eV,看看加速因子會變成幾倍?這樣你就不敢用了!
建議還是自己規劃試驗求出自己產品的活化能比較保險。
作者: xxex    時間: 2015-4-22 11:16:23

function 發表於 2015-4-21 21:28
活化能是很敏感的,通常經驗值跟實際的值不一樣!
你可以試算看看如果活或能取0.8eV,看看加速因子會變成 ...

谢谢许老师指点,我手中有部分有机材料的活化能试验数据,大约1.1~1.3ev,但是其它材料和零部件的活化能数据我手里没有,另外设计试验取求活化能,从项目时间进度和投入资源上比我拍脑袋定下0.7ev的风险更高,所以我选择了相对0.7eV的活化能,这里也是我的所有材料和零部件厂家给出了一个十度法则的经验结论后确定下来的。不知道有没有专门的数据库可以获得这个参数。我知道一些可靠性预计的标准上面是有的。
作者: function    時間: 2015-4-23 22:52:03

不管是甚麼資料庫,得到的活化能都不會跟自己產品的一樣!
比較好的做法是規劃試驗,用自己的產品試驗數據來獲得活化能。
作者: xxex    時間: 2016-5-12 15:55:17

good6608 發表於 2016-5-9 12:05
請問, 在執行這類的壽命模型建立的研究,
我的抽樣數應該要如何決定?

假定已知模型参数,要先确定可靠度或失效率,可接受的试验时间,试验置信度,试验时的容许失效数




歡迎光臨 睿地可靠度論壇(TW-REDI Forum) (http://m1.kdi.tw/) Powered by Discuz! X2