道路試驗(yàn)??！這到底要開多遠(yuǎn)才是個(gè)頭？——抽樣分布與最小樣本量的確定

2019-02-21 15:38:56· 來源：耐久論壇作者：李旭東博士

本篇圍繞Fisher提出的數(shù)理統(tǒng)計(jì)學(xué)的第三類任務(wù)（也是最后一類任務(wù)）抽樣分布，展開初步的討論，并借由抽樣分布問題給出汽車耐久性工程和各行各業(yè)都面臨的一個(gè)非常

本篇圍繞Fisher提出的數(shù)理統(tǒng)計(jì)學(xué)的第三類任務(wù)（也是最后一類任務(wù)）——抽樣分布，展開初步的討論，并借由抽樣分布問題給出汽車耐久性工程和各行各業(yè)都面臨的一個(gè)非?，F(xiàn)實(shí)的問題，即最小樣本量的確定。

1 什么是抽樣分布

在《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》中我們已經(jīng)談到，統(tǒng)計(jì)量是“完全由樣本所決定的量”，換句話說，統(tǒng)計(jì)量是樣本的已知函數(shù)，因此，它也有其概率分布。統(tǒng)計(jì)量的概率分布稱為（該統(tǒng)計(jì)量的）抽樣分布。這里面，樣本均值

的抽樣分布與最小樣本量的確定密切相關(guān)。

2 Lindeberg-Levy中心極限定理與大樣本法

Lindeberg-Levy在上世紀(jì)二十年代給出了如下重要而又非常有實(shí)用價(jià)值的中心極限定理：設(shè)X1,…,Xn共n個(gè)樣本獨(dú)立同分布于F，F(xiàn)有總體均值aF和總體方差σ2F，設(shè)0<σ2F<∞，以

記樣本均值

，則有

這里

表示依分布收斂。Lindeberg-Levy中心極限定理告訴我們：樣本均值

經(jīng)過規(guī)則化后

的極限分布為標(biāo)準(zhǔn)正態(tài)分布。

這里面有一點(diǎn)我們仔細(xì)琢磨琢磨是很牛的，就是Lindeberg-Levy中心極限定理并沒有對(duì)總體分布F作任何限定。不管F服從什么分布，不管它是有參的還是非參的，甚至我們壓根兒就不知道它是個(gè)什么分布，在這種一問三不知的情況下有一點(diǎn)我們卻是可以肯定的，那就是F的抽樣均值

在規(guī)則化后服從標(biāo)準(zhǔn)正態(tài)分布！這種性質(zhì)是樣本均值的一個(gè)非常重要的大樣本性質(zhì)，稱為漸進(jìn)正態(tài)性。

我們?cè)诖嗽俅稳右蝗雍Y子，來幫我們理解和體會(huì)一下Lindeberg-Levy中心極限定理的“威力”。我們拿來一對(duì)篩子，投擲一次，計(jì)算和記錄一下兩個(gè)篩子的點(diǎn)數(shù)之和。如圖1所示，把這個(gè)過程重復(fù)100次、1000次和10000次，我們發(fā)現(xiàn)兩個(gè)篩子點(diǎn)數(shù)和的分布（即樣本均值

的抽樣分布），越來越接近于完美的正態(tài)分布。您可能會(huì)說，篩子的分布我已經(jīng)知道了呀？不是均勻分布么？那好，您可以再去找來任何一對(duì)被做過手腳的篩子，重復(fù)上面的試驗(yàn)，結(jié)果你會(huì)發(fā)現(xiàn)，點(diǎn)數(shù)和的分布仍然會(huì)越來越接近于完美的正態(tài)分布，只不過由于篩子被做過手腳了（因此這回我們可真是壓根兒就不知道它服從什么分布），因此最后最經(jīng)常出現(xiàn)的點(diǎn)數(shù)和不見得是7罷了。

圖1 通過擲篩子來驗(yàn)證Lindeberg-Levy中心極限定理1

有了Lindeberg-Levy中心極限定理，我們可以在樣本量比較大的時(shí)候?qū)τ?img src="https://img.auto-testing.net/testingimg/201902/21/153856431.jpeg" alt="" />不超過某一值

的概率進(jìn)行一個(gè)近似的估算，其中

為標(biāo)準(zhǔn)正態(tài)分布的上α/2分位點(diǎn)，即：

對(duì)于上式，我們有兩點(diǎn)解釋：

1）γ稱為置信度，這是區(qū)間估計(jì)里面的一個(gè)重要概念。

區(qū)間估計(jì)就是用一個(gè)區(qū)間去估計(jì)未知參數(shù)，即把未知參數(shù)值估計(jì)在某兩界限之間，相對(duì)于點(diǎn)估計(jì)來說，區(qū)間估計(jì)的一個(gè)明顯的好處是把可能的誤差醒目的標(biāo)識(shí)了出來。

比如說，假設(shè)雞蛋的重量是一個(gè)服從正態(tài)分布的隨機(jī)變量，通過《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》中介紹的極大似然估計(jì)法，我們可以得到雞蛋重量的樣本均值，比方說50g。但是，這個(gè)點(diǎn)估計(jì)評(píng)估結(jié)果沒有給出評(píng)估的精度。區(qū)間估計(jì)的結(jié)果表示方式是，雞蛋重量落在某一數(shù)值區(qū)間的概率是多少。這里面有兩個(gè)要素：第一，數(shù)值區(qū)間的長度，我們把這個(gè)因素稱為精度；第二，落在這個(gè)區(qū)間的概率，我們把他稱為置信度，是可靠性的一種表征。

置信度和精度是一對(duì)矛盾的因素。比方說，我們可以自信的說，雞蛋重量落在數(shù)值區(qū)間[0噸，1噸]的置信度是100％。這個(gè)評(píng)估結(jié)果很可靠，置信度很高，但是評(píng)估結(jié)果卻沒有什么用處，因?yàn)榫忍汀７粗嗳弧?/div>

區(qū)間估計(jì)理論就是提供用統(tǒng)計(jì)學(xué)的方法解決置信度和精度之間的矛盾，把一定的置信度與一定的精度關(guān)聯(lián)起來。現(xiàn)在最流行的一種區(qū)間估計(jì)理論是美國統(tǒng)計(jì)學(xué)家J. Neyman在本世紀(jì)30年代建立的。

2）總體標(biāo)準(zhǔn)差

是未知的，但是在《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》我們談到，樣本標(biāo)準(zhǔn)差S是

的一個(gè)相合估計(jì)，因此在樣本量比較大的時(shí)候，可以用S去代替

。

這樣，上式變化為

式(1)對(duì)于最小樣本量的確定是及其重要的。我們想抽取一定數(shù)量的樣本，用樣本均值

來估計(jì)總體均值aF，但是希望兩者足夠接近。如果定義

為相對(duì)偏差的話，我們希望相對(duì)偏差不要超過某一指定的值δ。因此，由式(1)得到

因此，當(dāng)指定相對(duì)偏差為δ，置信度為γ時(shí)，最小樣本量為

由式(2)我們看到，影響最小樣本量大小的有三方面的因素：

1）置信度的因素。如果我們要求統(tǒng)計(jì)結(jié)果越可靠，置信度越高，相應(yīng)的

的值就會(huì)增大，從而引起最小樣本量的增大。

2）相對(duì)偏差的因素。如果我們希望樣本均值越來越精確的逼近總體均值，沒有別的途徑，唯有增加最小樣本量。

3）隨機(jī)變量本身的變異性。式(2)中

是一個(gè)非常重要的量，稱為變異系數(shù)，反應(yīng)樣本標(biāo)準(zhǔn)差和樣本均值之間的相對(duì)關(guān)系。如果變異系數(shù)越大，說明我們所研究的隨機(jī)變量的變異性越大，在這種情況下，需要更多的樣本量來達(dá)到同等的置信度和相對(duì)偏差。

以上介紹的最小樣本量的確定方法，來源于Lindeberg-Levy中心極限定理，是一種大樣本方法。它有一個(gè)好處：我們可以在對(duì)樣本分布一無所知的情況下使用這一方法來進(jìn)行最小樣本量的確定。但是，這里面也存在一個(gè)問題，那就是，Lindeberg-Levy中心極限定理，以及牽扯到的樣本標(biāo)準(zhǔn)差的相合性，都是大樣本性質(zhì)，也就是說，是在樣本量n趨于無窮大的時(shí)候才嚴(yán)格成立的？事實(shí)上樣本量不可能無窮大，當(dāng)樣本量固定在某一個(gè)值的時(shí)候，相關(guān)定理都是近似成立的。更加讓人遺憾的是，這種近似產(chǎn)生的偏差到底有多少，統(tǒng)計(jì)學(xué)大樣本理論發(fā)展到今天，還沒有能夠給出合理的解釋。因此，這種方法（特別是對(duì)于處女座的工程師來說）用起來總是有些感覺不踏實(shí)。

3 t分布與小樣本法

1908年，英國統(tǒng)計(jì)學(xué)家W.S. Gosset很文青的以“Student”作為筆名，發(fā)現(xiàn)和發(fā)表了一個(gè)統(tǒng)計(jì)學(xué)中最重要的分布之一，t分布，這是統(tǒng)計(jì)學(xué)發(fā)展過程中的一件大事，開創(chuàng)了統(tǒng)計(jì)學(xué)小樣本法的先河。W.S. Gosset證明：

如果已知總體服從正態(tài)分布，但是其總體均值aF和總體方差σ2F未知，那么從總體中抽樣本X1,…,Xn，則

服從(n-1)自由度的t分布。

與Lindeberg-Levy中心極限定理相比，上面的定理對(duì)于應(yīng)用的條件有所加強(qiáng)，也就是說不能對(duì)總體的分布情況一無所知，而是總體必須服從正態(tài)分布，因此，這使得上述定理的應(yīng)用范圍有所限制。但是，好在總體服從正態(tài)分布的情況是非常多見的，比如說，在《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》一文中我們提到，車輛耐久性工程中的重要隨機(jī)變量“車輛累積行駛里程達(dá)到設(shè)計(jì)里程時(shí)車輛某處的某載荷對(duì)應(yīng)的偽損傷（或偽損傷密度，或等效載荷幅值，……）”就服從對(duì)數(shù)正態(tài)分布，因此上述定理仍然有很廣闊的應(yīng)用空間。但是，應(yīng)用條件的些許限制，卻換來了一個(gè)很大的優(yōu)點(diǎn)，那就是應(yīng)用該定理的時(shí)候樣本量不需要趨于正無窮定理才成立，換句話說，當(dāng)樣本量固定為一個(gè)有限的數(shù)值時(shí)，相關(guān)定理是嚴(yán)格成立的！

基于以上定理，采用與第2小節(jié)完全相同的步驟，可以得到當(dāng)總體服從正態(tài)分布時(shí)，對(duì)應(yīng)于相對(duì)偏差為δ，置信度為γ的最小樣本量為

再次強(qiáng)調(diào)，當(dāng)總體服從正態(tài)分布式，式(3)是精確解。在實(shí)際工程中，經(jīng)常取δ=5％，γ=95％，或δ=5％，γ=90％。圖2會(huì)是一個(gè)經(jīng)常用到的表格，超出表格范圍的可以找相關(guān)軟件計(jì)算。

圖2 采用式(3)計(jì)算最小樣本量時(shí)的常用表格2

4 老王到底要在高速路上跑多遠(yuǎn)才能回家吃飯

隨機(jī)變量Y=司機(jī)老王駕車在高速路上每行駛10km時(shí)車輛某處某載荷對(duì)應(yīng)的偽損傷（或偽損傷密度，或等效載荷幅值，……）。

為了回答什么時(shí)候回家吃飯的問題，讓老王先在高速路上開上100km，獲得10個(gè)樣本Yi，i=1,…，10。在《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》我們提到，隨機(jī)變量Y服從對(duì)數(shù)正態(tài)分布，因此，滿足采用小樣本法、使用式(3)的條件。在指定了相對(duì)偏差為δ，置信度為γ，我們可以由式(3)清楚的知道：老王是不是已經(jīng)可以收工了；如果不能收工，還得開多遠(yuǎn)（具體地說是幾個(gè)10km）。

至此，我們已經(jīng)用連續(xù)的三篇文章《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》、《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》和《道路試驗(yàn)啊！這到底要開多遠(yuǎn)才是個(gè)頭？——抽樣分布與最小樣本量的確定》討論了Fisher先生給出的數(shù)理統(tǒng)計(jì)學(xué)的三大任務(wù)：定模型、估計(jì)和抽樣分布。這三篇文章雖然不長，但是選擇性的圍繞Fisher先生提出的這三大問題，把經(jīng)典統(tǒng)計(jì)學(xué)范疇內(nèi)的相關(guān)重要成果加以介紹，已經(jīng)使我們可以對(duì)于一維隨機(jī)變量做不少統(tǒng)計(jì)處理。

下一篇文章中，我們將簡要介紹西門子工業(yè)軟件公司的核心專利技術(shù)，客戶相關(guān)（Customer Correlation，簡稱CuCo）的車輛道路載荷大數(shù)據(jù)獲取和分布模型的構(gòu)建技術(shù)。我們將看到，運(yùn)用CuCo技術(shù)獲取大數(shù)據(jù)后，我們可以在一維隨機(jī)變量的范圍內(nèi)，用現(xiàn)在已經(jīng)介紹的這一些統(tǒng)計(jì)學(xué)知識(shí)，很好的解決車輛耐久性工程中載荷分布模型的確立，這一最重要的頂層輸入問題。

參考文獻(xiàn)

1. 統(tǒng)計(jì)學(xué)，David Freedman, Robert Pisani, Roger Purves, Ani Adhikari，1997年10月，第一版，中國統(tǒng)計(jì)出版社.

2. 劉文珽，結(jié)構(gòu)可靠性設(shè)計(jì)手冊(cè)，2008年2月，第一版，國防工業(yè)出版社.

附錄：W.S. Gosset（1876—1937），英國統(tǒng)計(jì)學(xué)家。

作者簡介：李旭東，2003年畢業(yè)于大連理工大學(xué)機(jī)械工程學(xué)院，獲工學(xué)學(xué)士學(xué)位；2008年畢業(yè)于北京大學(xué)力學(xué)系固體力學(xué)專業(yè)，獲理學(xué)博士學(xué)位。2008年至2014年，就職于中國航空綜合技術(shù)研究所，歷任工程師、高級(jí)工程師；2015年至今，就職于西門子工業(yè)軟件（北京）有限公司，任職耐久性應(yīng)用工程師。長期專注于（金屬）材料和結(jié)構(gòu)耐久性和損傷容限分析方法研究。

作者個(gè)人微信號(hào)：lixudong2008 （添加微信號(hào)請(qǐng)注明“姓名+工作單位”）

分享到：

微信“掃一掃”
分享到朋友圈

下一篇：減輕40%沖擊力！采埃孚發(fā)布新型安全氣囊
上一篇：OPAL-RT智能交通分公司于法國里昂成立

點(diǎn)贊 0 反對(duì) 0 舉報(bào) 0 收藏 0 評(píng)論 0

汽車測(cè)試網(wǎng)V課堂
微信公眾號(hào)
汽車測(cè)試網(wǎng)手機(jī)站

相關(guān)閱讀

0 條相關(guān)評(píng)論

• 可靠性\|加速壽命方法及模型的使用指導(dǎo)分析	• 汽車底盤件結(jié)構(gòu)耐久自動(dòng)分析系統(tǒng)研究
• nCode自定義材料庫的創(chuàng)建與合并	• 測(cè)試數(shù)據(jù)的分割提取及特征值統(tǒng)計(jì)
• 疲勞分析中需要知道的一點(diǎn)統(tǒng)計(jì)學(xué)	• 利用Flowproc實(shí)現(xiàn)DesignLife疲勞批處理運(yùn)算
• 汽車疲勞耐久性技術(shù)現(xiàn)狀及發(fā)展趨勢(shì)	• 基于Ncode疲勞分析的路試車PTC支架開裂問題研究
• 汽車零部件的疲勞耐久測(cè)試介紹	• 汽車座椅11大部件耐久性試驗(yàn)匯總

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

道路試驗(yàn)??！這到底要開多遠(yuǎn)才是個(gè)頭？——抽樣分布與最小樣本量的確定

微信公眾號(hào)

編輯推薦

最新資訊

“汽車爬坡試驗(yàn)方法”將有國家標(biāo)準(zhǔn)

十年耐久監(jiān)管時(shí)代：電池系統(tǒng)開發(fā)策略將如何

聯(lián)合國法規(guī)R59對(duì)機(jī)動(dòng)車備用消聲系統(tǒng)的工程

聯(lián)合國法規(guī)R58對(duì)后下部防護(hù)裝置的工程化約

聯(lián)合國法規(guī)R57對(duì)摩托車前照燈配光性能的工

日本无码免费高清在线|成人日本在线观看高清|A级片免费视频操逼欧美|全裸美女搞黄色大片网站|免费成人a片视频|久久无码福利成人激情久久|国产视频一二国产在线v|av女主播在线观看|五月激情影音先锋|亚洲一区天堂av

道路試驗(yàn)??！這到底要開多遠(yuǎn)才是個(gè)頭？——抽樣分布與最小樣本量的確定

微信公眾號(hào)

編輯推薦

最新資訊

“汽車爬坡試驗(yàn)方法”將有國家標(biāo)準(zhǔn)

十年耐久監(jiān)管時(shí)代：電池系統(tǒng)開發(fā)策略將如何

聯(lián)合國法規(guī)R59對(duì)機(jī)動(dòng)車備用消聲系統(tǒng)的工程

聯(lián)合國法規(guī)R58對(duì)后下部防護(hù)裝置的工程化約

聯(lián)合國法規(guī)R57對(duì)摩托車前照燈配光性能的工

道路試驗(yàn)??！這到底要開多遠(yuǎn)才是個(gè)頭？——抽樣分布與最小樣本量的確定