本篇圍繞Fisher提出的數(shù)理統(tǒng)計(jì)學(xué)的第三類任務(wù)(也是最后一類任務(wù))——抽樣分布,展開初步的討論,并借由抽樣分布問題給出汽車耐久性工程和各行各業(yè)都面臨的一個(gè)非?,F(xiàn)實(shí)的問題,即最小樣本量的確定。
1 什么是抽樣分布
在《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》中我們已經(jīng)談到,統(tǒng)計(jì)量是“完全由樣本所決定的量”,換句話說,統(tǒng)計(jì)量是樣本的已知函數(shù),因此,它也有其概率分布。統(tǒng)計(jì)量的概率分布稱為(該統(tǒng)計(jì)量的)抽樣分布。這里面,樣本均值

的抽樣分布與最小樣本量的確定密切相關(guān)。
2 Lindeberg-Levy中心極限定理與大樣本法
Lindeberg-Levy在上世紀(jì)二十年代給出了如下重要而又非常有實(shí)用價(jià)值的中心極限定理:設(shè)X1,…,Xn共n個(gè)樣本獨(dú)立同分布于F,F(xiàn)有總體均值aF和總體方差σ2F,設(shè)0<σ2F<∞,以

記樣本均值

,則有
這里

表示依分布收斂。Lindeberg-Levy中心極限定理告訴我們:樣本均值

經(jīng)過規(guī)則化后

的極限分布為標(biāo)準(zhǔn)正態(tài)分布。
這里面有一點(diǎn)我們仔細(xì)琢磨琢磨是很牛的,就是Lindeberg-Levy中心極限定理并沒有對(duì)總體分布F作任何限定。不管F服從什么分布,不管它是有參的還是非參的,甚至我們壓根兒就不知道它是個(gè)什么分布,在這種一問三不知的情況下有一點(diǎn)我們卻是可以肯定的,那就是F的抽樣均值

在規(guī)則化后服從標(biāo)準(zhǔn)正態(tài)分布!這種性質(zhì)是樣本均值的一個(gè)非常重要的大樣本性質(zhì),稱為漸進(jìn)正態(tài)性。
我們?cè)诖嗽俅稳右蝗雍Y子,來幫我們理解和體會(huì)一下Lindeberg-Levy中心極限定理的“威力”。我們拿來一對(duì)篩子,投擲一次,計(jì)算和記錄一下兩個(gè)篩子的點(diǎn)數(shù)之和。如圖1所示,把這個(gè)過程重復(fù)100次、1000次和10000次,我們發(fā)現(xiàn)兩個(gè)篩子點(diǎn)數(shù)和的分布(即樣本均值

的抽樣分布),越來越接近于完美的正態(tài)分布。您可能會(huì)說,篩子的分布我已經(jīng)知道了呀?不是均勻分布么?那好,您可以再去找來任何一對(duì)被做過手腳的篩子,重復(fù)上面的試驗(yàn),結(jié)果你會(huì)發(fā)現(xiàn),點(diǎn)數(shù)和的分布仍然會(huì)越來越接近于完美的正態(tài)分布,只不過由于篩子被做過手腳了(因此這回我們可真是壓根兒就不知道它服從什么分布),因此最后最經(jīng)常出現(xiàn)的點(diǎn)數(shù)和不見得是7罷了。
圖1 通過擲篩子來驗(yàn)證Lindeberg-Levy中心極限定理1
有了Lindeberg-Levy中心極限定理,我們可以在樣本量比較大的時(shí)候?qū)τ?img src="https://img.auto-testing.net/testingimg/201902/21/153856431.jpeg" alt="" />不超過某一值

的概率進(jìn)行一個(gè)近似的估算,其中

為標(biāo)準(zhǔn)正態(tài)分布的上α/2分位點(diǎn),即:
對(duì)于上式,我們有兩點(diǎn)解釋:
1)γ稱為置信度,這是區(qū)間估計(jì)里面的一個(gè)重要概念。
區(qū)間估計(jì)就是用一個(gè)區(qū)間去估計(jì)未知參數(shù),即把未知參數(shù)值估計(jì)在某兩界限之間,相對(duì)于點(diǎn)估計(jì)來說,區(qū)間估計(jì)的一個(gè)明顯的好處是把可能的誤差醒目的標(biāo)識(shí)了出來。
比如說,假設(shè)雞蛋的重量是一個(gè)服從正態(tài)分布的隨機(jī)變量,通過《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》中介紹的極大似然估計(jì)法,我們可以得到雞蛋重量的樣本均值,比方說50g。但是,這個(gè)點(diǎn)估計(jì)評(píng)估結(jié)果沒有給出評(píng)估的精度。區(qū)間估計(jì)的結(jié)果表示方式是,雞蛋重量落在某一數(shù)值區(qū)間的概率是多少。這里面有兩個(gè)要素:第一,數(shù)值區(qū)間的長度,我們把這個(gè)因素稱為精度;第二,落在這個(gè)區(qū)間的概率,我們把他稱為置信度,是可靠性的一種表征。
置信度和精度是一對(duì)矛盾的因素。比方說,我們可以自信的說,雞蛋重量落在數(shù)值區(qū)間[0噸,1噸]的置信度是100%。這個(gè)評(píng)估結(jié)果很可靠,置信度很高,但是評(píng)估結(jié)果卻沒有什么用處,因?yàn)榫忍汀7粗嗳弧?/div>
區(qū)間估計(jì)理論就是提供用統(tǒng)計(jì)學(xué)的方法解決置信度和精度之間的矛盾,把一定的置信度與一定的精度關(guān)聯(lián)起來。現(xiàn)在最流行的一種區(qū)間估計(jì)理論是美國統(tǒng)計(jì)學(xué)家J. Neyman在本世紀(jì)30年代建立的。
2)總體標(biāo)準(zhǔn)差

是未知的,但是在《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》我們談到,樣本標(biāo)準(zhǔn)差S是

的一個(gè)相合估計(jì),因此在樣本量比較大的時(shí)候,可以用S去代替

。
這樣,上式變化為
式(1)對(duì)于最小樣本量的確定是及其重要的。我們想抽取一定數(shù)量的樣本,用樣本均值

來估計(jì)總體均值aF,但是希望兩者足夠接近。如果定義

為相對(duì)偏差的話,我們希望相對(duì)偏差不要超過某一指定的值δ。因此,由式(1)得到
因此,當(dāng)指定相對(duì)偏差為δ,置信度為γ時(shí),最小樣本量為
由式(2)我們看到,影響最小樣本量大小的有三方面的因素:
1)置信度的因素。如果我們要求統(tǒng)計(jì)結(jié)果越可靠,置信度越高,相應(yīng)的

的值就會(huì)增大,從而引起最小樣本量的增大。
2)相對(duì)偏差的因素。如果我們希望樣本均值越來越精確的逼近總體均值,沒有別的途徑,唯有增加最小樣本量。
3)隨機(jī)變量本身的變異性。式(2)中

是一個(gè)非常重要的量,稱為變異系數(shù),反應(yīng)樣本標(biāo)準(zhǔn)差和樣本均值之間的相對(duì)關(guān)系。如果變異系數(shù)越大,說明我們所研究的隨機(jī)變量的變異性越大,在這種情況下,需要更多的樣本量來達(dá)到同等的置信度和相對(duì)偏差。
以上介紹的最小樣本量的確定方法,來源于Lindeberg-Levy中心極限定理,是一種大樣本方法。它有一個(gè)好處:我們可以在對(duì)樣本分布一無所知的情況下使用這一方法來進(jìn)行最小樣本量的確定。但是,這里面也存在一個(gè)問題,那就是,Lindeberg-Levy中心極限定理,以及牽扯到的樣本標(biāo)準(zhǔn)差的相合性,都是大樣本性質(zhì),也就是說,是在樣本量n趨于無窮大的時(shí)候才嚴(yán)格成立的?事實(shí)上樣本量不可能無窮大,當(dāng)樣本量固定在某一個(gè)值的時(shí)候,相關(guān)定理都是近似成立的。更加讓人遺憾的是,這種近似產(chǎn)生的偏差到底有多少,統(tǒng)計(jì)學(xué)大樣本理論發(fā)展到今天,還沒有能夠給出合理的解釋。因此,這種方法(特別是對(duì)于處女座的工程師來說)用起來總是有些感覺不踏實(shí)。
3 t分布與小樣本法
1908年,英國統(tǒng)計(jì)學(xué)家W.S. Gosset很文青的以“Student”作為筆名,發(fā)現(xiàn)和發(fā)表了一個(gè)統(tǒng)計(jì)學(xué)中最重要的分布之一,t分布,這是統(tǒng)計(jì)學(xué)發(fā)展過程中的一件大事,開創(chuàng)了統(tǒng)計(jì)學(xué)小樣本法的先河。W.S. Gosset證明:
如果已知總體服從正態(tài)分布,但是其總體均值aF和總體方差σ2F未知,那么從總體中抽樣本X1,…,Xn,則

服從(n-1)自由度的t分布。
與Lindeberg-Levy中心極限定理相比,上面的定理對(duì)于應(yīng)用的條件有所加強(qiáng),也就是說不能對(duì)總體的分布情況一無所知,而是總體必須服從正態(tài)分布,因此,這使得上述定理的應(yīng)用范圍有所限制。但是,好在總體服從正態(tài)分布的情況是非常多見的,比如說,在《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》一文中我們提到,車輛耐久性工程中的重要隨機(jī)變量“車輛累積行駛里程達(dá)到設(shè)計(jì)里程時(shí)車輛某處的某載荷對(duì)應(yīng)的偽損傷(或偽損傷密度,或等效載荷幅值,……)”就服從對(duì)數(shù)正態(tài)分布,因此上述定理仍然有很廣闊的應(yīng)用空間。但是,應(yīng)用條件的些許限制,卻換來了一個(gè)很大的優(yōu)點(diǎn),那就是應(yīng)用該定理的時(shí)候樣本量不需要趨于正無窮定理才成立,換句話說,當(dāng)樣本量固定為一個(gè)有限的數(shù)值時(shí),相關(guān)定理是嚴(yán)格成立的!
基于以上定理,采用與第2小節(jié)完全相同的步驟,可以得到當(dāng)總體服從正態(tài)分布時(shí),對(duì)應(yīng)于相對(duì)偏差為δ,置信度為γ的最小樣本量為
再次強(qiáng)調(diào),當(dāng)總體服從正態(tài)分布式,式(3)是精確解。在實(shí)際工程中,經(jīng)常取δ=5%,γ=95%,或δ=5%,γ=90%。圖2會(huì)是一個(gè)經(jīng)常用到的表格,超出表格范圍的可以找相關(guān)軟件計(jì)算。
圖2 采用式(3)計(jì)算最小樣本量時(shí)的常用表格2
4 老王到底要在高速路上跑多遠(yuǎn)才能回家吃飯
隨機(jī)變量Y=司機(jī)老王駕車在高速路上每行駛10km時(shí)車輛某處某載荷對(duì)應(yīng)的偽損傷(或偽損傷密度,或等效載荷幅值,……)。
為了回答什么時(shí)候回家吃飯的問題,讓老王先在高速路上開上100km,獲得10個(gè)樣本Yi,i=1,…,10。在《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》我們提到,隨機(jī)變量Y服從對(duì)數(shù)正態(tài)分布,因此,滿足采用小樣本法、使用式(3)的條件。在指定了相對(duì)偏差為δ,置信度為γ,我們可以由式(3)清楚的知道:老王是不是已經(jīng)可以收工了;如果不能收工,還得開多遠(yuǎn)(具體地說是幾個(gè)10km)。
至此,我們已經(jīng)用連續(xù)的三篇文章《車輛耐久性工程中的重要隨機(jī)變量及如何確定其服從怎樣的分布模型》、《極大似然估計(jì)及點(diǎn)估計(jì)的一些重要性質(zhì)》和《道路試驗(yàn)啊!這到底要開多遠(yuǎn)才是個(gè)頭?——抽樣分布與最小樣本量的確定》討論了Fisher先生給出的數(shù)理統(tǒng)計(jì)學(xué)的三大任務(wù):定模型、估計(jì)和抽樣分布。這三篇文章雖然不長,但是選擇性的圍繞Fisher先生提出的這三大問題,把經(jīng)典統(tǒng)計(jì)學(xué)范疇內(nèi)的相關(guān)重要成果加以介紹,已經(jīng)使我們可以對(duì)于一維隨機(jī)變量做不少統(tǒng)計(jì)處理。
下一篇文章中,我們將簡要介紹西門子工業(yè)軟件公司的核心專利技術(shù),客戶相關(guān)(Customer Correlation,簡稱CuCo)的車輛道路載荷大數(shù)據(jù)獲取和分布模型的構(gòu)建技術(shù)。我們將看到,運(yùn)用CuCo技術(shù)獲取大數(shù)據(jù)后,我們可以在一維隨機(jī)變量的范圍內(nèi),用現(xiàn)在已經(jīng)介紹的這一些統(tǒng)計(jì)學(xué)知識(shí),很好的解決車輛耐久性工程中載荷分布模型的確立,這一最重要的頂層輸入問題。
參考文獻(xiàn)
1. 統(tǒng)計(jì)學(xué),David Freedman, Robert Pisani, Roger Purves, Ani Adhikari,1997年10月,第一版,中國統(tǒng)計(jì)出版社.
2. 劉文珽,結(jié)構(gòu)可靠性設(shè)計(jì)手冊(cè),2008年2月,第一版,國防工業(yè)出版社.
附錄:W.S. Gosset(1876—1937),英國統(tǒng)計(jì)學(xué)家。
作者簡介:李旭東,2003年畢業(yè)于大連理工大學(xué)機(jī)械工程學(xué)院,獲工學(xué)學(xué)士學(xué)位;2008年畢業(yè)于北京大學(xué)力學(xué)系固體力學(xué)專業(yè),獲理學(xué)博士學(xué)位。2008年至2014年,就職于中國航空綜合技術(shù)研究所,歷任工程師、高級(jí)工程師;2015年至今,就職于西門子工業(yè)軟件(北京)有限公司,任職耐久性應(yīng)用工程師。長期專注于(金屬)材料和結(jié)構(gòu)耐久性和損傷容限分析方法研究。
作者個(gè)人微信號(hào):lixudong2008 (添加微信號(hào)請(qǐng)注明“姓名+工作單位”)