翻譯|使用教程|編輯:況魚杰|2020-06-28 11:40:51.540|閱讀 1264 次
概述:數(shù)據(jù)的正態(tài)分布遵循鐘形對稱模式。大多數(shù)觀察值都接近平均值,并且越來越遠(yuǎn)離平均值的觀察值也越來越少。它表明,有一些方法可以解決原始數(shù)據(jù)的瘋狂問題。許多情況下的數(shù)據(jù)都遵循正態(tài)分布。但是,要衡量的許多事情都不遵循這種模式。據(jù)說它們具有非正態(tài)分布。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
Minitab Statistical Software是一款無與倫比的可視化統(tǒng)計分析軟件,它會審視當(dāng)前及過往的數(shù)據(jù),以找出趨勢并預(yù)測規(guī)律、發(fā)現(xiàn)變量之間隱藏的關(guān)系、可視化數(shù)據(jù)交互作用并識別重要因素,從而解答最棘手的問題、應(yīng)對最嚴(yán)峻的難題。
正常數(shù)據(jù)? 非正常數(shù)據(jù)? 在分布中尋找模式
數(shù)據(jù)的正態(tài)分布遵循鐘形對稱模式。大多數(shù)觀察值都接近平均值,并且越來越遠(yuǎn)離平均值的觀察值也越來越少。它表明,有一些方法可以解決原始數(shù)據(jù)的瘋狂問題。許多情況下的數(shù)據(jù)都遵循正態(tài)分布。但是,要衡量的許多事情都不遵循這種模式。據(jù)說它們具有非正態(tài)分布。
但是,對于正態(tài)和非正態(tài)數(shù)據(jù),如果我們從總體中重復(fù)獲取大小為n的獨立隨機(jī)樣本,則當(dāng)n大時,樣本均值的分布將接近正態(tài)分布。
多大的樣本量就足夠了?
這要看情況。總體分布已經(jīng)越接近于正態(tài)分布,證明該定理所需的樣本就越少。一般來說,樣本大小為30或更大被認(rèn)為足以使中心極限定理生效。 但是,嚴(yán)重偏斜或具有多種模式的總體可能需要更大的樣本量。
示例1:滾動模具顯示正態(tài)分布
假設(shè)您有一個6面模具。滾動任何數(shù)字的概率為1/6。滾動任何一個數(shù)字的概率與滾動其他五個數(shù)字的概率相同。在Minitab統(tǒng)計軟件中,您可以利用隨機(jī)數(shù)據(jù)生成器為您的第一卷模具模擬500種不同的結(jié)果。 單擊計算>隨機(jī)數(shù)據(jù)>整數(shù)…,并使其生成500行,其中最小值為1,最大值為6。
直方圖可用于可視化這500個“第一卷”。 在這種情況下,樣本大小為1。并且由于滾動每個數(shù)字的幾率相等,因此分布相對平坦。請看下圖中的藍(lán)色條形圖與代表正態(tài)分布的紅色曲線圖相比如何? 這不正常。
現(xiàn)在,讓我們獲取更多樣本,看看這些樣本的平均值的直方圖發(fā)生了什么。這次,將模擬模子滾動兩次,并重復(fù)此過程500次。現(xiàn)在樣本大小為2。我們使用Calc> Row Statistics…計算每對的平均值。見下文。在這里,每一行代表大小為2的樣本及其均值。 當(dāng)樣本量足夠大時,將遵循正態(tài)分布。讓我們創(chuàng)建一個獲取想法的直方圖。它開始看起來更加正常。現(xiàn)在,讓我們擲骰子5、10、20和30次。
每組均值的直方圖顯示,隨著樣本數(shù)量的增加,樣本均值的分布越來越接近正態(tài)分布。
示例2:指數(shù)分布
指數(shù)分布模擬事件之間的時間。無論產(chǎn)品是全新的,一年或更舊的(無論是全新的還是一歲的),它都是隨時可能發(fā)生故障的產(chǎn)品或產(chǎn)品生命周期的一個很好的模型。它開始老化并在預(yù)期的應(yīng)用中磨損。這是估算晶體管失效時間的概率密度曲線的示例。
顯然,這不是正態(tài)分布。但是,當(dāng)您使用樣本量5生成指數(shù)數(shù)據(jù)時,計算均值,然后創(chuàng)建均值的直方圖會怎樣?樣本量10、20和30怎么樣?
就像滾動模具一樣,隨著樣本數(shù)量的增加,均值的分布更接近正態(tài)分布。
如果您感興趣,可以下載Minitab來試試!當(dāng)然,你有任何其他想了解的信息,可以點擊咨詢在線客服>>
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自:minitab