翻譯|使用教程|編輯:況魚杰|2020-08-31 11:12:49.123|閱讀 483 次
概述:本文將會介紹一些Minitab統計規程中的一些最常見的錯誤,這些錯誤涉及從分析結果中得出錯誤的結論。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關鏈接:
Minitab Statistical Software是一款無與倫比的可視化統計分析軟件,它會審視當前及過往的數據,以找出趨勢并預測規律、發現變量之間隱藏的關系、可視化數據交互作用并識別重要因素,從而解答最棘手的問題、應對最嚴峻的難題。
本文將會介紹一些Minitab統計規程中的一些最常見的錯誤,這些錯誤涉及從分析結果中得出錯誤的結論。
在比較多個均值時,有時建議統計從業人員比較置信區間的結果并確定區間是否重疊。如果兩個獨立總體的均值的95%置信區間不重疊,則均值之間確實存在統計學上的顯著差異(顯著性水平為0.05)。但是,情況不一定 相反。 CI可能會重疊,但均值之間可能存在統計上的顯著差異。
舉個例子:
兩個重疊的95%置信區間在95%置信度水平上可能會顯著不同。
t檢驗P值的意義是什么?在這種情況下,P值小于0.05(0.049 <0.05),這告訴我們平均值之間存在統計差異(但CI的重疊程度很大)。
利用統計數據,我們可以分析一個小的樣本來推斷整個人口。但是在某些情況下,您應該避免對樣本不代表的總體進行推斷:
為避免這些情況,請在采樣前定義總體,并采取能真正代表總體的樣本。
它有時會被過度使用,但是在處理統計信息時,“相關性并不意味著因果關系”是一個很好的提醒。兩個變量之間的關聯并不意味著一個變量會引起另一個變量的變化,特別是如果關聯統計是您在數據分析中使用的唯一統計時。
例如,數據分析顯示襯衫尺寸和鞋子尺寸之間有很強的正相關性。隨著襯衫尺寸的增加,鞋子的尺寸也隨之增加。這是否意味著穿大襯衫會使您穿大鞋子?當然不是!這里可能還有其他“隱藏”因素在起作用,例如身高。 (高個子的人傾向于穿更大的衣服和鞋子。)
查看此散點圖,該散點圖顯示HIV抗體假陰性率與患者年齡相關:
這是否表明HIV抗體測試不適用于老年患者?也許會 …
但是,您不能止步于此,并假設僅僅因為患者年齡較大,才是導致他們獲得假陰性測試結果的因素(假陰性是指患者在測試中測試為陰性,但被確認具有這種病)。
讓我們深入一點。在下面,您可以看到患者的年齡和有風險的暴露與測試之間經過的天數是相關的:
老年患者的檢測速度更快……在HIV抗體能夠完全發育并顯示出陽性檢測結果之前。
閱讀媒體上公布的許多研究中的某些內容時,請牢記“相關性并不意味著因果關系”的想法。不論有意還是無意,媒體經常暗示一項研究已經揭示了某種因果關系,即使該研究的作者精確地詳述了他們研究的局限性。
重要的是要記住,使用統計數據,我們可以發現統計上的顯著差異,在“現實世界”中沒有明顯的影響。換句話說,僅僅因為存在差異并不意味著差異重要。而且您可能會浪費大量時間和金錢來嘗試“校正”無統計學意義的重大差異。
假設您喜歡Tastee-O的谷物。制造工廠的他們使用自動測量系統在灌裝線的末端稱重每個谷物盒。假設每個班次裝滿18,000箱,目標裝填重量為360克,標準偏差為2.5克。
使用統計數據,工廠可以在90%的時間內檢測到0.06克的平均填充重量偏移。但是,僅因為0.06克偏移具有統計意義,并不意味著它具有實際意義。 0.06克的差異可能相當于兩到三個Tastee-O,不足以吸引您,客戶,注意或關心。
在大多數假設檢驗中,我們知道原假設并不完全正確。在這種情況下,我們不希望平均填充重量精確地為360克-我們只是在嘗試查看是否存在有意義的差異。代替假設檢驗,谷物制造商可以使用置信區間來查看差異可能有多大,并決定是否需要采取措施。
在假設檢驗中,您將構成原假設(H0)和替代假設(H1)。然后,您可以收集數據,對其進行分析,并使用統計信息來評估數據是否支持替代假設。如果p值大于0.05,則表示“沒有足夠的證據可以得出H5為0.05 /顯著性水平”。
換句話說,即使我們沒有足夠的證據支持替代假設,原假設也可能是正確的,也可能不是。
例如,可以擲3次公平硬幣并進行測試:
H0:正面比例= 0.40
H1:正面比例≠0.40
在這種情況下,保證p值大于0.05。因此,不能得出H1。但是不能得出H1并不能證明H0是正確或正確的!這就是為什么說“未能拒絕”原假設,而不是“接受”原假設的原因。
Minitab是做質量分析的工具,不知道您是否有產品質量這方面的困擾呢?不妨試試產品質量分析及預測方案吧!點擊咨詢在線客服
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉載自:minitab