翻譯|行業(yè)資訊|編輯:況魚杰|2020-05-11 14:12:43.490|閱讀 1174 次
概述:隨著我們從流程中收集越來越多的觀測數(shù)據(jù),我們可能需要新的工具來提供有意義的見解。 您可以將現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)與傳統(tǒng)統(tǒng)計(jì)工具一起添加,以分析,改善和控制您的流程。 讓我們看一個(gè)以二進(jìn)制邏輯回歸開始,以分類和回歸樹(CART?)結(jié)尾的示例。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
隨著我們從流程中收集越來越多的觀測數(shù)據(jù),我們可能需要新的工具來提供有意義的見解。 您可以將現(xiàn)代機(jī)器學(xué)習(xí)技術(shù)與傳統(tǒng)統(tǒng)計(jì)工具一起添加,以分析,改善和控制您的流程。 讓我們看一個(gè)以二進(jìn)制邏輯回歸開始,以分類和回歸樹(CART®)結(jié)尾的示例。
編者注:該文章的早期版本顯示了Salford Predictive Modeler中的CART,已于2018年3月發(fā)布。我們對其進(jìn)行了更新,以在Minitab的最新版本中顯示CART。
更多新功能可下載Minitab 19使用!
尋找紙漿漂白過程中過度變化的根本原因
在我們的示例中,我們看到產(chǎn)品中有2.9%存在缺陷。要開始查看此過程中出現(xiàn)不可接受百分比缺陷的根本原因,您可以從Minitab中的Binary Logistic回歸開始,其中響應(yīng)變量可以觀察值是否存在缺陷。不幸的是,對于這些數(shù)據(jù),下面殘差圖中的瘋狂模式表明二進(jìn)制logistic回歸模型可能不夠充分。
CART方法
CART是一種決策樹算法,通過創(chuàng)建一組是/否規(guī)則進(jìn)行工作,這些規(guī)則根據(jù)預(yù)測變量(X)的設(shè)置將響應(yīng)(Y)變量分為多個(gè)分區(qū)。使用Minitab中的CART功能之后,發(fā)現(xiàn)預(yù)測變量之一——放電pH是造成缺陷的重要因素。
如果排放pH <= 7.739,則估計(jì)的缺陷可能性相對較高(17.7%)。 如果放電pH> 7.739,則幾乎沒有缺陷發(fā)生。
點(diǎn)擊可查看使用CART作為替代方法來分析分類調(diào)查數(shù)據(jù)
下面的Minitab圖說明了此規(guī)則起作用的原因。CART模型找到最能將Response = Pass與Response = Fail組區(qū)分開的變量和設(shè)置。在這里,該變量和設(shè)置是排出pH為7.739。
接下來可以繼續(xù)發(fā)展CART樹,以最終找到導(dǎo)致此過程中出現(xiàn)缺陷的更多設(shè)置組合。將問題縮小到至關(guān)重要的幾個(gè)X后,就可以放置控件以減少出現(xiàn)缺陷的機(jī)會。在這種情況下,完整的CART分類模型會確定放電pH和生產(chǎn)率的某些特定組合,這些組合會導(dǎo)致缺陷數(shù)量不成比例,如下圖所示。
心動了嗎?想要自己嘗試看看嗎?
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自:minitab