原創(chuàng)|行業(yè)資訊|編輯:況魚杰|2020-06-02 15:39:46.577|閱讀 53 次
概述: 當您將這兩個統(tǒng)計數(shù)據(jù)聯(lián)系起來時,很明顯,要部署和運行模型,必須克服一系列挑戰(zhàn)。 本文將會介紹如何使您對這些挑戰(zhàn)以及如何克服這些挑戰(zhàn)有更深入的了解。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
2019年,Cloudera組織在機器學習應(yīng)用程序開發(fā)(Statistica)中投資了285億美元。但是,只有35%的組織表示已在生產(chǎn)中完全部署了分析模型(IDC)。
當您將這兩個統(tǒng)計數(shù)據(jù)聯(lián)系起來時,很明顯,要部署和運行模型,必須克服一系列挑戰(zhàn)。常見的障礙通常集中在:
以下各段將使您對這些挑戰(zhàn)以及如何克服這些挑戰(zhàn)有更深入的了解。
一塊玻璃可以防碎
無論您處于機器學習開發(fā)的哪個階段,如果使用點解決方案或孤立的工具集,都將為模型和業(yè)務(wù)創(chuàng)建漏洞。為了克服這個問題,您需要在一個整體的,統(tǒng)一的平臺上進行操作,使您可以通過一個單一的窗格(從數(shù)據(jù)源到生產(chǎn)環(huán)境)查看操作。這將使您的團隊更快地將ML模型從實驗移至生產(chǎn),并為您提供對數(shù)學和技術(shù)指標性能的精簡見解。
擁有集成的主干將幫助您可視化數(shù)據(jù)(無論是圖表,圖形還是其他可視化效果),從而使您可以評估進度并快速進行迭代。它還可以提供自動化功能–如果缺少基準或檢測到異常,則向您發(fā)送警報。
建立或破壞您的代碼
ML探索的早期步驟要求您整理原始數(shù)據(jù)源,并為進行測試和建模做好準備。當您了解數(shù)據(jù)和問題時,代碼將快速發(fā)展。如果您的數(shù)據(jù)工程和科學團隊以孤立的方式工作(使用不同的解決方案),您將不可避免地遇到一個共同的挑戰(zhàn):您的生產(chǎn)系統(tǒng)將無法運行ML模型。
重寫生產(chǎn)代碼會大大減慢您的進度,從而浪費時間和金錢。為了克服這一(極其常見的)挑戰(zhàn),您應(yīng)該考慮從一開始就進入生產(chǎn)和跨團隊協(xié)作的樣子。即使距離這個階段還很遙遠,也請考慮一個集成平臺將為您的數(shù)據(jù)科學家和工程師長期提供的功能:在一個地方實時訪問數(shù)據(jù)和模型。
這一點與確保您利用ML操作(MLOps)標準緊密相關(guān)。盡早(在平臺的幫助下)做到這一點,以便您在團隊和生產(chǎn)工作流中使用共同的語言。這樣可以確保您的數(shù)據(jù),代碼和模型的結(jié)構(gòu)能夠在生產(chǎn)環(huán)境中正常運行,無論它們是本地還是在云中。
影子IT差距:浪費好精力的地方
無論我們是否在談?wù)摍C器學習,企業(yè)中的安全性都是至關(guān)重要的。如果沒有正確的端到端基礎(chǔ)架構(gòu),對整個機器學習工作的挑戰(zhàn)(或威脅)可能變得孤立無援(影子IT)。如果您缺乏可見性并被迫對模型進行編碼和重新編碼,則會造成差距。IT漏洞是不良行為者和無盡隧道的避風港,在隧道中數(shù)據(jù)可能會丟失或混亂。您需要具有強大的端到端治理標準的統(tǒng)一平臺,以確保流經(jīng)生產(chǎn)環(huán)境的數(shù)據(jù)安全。
不要讓基礎(chǔ)架構(gòu)阻止您
部署的重點是釋放更大的業(yè)務(wù)價值-從可用的模型過渡到提供概率性預測和說明性見解的模型。
部署模型時,它們將占用大量數(shù)據(jù)和計算資源。您的基礎(chǔ)架構(gòu)必須能夠支持這些工作負載。一個普遍的挑戰(zhàn)是使數(shù)據(jù)和模型在內(nèi)部部署和云環(huán)境之間無縫地移動,以進行工作流,例如突發(fā)計算密集型工作,在企業(yè)內(nèi)或通過Web部署模型。當您沒有靈活的環(huán)境時,幾乎不可能擴展模型。
這里的關(guān)鍵是利用提供互操作性的平臺。這將創(chuàng)建可以連續(xù)監(jiān)視和控制的靈活工作流。設(shè)置好這些設(shè)置后,您還將有機會采用微服務(wù),從而使您可以查看生產(chǎn)分析,從而幫助您快速迭代和擴展。
關(guān)于Cloudera
在 Cloudera,我們相信數(shù)據(jù)可以使今天的不可能,在明天成為可能。我們使人們能夠?qū)碗s的數(shù)據(jù)轉(zhuǎn)換為清晰而可行的洞察力。Cloudera為任何地方的任何數(shù)據(jù)從邊緣到人工智能提供企業(yè)數(shù)據(jù)云平臺服務(wù)。在開源社區(qū)不懈創(chuàng)新的支持下, Cloudera推動了全球最大型企業(yè)的數(shù)字化轉(zhuǎn)型歷程。了解更多,請聯(lián)系。
歡迎撥打慧都熱線023-68661681或咨詢慧都在線客服,我們有專業(yè)的大數(shù)據(jù)團隊,為您提供免費大數(shù)據(jù)相關(guān)業(yè)務(wù)咨詢!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請郵件反饋至chenjj@fc6vip.cn