翻譯|大數(shù)據(jù)新聞|編輯:況魚(yú)杰|2020-10-13 10:08:44.620|閱讀 193 次
概述:本文,我們將會(huì)分享如何將大數(shù)據(jù)工具集成到您的工作流程中。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
相關(guān)鏈接:
智能傳感器和物聯(lián)網(wǎng)(IoT)等技術(shù)使人們能夠從科學(xué)儀器,制造系統(tǒng),聯(lián)網(wǎng)汽車,飛機(jī)和其他來(lái)源收集大量詳細(xì)數(shù)據(jù)。借助適當(dāng)?shù)墓ぞ?和技術(shù),此數(shù)據(jù)可用于快速進(jìn)行科學(xué)發(fā)現(xiàn),并將更多的情報(bào)開(kāi)發(fā)并整合到產(chǎn)品,服務(wù)和制造過(guò)程中。
盡管科學(xué)家和工程師具有使用該數(shù)據(jù)進(jìn)行設(shè)計(jì)和業(yè)務(wù)決策的領(lǐng)域知識(shí)和經(jīng)驗(yàn),但是可能需要其他軟件分析和建模工具才能將產(chǎn)品差異化提升到一個(gè)新的水平。使用支持這些大數(shù)據(jù)需求的平臺(tái)可提供可伸縮性和效率,同時(shí)為公司提供在全球市場(chǎng)上的競(jìng)爭(zhēng)優(yōu)勢(shì)。
對(duì)于某些潛在的大數(shù)據(jù)用戶而言,獲得對(duì)分析工具的訪問(wèn)權(quán)限并將其實(shí)際集成到工作流中似乎是一項(xiàng)有趣而艱巨的任務(wù)。幸運(yùn)的是,當(dāng)今的軟件分析和建模工具已通過(guò)新功能得到了增強(qiáng),這些功能使處理大數(shù)據(jù)更加輕松和直觀。使用這些工具,工程師和科學(xué)家可以通過(guò)訪問(wèn)和組合多個(gè)數(shù)據(jù)集并使用熟悉的語(yǔ)法和功能創(chuàng)建預(yù)測(cè)模型來(lái)成為數(shù)據(jù)科學(xué)家。
為了有效地捕獲和整合大數(shù)據(jù)的優(yōu)勢(shì),工程師和科學(xué)家需要一種可擴(kuò)展的工具,該工具可提供對(duì)用于存儲(chǔ)和管理數(shù)據(jù)的各種系統(tǒng)和格式的訪問(wèn)。在可能使用不止一種類型的系統(tǒng)或格式的情況下,這尤其重要。例如,存儲(chǔ)在共享驅(qū)動(dòng)器上的文件中的傳感器或圖像數(shù)據(jù)可能需要與存儲(chǔ)在數(shù)據(jù)庫(kù)中的元數(shù)據(jù)合并。
在某些情況下,必須匯總許多不同格式的數(shù)據(jù)以了解系統(tǒng)的行為并開(kāi)發(fā)預(yù)測(cè)模型。例如,為石油和天然氣經(jīng)營(yíng)者提供服務(wù)的貝克休斯(Baker Hughes)的工程師需要開(kāi)發(fā)一種預(yù)測(cè)性維護(hù)系統(tǒng),以減少其石油和天然氣開(kāi)采卡車的泵設(shè)備成本和停機(jī)時(shí)間。如果活動(dòng)現(xiàn)場(chǎng)的卡車出現(xiàn)泵故障,貝克休斯必須立即更換卡車以確保連續(xù)運(yùn)行。如果將備用卡車運(yùn)往每個(gè)站點(diǎn),那么如果這些卡車在另一個(gè)站點(diǎn)活動(dòng),則可以節(jié)省公司數(shù)千萬(wàn)美元的收入。無(wú)法準(zhǔn)確預(yù)測(cè)閥門和泵何時(shí)需要維護(hù)將加劇其他成本。過(guò)于頻繁的維護(hù)很浪費(fèi),導(dǎo)致零件仍在使用時(shí)被更換,而過(guò)于頻繁的維護(hù)則有損壞泵的危險(xiǎn),無(wú)法維修。為了達(dá)到平衡,貝克·休斯(Baker Hughes)的工程師使用MATLAB從石油和天然氣開(kāi)采卡車中收集了TB級(jí)數(shù)據(jù),然后開(kāi)發(fā)了可預(yù)測(cè)設(shè)備何時(shí)需要維護(hù)或更換的應(yīng)用程序,最后再用Qlik完成數(shù)據(jù)的可視化展示。
同樣,希望有效地獲取大數(shù)據(jù)利益的工程師和科學(xué)家需要一種可擴(kuò)展的工具來(lái)分類不同的格式并了解系統(tǒng)的行為,然后再開(kāi)發(fā)其預(yù)測(cè)模型。
軟件分析和建模工具可以簡(jiǎn)化此探索過(guò)程,從而使工程師和科學(xué)家更容易觀察,清理和有效使用大數(shù)據(jù),并確定應(yīng)在大型數(shù)據(jù)集中使用哪種機(jī)器學(xué)習(xí)算法來(lái)實(shí)現(xiàn)實(shí)際模型。在訪問(wèn)數(shù)據(jù)之后,在創(chuàng)建模型或理論之前,了解數(shù)據(jù)中的內(nèi)容很重要,因?yàn)檫@可能會(huì)對(duì)最終結(jié)果產(chǎn)生重大影響。
通常,在創(chuàng)建模型或理論時(shí),該軟件可以幫助解密數(shù)據(jù)并識(shí)別:
趨勢(shì)緩慢或頻率不高的事件散布在整個(gè)數(shù)據(jù)中
在建立有效的模型或理論之前,需要清除不良或丟失的數(shù)據(jù)
與理論或模型最相關(guān)的數(shù)據(jù)
此外,大數(shù)據(jù)工具還可以協(xié)助進(jìn)行要素工程設(shè)計(jì),在其中可以導(dǎo)出其他信息以用于以后的分析和模型創(chuàng)建。
讓我們看一些可以幫助輕松瀏覽和理解數(shù)據(jù)的功能,即使這些數(shù)據(jù)太大而無(wú)法容納典型臺(tái)式機(jī)工作站的內(nèi)存。
摘要可視化,例如binScatterPlot,提供了一種輕松查看模式并快速獲得見(jiàn)解的方法。
數(shù)據(jù)清理可消除異常值,并替換不良或丟失的數(shù)據(jù)以確保更好的模型或分析。以編程方式清除數(shù)據(jù)的方法使收集到的新數(shù)據(jù)能夠自動(dòng)清除。
數(shù)據(jù)縮減技術(shù)(例如主成分分析(PCA))有助于查找最具影響力的數(shù)據(jù)輸入。通過(guò)減少輸入的數(shù)量,可以創(chuàng)建更緊湊的模型,當(dāng)將模型嵌入產(chǎn)品或服務(wù)中時(shí),需要較少的處理。
大規(guī)模數(shù)據(jù)處理使工程師和科學(xué)家不僅可以在臺(tái)式機(jī)工作站上處理大量數(shù)據(jù),還可以在企業(yè)級(jí)系統(tǒng)(例如Hadoop)上使用他們的分析管道或算法。 在系統(tǒng)之間移動(dòng)而無(wú)需更改代碼的能力極大地提高了效率。
為了真正利用大數(shù)據(jù)的價(jià)值,必須支持從訪問(wèn)數(shù)據(jù)到開(kāi)發(fā)分析模型再將這些模型部署到生產(chǎn)中的整個(gè)過(guò)程。但是,將模型合并到產(chǎn)品或服務(wù)中通常是與企業(yè)應(yīng)用程序開(kāi)發(fā)人員和系統(tǒng)架構(gòu)師一起完成的,并且可能會(huì)帶來(lái)挑戰(zhàn),因?yàn)楣こ處熀涂茖W(xué)家很難用傳統(tǒng)編程語(yǔ)言開(kāi)發(fā)模型。
為了緩解此問(wèn)題,企業(yè)應(yīng)用程序開(kāi)發(fā)人員應(yīng)尋找工程師和科學(xué)家熟悉的數(shù)據(jù)分析和建模工具。通過(guò)利用某些軟件分析和建模工具,科學(xué)家和工程師可以使用熟悉的功能和語(yǔ)法探索,處理和創(chuàng)建具有大數(shù)據(jù)的模型,同時(shí)提供將其模型和見(jiàn)解直接集成到產(chǎn)品,系統(tǒng)和運(yùn)營(yíng)中的能力。同時(shí),使組織能夠利用這些工具中的可用于生產(chǎn)的應(yīng)用服務(wù)器和代碼生成功能,將這些模型快速整合到其產(chǎn)品和服務(wù)中。
對(duì)提供可擴(kuò)展性和效率的工具的訪問(wèn)使領(lǐng)域?qū)<铱梢猿蔀楦玫臄?shù)據(jù)科學(xué)家,并為其公司在全球市場(chǎng)上的競(jìng)爭(zhēng)優(yōu)勢(shì)。能夠成為有效數(shù)據(jù)科學(xué)家的知識(shí)淵博的領(lǐng)域?qū)<遗c能夠?qū)⑵涔ぷ餮杆僬系浇M織的服務(wù),產(chǎn)品和運(yùn)營(yíng)中的IT團(tuán)隊(duì)的結(jié)合,在提供產(chǎn)品和服務(wù)時(shí)具有明顯的競(jìng)爭(zhēng)優(yōu)勢(shì)。
慧都大數(shù)據(jù)分析平臺(tái)「GetInsight®」升級(jí)發(fā)布,將基于企業(yè)管理駕駛艙、產(chǎn)品質(zhì)量分析及預(yù)測(cè)、設(shè)備分析及預(yù)測(cè)等大數(shù)據(jù)模型的構(gòu)建,助力企業(yè)由傳統(tǒng)運(yùn)營(yíng)模式向數(shù)字化、智能化的新模式轉(zhuǎn)型升級(jí),抓住數(shù)據(jù)經(jīng)濟(jì)的發(fā)展勢(shì)頭,提供管理效能,精準(zhǔn)布局未來(lái)。了解更多,請(qǐng)聯(lián)系。
慧都大數(shù)據(jù)專業(yè)團(tuán)隊(duì)為企業(yè)提供商業(yè)智能大數(shù)據(jù)平臺(tái)搭建,免費(fèi)業(yè)務(wù)咨詢,定制開(kāi)發(fā)等完整服務(wù),快速、輕松、低成本將任何Hadoop集群從試用階段轉(zhuǎn)移到生產(chǎn)階段。
歡迎撥打慧都熱線023-68661681或咨詢慧都在線客服,我們有專業(yè)的大數(shù)據(jù)團(tuán)隊(duì),為您提供免費(fèi)大數(shù)據(jù)相關(guān)業(yè)務(wù)咨詢!
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn
文章轉(zhuǎn)載自: