欢迎光临熊猫体育官方网站

crm系統

免費試用400-821-5041


機器學習的挑戰:開始之前要了解的知識

時間: 2019-11-28來源: Sherry Tiao

機器學習

機器學習的回報是眾所周知的,它可能會讓您想現在就開始。然而,與此同時,在開始自己的項目之前,您應該考慮一下機器學習的挑戰。

 

這篇文章并不是要嚇跑您,相反,這樣做是為了確保您做好了準備,并在開始之前仔細考慮所需注意的事項。

 

本文據與Oracle信息管理平臺團隊的數據科學家Brian MacDonald訪談,他談到了他所看到的陷阱,以及公司可以采取哪些措施來避免這些陷阱。

 

這些機器學習的挑戰包括:

• 解決技能差距

• 知道如何管理您的數據

• 數據運作

 

1. 解決機器學習技能的差距
當然,較大的困難是在大數據環境中使用機器學習的技能差距。有一群人認為大數據讓生活更美好,而且很容易上手。

 

您將發現較大的挑戰是找到合適的人。機器學習的人才需求量很大,可供選擇的人才很少。但獲得高管的支持是實現這一目標的關鍵。如果您有高層管理人員的支持,那么您還將獲得尋找和招募這些寶貴人才的資金。

 

這是要考慮的事情:如果您處于一種由于經驗豐富的數據科學家很昂貴而對成本非常敏感的情況,那么你可能沒有足夠大的商業問題來讓機器學習變得值得去做。

 

假設一位經驗豐富的數據科學家要花費您公司3-40萬美元(包括所有的福利和獎勵)。如果該人不能幫助您解決每年至少價值一百萬美元的問題,那么您可能不需要他。對嗎?

 

另一方面,如果您真的相信這個人(或團隊)可以幫助您解決數千萬的問題,那么您還在等什么呢?

 

很難找到人。但如果這對您的公司真的很重要,您可以找到他們。

 

這里還有一個需要考慮的問題:工具和軟件。當然,有一些工具會有所幫助,但您很難立即找到您需要的:準確的、完美的、開箱即用的機器學習工具。您必須考慮將要使用的工具。

 

Python, R, SQL, TensorFlow…如果您使用它們,它們將如何與您的數據湖一起工作?您將如何處理可能帶來挑戰的設置和配置?開始之前請仔細考慮所有細節,并確保您有足夠的資金。


2.知道如何管理大數據
機器學習是一個混亂的過程。僅僅擁有一個大數據平臺并不意味著它會變得更容易。事實上,這可能會使它變得更混亂,因為您將擁有更多的數據。這些數據使您能夠做更多的工作,但這也意味著必須完成更多的數據準備工作。


你必須全盤考慮如何處理這個問題。以下是一些需要思考的問題:

• 您的數據來自哪里?

• 您打算怎樣處理這個問題?

• 您希望如何處理數據準備工作?

• 完成后,您將如何構建模型并實現所有操作?

 

如果您還沒有一個好的BI實踐或分析實踐,如果您還沒有以您能想到的所有方式使用數據,那么跳到機器學習將是一個真正的挑戰。已經有數據驅動的決策絕對至關重要。如果您還沒有,我們建議您在開始機器學習之前就做好了準備。

 

如果您決定開始,那么這里還有其他一些注意事項。在開始之前,請仔細考慮它們:
快速變化:在機器學習的世界里,創新來的很快,這意味著快速的變化。今天的好東西明天可能就不那么好了,而且你不能總是依賴軟件,因為它是一個更不穩定的空間。不同的版本和沖突可能會帶來更多的問題。


龐大的數據量:借助機器學習,您將不得不處理大量數據以及許多不同類型的數據。了解您是否使用所有這些信息,過程,是否采樣等都是挑戰,尤其是當您深入了解數據并處理數據移動時。

 

確保您已準備好應對挑戰,并制定了計劃。

 

3.大數據的運作
大多數數據科學家面臨的較大問題是什么?是數據的運作。

 

假設您已經建立了一個模型,它可以預測導致客戶流失的因素。您如何把這個模型推廣給那些能影響這些數字的人?您如何將其導入CRM系統或移動應用?

 

如果您擁有可以預測設備故障的模型,那么如何及時將其告知操作員以防止發生故障?建立模型并使之可行具有許多挑戰。對于當今的數據科學家來說,這可能是較大的技術挑戰。

 

您可以建立世界上非常漂亮的模型。但是,您的管理層真的會真正在意這是否會對公司的利潤產生影響嗎?您可能認為您的部分交易只是提供數據。但事實并非如此。您必須確保實際使用您的數據,獲得主管的支持對此很有幫助。

 

因此,機器學習并不是很容易。但這可以成就大事。為了激發您的靈感并提醒您可行的方法,我們分享了一個真實的客戶示例及其機器學習項目。

 

現實生活中的機器學習和大數據示例
該公司是美國較大的無線語音和數據通信服務提供商。

 

業務挑戰:

• 信用風險:他們通過融資部門進行的設備租賃和貸款項目每年都要沖銷大量壞賬。他們希望減少壞賬和違約,這將大大增加他們每年數以百萬計的利潤。此外,影響未決收款的能力將更大地幫助現金流。

• 客戶體驗和個性化:客戶流失使公司每年損失數百萬美元。通過個性化和細分,盡早識別和定位潛在的客戶流失和新的高價值客戶,可以顯著增加新用戶的數量,并減少客戶流失率。

• 運營效率:該公司通過網絡優化和數據貨幣化來尋求有針對性的營銷和營銷活動有效性。

 

技術挑戰:
• 該電信公司希望更早地檢測欺詐活動,并集成來自多個結構化和非結構化數據源的數據,以改進客戶評分。這將使公司能夠提供定制的報價,并降低風險。

• 他們還希望能夠存儲和分析大量的客戶數據,以幫助企業發展更好的能力來細分客戶并預測其個性化報價的行為。

• 他們試圖通過新的假設分析來優化定價。


為了實現這一目標,公司購買了包括多種大數據產品。

 

解決技能差距,管理數據并對其進行運作是嘗試機器學習技術需要解決的挑戰,但可以解決,且結果令人驚喜的。