三個核心要素幫你應對機器學習挑戰(zhàn)
2016年,“機器學習”還只是被Gartner 視為一個“流行詞”,到如今,它已發(fā)展成為幾乎所有 IT 人士都在思考、探索或執(zhí)行的一件事。毫無疑問,基于數(shù)據的分析和預測(機器從信息資源中學習,然后通知業(yè)務部門及其他部門并影響其行動)已經是當今迅速增長的最新、最熱門的技術領域之一。但對于那些正在進入機器學習領域的參與者來說,理想和現(xiàn)實之間仍無法平衡;正如每個不斷發(fā)展的新興事業(yè)一樣,基礎設施之水既能載舟,亦能覆舟。
本文引用地址:http://www.ex-cimer.com/article/201801/375118.htmGartner已經確定了三種主要的最佳實踐,基礎設施和運營領導者在幫助所在組織準備應對機器學習 (ML) 和人工智能 (AI) 帶來的挑戰(zhàn)時,可以考慮采用這三種最佳實踐:
1. 采用模塊化訪問,實現(xiàn)高效的數(shù)據管道——根據 Gartner 的研究,“最終用戶表示,在典型項目中,數(shù)據準備和管理占去了將近 75% 到 85% 的機器學習管道。”建議在整個組織內執(zhí)行更有效的數(shù)據清理、轉換和整合。
2. 制定高效的機器學習模型交付策略——該評論指出:“I&O 領導者可以通過訪問模型、功能和預測存儲庫來顯著加快其機器學習管道的速度。”這有助于縮小實驗級和生產級系統(tǒng)之間的資源差距。
3. 提供可擴展的計算基礎設施——Gartner 指出:“機器學習管道中的第二大時間密集型部分通常是模型工程設計階段。”同樣,建議采取的措施是針對需要聚集的核心參與者,將數(shù)據科學家、業(yè)務專家和軟件工程師的最佳技能結合起來,實現(xiàn)協(xié)作并推動“跨團隊的機器學習理念”。
如果具體情形難度相當,通常需要權衡生產時間和準確性以及提供組織范圍的機器學習策略,而且往往要橫跨包括公共、私有、數(shù)據庫、大數(shù)據生態(tài)系統(tǒng)、傳統(tǒng)數(shù)據存儲等在內的多個孤立的數(shù)據源進行。
評論