創新易聯歡迎您!13年專注深圳網站建設

Gartner預測:90%的數據湖將毫無用處

日期:2018-07-31 | 來源:易聯網站建設公司 | 閱讀:

Gartner此前曾預計,到2018年,90%的數據湖將毫無用處,因為它們充滿了原始數據,很少有人會使用這些技術。


在當前的技術領域,沒有什么能像人工智能(AI)那樣引起人們的好奇和興奮。而AI的潛在優勢,也剛剛開始在企業內顯現出來。


然而,企業中人工智能的增長受到了阻礙,因為數據科學家通常無法獲得建立有效人工智能模型所需的相關數據。這些數據專家經常被迫僅依賴于一些已知的來源,如現有的數據倉庫,而并不能利用他們所需的所有實時的真實數據。此外,許多公司很難有效且經濟地確定大量數據的業務環境和質量。鑒于這些困難,很容易理解AI在加速和應用過程中的一些歷史障礙。


數據對AI有價值,用戶才能自信而安全地使用它來訓練AI模型。實現這一目標的唯一方法是以“智能數據”為基礎。


多年來,我們已經超越了數據的收集和聚合,以驅動特定的業務應用程序(數據1.0),組織已經能夠創建定義明確的流程,允許任何人訪問數據,但這還遠遠不夠,我們現已達到了需要智能數據才能真正為企業范圍的轉型提供動力的數據(數據3.0)。


例如,考慮一家公司將嘗試重新定義其與客戶群的傳統關系所面臨的挑戰,引導這種顛覆性變革需要來自眾多數據源,諸如數據庫,數據倉庫,應用程序,大數據系統,物聯網,社交媒體等的輸入,各種數據類型,諸如結構化,半結構化和非結構化,以及各種位置,諸如本地,云,混合和大數據等因素。


如今,數據湖正在成為信息變革時代所需大量不同數據的首選存儲庫。但沒有智能數據,這些湖泊價值不大。 Gartner此前曾預計,到2018年,90%的數據湖將毫無用處,因為它們充滿了原始數據,很少有人會使用這些技術。


相比之下,通過智能數據,數據科學家可以進行類似Google的搜索,并立即發現相關數據的所有潛在來源。智能數據可以節省大量寶貴的時間,數據科學家可能不得不花費時間來收集、組裝和改進模型所需的數據


那么如何確保數據真正智能化?通過構建端到端數據管理平臺,該數據管理平臺本身使用機器學習和AI功能,由廣泛的元數據驅動,以提高平臺的整體生產力。元數據是釋放數據價值的關鍵。


如果用戶希望提供全面,相關且準確的數據來實施人工智能技術,那么就需要查看四種不同的元數據類別:


1.技術元數據 - 包括數據庫表和列信息以及有關數據質量的統計信息。


2.業務元數據 - 定義數據的業務上下文以及它參與的業務流程。


3.操作元數據 - 有關軟件系統和流程執行的信息。


4.使用元數據 - 有關用戶活動的信息,包括訪問的數據集,評級和評論。


應用于此元數據集合的AI和機器學習不僅有助于識別和推薦正確的數據,該數據也可以自動處理——無需人工干預,使其適用于企業AI項目。


數字化轉型,正在迫使組織以不同的方式審視數據,這是成為“獵物或捕食者”的問題。如今,有實時可用的數據和工具訪問,可以實現快速分析,將促進了人工智能和機器學習,并允許過渡到數據優先的方法。由于數字化、數據爆炸以及人工智能對企業的變革影響,人工智能帶來的信息技術變革正在蓬勃發展。


顯然,越來越多的數據輸入可能影響人工智能應用程序的決策,因此組織需要對相關且有影響力的內容進行分類整理。然而,在您的組織采用人工驅動的數據管理方法之前,請考慮以下問題:


您希望從AI中獲得什么?

—— 微信公眾號 ——

熱門標簽

急速赛车单机版