数据挖掘,在商业智能BI领域的运用
數據挖掘在商業領域,特別是在零售業的運用是比較成功的。由于各業務系統的普遍使用,再加上商業智能BI的可視化分析,企業可以收集到大量關于購買情況的數據,并且數據量在不斷激增。利用數據挖掘技術可以為經營管理人員提供正確的決策手段,這樣對促進銷售及提高競爭力是有幫助的。
一、什么是數據挖掘
所站立場不同,對數據挖掘的定義也是不一樣的。
1. 技術上的定義
數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。
2. 商業角度的定義
數據挖掘是一種新的商業信息處理技術,其主要特點是對商業數據庫中的大量業務數據進行抽取、轉換、分析和其他模型化處理,從中提取輔助商業決策的關鍵性數據。
因此,數據挖掘可以描述為:按企業既定業務目標,對大量的企業數據進行探索和分析,揭示隱藏的、未知的或驗證已知的規律性,并進一步將其模型化的先進有效的方法。
二、數據挖掘的分類
數據挖掘分為有指導的數據挖掘和無指導的數據挖掘。有指導的數據挖掘是利用可用的數據建立一個模型,這個模型是對一個特定屬性的描述。無指導的數據挖掘是在所有的屬性中尋找某種關系。具體而言,分類、估值和預測屬于有指導的數據挖掘;關聯規則和聚類屬于無指導的數據挖掘。
分類
它首先從數據中選出已經分好類的訓練集,在該訓練集上運用數據挖掘技術,建立一個分類模型,再將該模型用于對沒有分類的數據進行分類。?
估值
估值與分類類似,但估值最終的輸出結果是連續型的數值,估值的量并非預先確定。估值可以作為分類的準備工作。?
預測
它是通過分類或估值來進行,通過分類或估值的訓練得出一個模型,如果對于檢驗樣本組而言該模型具有較高的準確率,可將該模型用于對新樣本的未知變量進行預測。?
關聯
關聯的目的是發現某些事情總是一起發生。?
聚類
它是自動尋找并建立分組規則的方法,它通過判斷樣本之間的相似性,把相似樣本劃分在一個簇中。
三、數據分析和數據挖掘的區別
數據分析,是用適當的統計方法對收集的海量數據進行分析、提取有用的信息和形成結論,然后對數據加以詳細研究和概括總結的過程。
數據挖掘,是從海量的數據中通過相應的算法,挖掘其中有價值(未知的、有規律的)的信息的復雜過程。
數據挖掘是深層次的數據分析,數據分析是淺層次的數據挖掘,數據挖掘更偏重于探索性數據分析,因為數據挖掘的重點是從數據中發現知識規律。
四、應用領域
搜索引擎:數據挖掘技術應用到搜索引擎領域,從而產生智能搜索引擎,將會給用戶提供一個高效、準確的檢索工具。
金融領域:可以利用數據挖掘對客戶信譽進行分析。典型的金融分析領域有投資評估和股票交易市場預測。
數據挖掘還可用于工業、農業、交通、電信、軍事、互聯網等其它行業。數據挖掘具有廣泛的應用前景,它既可應用于決策支持,也可用于數據庫管理系統中。
隨著近些年數字經濟的快速增長,有關數字和數據的新名詞成為了世界范圍內的熱點詞匯。企業想要在數字時代增強競爭力,就要善用企業的數據資產,一方面是自身的改革發展,另一方面也有著引領其它企業數字化轉型。
總結
以上是生活随笔為你收集整理的数据挖掘,在商业智能BI领域的运用的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: RK3399 HDC适配
- 下一篇: 最新链接分享给微信好友和微信朋友圈带图标