數據挖掘的功能?

數據挖掘是為了從現有數據中獲得信息,但它也不是萬能,能夠發現的知識主要是以下5種:

1.概念知識

類別特徵的概括性描述知識。根據數據的微觀特徵發現同類事物帶有普遍性的、較高層次概念的共同性質,是一種對數據的概況、提煉和抽象。

2.關聯知識

主要反映一個事件和其他事件之間依賴或者關聯性。如果兩項或者多項屬性之間存在關聯,那麼其中一項的屬性值就可以根據其他屬性值進行預測。這類知識發現方法中最有名的就是Apriori算法。

3.分類知識

主要反映同類事物的共同特徵和不同事物之間的差異。

4.預測性知識

根據歷史數據和當前數據對未來數據進行預測,主要是時間序列預測。

5.偏差性知識

這是對差異和階段特例的揭示,如數據聚類的離群值等。

相較於挖掘能夠發現的知識而言,數據挖掘的方法類型很多,大致可以分為7類

1.決策樹方法(信息論方法)

這類方法給予信息論原理,直觀容易理解。一般來說這類方法效果好,影響力大。代表算法:ID3算法、C4.5算法、IBLE算法。

2.聚類方法

比較樣本距離,距離近的歸為一類,距離遠的分屬在不同的類中。代表算法:k均值、Clara算法、變色龍算法。

3.統計分析方法

利用統計學原理對數據進行分析,這方面有大量的商業軟件可以選用。

4.仿生物技術

代表算法:神經網絡算法和遺傳算法,當然包括兩者的其他衍生或近似算法,如鳥群算法。

5.可視化技術

對傳統圖標功能的一種擴充,讓用戶對數據的剖析更清晰。

6.模糊數學方法

我最喜歡的一類方法,包括模糊評判、模糊決策、模糊模式識別和模糊聚類。可以參考我以前的有關Aforge.net的博文。

7.其他

其他就是其他,比如SVM、文件挖掘、最近鄰方法等。

相關問題答案