官术网_书友最值得收藏!

1.2 數據挖掘的常用方法

數據挖掘的常用方法包括分類與回歸、聚類、關聯規則、智能推薦、時間序列等,以幫助企業提取數據中蘊含的商業價值,提高企業的競爭力。具體方法介紹如下。

(1)分類與回歸。分類是一種對離散型隨機變量進行建模或預測的方法,反映的是如何找出同類事物之間具有共同性質的特征和不同事物之間的差異特征,用于將數據集中的每個對象歸類到某個已知的對象類中。回歸是通過建立模型來研究變量之間相互關系的密切程度、結構狀態及進行模型預測的一種有效方法。分類與回歸廣泛應用于醫療診斷、信用卡的信用分級、圖像模式識別、風險評估等領域。

(2)聚類。聚類是在預先不知道類別標簽的情況下,根據信息相似度原則進行信息集聚的一種方法。聚類的目的是使得屬于同一類別的個體之間的差別盡可能小,而不同類別的個體之間的差別盡可能大。因此,聚類的意義在于將類似的事物組織在一起。通過聚類,人們能夠識別密集和稀疏的區域,從而發現全局的分布模式,以及數據屬性之間的關系。聚類分析廣泛應用于商業、生物、地理、網絡服務等多個領域。

(3)關聯規則。關聯規則是一種使用較為廣泛的模式識別方法,旨在從大量的數據當中發現特征之間或數據之間在一定程度上的依賴或關聯關系。關聯規則分析廣泛應用于市場營銷、事務分析等領域。

(4)智能推薦。智能推薦用于聯系用戶和信息,幫助用戶發現對自己有價值的信息,同時讓這些有價值的信息展現在對此感興趣的用戶面前,從而實現信息消費者和信息生產者的雙贏。智能推薦廣泛應用于金融、電商、服務等領域。

(5)時間序列。時間序列是對在不同時間段內取得的樣本數據進行挖掘,分析樣本數據的變化趨勢。時間序列廣泛應用于股指預測、生產過程監測、電氣系統監測、銷售額預測等領域。

主站蜘蛛池模板: 福州市| 田林县| 抚顺县| 交口县| 高台县| 大丰市| 都昌县| 田东县| 民丰县| 闸北区| 应用必备| 双桥区| 天峨县| 廊坊市| 沛县| 佳木斯市| 东宁县| 阳山县| 紫金县| 成武县| 鄂伦春自治旗| 肇州县| 明星| 大化| 雅江县| 汉寿县| 济源市| 五大连池市| 米泉市| 黄梅县| 广饶县| 铁岭县| 岳普湖县| 荣昌县| 邯郸市| 洛川县| 洛宁县| 慈溪市| 延安市| 大名县| 寿光市|