91精产国品,日本免费一级,国产手机在线视频,午夜伦情电午夜伦情电影,亚洲99影视一区二区三区,亚洲毛片视频,久久伊人热

數(shù)據(jù)挖掘最常見的十種方法

2013-10-28 09:18:19 看看新聞網(wǎng)  點(diǎn)擊量: 評(píng)論 (0)
下面介紹十種數(shù)據(jù)挖掘(Data Mining)的分析方法,以便于大家對(duì)模型的初步了解,這些都是日常挖掘中經(jīng)常遇到的算法,希望對(duì)大家有用!1、基于歷史的MBR分析(Memory-Based Reasoning;MBR)基于歷史的MBR分

挖掘技術(shù),但是透過在線分析處理工具,使用者能更清楚的了解數(shù)據(jù)所隱藏的潛在意涵。如同一些視覺處理技術(shù)一般,透過圖表或圖形等方式顯現(xiàn),對(duì)一般人而言,感覺會(huì)更友善。這樣的工具亦能輔助將數(shù)據(jù)轉(zhuǎn)變成信息的目標(biāo)。

8、神經(jīng)網(wǎng)絡(luò)(Neural Networks)

神經(jīng)網(wǎng)絡(luò)是以重復(fù)學(xué)習(xí)的方法,將一串例子交與學(xué)習(xí),使其歸納出一足以區(qū)分的樣式。若面對(duì)新的例證,神經(jīng)網(wǎng)絡(luò)即可根據(jù)其過去學(xué)習(xí)的成果歸納后,推導(dǎo)出新的結(jié)果,乃屬于機(jī)器學(xué)習(xí)的一種。數(shù)據(jù)挖掘的相關(guān)問題也可采類神經(jīng)學(xué)習(xí)的方式,其學(xué)習(xí)效果十分正確并可做預(yù)測(cè)功能。

9、判別分析(Discriminant Analysis)

當(dāng)所遭遇問題它的因變量為定性(categorical),而自變量(預(yù)測(cè)變量)為定量(metric)時(shí),判別分析為一非常適當(dāng)之技術(shù),通常應(yīng)用在解決分類的問題上面。若因變量由兩個(gè)群體所構(gòu)成,稱之為雙群體 —判別分析 (Two-Group Discriminant Analysis);若由多個(gè)群體構(gòu)成,則稱之為多元判別分析(Multiple Discriminant Analysis;MDA)。
    (1) 找出預(yù)測(cè)變量的線性組合,使組間變異相對(duì)于組內(nèi)變異的比值為最大,而每一個(gè)線性組合與先前已經(jīng)獲得的線性組合均不相關(guān)。
    (2) 檢定各組的重心是否有差異。
    (3) 找出哪些預(yù)測(cè)變量具有最大的區(qū)別能力。
    (4) 根據(jù)新受試者的預(yù)測(cè)變量數(shù)值,將該受試者指派到某一群體。

10、羅吉斯回歸分析(Logistic Analysis)

當(dāng)判別分析中群體不符合正態(tài)分布假設(shè)時(shí),羅吉斯回歸分析是一個(gè)很好的替代方法。羅吉斯回歸分析并非預(yù)測(cè)事件(event)是否發(fā)生,而是預(yù)測(cè)該事件的機(jī)率。它將自變量與因變量的關(guān)系假定是S行的形狀,當(dāng)自變量很小時(shí),機(jī)率值接近為零;當(dāng)自變量值慢慢增加時(shí),機(jī)率值沿著曲線增加,增加到一定程度時(shí),曲線協(xié)率開始減小,故機(jī)率值介于0與1之間。

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:廖生玨

免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個(gè)贊
?