摘要:孤立點(diǎn)檢測是數(shù)據(jù)挖掘的重要分支之一,旨在發(fā)現(xiàn)一個數(shù)據(jù)集中與多數(shù)對象行為明顯不同的一些對象.針對分類型矩陣數(shù)據(jù),通過給出一種矩陣對象自身的內(nèi)聚度和該矩陣對象與其他矩陣對象之間的耦合度,定義了矩陣對象的孤立因子,提出一種面向分類型矩陣數(shù)據(jù)的孤立點(diǎn)檢測算法.在Marketbasket、Microsoft web和MovieLens真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,與基于共同近鄰(common-neighbor-based,CNB)算法、局部異常因子(local outlierfactor,LOF)算法和基于信息熵(information entropy-based,IE-based)的算法相比,本算法能有效檢測分類型矩陣數(shù)據(jù)中的孤立點(diǎn).
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社。
深圳大學(xué)學(xué)報(bào)·人文社會科學(xué)版雜志, 雙月刊,本刊重視學(xué)術(shù)導(dǎo)向,堅(jiān)持科學(xué)性、學(xué)術(shù)性、先進(jìn)性、創(chuàng)新性,刊載內(nèi)容涉及的欄目:文明對話與文化比較、創(chuàng)意經(jīng)濟(jì)與文化產(chǎn)業(yè)、經(jīng)濟(jì)增長與金融創(chuàng)新、政治空間與法治社會、城鄉(xiāng)建設(shè)與社會治理、人文天地與中國精神等。于1984年經(jīng)新聞總署批準(zhǔn)的正規(guī)刊物。