- 相關(guān)推薦
淺析改進的Apriori關(guān)聯(lián)挖掘算法的實踐應用
摘要:本文介紹了數(shù)據(jù)挖掘技術(shù)在圖書館中的應用,并運用改進的Apriori關(guān)聯(lián)挖掘算法對安徽省圖書館自動化系統(tǒng)中讀者流通庫進行挖掘,并對挖掘出的結(jié)果及其意義進行評價,從而為圖書館讀者管理、圖書資源的采購提供決策支持。關(guān)鍵詞:數(shù)據(jù)挖掘 Apriori算法 圖書館管理 讀者管理
數(shù)據(jù)挖掘技術(shù)在商業(yè)領域內(nèi)的應用給圖書館帶來了很大的啟發(fā)。圖書館的數(shù)據(jù)庫可以運用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析、聚類分析、決策樹、時間序列分析等數(shù)據(jù)挖掘方法,以找出數(shù)據(jù)庫中蘊藏的對于圖書館管理有用的潛在規(guī)則,并且通過描述和預測,為圖書館的圖書采購、讀者服務、館藏目錄設置等管理工作提供決策支持。
關(guān)聯(lián)規(guī)則是與多數(shù)人想象的挖掘過程中最相近的一種數(shù)據(jù)挖掘形式,即尋找在同一事件中出現(xiàn)的不同項的相關(guān)性。關(guān)聯(lián)規(guī)則的研究有助于發(fā)現(xiàn)數(shù)據(jù)庫中不同商品間的聯(lián)系,找出顧客購買行為模式。在圖書館運用關(guān)聯(lián)規(guī)則分析可以細分出讀者群,根據(jù)其借閱情況提供不同的服務,為圖書館的管理決策提供參考。關(guān)聯(lián)規(guī)則的核心算法是Apriori算法。
關(guān)聯(lián)規(guī)則的基本概念及算法
挖掘流通借閱事務數(shù)據(jù)庫中所有的關(guān)聯(lián)規(guī)則的問題可以被劃分成如下兩個子問題:
找出所有具有最小支持度的項集(即頻繁項集),可用Apriori算法來找出頻繁項集。由頻繁項集產(chǎn)生強關(guān)聯(lián)規(guī)則,對于每一個頻繁項集I,找出其中所有的非空子集,然后,對于每一個這樣的子集a,如果support(I)與support(a)的比值大于最小置信度,則存在規(guī)則a=