- 相關(guān)推薦
數(shù)據(jù)挖掘技術(shù)在機(jī)房信息管理的運(yùn)用論文
1、大數(shù)據(jù)概述
大數(shù)據(jù)用來描述和定義信息爆炸時(shí)代所產(chǎn)生的海量數(shù)據(jù),它是計(jì)算機(jī)和互聯(lián)網(wǎng)互相結(jié)合的產(chǎn)物,計(jì)算機(jī)實(shí)現(xiàn)了信息的數(shù)字化,互聯(lián)網(wǎng)實(shí)現(xiàn)了信息的網(wǎng)絡(luò)共享化。隨之興起的則是從海量數(shù)據(jù)中挖掘預(yù)測(cè)出對(duì)人類行為有效的方法和結(jié)果,即數(shù)據(jù)挖掘技術(shù)[1]。數(shù)據(jù)挖掘(Datamining)指從大量的數(shù)據(jù)中通過算法搜索隱藏于其中的信息的過程,是一門跨多個(gè)領(lǐng)域的交叉學(xué)科,通常與人工智能、模式識(shí)別及計(jì)算機(jī)科學(xué)有關(guān),并通過統(tǒng)計(jì)、在線分析處理、情報(bào)檢索、機(jī)器學(xué)習(xí)、專家系統(tǒng)(依靠過去的經(jīng)驗(yàn)法則)和模式識(shí)別等諸多方法來實(shí)現(xiàn)上述目標(biāo)。其特點(diǎn)為:海量數(shù)據(jù)尋知識(shí)、集成變換度量值、分析模式評(píng)效果、圖形界面來展示[2]。
2、大數(shù)據(jù)時(shí)代下的高校機(jī)房現(xiàn)狀
順應(yīng)時(shí)代潮流的發(fā)展,各高校都開設(shè)有計(jì)算機(jī)專業(yè),非計(jì)算機(jī)專業(yè)也在大一或大二時(shí)期開設(shè)公共計(jì)算機(jī)課程,計(jì)算機(jī)成為教育領(lǐng)域內(nèi)不可或缺的教學(xué)設(shè)備,隨著高校的進(jìn)一步擴(kuò)招,教育事業(yè)的不斷更新發(fā)展,學(xué)校的機(jī)房建設(shè)也隨之增多,其任務(wù)由原來的面向計(jì)算機(jī)專業(yè)發(fā)展到面向全校的所有專業(yè)開設(shè)公共計(jì)算機(jī)教學(xué)、承擔(dān)各種計(jì)算機(jī)考試等多項(xiàng)任務(wù)。因此機(jī)房管理系統(tǒng)在日常教學(xué)和考試任務(wù)中積累了海量數(shù)據(jù),一般這些數(shù)據(jù)都保存在主服務(wù)器上僅供查詢使用[3]。利用數(shù)據(jù)挖掘技術(shù),對(duì)學(xué)校機(jī)房信息管理系統(tǒng)所積累的大量學(xué)生上機(jī)數(shù)據(jù)進(jìn)行深入分析與挖掘,將挖掘得到的預(yù)測(cè)結(jié)果輔助學(xué)生成績(jī)管理決策,能合理利用機(jī)房資源,提高學(xué)生成績(jī)管理質(zhì)量。本文利用關(guān)聯(lián)規(guī)則,從現(xiàn)有的機(jī)房信息管理系統(tǒng)中收集到的海量學(xué)生上機(jī)記錄數(shù)據(jù)中挖掘出隱藏在數(shù)據(jù)中的學(xué)生上機(jī)規(guī)律和上機(jī)效率,進(jìn)而預(yù)測(cè)學(xué)生的期末考試成績(jī),提前告知,學(xué)生可以在隨后的學(xué)習(xí)中通過人為干預(yù)學(xué)習(xí)過程:比如挖掘預(yù)測(cè)出某生成績(jī)將會(huì)較差,則可以在其后的學(xué)習(xí)中調(diào)整學(xué)習(xí)方式和學(xué)習(xí)態(tài)度,以修正期末考試結(jié)果,提高學(xué)習(xí)效率和考試通過率,為以后的就業(yè)做好鋪墊,因此不管是對(duì)于當(dāng)前利益還是長(zhǎng)遠(yuǎn)利益,都有深遠(yuǎn)的意義。
3、數(shù)據(jù)挖掘階段
1)定義問題:明確數(shù)據(jù)挖掘的預(yù)期目標(biāo)。本次挖掘目標(biāo)旨在從海量機(jī)房學(xué)生登錄信息中找出能預(yù)測(cè)成績(jī)的相關(guān)規(guī)則。
2)數(shù)據(jù)準(zhǔn)備:提取數(shù)據(jù)挖掘的目標(biāo)數(shù)據(jù)集,并進(jìn)行預(yù)處理[4]。本次挖掘數(shù)據(jù)對(duì)象為吉首大學(xué)設(shè)備中心六樓公共計(jì)算機(jī)機(jī)房的學(xué)生上機(jī)信息表,并檢查數(shù)據(jù)的有效性、一致性、完整性,并去除噪聲,進(jìn)行預(yù)處理。
3)數(shù)據(jù)挖掘:根據(jù)上個(gè)步驟所提取數(shù)據(jù)的特點(diǎn)和類型選擇相應(yīng)合適的算法,并在預(yù)處理過的數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘。根據(jù)問題定義,本次選擇關(guān)聯(lián)規(guī)則算法Apriori算法,進(jìn)行關(guān)聯(lián)規(guī)則發(fā)現(xiàn)并預(yù)測(cè)。
4)分析挖掘結(jié)果:解釋評(píng)價(jià)數(shù)據(jù)挖掘的結(jié)果,并將其轉(zhuǎn)換成能被用戶所理解的規(guī)則。
5)運(yùn)用規(guī)則:通過分析挖掘結(jié)果,可以適當(dāng)進(jìn)行人工干預(yù),修正學(xué)習(xí)行為,使得最終結(jié)果達(dá)到理想學(xué)習(xí)效率。
4、數(shù)據(jù)挖掘在機(jī)房管理系統(tǒng)中的應(yīng)用
4.1關(guān)聯(lián)規(guī)則算法
Apriori算法采用逐層搜索的迭代方法,不需要復(fù)雜的理論推導(dǎo),易于實(shí)現(xiàn),是利用挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的一種算法。基本思想是:首先找出所有的頻集,這些項(xiàng)集出現(xiàn)的頻繁性至少和預(yù)定義的最小支持度一樣。然后由頻集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小可信度。然后使用第1步找到的頻集產(chǎn)生期望的規(guī)則,產(chǎn)生只包含集合的項(xiàng)的所有規(guī)則,其中每一條規(guī)則的右部只有一項(xiàng),這里采用的是中規(guī)則的定義。一旦這些規(guī)則被生成,那么只有那些大于用戶給定的最小可信度的規(guī)則才被留下來[5]。
4.2關(guān)聯(lián)結(jié)果分析
以吉首大學(xué)實(shí)驗(yàn)室與設(shè)備管理中心為例,吉首大學(xué)實(shí)驗(yàn)室與設(shè)備管理中心下設(shè)置的公共計(jì)算機(jī)實(shí)驗(yàn)教學(xué)中心,負(fù)責(zé)學(xué)校公共計(jì)算機(jī)實(shí)驗(yàn)室建設(shè)與管理,組織實(shí)施公共計(jì)算機(jī)實(shí)驗(yàn)教學(xué)與開放,完成基于計(jì)算機(jī)平臺(tái)進(jìn)行的計(jì)算機(jī)等級(jí)考試、普通話測(cè)試、各類社會(huì)化考試等測(cè)試工作。其中承擔(dān)公共計(jì)算機(jī)教學(xué)的機(jī)房共有7間,每個(gè)機(jī)房平均配置95臺(tái)學(xué)生用計(jì)算機(jī)和一臺(tái)教師教學(xué)用計(jì)算機(jī),每臺(tái)電腦上都安裝有奧易機(jī)房管理軟件,學(xué)生每次上機(jī)都必須通過奧易軟件登錄界面輸入自己的學(xué)號(hào)和密碼才能進(jìn)入系統(tǒng)使用計(jì)算機(jī),從而收集到學(xué)生的上機(jī)登錄時(shí)間、離開時(shí)間,教師端可以利用奧易軟件對(duì)任意學(xué)生電腦端進(jìn)行調(diào)換、抓屏、控制屏幕、考試、答疑等操作,所有數(shù)據(jù)存儲(chǔ)在機(jī)房管理端的后臺(tái)數(shù)據(jù)庫中,通過調(diào)用后臺(tái)數(shù)據(jù)庫中的學(xué)生上機(jī)情況數(shù)據(jù),進(jìn)行挖掘分析。由于數(shù)據(jù)量龐大,所以采用從起始順序抽樣的方法,抽取出2015年11月5日的部分學(xué)生上機(jī)的相關(guān)數(shù)據(jù),去除不完整、不一致、有缺失的數(shù)據(jù),進(jìn)行預(yù)處理,為達(dá)到預(yù)測(cè)挖掘目標(biāo)提供正確的數(shù)據(jù)源。表1中的數(shù)據(jù)前六列是從奧易軟件后臺(tái)數(shù)據(jù)庫中提取到的原始數(shù)據(jù),我們?cè)O(shè)置第二、三、五列數(shù)據(jù)與學(xué)習(xí)情況有關(guān)聯(lián)。將這些數(shù)據(jù)存在于整合表中,剔除學(xué)號(hào)異常的記錄,即只要是學(xué)號(hào)異常,強(qiáng)制設(shè)定其上機(jī)情況為較差(異常學(xué)號(hào)學(xué)生,應(yīng)為重修生,是學(xué)習(xí)重點(diǎn)關(guān)注對(duì)象),為了方便系統(tǒng)分析,將關(guān)聯(lián)整合后的數(shù)據(jù)轉(zhuǎn)化為布爾類型。登錄時(shí)間:S1:10:00;S2:遲到五分鐘;S3:遲到十分鐘;S4:遲到十分鐘以上。學(xué)號(hào):N1:正常學(xué)號(hào);N2:異常學(xué)號(hào)。下課時(shí)間:E1:正常下課時(shí)間;E2:提前五分鐘下課;E3:提前五至十分鐘下課;E4:提前十分鐘以上下課。利用關(guān)聯(lián)算法產(chǎn)生頻繁項(xiàng)集情況分析Q:Q1:優(yōu)秀;Q2:良好;Q3:一般;Q4:較差。利用Apriori算法挖掘關(guān)聯(lián)規(guī)則,可以得到學(xué)生上機(jī)情況規(guī)律:S1,E1→Q1;(S2,E2)/(S1,E2)→Q2/Q3;S4,E4→Q4評(píng)價(jià)結(jié)果:按照正常上課時(shí)間上機(jī)并且堅(jiān)持不早退的同學(xué)學(xué)習(xí)情況為優(yōu)秀;上課準(zhǔn)時(shí)但是提前五分鐘之內(nèi)下課的同學(xué)學(xué)習(xí)情況為良好;上課遲到五分鐘以內(nèi)且下課也提前五分鐘的同學(xué)學(xué)習(xí)情況為一般;上課遲到十分鐘以上并且下課早退十分鐘以上的同學(xué)學(xué)習(xí)評(píng)估為較差。如果利用關(guān)聯(lián)算法得出某個(gè)學(xué)生的學(xué)習(xí)情況有三次為較差,就啟動(dòng)成績(jī)預(yù)警,提示并干預(yù)該生以后的上機(jī)學(xué)習(xí),督促其學(xué)習(xí)態(tài)度,提高學(xué)習(xí)效率,以避免期末考試掛科現(xiàn)象。
5、結(jié)束語
借數(shù)據(jù)挖掘促進(jìn)治理主體多元化[6],借關(guān)聯(lián)分析實(shí)現(xiàn)決策科學(xué)化[7].,本文利用關(guān)聯(lián)規(guī)則思路和算法,將吉首大學(xué)設(shè)備中心機(jī)房中存在的大量學(xué)生上機(jī)情況數(shù)據(jù)進(jìn)行分析挖掘,嘗試從學(xué)生上機(jī)相關(guān)數(shù)據(jù)中預(yù)測(cè)其學(xué)習(xí)情況,并根據(jù)預(yù)測(cè)結(jié)果有效提示學(xué)生的期末考試成績(jī)走向,引導(dǎo)該生在隨后的學(xué)習(xí)應(yīng)該更加有效,以達(dá)到避免出現(xiàn)最壞結(jié)果,從而提高期末考試通過率。
參考文獻(xiàn):
[1]李濤,曾春秋,周武柏,等.大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘——從應(yīng)用的角度看大數(shù)據(jù)挖掘[J].大數(shù)據(jù),2015(4):57-80.
[2]王夢(mèng)雪.數(shù)據(jù)挖掘綜述[J].軟件導(dǎo)刊,2013(10):135-137.
[3]袁露,王映龍,楊珺.關(guān)于高校計(jì)算機(jī)機(jī)房管理與維護(hù)的探討[J].電腦知識(shí)與技術(shù),2013(18):4334-4335.
[4]李明江,唐穎,周力軍.數(shù)據(jù)挖掘技術(shù)及應(yīng)用[J].中國新通信,2012(22):66-67+74.
[5]胡文瑜,孫志揮,吳英杰.數(shù)據(jù)挖掘取樣方法研究[J].計(jì)算機(jī)研究與發(fā)展,2011(1):45-54.
[6]黃夢(mèng)橋,李杰.因素挖掘法在投資學(xué)課程中的教學(xué)實(shí)踐[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2015(4):80-83.
[7]尹鵬飛,歐云.基于決策樹算法的銀行客戶分類模型[J].吉首大學(xué)學(xué)報(bào):自然科學(xué)版,2014(5):29-32.
【數(shù)據(jù)挖掘技術(shù)在機(jī)房信息管理的運(yùn)用論文】相關(guān)文章:
旅游管理下數(shù)據(jù)挖掘運(yùn)用論文11-18
數(shù)據(jù)挖掘技術(shù)在飯店?duì)I銷中的運(yùn)用03-28
旅游管理下數(shù)據(jù)挖掘運(yùn)用論文6篇11-18
臨床醫(yī)學(xué)中數(shù)據(jù)挖掘技術(shù)的運(yùn)用分析11-29
數(shù)據(jù)挖掘理論在數(shù)據(jù)采集中的運(yùn)用03-16
電商網(wǎng)站設(shè)計(jì)中網(wǎng)絡(luò)數(shù)據(jù)挖掘技術(shù)的運(yùn)用11-15
大數(shù)據(jù)技術(shù)在移動(dòng)通信網(wǎng)絡(luò)優(yōu)化的運(yùn)用論文06-09
數(shù)據(jù)挖掘的論文參考文獻(xiàn)10-14