国产激情久久久久影院小草_国产91高跟丝袜_99精品视频99_三级真人片在线观看

數(shù)據(jù)挖掘技術應用于經(jīng)濟統(tǒng)計中的研究論文

時間:2024-10-15 12:36:08 經(jīng)濟學 我要投稿

數(shù)據(jù)挖掘技術應用于經(jīng)濟統(tǒng)計中的研究論文

  摘要:數(shù)據(jù)管理中,由于很大數(shù)量的基數(shù)產(chǎn)生,而且數(shù)據(jù)的結構相對復雜,很容易導致數(shù)據(jù)缺失的問題。采用數(shù)據(jù)挖掘技術,可以對數(shù)據(jù)管理中所產(chǎn)生的數(shù)據(jù)進行更深層次加工,以提高數(shù)據(jù)質(zhì)量。本論文針對數(shù)據(jù)挖掘技術應用于經(jīng)濟統(tǒng)計中的研究展開研究。

數(shù)據(jù)挖掘技術應用于經(jīng)濟統(tǒng)計中的研究論文

  關鍵詞:數(shù)據(jù)挖掘技術 預處理 決策樹 經(jīng)濟統(tǒng)計

  數(shù)據(jù)挖掘技術作為數(shù)據(jù)處理技術,就是針對數(shù)據(jù)倉庫中的各種數(shù)據(jù)信息處理中選擇合適的分析工具,以通過篩選而獲得有用的信息。在經(jīng)濟統(tǒng)計中應用數(shù)據(jù)挖掘技術,可以對社會經(jīng)濟活動的運行情況進行分析,以使得統(tǒng)計信息能夠滿足社會各個領域的需求。

  一、數(shù)據(jù)挖掘技術

  信息環(huán)境下所產(chǎn)生的數(shù)據(jù)量逐漸增大,給數(shù)據(jù)信息的使用者帶來了困難。在經(jīng)濟統(tǒng)計中,如果對這些信息進行處理,并獲得有價值對信息成為亟待解決的問題。面對龐大的屬于局信息,采用數(shù)據(jù)挖掘技術,可以通過對所獲得的數(shù)據(jù)信息進行分析和技術處理后獲得符合使用標準的數(shù)據(jù)信息,以滿足使用者的需求。在經(jīng)濟統(tǒng)計中采用數(shù)據(jù)挖掘技術,可以提高數(shù)據(jù)信息質(zhì)量,以使得數(shù)據(jù)信息能夠更好地為中的社會經(jīng)濟發(fā)展服務。隨著數(shù)據(jù)信息質(zhì)量的提高,數(shù)據(jù)信息的使用效率也會提升,而且數(shù)據(jù)之間的內(nèi)在關聯(lián)性也會被建立起來。

  二、經(jīng)濟統(tǒng)計中數(shù)據(jù)挖掘技術的應用

  1.數(shù)據(jù)挖掘技術之預處理方法的應用

  對數(shù)據(jù)進行預處理可以分為三個部分,即要做好數(shù)據(jù)清理工作,之后對有用的信息進行篩選,對統(tǒng)計數(shù)據(jù)中所存在的不全面的現(xiàn)象,就要將具有噪聲的信息進行去除。經(jīng)濟統(tǒng)計中所獲得的數(shù)據(jù)信息不同,所采用的數(shù)據(jù)挖掘技術也要有所不同。如果在經(jīng)濟統(tǒng)計的過程中所獲得的數(shù)據(jù)中,數(shù)據(jù)點和噪聲都是空值的時候,在進行數(shù)據(jù)處理的時候就可以采用均值法或者平滑法。兩者之間的不同在于,均值法是將所獲得的有效數(shù)據(jù)進行平均處理而獲得的數(shù)值,而平滑法所使用的是經(jīng)過加權處理后所獲得的平均數(shù)。這種方法對數(shù)據(jù)對其結果的權重都要予以充分考慮,因此結果與真實值更加接近。這兩種方法的運用,要根據(jù)實際需要進行選擇。還有一種方法是數(shù)據(jù)集成,就是集合不同的數(shù)據(jù)而形成集體,在集合數(shù)據(jù)的同時,還能夠對數(shù)據(jù)的準確性予以保證。數(shù)據(jù)集成在運用的過程中會存在一些問題,如果存在實體識別問題,由于不同的數(shù)據(jù)會以不同的數(shù)據(jù)模式呈現(xiàn),就會出現(xiàn)模式集成問題;如果數(shù)據(jù)較為繁瑣,存在多于的數(shù)據(jù)而使得數(shù)據(jù)質(zhì)量較低,就是冗余問題的存在。在數(shù)據(jù)挖掘中,就要將經(jīng)濟統(tǒng)計數(shù)據(jù)與其他數(shù)據(jù)之間的關系精簡,以使得數(shù)據(jù)庫中所存有的數(shù)據(jù)量得到優(yōu)化而提高數(shù)據(jù)的管理效率和應用價值。比如,在對于國民生產(chǎn)總值進行計算的時候,就要總體人口的屬性合理利用,還要將國內(nèi)生產(chǎn)總值計算出來。對冗余的屬性進行判斷的時候,要將相關度的對比關系充分地利用起來。其中,元組的個數(shù)為n,屬性A的標準方差表示為“σA”,屬性B的標準方差表示為“σB”。如果σA>O,σB>0,就意味著屬性A與屬性B之間存在著正相關性,隨著屬性A的逐漸增大,屬性B也會有所增大。如果σA=0,σB=0,就意味著屬性A與屬性B之間并不存在相關性,相互之間并不存在必然的聯(lián)系,兩者是各自獨立存在的。如果σA<0,σB<0,就意味著屬性A與屬性B之間存在著負相關性,隨著屬性A的增大,屬性B就會相應地減小。

  2.數(shù)據(jù)挖掘技術之決策樹的應用

  對數(shù)據(jù)采用數(shù)據(jù)挖掘技術的時候,首先要系統(tǒng)性地分析數(shù)據(jù),將分析完成的數(shù)據(jù)輸出。在進行數(shù)據(jù)分類的時候采用決策樹,就是要將決策樹的結構構建起來。首先,對數(shù)據(jù)的基本模型進行分析,之后采用訓練集將決策樹建立起來,而且要對數(shù)據(jù)的決策樹進行精簡處理。其次,對決策樹進行分類,從決策樹的根部開始數(shù)據(jù)分類,之后是樹干的數(shù)據(jù)和樹丫的數(shù)據(jù)的分類,直到所輸入的數(shù)據(jù)能夠滿足條件。

  比如,將某地區(qū)的企業(yè)在每年所上報的數(shù)據(jù)建立序列模式,得出企業(yè)當年的預測值。將企業(yè)所上報的數(shù)據(jù)以及預測值經(jīng)過比較后得出差別率。如果差別率超過20%,則企業(yè)為A類;如果差別率介于10%至20%之間,則企業(yè)為B類;如果差別率低于10%,則企業(yè)為C類。根據(jù)企業(yè)規(guī)模的變化率以及企業(yè)可能發(fā)生的經(jīng)營事件將決策樹建立起來。差別率采用如下公式:

  差別率=|上報數(shù)據(jù)預測值|/上報數(shù)據(jù)×100%

  如果企業(yè)所上報的數(shù)據(jù)與預測值之間存在很大的差距,就要以這些企業(yè)作為主要的調(diào)查對象。

  綜上所述,中國進入到進一步深化改革開放的發(fā)展時期,要促進經(jīng)濟的快速發(fā)展,就要對先進的技術予以充分利用。在經(jīng)濟統(tǒng)計中應用數(shù)據(jù)挖掘技術,可以提高數(shù)據(jù)的有效利用率,以提高經(jīng)濟效益。

【數(shù)據(jù)挖掘技術應用于經(jīng)濟統(tǒng)計中的研究論文】相關文章:

數(shù)據(jù)挖掘技術在Web信息檢索中的應用研究論文12-01

時間序列數(shù)據(jù)挖掘研究論文提綱03-27

數(shù)據(jù)挖掘技術在高校學生成績分析中的應用研究論文03-15

基于數(shù)據(jù)挖掘的統(tǒng)計過程控制項目研究11-23

數(shù)據(jù)挖掘在電力企業(yè)中的應用論文12-13

數(shù)據(jù)挖掘技術的教學輔助系統(tǒng)應用論文03-16

數(shù)據(jù)挖掘技術在就業(yè)指導的應用論文02-27

大數(shù)據(jù)技術在網(wǎng)絡營銷中的策略研究論文01-23

數(shù)據(jù)挖掘在現(xiàn)代遠程教育中的應用論文11-22

數(shù)據(jù)挖掘技術在中等職業(yè)學校管理實踐中的應用研究11-19

  • 相關推薦