《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 通信与网络 > 业界动态 > 基于关联规则理论的道路交通事故数据挖掘模型

基于关联规则理论的道路交通事故数据挖掘模型

2009-06-11
作者:吴 昊, 李军国

  摘??要: 根據(jù)數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則理論,提出“道路交通事故屬性”的定義,并建立一種新的道路交通事故數(shù)據(jù)挖掘模型,利用改進(jìn)的多維多數(shù)據(jù)類型的Apriori算法,從記錄交通事故的數(shù)據(jù)庫中發(fā)現(xiàn)潛在的、有價(jià)值、有聯(lián)系的規(guī)律,用以指導(dǎo)交通管理部門找出道路黑點(diǎn),并做出決策,杜絕事故隱患、減少事故發(fā)生,保障人們的生命和財(cái)產(chǎn)的安全。
  關(guān)鍵詞: 道路交通事故屬性; 關(guān)聯(lián)規(guī)則; 數(shù)據(jù)挖掘; Apriori算法

?

  智能交通系統(tǒng)ITS(Intelligent Transportation System)是先進(jìn)的信息技術(shù)、數(shù)據(jù)通訊傳輸技術(shù)、電子傳感技術(shù)、電子控制技術(shù)及計(jì)算機(jī)處理技術(shù)等多種高新技術(shù)與傳統(tǒng)交通運(yùn)輸融合的集成和應(yīng)用。改善道路交通環(huán)境。
  關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的主要方法,是指在數(shù)據(jù)集中支持度和置信度分別滿足給定閾值的規(guī)則,反映一個(gè)事物與其他事物之間的相互依存性和關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則挖掘的Apriori算法是根據(jù)有關(guān)頻繁項(xiàng)集特性的先驗(yàn)知識而命名的,算法中蘊(yùn)含的一條基本性質(zhì)是一個(gè)頻繁項(xiàng)集的任一子集均應(yīng)是頻繁的。借助一定的專業(yè)領(lǐng)域知識,關(guān)聯(lián)規(guī)則可以直接用于分析數(shù)據(jù)的因果關(guān)系,做出規(guī)則預(yù)測。從大量的數(shù)據(jù)中發(fā)現(xiàn)其關(guān)聯(lián)關(guān)系在市場定位、決策分析和商業(yè)管理等領(lǐng)域極為有用。
  本文提出“道路交通事故屬性”的定義,并且采用“星型全連接數(shù)據(jù)模型”對道路交通事故屬性的數(shù)據(jù)組織建模。結(jié)合對經(jīng)典單維單層的Apriori算法進(jìn)行改進(jìn),實(shí)現(xiàn)挖掘多維多數(shù)據(jù)類型關(guān)聯(lián)規(guī)則的新算法。通過對某市區(qū)的道路交通事故數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則提取分析,產(chǎn)生大量具有支持度和置信度的強(qiáng)關(guān)聯(lián)規(guī)則,可有效地分析交通事故發(fā)生的主要原因,為決策者提供切實(shí)可行的治理方案和預(yù)防措施。
1 關(guān)聯(lián)規(guī)則理論
1.1 關(guān)聯(lián)規(guī)則的基本概念

  

  

  式中:support(AYB)為包含項(xiàng)集AYB的交易記錄數(shù)目,support(A)為包含項(xiàng)集A的交易記錄數(shù)目。
規(guī)則的支持度和置信度是兩個(gè)規(guī)則的度量, 它們分別反映發(fā)現(xiàn)規(guī)則的實(shí)用性和確定性。這兩個(gè)閾值均在0%~100%之間,而不是0~1之間。
  給定一個(gè)交易集D,挖掘關(guān)聯(lián)規(guī)則問題就是產(chǎn)生支持度和置信度分別大于用戶給定的最小支持度min-sup(minimum support count)和最小置信度min-con(minimum confidence count)的關(guān)聯(lián)規(guī)則。前者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小支持度,表示了一組物品集在統(tǒng)計(jì)意義上需滿足的最低程度;后者即用戶規(guī)定的關(guān)聯(lián)規(guī)則必須滿足的最小置信度,反應(yīng)了關(guān)聯(lián)規(guī)則的最低可靠度。
  如果不考慮關(guān)聯(lián)規(guī)則的支持度和置信度,則在事務(wù)數(shù)據(jù)庫中存在無窮多的關(guān)聯(lián)規(guī)則。事實(shí)上,人們一般只對滿足一定的支持度和置信度的關(guān)聯(lián)規(guī)則感興趣。一般把同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則稱為強(qiáng)規(guī)則。給定一個(gè)事務(wù)集D,挖掘關(guān)聯(lián)規(guī)則問題就是產(chǎn)生支持度和置信度分別大于用戶給定的最小支持度和最小置信度的關(guān)聯(lián)規(guī)則,也就是強(qiáng)規(guī)則的問題。
  因此,關(guān)聯(lián)規(guī)則挖掘可定義為:給定一個(gè)事務(wù)數(shù)據(jù)庫D,尋找出所有滿足support>min-sup,confidence>min-con的關(guān)聯(lián)規(guī)則AB。
??? 具體產(chǎn)生關(guān)聯(lián)規(guī)則的操作說明如下:
  (1) 對于每個(gè)頻繁項(xiàng)集l,產(chǎn)生l的所有非空子集。
  (2) 對于每個(gè)l的非空子集s,若support(l)/support(s)>=min-con,則產(chǎn)生一個(gè)關(guān)聯(lián)規(guī)則“s(l-s)”。
  項(xiàng)的集合稱為項(xiàng)集(Item set),包含k個(gè)數(shù)據(jù)項(xiàng)的項(xiàng)集稱為k-項(xiàng)集。
  項(xiàng)集的出現(xiàn)頻率是在整個(gè)交易數(shù)據(jù)集D中包含該項(xiàng)集的交易記錄數(shù),簡稱為項(xiàng)集的頻率、支持度或計(jì)數(shù)。
如果項(xiàng)集的出現(xiàn)頻率大于或等于min-sup與D中事務(wù)總數(shù)的乘積,稱項(xiàng)集滿足最小支持度min-sup。如果項(xiàng)集滿足最小支持度,則稱它為頻繁項(xiàng)集(Frequent Item set),簡稱頻集。頻繁k-項(xiàng)集的集合通常記作Lk。
1.2 Apriori算法
  Apriori算法是由AGRAWAL R等人提出的。該算法利用一個(gè)層次順序搜索的循環(huán)方法完成頻繁項(xiàng)集的挖掘工作。利用k-項(xiàng)集來產(chǎn)生(k+1)-項(xiàng)集。核心思想是把發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的工作分為兩步:第一步通過迭代檢索出事務(wù)數(shù)據(jù)庫中的所有頻繁項(xiàng)集,即頻繁項(xiàng)集的支持度不低于用戶設(shè)定的閾值;第二步從頻繁項(xiàng)集中構(gòu)造出滿足用戶最低信任度的規(guī)則。挖掘或識別所有頻繁項(xiàng)集是Apriori算法的核心,占整個(gè)計(jì)算量的大部分。后來的許多算法多是對Apriori算法的改進(jìn)研究。
  為提高按層次搜索并產(chǎn)生相應(yīng)頻繁項(xiàng)集的處理效率,Apriori算法利用了一個(gè)稱為Apriori的重要性質(zhì),來幫助有效縮小頻繁項(xiàng)集的搜索空間。Apriori算法的性質(zhì):頻繁項(xiàng)集中所有非空子集也都必須是頻繁項(xiàng)集。
  這一性質(zhì)是由AGRAWAL和SRIKANT提出并證明的,若一個(gè)集合不能通過測試,該集合的所有超集也不能通過同樣的測試。根據(jù)這一性質(zhì),進(jìn)行第k遍掃描之前,可先產(chǎn)生候選集Ck,Ck可以分兩步來產(chǎn)生,設(shè)前一步(第k-1步)已生成(k-1)-頻繁集Lk-1,則首先可以通過對Lk-1中的成員進(jìn)行聯(lián)接來產(chǎn)生候選,Lk-1中的兩個(gè)成員必需滿足在兩個(gè)成員的項(xiàng)目中有k-2個(gè)項(xiàng)目是相同的這個(gè)條件方可連接,即:
    

  然后再從Ck中刪除所有包含不是頻繁的(k-1)-子集的成員項(xiàng)目集即可[2]。也可以根據(jù)定義,如果項(xiàng)集I不滿足最小支持度閾值min-sup,則I不是頻繁的,即P(I)[3]。
2 基于關(guān)聯(lián)規(guī)則的道路交通事故數(shù)據(jù)挖掘模型
2.1建立數(shù)據(jù)模型

  實(shí)際上,交通管理部門在道路交通事故預(yù)防工作中,主要是根據(jù)不同時(shí)期、不同地點(diǎn)道路交通事故的態(tài)勢做出相應(yīng)的管理對策,從管理上減少事故。要做到這一點(diǎn),首先要對事故發(fā)生的情況進(jìn)行數(shù)據(jù)分析,從中發(fā)現(xiàn)規(guī)律性的東西,做到有的放矢。道路交通事故研究主要建立在大量事故統(tǒng)計(jì)分析資料的基礎(chǔ)上,由于道路交通事故難以現(xiàn)場直接觀測其發(fā)生過程,需要通過事后的數(shù)據(jù)資料分析來研究其發(fā)生規(guī)律。因此,針對交通事故基礎(chǔ)數(shù)據(jù)資料的整理顯得尤為重要。如何從大量的道路交通事故的誘發(fā)因素中發(fā)現(xiàn)它們之間聯(lián)系的內(nèi)在規(guī)律,進(jìn)行人為控制和干預(yù),以減少交通事故發(fā)生的概率是大家所關(guān)注的焦點(diǎn)。結(jié)合對實(shí)際情況的分析,提出以下問題:
  在以往關(guān)聯(lián)規(guī)則理論研究中,主要集中在單維單層布爾型關(guān)聯(lián)規(guī)則上,即每一條規(guī)則包括一個(gè)多次出現(xiàn)的謂詞。如果把典型的單維單層布爾型的數(shù)據(jù)挖掘的Apriori算法直接作用于此次項(xiàng)目中的數(shù)據(jù),則Apriori算法只能解決針對多維數(shù)據(jù)列表中的某一列屬性的關(guān)聯(lián)規(guī)則的挖掘,而不能解決多個(gè)屬性集之間的數(shù)據(jù)挖掘。例如,只能挖掘道路交通事故屬性中的事故主要原因的關(guān)聯(lián)規(guī)則:酒后駕車,疲勞駕車,超速行駛,逆向行駛,違章超車,違章轉(zhuǎn)彎,違章裝載……。但是如果要挖掘駕駛員因素與道路因素之間的關(guān)聯(lián)規(guī)則,此算法則無法直接應(yīng)用。
  如果把道路交通事故屬性集的所有屬性不分類別地全部放到一個(gè)屬性集合中,使其成為一個(gè)混合內(nèi)容的單維數(shù)據(jù)集合,就可以直接利用Apriori算法。例如,把天氣屬性:沙塵、雨、雪、霧、晴、大風(fēng)、陰、其他的每個(gè)元素都作為整體事故屬性集合中的屬性值,存在如下問題:(1) 每次數(shù)據(jù)庫掃描的信息過于龐大,降低效率;(2) 同一類型的屬性被拆開,不利于做統(tǒng)計(jì)分析;(3) 得到的結(jié)果很可能是沒有意義的;(4) 數(shù)據(jù)庫將變得雜亂無章等。
  人們已提出了挖掘單層與多層的布爾型關(guān)聯(lián)規(guī)則、多維多層數(shù)據(jù)類型關(guān)聯(lián)規(guī)則的許多算法,最著名的是單層布爾型Apriori挖掘算法。許多算法都是基于Apriori的,其缺陷是掃描數(shù)據(jù)庫的次數(shù)正比于最大模式的長度。而挖掘多維多層關(guān)聯(lián)規(guī)則過程中發(fā)現(xiàn)的模式長度在20左右的情況并不少見,算法代價(jià)非常高。其次,已有的多維多層關(guān)聯(lián)規(guī)則挖掘算法只能通過合并相鄰的數(shù)值型屬性區(qū)間來建立有限的概念層次,不能滿足實(shí)際應(yīng)用的需要。
  針對以上問題,本文基于多維多層的關(guān)聯(lián)規(guī)則的挖掘算法,著重研究數(shù)據(jù)挖掘技術(shù)在決策分析系統(tǒng)中的應(yīng)用,針對道路交通事故這一實(shí)際問題對典型的單維單層布爾型Apriori算法進(jìn)行改進(jìn),實(shí)現(xiàn)挖掘多維多層多數(shù)據(jù)類型關(guān)聯(lián)規(guī)則的新算法。
2.2 道路交通事故屬性的定義
  道路交通事故屬性PRTA(Property of the Road Traffic Accident)是指道路交通事故發(fā)生時(shí),駕駛員、車輛、道路、天氣和時(shí)間的狀態(tài),以及事故本身的特點(diǎn),即:駕駛員屬性、車輛屬性、道路屬性、天氣屬性、時(shí)間屬性和事故本身屬性的集合。這樣,就可以將大量的道路交通事故數(shù)據(jù)按照道路交通事故屬性組織為信息進(jìn)行數(shù)據(jù)挖掘。
2.3 道路交通事故屬性的數(shù)據(jù)模型
  在大規(guī)模的數(shù)據(jù)庫中,由于多維數(shù)據(jù)空間的稀疏性,若要在低層和原始層的數(shù)據(jù)項(xiàng)之間發(fā)現(xiàn)強(qiáng)的和有趣的關(guān)聯(lián)規(guī)則比較困難,因?yàn)楹枚囗?xiàng)集沒有足夠的支持度。在較高的概念層發(fā)現(xiàn)的強(qiáng)關(guān)聯(lián)規(guī)則可能提供普遍意義的知識,對于一個(gè)用戶代表普遍意義的知識,對于另一個(gè)用戶可能是新穎的。這樣,數(shù)據(jù)挖掘系統(tǒng)可在多個(gè)抽象層挖掘關(guān)聯(lián)規(guī)則,且容易在不同的抽象空間轉(zhuǎn)換。
  概念層次樹是數(shù)據(jù)庫中各屬性值和概念依據(jù)抽象程度不同而構(gòu)成的一個(gè)層次結(jié)構(gòu),如圖1所示。

  圖中,PRTA為道路交通事故屬性; D(Driver)為駕駛員屬性; V(Vehicle)為車輛屬性; R(Road)為道路屬性; W(Weather)為天氣屬性; T(Time)為時(shí)間屬性; A(Accident)為事故本身屬性。
  多層關(guān)聯(lián)規(guī)則的挖掘一般采用自頂向下的策略,由概念層1開始向下,到較低的更特定的概念層,對每個(gè)概念層的計(jì)算頻繁項(xiàng)集累加計(jì)數(shù),直到不能再找到頻繁項(xiàng)集,即:一旦找到概念層1的所有頻繁項(xiàng)集,就開始在第2層找頻繁項(xiàng)集,如此下去,就可以在每一層使用發(fā)現(xiàn)頻繁項(xiàng)集的多維多數(shù)據(jù)類型Apriori算法。
  在進(jìn)行多維數(shù)據(jù)挖掘時(shí),將數(shù)據(jù)按一定的結(jié)構(gòu)組織起來,通常的數(shù)據(jù)建模方法有多維數(shù)據(jù)結(jié)構(gòu)、星型模型、雪花模型以及超立方體等?;趯Φ缆方煌ㄊ鹿蕦傩缘姆治?,這里建立星型全連接結(jié)構(gòu)的數(shù)據(jù)模型如圖2所示。

  定義了道路交通事故屬性的概念層次樹和星型全連接的數(shù)據(jù)模型后, 就可以對發(fā)生道路交通事故的各個(gè)因素進(jìn)行定性的分析。
  道路交通事故屬性的數(shù)據(jù)來自“道路交通事故信息采集項(xiàng)目表”,每一個(gè)道路交通事故屬性是表的維,每個(gè)維連接著一個(gè)維表。要對D[D1,D2,…,Dn]維進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,每個(gè)維Di表示一個(gè)屬性,每個(gè)維包含|Di|(i=1,2,…,n)個(gè)不同的數(shù)值,在這里|Di|為維Di具有的不同屬性的個(gè)數(shù)。在這些維的每個(gè)單元中存儲(chǔ)的是原始數(shù)據(jù)的計(jì)數(shù)值。一般情況下,可以把一個(gè)n維的數(shù)據(jù)映射成一個(gè)具有n個(gè)屬性的表。
  交通事故屬性具有概念分層,主要有三層:
  第一層是道路交通事故屬性。
  第二層是第一層的細(xì)化:駕駛員屬性、車輛屬性、道路屬性、天氣屬性、時(shí)間屬性、事故本身的屬性。
  第三層是對第二層的更進(jìn)一步細(xì)化,主要是對道路交通事故每一屬性維的刻度(也就是粒度)進(jìn)行分析:性別、年齡、駕齡、駕照種類、駕駛員類型、出行目的、車輛使用性質(zhì)、交通方式、行駛狀態(tài)、所屬行業(yè)、公路行政等級、地形、路面情況、路面類型、道路橫斷面、路口路段類型、道路線形、道路類型、交通控制方式、照明條件、小時(shí)、星期、月份、事故類型、事故主要原因、事故形態(tài)、現(xiàn)場。
2.4 提取道路交通事故屬性的關(guān)聯(lián)規(guī)則
  從以上分析可以看出,道路交通事故屬性模型是多維多層的。由于Apriori算法只是在單維單層的數(shù)據(jù)模型上進(jìn)行挖掘,不適合對多維多層的數(shù)據(jù)模型進(jìn)行挖掘,要想對上述的道路交通事故屬性的數(shù)據(jù)模型進(jìn)行分析,Apriori算法必須進(jìn)行一定的改進(jìn)。將數(shù)據(jù)模型的每個(gè)維看成是一個(gè)謂詞,就可以挖掘多維關(guān)聯(lián)規(guī)則,在多維關(guān)聯(lián)規(guī)則的挖掘中,搜索頻繁謂詞集。對于多層數(shù)據(jù)模型,在設(shè)定各層的支持度大小時(shí)有多種方法,再進(jìn)行多維多層的數(shù)據(jù)挖掘是比較繁瑣的,這里對其進(jìn)行了簡化。在進(jìn)行關(guān)聯(lián)規(guī)則分析前,預(yù)先指定該維的那一個(gè)層次參與關(guān)聯(lián)分析,其他層次不參與關(guān)聯(lián)分析,從而將問題簡化為單純的多維數(shù)據(jù)模型的挖掘。在進(jìn)行挖掘之前,對事故主要原因選擇第三層,其他維都是單層的。通過這樣的指定,就可以得到多維單層道路交通事故屬性數(shù)據(jù),便于關(guān)聯(lián)分析。
  通過選定要分析的交通事故本身與駕駛員、車輛、道路、天氣、時(shí)間等具體選項(xiàng)信息,利用多維多數(shù)據(jù)類型Apriori算法作關(guān)聯(lián)分析,發(fā)現(xiàn)各個(gè)因素之間的聯(lián)系,結(jié)果采用文本形式來描述,形如(A,B,C)D(sup;con)。其中,A、B、C分別代表規(guī)則的前提條件,D代表規(guī)則的結(jié)果,sup和con表示該規(guī)則的支持度和置信度,取值均為0 %~100 %之間。支持度描述的是在所有的記錄中,A、B、C同時(shí)出現(xiàn)的概率;置信度表示在A、B、C同時(shí)出現(xiàn)的條件下,發(fā)生情況D的概率。當(dāng)一條規(guī)則滿足一定的最小支持度和最小置信度時(shí),可以認(rèn)為該規(guī)則是比較常見的,可信度是較高的。
  對多維數(shù)據(jù)關(guān)聯(lián)分析需對Apriori算法進(jìn)行改進(jìn),數(shù)據(jù)挖掘簡要流程圖如圖3所示。

3 道路交通事故數(shù)據(jù)的分析
  實(shí)驗(yàn)使用的是對某市市區(qū)2002年12月21日至2007年7月20日的道路交通事故數(shù)據(jù)進(jìn)行測試。采取星型全連接的數(shù)據(jù)模型對道路交通事故屬性數(shù)據(jù)按照上述數(shù)據(jù)建模進(jìn)行組織。對該市區(qū)的道路交通事故數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則提取分析,得出許多具有實(shí)際意義的結(jié)論。
  以分析2003年12月至2004年7月某市市區(qū)事故原因?yàn)槔?,首先得到的是各種事故原因發(fā)生的比例(事故數(shù)據(jù)個(gè)數(shù)為2 401)如:不按規(guī)定讓行(27.66%)、未保持安全距離(12.16%)、超速行駛(8.79%)、違章拐彎(7.58%)、其他機(jī)動(dòng)車原因(5.46%)、逆向行駛(4.91%)、違章變更車道(4.33%)等,其他事故原因比例較小,可視為“噪音”而省略。
假設(shè)用戶想了解導(dǎo)致“不按規(guī)定讓行”這一結(jié)果,設(shè)置最小支持度閾值為5%,最小置信度閾值為40%。產(chǎn)生以下規(guī)則:
  (1)條件:道路因素
  規(guī)則:
 ?、俚缆窓M斷面:混合式 & 道路類型:主干路不按規(guī)定讓行(6.01%,36.65%)。
 ?、诼房诼范晤愋停核闹Ψ植婵?IMG src="http://files.chinaaet.com/old/uploadfiles/jishu/jslw/20090611024027546.gif" border=0>不按規(guī)定讓行(7.04%,42.66%)。
 ?、勐访骖愋停簽r青&道路橫斷面:混合式 & 照明條件:白天 &交通控制方式:無控制不按規(guī)定讓行(9.79%,36.40%)。
  (2)條件:天氣因素、道路因素
  規(guī)則:
 ?、偬鞖猓呵?& 地形:平原 & 道路橫斷面:混合式 & 照明條件:白天&道路線形:平直&交通控制方式:無控制不按規(guī)定讓行(9.27%,36.31%)。
  ②天氣:晴 & 路面類型:瀝青 & 道路橫斷面:混合式&照明條件:白天不按規(guī)定讓行(11.84%,36.34%)。
 ?、厶鞖猓呵?路面情況:平坦&道路橫斷面:混合式 & 照明條件:白天 & 道路線形:平直 & 交通控制方式:無控制不按規(guī)定讓行(8.67%,36.33%)。
 ?、芴鞖猓呵?& 地形:平原&道路橫斷面:混合式 & 照明條件:白天 & 道路線形:平直 & 交通控制方式:無控制不按規(guī)定讓行(9.27%,36.31%)。
  對2002年12月至2007年7月該市區(qū)交通事故情況進(jìn)行分析,得出以下結(jié)果:
  (1) 機(jī)動(dòng)車駕駛?cè)诉`章駕車行為導(dǎo)致交通事故的發(fā)生率占到事故總數(shù)的85.79%,而死亡率占67.14%。
  (2)平直道路事故頻繁:其上事故發(fā)生率占總數(shù)的75.63%,死亡率占81.34%。
  (3) 晴天事故占絕大比例:事故發(fā)生率占總數(shù)的90.24%,死亡事故占89.27%。
  (4) 從月統(tǒng)計(jì)周期分布來看,6~9月為事故多發(fā)時(shí)段,9月事故致人死亡較為突出。
  (5) 從24小時(shí)事故分布情況看,中午、傍晚和下午時(shí)分是交通事故的多發(fā)時(shí)段。
  以上實(shí)驗(yàn)所得到的結(jié)論與交警的經(jīng)驗(yàn)數(shù)據(jù)基本一致。
  本文基于關(guān)聯(lián)規(guī)則理論,針對道路交通的實(shí)際問題,建立了基于關(guān)聯(lián)規(guī)則理論的星型全連接數(shù)據(jù)模型,并提出一種改進(jìn)的多維多數(shù)據(jù)類型Apriori算法,用來分析道路交通事故歷史數(shù)據(jù),并且完成了系統(tǒng)決策分析模塊的實(shí)現(xiàn)。實(shí)踐證明,關(guān)聯(lián)規(guī)則的挖掘能夠發(fā)現(xiàn)大量數(shù)據(jù)的屬性之間有趣的關(guān)聯(lián)關(guān)系,利用關(guān)聯(lián)規(guī)則挖掘技術(shù)在關(guān)聯(lián)性發(fā)現(xiàn)方面有著強(qiáng)大的優(yōu)勢。關(guān)聯(lián)規(guī)則最重要的特點(diǎn)是關(guān)聯(lián)是自然組合的,這對發(fā)現(xiàn)所有屬性的子集存在的模式是非常適用的。

參考文獻(xiàn)
[1] ?LIU Zheng Jiang, WU Zhao Lin. Data mining to human factors based on ship collision accident survey reports.?Navigation of China, Jun, 2004(2).
[2] ?YANG Xue Bing.A high efficient multi-dimensional association rules mining algorithm. Computer Development,2002(6).
[3] ?SONG Zhong shan. Research on the algorithm apriori of?mining association rules. Journal of South-Central University fox Nationalities(Nat. Set Edition), Mar. 2003,22(1).

?

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時(shí)通過電子郵件或電話通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。

相關(guān)內(nèi)容