2011年11月24日 星期四

[轉]關聯規則興趣度評價


隨著資料收集和存儲技術的不斷發展,各行各業積累了大量的資料。為了從這些資料中獲取有用的知識,資料採擷技術越來越多地被資料分析人員所使用。關聯規則 挖掘作為資料採擷領域的一項關鍵技術,目前在許多領域得到了廣泛的應用[1]。關聯規則演算法可以產生大量的規則。但是由於資源的有限性,只能有部分規則可 能被決策者選擇出來使用[2],因此關聯規則的興趣度評價對於關聯規則挖掘技術的實際應用具有重要意義。

關聯規則的興趣度可以通過興趣度度量來評價。目前存在的興趣度度量主要包括客觀的度量和主觀的度量[3]。客觀的度量主要考慮資料的統計顯著性,如關聯規 則挖掘中用到的支持度、置信度和提升度。主觀的度量綜合考慮原始資料和使用者的領域知識。文[4]提出將用戶的領域知識作為約束集成到關聯規則挖掘系統中, 獲得使用者感興趣的規則。文[5]認為在挖掘的過程中,使用者應該和關聯規則挖掘系統進行交互,來判斷規則是否感興趣。文[6]和文[7]基於效用理論,提出 了加權支持度和置信度來衡量關聯規則興趣度。

對於許多關聯規則挖掘的特定應用領域,用戶所感興趣的挖掘結果可能涉及到多個方面。如在購物籃分析中,使用者除了關注規則的統計顯著性指標之外,可能對規則可以帶來的銷售利潤也很關心。也就是說,對關聯規則的評價應當是一個多屬性決策問題。文[8]將PROMETHEE方法應用于關聯規則評價,獲得使用者感興趣的模式;文[2]同時考慮了客觀的興趣度度量和用戶的主觀偏好,將AHP-ELECTRE II方法用於關聯規則排序,實現了關聯規則挖掘同決策分析的集成。文[9]和[10]分別使用兩個不同的資料包絡分析(DEA)模型,對同一關聯規則集進行了評價。

從文[9]和[10]的評價結果對比來看,對於同一關聯規則集使用不同評價方法得出的評價結果存在一定程度的差異,當用戶同時面臨多種評價結果時,便會產 生困惑,不利於決策。由於每種評價方法得出的結果都是對評價物件客觀狀態某個視角的反映,因此有必要綜合考慮多種評價方法的評價資訊,對評價結果進行集 成,以得到更好的評價結果[11]。但如何選取合適的評價指標並建立關聯規則評價指標體系,如何將現代綜合評價方法與決策方法應用于關聯規則評價 [12,13],並對單一方法得到的評價結果進行綜合集成,都是需要進一步研究的問題。

參考文獻
[1] Tan P N, Steinbach M, Kumar V. Introduction to data mining[M]. Pearson Addison-Wesley, 2005.
[2] Choi D H, Ahn B S, Kim SH. Prioritization of association rules in data mining: Multiple criteria decision approach [J]. Expert Systems with Application, 2005, 29(4): 867-878.
[3] Geng L, Hamilton H J. Interestingness measures for data mining: a survey[J]. ACM Computing Surveys, 2006, 38(3): 1-32.
[4]Padmanabhan B, Tuzhilin A. A belief-driven method for discovering unexpected patterns[C]. Proceedings of the 4th International Conference on Knowledge Discovery and Data Mining.1998: 94–100.
[5] Sahar S. Interestingness via what is not interesting[C]. Proceedings of the fifth ACM SIGKDD international conference on Knowledge discovery and data mining.1999: 332-336.
[6] Lu S F, Hu H P, Li F. Mining weighted association rules[J]. Intelligent Data Analysis, 2001, 5(3): 211-225.
[7] Shen Y D, Zhang Z, Yang Q. Objective-Oriented utility-based association mining[C]. Proceedings of the 2002 IEEE International Conference on Data Mining.2002: 426–433.
[8] 陳中祥, 吳相林, 嶽超源. 基於PROMETHEE的模式興趣度評估方法研究[J]. 系統工程與電子技術, 2003, 25(9): 1090-1093.
[9] Chen MC. Ranking discovered rules from data mining with multiple criteria by data envelopment analysis[J]. Expert Systems with Application, 2007, 33(4): 1110-1106.
[10] Toloo M, Sohrabi B, Nalchigar S. A new method for ranking discovered rules from data mining by DEA[J]. Expert Systems with Application, 2009, 36(4): 8503-8508.
[11] 郭崇慧, 張震. 基於組合評價方法的關聯規則興趣度評價[J]. 情報學報, 2011, 30(4):353-360.
[12] 郭亞軍, 易平濤. 一種基於整體差異的客觀組合評價法[J]. 中國管理科學, 2006,14(3):60-64.
[13] 嶽超源. 決策理論與方法[M]. 北京: 科學出版社, 2003.

沒有留言: