Règle d'association
Règles d'association
5.1 Introduction
De nombreuses entreprises commerciales accumulent d'importantes quantités de données lors de leurs opérations quotidiennes. Par exemple, les grands magasins collectent énormément de données sur les achats des consommateurs via les tickets de caisse. Le tableau 5.1 donne une illustration de ce type de données. Chaque rang correspond à une transaction et reporte le numéro de ticket ainsi qu'une liste de produits achetés. Les commerçants sont intéressés par l'analyse de ce type de données pour mieux connaître les comportements d'achat de leurs clients. Ces informations servent à bien mener les campagnes marketing, mieux gérer les inventaires ou améliorer les relations clients.
TID 1 2 3 4 4
Items {Pain, Lait} {Pain, Couches, Bière, Oeufs} {Lait,Couches,Bière,Coca} {Pain, Lait, Couches, Bière} {Pain, Lait, Couches, Coca} Table 5.1 Panier de la ménagère
Dans ce chapitre, nous allons étudier une méthode connue sous le non d'analyse des associations et qui est utilisée pour découvrir des associations ou des relations cachées dans les grandes bases de données. Les relations découvertes peuvent être représentées sous forme de règles d'association ou d'ensemble d'items fréquents. Par exemple, on peut extraire la règle suivant de la table 5.1 : Cette règle suggère qu'il existe une relation forte entre la vente de couches et de bières parce de nombreux clients qui achètent des couches achètent aussi de la bière. Les règles d'association sont bien sûr aussi applicables à d'autres domaines tels que la bioinformatique (génétique), les diagnostiques médicaux, le web mining, etc.
29
Il y a deux problèmes clés qui doivent être considérés quand on utilise des règles d'association. Tout d'abord l'extraction de motifs (plus ou moins fréquents) peut être numériquement coûteux si les bases de données sont importantes. Deuxièmement, certaines associations sont potentiellement fausses ou sans intérêt, elles